PicTalk 是一个全栈 Web 应用程序,旨在通过“看图说话”帮助用户提升英语口语。它利用人工智能为用户的语法和词汇提供即时反馈。
我使用 Next.js 和 Tailwind CSS 构建了前端。后端和数据库采用了 Firebase(Auth 和 Firestore)。此外,我还集成了 Stripe 处理订阅支付。
练习模式: 用户可以选择“教练模式”描述来自 Unsplash API 的随机图片,或选择“日常聊天”模式进行对话练习。应用会录制用户的语音,并使用 ElevenLabs STT(语音转文本)API 进行处理。
AI 反馈: 我使用 AI API 分析转换后的文本。它可以纠正语法错误,提供更好的词汇建议,并生成母语级别的参考描述。应用还能使用 ElevenLabs TTS(文本转语音)API 朗读反馈内容。
历史记录: 用户可以查看过去的练习记录。历史页面显示了他们描述的图片、语音转写文本以及 AI 评估。免费用户可以查看最近 3 条记录,而专业版用户可以查看更多。
家庭计划管理: 订阅了家庭计划的用户可以邀请最多 2 名成员共享专业版功能。系统在数据库中安全地关联这些账户。