本项目模拟了《女神异闻录3》中角色埃癸斯(アイギス,Aegis)的语音助手功能,能够完成基本对话,以及实现部分如播放音乐等 Function Calling 。该项目作为一个学习和参考的 Demo,供对《女神异闻录3》爱好者和语音助手技术感兴趣的开发者使用。
本项目遵循常见的语音助手架构,包括在声音活动检测(VAD)后进行录音、自动语音识别(ASR)、通过大型语言模型(LLM)以理解和生成回应,最终文本到语音(TTS)输出。
当前实现的是简易的循环对话模式,程序启动后会立即开始监听。若要实现实用化,请在录音前加入唤醒词功能。
使用的模型:
- ASR:faster-whisper large-v3
- LLM:Deepseek V3(在线 API)
- TTS:GPT-SoVITS
请注意,本项目并非开箱即用:
- 本项目不包含已训练的埃癸斯 GPT-SoVITS 声音模型。用户需根据 GPT-SoVITS 的使用文档自行训练声音模型,并启动推理服务端以便本项目调用。
- LLM 部分需要用户填写自己的 Api Key,或是切换为其他大模型。