这是一个结合MiniMax MCP与豆包AI的语音克隆示例应用,可以实现:
- 录制用户语音并进行声音克隆
- 使用克隆的声音播报豆包AI返回的内容
- 通过语音或文字与豆包AI进行交互
- 语音录制与播放
- 语音克隆技术集成
- 与豆包AI的文本交互
- 语音识别与语音合成
npm installnpm start或者开发模式:
npm run dev打开浏览器访问:http://localhost:3000
- 在主页中点击"进入语音克隆页面"
- 按照界面提示,录制一段15-30秒的清晰语音
- 等待系统完成语音克隆
- 在聊天界面中通过文字或语音与AI交互
- AI的回复将使用您克隆的声音播放出来
MCP配置存储在 ~/.cursor/mcp.json 文件中,包含以下关键配置:
MINIMAX_MCP_BASE_PATH: 输出目录路径MINIMAX_RESOURCE_MODE: 资源模式(url或local)
- 前端:HTML5, CSS3, JavaScript
- 后端:Node.js, Express
- 音频处理:Web Audio API
- AI集成:豆包AI, MiniMax MCP
- 语音克隆功能为模拟演示,实际应用需要接入MiniMax的语音克隆API
- 需要确保浏览器允许麦克风访问权限