西湖心辰发布国内首个端到端通用语音大模型，中文语音效果超 GPT-4o

aixo 2024-09-07 02:04:23

2024-09-07 02:04:23

9 月 6 日消息，西湖心辰昨日发布了心辰 Lingo 语音大模型，号称是“国内首个端到端通用语音大模型”。

官方表示，针对心辰 Lingo端到端语音大模型的能力，在多个领域和中文上进行增强，使得心辰 Lingo 的中文语音效果，相较 GPT-4o 更为出色。心辰 Lingo 于 8 月24 日开启内测，至今已经有超千家企业用户预约测试。

相比较传统 TTS，端到端语音大模型则是一种更为全面的技术，不仅可以语音识别，还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节，实现了从语音输入到语音反馈的完整交互过程。

心辰 Lingo 语音模型技术能力上具备以下三个特点：

注意到，目前心辰 Lingo 语音大模型仍需通过内测申请，申请链接如下：

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，所有文章均包含本声明。

自然语言处理