科大讯飞宣布星火语音大模型更新，极速超拟人交互将全民开放使用

aixo 2024-08-19 17:42:17

2024-08-19 17:42:17

8月19日消息，科大讯飞宣布星火语音大模型更新，正式推出星火极速超拟人交互，并将其能力运用于讯飞星火APP“小星畅聊”功能中，将在8月底率先全民开放使用。

从官方展示效果来看，星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破。

响应速度方面，星火极速超拟人交互支持多轮交互，响应速度与GPT-4o相当，几乎与人类正常聊天节奏一致。用户可在对话中随时打断、插话，系统能迅速回应，实现了真正的无缝对话体验。

情绪感知情感共鸣方面，星火极速超拟人交互能够识别用户的喜、怒、哀、乐等多种情绪，不仅通过声音内容判断，还能以适当的情感回应。此外，系统还能识别非言语声音，如咳嗽、宠物叫声，并给出相应回复。

语音可控表达方面，相比以前语音交互中机器声音无法调整的情况，现在只要语音发出指令，就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。

“角色扮演”方面，支持多种角色模拟，可根据用户需求变换角色，增强对话的趣味性和互动性。

据悉，科大讯飞采用统一神经网络实现语音到语音的端到端建模，简化了传统语音交互语音转文字、大模型生成回复、语音合成的流程，从而大幅缩短了响应时间，并提升了交互的拟人度和流畅度。此外，通过多维度的语音属性解耦表征训练，系统能更灵活地控制内容、音色、情感等元素，满足不同场景和需求。

科大讯飞表示，星火极速超拟人交互将于8月底全面开放使用，并计划在未来持续拓展交互功能和模态，为用户提供更加丰富、实用的智能语音服务。随着技术的不断成熟和应用场景的拓展，智能语音技术有望在智能手机、智能汽车等多个领域迎来爆发式增长。据IDC预测，到2030年，全球智能语音服务市场规模将达到约731.6亿美元，年复合增长率达27%。（咸咸）

GPT

科大讯飞宣布星火语音大模型更新，极速超拟人交互将全民开放使用

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号