科大讯飞宣布星火语音大模型更新,极速超拟人交互将全民开放使用
8月19日消息,科大讯飞宣布星火语音大模型更新,正式推出星火极速超拟人交互,并将其能力运用于讯飞星火APP“小星畅聊”功能中,将在8月底率先全民开放使用。
从官方展示效果来看,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破。
响应速度方面,星火极速超拟人交互支持多轮交互,响应速度与GPT-4o相当,几乎与人类正常聊天节奏一致。用户可在对话中随时打断、插话,系统能迅速回应,实现了真正的无缝对话体验。
情绪感知情感共鸣方面,星火极速超拟人交互能够识别用户的喜、怒、哀、乐等多种情绪,不仅通过声音内容判断,还能以适当的情感回应。此外,系统还能识别非言语声音,如咳嗽、宠物叫声,并给出相应回复。
语音可控表达方面,相比以前语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。
“角色扮演”方面,支持多种角色模拟,可根据用户需求变换角色,增强对话的趣味性和互动性。
据悉,科大讯飞采用统一神经网络实现语音到语音的端到端建模,简化了传统语音交互语音转文字、大模型生成回复、语音合成的流程,从而大幅缩短了响应时间,并提升了交互的拟人度和流畅度。此外,通过多维度的语音属性解耦表征训练,系统能更灵活地控制内容、音色、情感等元素,满足不同场景和需求。
科大讯飞表示,星火极速超拟人交互将于8月底全面开放使用,并计划在未来持续拓展交互功能和模态,为用户提供更加丰富、实用的智能语音服务。随着技术的不断成熟和应用场景的拓展,智能语音技术有望在智能手机、智能汽车等多个领域迎来爆发式增长。据IDC预测,到2030年,全球智能语音服务市场规模将达到约731.6亿美元,年复合增长率达27%。(咸咸)