科大讯飞推出星火极速超拟人交互技术,对标 GPT-4o 语音功能
8月19日,记者从科大讯飞获悉,公司已正式推出星火极速超拟人交互技术,在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破,对标GPT 4o语音功能。据悉,“星火极速超拟人交互”采用统一神经网络实现语音到语音的端到端建模。官方称即便被频繁打断,也能“迅速反应”,更加符合日常对话情境。
今年5月,惊艳亮相了GPT-4o,展示了堪比电影《Her》中的人机交互体验,但迟迟没有面向用户开放,上个月底也只是选择性地向一小部分Alpha测试参与者开放部分语音功能。
据科大讯飞透露,星火极速超拟人交互已在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破,让整体的交互体验更自然、更有趣,就像电影《Her》中展现的智能且人性化的聊天效果一样。
在响应速度上,星火极速超拟人交互支持极速响应多轮交互,能够在对话过程中生成高质量的回答,并且响应速度更快、与GPT-4o响应时间相当,几乎与人类正常聊天节奏一致,并且对话中允许用户随时打断、插话,可谓实现了人机对话的“无缝衔接”。
在情绪感知情感共鸣上,星火极速超拟人交互可以在对话中感知到用户的喜、怒、哀、乐、害怕、困惑等各类情绪,不仅能根据声音的内容来判断,还能像朋友一样用合适的情感回应用户。比如,用笑声回应开心,安慰悲伤情绪……同时,还能识别用户咳嗽、猫和狗的叫声等,给出对应的回复语。
与此同时,相比以前语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。
此外,星火极速超拟人交互还支持“角色扮演”,可以模仿不同的角色陪你聊天。比如,“模仿孙悟空的声音来和小孩子对话”,超拟人便会模仿孙悟空的声音和人设和小朋友聊天。
记者获悉,星火极速超拟人交互计划将抢先在的“Her”落地之前,于8月30日上线,并对全民开放使用体验。
头图由科大讯飞提供
海量资讯、精准解读,尽在新浪财经APP