除了声音酷似外还有刻意“谄媚”嫌疑正在暂停使用AI声音模板

aixo 2024-05-22 15:42:24
大模型 2024-05-22 15:42:24

当地时间周一,美国科创公司发表声明宣布,由于旗下聊天机器人的一款名为Sky的女性配音引发网友广泛质疑,公司正采取措施解决问题,同时正在暂停使用这款AI声音模板。

需要说明的是,的语音模式其实是在去年9月底推出的,当初一共发布了5款配音,引发争议的Sky也在其中。当然,引爆争议的源头,还是上周在发布会上引入的“实时语音对话”。

除了声音酷似外 还有刻意“谄媚”嫌疑

在上周的发布会上,发布了最新的GPT-4o模型。通过反应速度的倍增,使得的语音功能顺滑到类似于“实时对话”的程度——你可以时不时插嘴打断聊天机器人,仿佛就像是在与真人交流那样。而且也能分辨出说话者的语气,回应的情感也更加强烈。

或许是为了庆祝人机交互的跨越式进步,首席执行官山姆·奥尔特曼在发布会结束后,马上发了一个单词——her,指的是科幻爱情电影《Her》的场景正在成为现实。在那部2013年的电影中,讲述了一个人类与人工智能助手陷入复杂恋情的故事。

也是因为这个比喻,令不少网友意识到了另一个问题:找的配音,是不是与好莱坞知名女演员、饰演过漫威宇宙英雄“黑寡妇”,以及给《Her》里面人工智能助手配音的斯嘉丽·约翰逊( )非常相近。

除了声音外,的新对话功能也引发了深一层的争议:除了与主持人进行互动外,似乎额外展现了“讨好”对话者的倾向性。例如在展示多模态对话功能时,聊天机器人会感叹“哇,你穿的衣服真是相当有型”。而在受到赞美时,还会说“别这样,你让我脸红了”。

有网友一针见血地指出:这让人感觉像是给男性写的女性角色。

由于发布会篇幅限制,同时新的语音模式还未向付费用户推送,目前并不知道在语音模式下是否会有讨好女性用户的一面。

对于这些争议,也在周日发布了一篇长文,虽然没有回应对话“谄媚”的问题,但明确对语音像女演员一事给予坚决否认。

揭秘:这些语音是怎么来的

在《的语音是怎么选出来的》一文中,披露,在去年9月推出语音模式前,公司进行了为期5个月的筹备,最终从400多份申请中挑选出了5个声音。

image

斩钉截铁地表示,人工智能的语音不应该刻意模仿名人的独特声音——Sky的声音并不是在模仿斯嘉丽·约翰逊,而是属于另一个专业女演员,这是她自然说话的声音。也表示,为了保护配音演员的隐私,公司无法对外公开他们的名字。

透露,在2023年初为了让“说话”,公司与一系列知名的选角导演、制片人合作定下了选拔“配音演员”的标准,例如:

有不同背景或能说多种语言的演员;一种听起来有“永恒”()感觉的声音;一种平易近人、能激发信任的声音;一种音色丰富,且温暖、引人入胜、充满自信、魅力十足的声音;自然且易于听取。

介绍称,在2023年5月,选角机构发布了招募配音演员的通知,在不到一周的时间内,总共收到超过400份申请,有来自专业配音演员,还有一些影视演员。

为了参加试镜,演员们被要求录制一份回复的剧本,涵盖的问题包括正念、头脑风暴旅行计划,以及与用户“日常一天”有关的对话文本。

通过海选,确定了一份14人的初选名单。接下来公司与每位演员讨论了AI语音交互和公司的愿景,包括技术能力、局限性、涉及风险以及已经实施的保障措施。之后的内部团队基于产品和研究的角度,最终选择了5个声音。这些演员在去年6月和7月期间飞往旧金山展开录音。

也在公告中强调,每位配音演员都获得了“高于市场最高水平”的报酬,只要持续使用他们的声音,这种待遇就会持续下去。

公司表示,计划在未来几周里向付费用户提供GPT-4o新语音模式的访问权限。未来也将给引入更多的声音,以更好地匹配用户的不同兴趣和偏好。