OpenAI 新模型草莓即将推出,将对 GPT-4 及现有产品产生重要影响

aixo 2024-08-29 02:04:41
大模型 2024-08-29 02:04:41

“草莓”模型对新旗舰模型及GPT-4的改进都至关重要。

的“草莓”要熟了?

智东西8月28日报道,今天,外媒The 援引知情人士称,将在今年秋天推出代号为“草莓”(之前被称为Q*)的新模型。

“草莓”项目就是盛传已久的神秘Q*模型,据传是此前戏剧化的政变关键原因之一。它展现出了解答未见过的数学问题、复杂编程的更强大能力,当时让AI安全的研究人员都为之震惊。

这一项目当下最重要的用处有两个:一是改进等现有产品,二是帮助开发下一代旗舰模型Orion。这些都指向了想要保持自己在大模型领导地位,并获得更多收入机会的决心。

不过,近日还被曝出已经向美国国家安全官员展示了“草莓”项目,这可能是这家创企安全部门高管频繁离职背景下,想要让产品提高透明度的举措。

本月初, CEO Sam 在推特暗戳戳秀自家花园5颗草莓的时候,就有网友根据草莓成熟时间跳了预言家:GPT-5可能在未来4-6周内确认发布。这正好和现在秋天可能发布的时间点对上了。

openai上市公司股票_OpenAI_openai股票

网友猜测草莓的成熟时间

可能在不久的将来,我们就能看到“草莓”项目被直接集成到了里。

01.稳住大模型霸主地位,“草莓”能帮新旗舰模型减少幻觉

“草莓”项目是新取得的重要技术里程碑,能解决以前从未见过的数学问题,经过训练可以解决涉及编程的问题,回答产品营销策略等主观问题、解决复杂字谜游戏都可以。

一直没有浮出水面的“草莓”模型,近段时间冲到大众视野的迹象变得更加明显。

除了秀5颗草莓,还有研究员 发文在吃晚餐,盘子里是草莓。

openai上市公司股票_OpenAI_openai股票

研究员 发文在吃晚餐

新模型脚步可能越来越近的现实情况下,这可能是想要保持自己在大模型领域霸主地位的举措,毕竟它的竞争对手已经拿出了不少与最新旗舰模型GPT-4性能相当的模型。

尽管目前的模型仍是企业和AI应用程序开发者的首选,但来自谷歌、xAI、和Meta等其他企业的模型正在诸多排行榜上迅速赶上。

因此,的前景在一定程度上取决于它最终能否推出一款代号为Orion的新旗舰模型。该模型旨在改进其去年年初推出的旗舰模型GPT-4,后者于去年年初推出。

而“草莓”项目的发布就对Orion的训练至关重要——它可以为Orion生成高质量训练数据,减少幻觉。

“草莓”模型可以帮助克服获取高质量数据的限制,从而利用从互联网上提取的文本或图像等现实世界数据来训练新模型。

智能体创企 AI首席执行官、 前首席架构师Alex 认为,使用“草莓”模型生成更高质量的训练数据可以帮助减少其模型产生的错误数量,即所谓的幻觉。该模型之所以能够做到这一点,是因为“训练数据中的歧义较少,所以它猜测的次数较少”。

除了下一代旗舰模型,“草莓”项目的推出也能改进的现有产品。

内部正在通过“提炼”过程来简化和缩小“草莓”模型,以便在Orion发布之前将其用于提升现有产品的性能。这种“草莓”模型的较小、简化版本,能够在保持与较大模型相同性能水平的同时,更易于操作且成本更低。

一个显而易见的想法是将“草莓”模型改进的推理能力融入中。这可能意味着用户虽然获得了更准确的答案,但速度会变慢。

因此,这可能不适用于搜索引擎等用户希望能获得立即响应的工具,但非常适合对时间不太敏感的用例,例如修复中的非关键编码错误。

那是不是在不久的将来,用户能够根据请求的时间敏感度来自主选择打开或关闭“草莓”模型。

02.收入告急?今年夏天已向政府官员展示

面对资金实力雄厚的科技大公司以及疯狂吸金的创企劲敌,需要开辟更多的收入机会。

尽管相比于一年前业务增长飞速,目前其向企业销售的API和订阅收入增长了约两倍,达到每月2.83亿美元,但每月的亏损可能更高。The 基于此前未披露的内部财务数据和参与该业务的人士的分析,今年可能亏损高达50亿美元。

知情人士透露,希望为公司筹集更多资金,并寻找减少损失的方法。作为与微软达成商业合作的一部分,自2019年以来已从微软筹集了约130亿美元,该合作将持续到2030年。但合作条款可能会发生变化,包括如何向微软支付租用云服务器的费用以开发其模型,这也是目前是最大的成本支出。

鉴于现有的等对话式AI在航空航天和结构工程等数学密集型领域并不擅长,解决棘手数学问题的模型可能是一个潜在的有利可图的应用。同时,数学推理的改进也可以帮助模型更好地推理对话查询,例如客户服务请求。

谷歌和一些初创公司也在开发推理技术。上个月,谷歌的模型在国际数学奥林匹克竞赛中击败了大多数人类参赛者;最新的模型可以编写更复杂的代码、回答有关图表和图形的能力;还有一些创企通过将问题分解为更小的步骤来提高推理能力,但这种方法速度慢且成本更高……

openai股票_OpenAI_openai上市公司股票

谷歌、等公司正在开发推理技术

因此,“草莓”模型的发布可能会为推理技术带来新的思路。

今年5月就曾透露“我们觉得我们拥有足够的数据来开发下一个模型。我们已经进行了各种实验,包括生成合成数据。”他当时可能指的就是Orion模型。

一位直接知情人士称,在今年夏天向国家安全官员展示了“草莓”模型的能力。

此次演示可能是努力向美国政策制定者提高透明度的一部分,近几个月来,联合创始人之一John 等几位安全部门的高管离职,这也使得业界对于的技术安全更加关注。

03.结语:寻求开辟更多收入机会

推出“草莓”模型是是在大模型产业中永无止境的战斗的一部分,它要领先于其他资金雄厚的竞争对手,稳固自己在大模型领域的霸主地位。此外,这项技术还对未来的产品产生影响,如解决多步骤任务的智能体等。

等大模型玩家同样希望借此能在这一领域开辟出更多的收入机会,以支持高昂的大模型训练费用。