Anthropic 推出 Claude 3.5 Sonnet,性能超越 GPT-4,成本仅为前代五分之一
每经编辑 杜宇
的竞争对手在周四宣布了其迄今为止最强大的人工智能模型 3.5 。
3.5在阅读、编程、数学等领域多项性能测试中成绩超过GPT-4o等对手。它理解复杂指令更出色、幽默感增强,App处理速度是前代两倍、成本只有前代模型 3 Opus的五分之一,解读图表图形等视觉推理能力提升明显。还推出“预览版”,用户能从中编辑和迭代AI模型生成的内容,从对话式AI进化为协作式工作环境。
是像的和的一样的聊天机器人,在过去一年中人气激增。由前研究高管创立的,得到了包括、和在内的投资者支持。在过去一年中,完成了五笔不同的融资交易,总计约73亿美元。
这一消息紧随在三月份首次推出其 3系列模型和在五月份推出的GPT-4o之后。该公司表示, 3.5 比其之前的领先模型 3 Opus更快,并且是新推出的 3.5系列中的第一个模型。
在覆盖阅读、编程、数学和视觉等领域的多项性能测试中, 3.5 的性能略胜一筹,超过GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型 3 Opus。
的产品负责人 自信表示道:“对企业来说,重要的是AI是否能帮助他们满足业务需求,而不是AI在性能测试中是否具有竞争力,从这个角度来看,我相信 3.5 将领先于我们现有的任何其他产品,也领先于行业中的任何其他产品。”
定价方面,新模型定价与前代3 模型相同,即每输入百万token为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。Token是数据的细分单元,例如单词“”中的“fan”、“tas”和“tic”。
3.5 可以在公司的网站.ai和 应用程序中免费使用。 Pro和Team订阅者可以访问具有更高速率限制的最新模型。
“它在把握细微差别、幽默和复杂指令方面有显著改进,并且非常擅长以自然、易于理解的语调撰写高质量的内容,”公司在博客文章中表示。它还可以编写、编辑和执行代码。
还宣布了“”,它表示这允许用户要求其聊天机器人生成文本文档或代码,然后在专用窗口中打开结果。“这创造了一个动态的工作空间,他们可以实时看到、编辑和构建的创作,”公司表示,并补充说它预计对于代码开发、法律合同起草和分析、商业报告撰写等将非常有用。
和前一代模型 3 Opus相比,新模型在多个方面实现了性能上的提升。在一篇博客中写道:“它在把握细微差别、幽默和复杂指示方面有显著进步,在以自然、合理的语气撰写高质量内容方面也十分出色。此外,它还可以编写、编辑和执行代码。”
例如,与3 Opus相比, 3.5 在理解复杂指令和细微差别方面更为出色,甚至能够更好地把握幽默概念,尽管AI在幽默感方面通常表现不佳。
对于需要快速响应的应用程序,如客户服务聊天机器人,3.5 的处理速度是 3 Opus的两倍,成本只有其五分之一。
视觉分析方面,3.5 能够更准确地解读图表和图形,并能从存在失真和视觉伪影的“不完美”图像中转录文本。
除了新模型的推出,还推出了新功能“预览版”,这是一个工作空间,允许用户能够编辑和迭代AI模型生成的内容。
今年3月,推出了 3系列模型。随后,在5月份推出了GPT-4o。6月20日又推出了 3.5家族的第一款模型“ 3.5 ”。
在AI技术的不断演进中,公司的 3.5 模型虽未带来翻天覆地的变化,却代表了AI模型发展的现阶段现实:在期待重大科研突破的同时,实现逐步的性能提升,即在等待重大研究突破的同时,持续进行小步快跑。
随着像和这样的初创公司在生成式人工智能业务中获得动力,它们——以及像、、和Meta这样的科技巨头——已经成为一场人工智能竞赛的一部分,将这项技术整合起来,确保他们不会在一个预计在十年内收入将超过1万亿美元的市场中落后。
新模型的消息紧随该公司在5月首次推出的企业产品之后。
这项针对企业的计划,被称为Team,在过去几个季度一直在开发中,并涉及与30到50家客户的beta测试,这些客户来自技术、金融服务、法律服务和医疗保健等行业,联合创始人 上个月在接受CNBC采访时表示。这项服务的想法部分来自于许多同样的客户要求一个专门的企业产品,补充说。
“我们从企业那里听到的很多是,人们已经在办公室使用了,”当时说。
上个月,在的新产品首次亮相后不久,的联合创始人Mike 加入了该公司,担任首席产品官。,Meta旗下的前首席技术官,在任职期间将该平台的用户增长到10亿,并将其工程团队扩大到超过450人,根据一份发布的消息。的前安全领袖Jan Leike也在5月加入了该公司。
每日经济新闻综合公开资料