Claude 3.5 Sonnet 推出，性能优于 GPT-4o 和 Gemini 1.5 Pro

aixo 2024-06-21 14:29:29

2024-06-21 14:29:29

IT之家 6 月 21 日消息，今天（6 月 21 日）推出了 3.5 ，这是 3.5 系列的首个模型版本，在各项评估中优于的 GPT-4o 和谷歌的 1.5 Pro。

3.5 在前代的基础上迭代升级，性能更快，编码、视觉和自然语言理解能力更强。

3.5 属于中等尺寸模型，介于小型 Haiku 和高端 Opus 之间，但声称，根据内部基准测试，的性能甚至超过了顶级 Opus。

据称， 3.5 处理输入的速度是 Opus 的两倍。该公司称，在编码挑战方面，超越了之前的 Opus 模型，修复了 64% 的代码错误，而 Opus 只有 38%。

基准测试结果还显示，在 9 个总体类别中的 7 个类别、5 个视觉任务中的 4 个任务上击败了竞争对手。

IT之家翻译官方新闻稿如下：

3.5 是我们迄今为止最强大的视觉模型，在标准视觉基准测试中超过了 3 Opus，在解读图表等需要视觉推理的任务中，这些阶跃式的改进最为明显。

3.5 还能从不完美的图像中准确地转录文本，这是零售、物流和金融服务的核心能力，在这些领域，人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。

为确保安全，将提交给英国和美国人工智能安全研究所进行外部评估。他们发现，经过改进后，该模型仍处于 ASL 2 级水平。还利用儿童安全专业知识对助手进行了更新，以更好地预防潜在伤害。

Anthropic