OpenAI 发布新款轻量级大模型 GPT-4o mini，推动大模型成本下降

aixo 2024-07-20 08:49:15

2024-07-20 08:49:15

虽然迟迟未发布下一代模型GPT-5，但在现有能力基础上，仍在更新模型，继续推动大模型成本下降。

当地时间7月18日，发布了新款轻量级的大模型GPT-4o mini。据介绍，GPT-4o mini即日起将在问答机器人中取代GPT-3.5 Turbo，企业用户则能从下周起访问GPT-4o mini。

“我们预计GPT-4o mini将扩大人工智能的应用，让人工智能变得更实惠。”官网文章称，GPT-4o mini的输入价格为15美分（0.15美元）/百万（词元），输出价格为60美分（0.6美元）/百万（约等于一本2500页的书），比GPT-3.5 Turbo便宜60%。

从模型能力看，称，GPT-4o mini在行业基准测试MMLU（评估大规模多任务语言理解）中获得82%的分数，低于GPT-4o的88.7%，高于77.9%的 Flash、73.8%的 3 Haiku和69.8%的GPT-3.5 Turbo。GPT-4o mini在MGSM测试（评估数学推理）和MMMU测试（评估多模态推理）中，分别得分87%和59.4%，均超过 Flash和 3 Haiku，但低于GPT-4o。

此外，GPT-4o mini上下文窗口为128K ，支持输出16K ，知识更新至2023年10月。介绍，GPT-4o mini还改进了处理非英语文本时的成本效益。GPT-4o mini能以较低成本和延迟执行广泛任务，如链接或并行多个模型调用（调用API接口）、将大量上下文输入给模型、通过快速的实时文本响应与人交互。

目前，GPT-4o mini可以生成文字和图像，未来将支持视频和音频。计划还在未来几天推出GPT-4o的微调。

目前来看，GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo，并通过降低价格吸引用户。

称，公司还将在提高模型性能的同时继续降低成本。相比2022年的text--003型号，GPT-4o mini的成本下降了99%。

“2022年全世界最先进的模型还是text--003，这个模型比现在的新模型差了很多，却贵了100倍。” CEO萨姆·奥尔特曼（Sam ）在社交平台上表示。

其他大模型厂商今年也在推动模型轻量化，追求“小而美”。此前有大模型业内人士告诉记者，参数较小的大模型今年来展现了颇高的潜力，通过加大数据量而不是加大参数量的方式训练，模型性能还有很大提升空间，好处则在于轻量大模型的使用成本低，可以扩大使用。

谷歌今年5月也发布了轻量级模型 1.5 Flash。 3月发布的 3系列中，则包括轻量级的 3 Haiku，在多项基准测试中 3 Haiku的得分高于GPT-3.5、低于GPT-4。微软今年也在推动部署轻量级AI模型系列Phi。微软此前称，今年4月推出的Phi-3系列是市面上性能最强、最具性价比的“小语言模型”，最小版本的Phi-3-mini性能可超过参数规模高出一倍多的模型，成本可能只有类似功能的模型的十分之一。

从价格上看， 1.5 Flash每百万起始价格为0.35美元，输出为1.05美元， Haiku每百万价格0.25美元，输出为1.25美元。GPT-4o mini的价格相对更便宜。

OpenAI

OpenAI 发布新款轻量级大模型 GPT-4o mini，推动大模型成本下降

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号