Meta 开源大模型 Llama 3.1 与 OpenAI 低价策略 GPT-4o mini 之间的竞争

aixo 2024-07-30 20:34:37

2024-07-30 20:34:37

Meta与分别代表着开源与闭源的两条技术路线。关于开源和闭源的斗争由来已久，此前在彭博社的采访中，扎克伯格更是公开嘲讽：“阿尔特曼的领导能力值得称赞，但有点讽刺的是公司名为却成为构建封闭式人工智能模型的*。”

面对Meta这次的大招，以低价策略应战。

Meta公布Llama 3.1两个多小时后，发布消息：公司推出了GPT-4o mini微调功能版，从现在到9月23日可免费使用。据了解，GPT-4o mini的输入费用比GPT-3.5 Turbo 低90%，输出费用低80%。即使免费期结束，GPT-4o mini的价格也比GPT-3.5 Turbo低一半。

价钱打折，但产品能力不打折。据了解，GPT-4o mini比经典版本GPT-3.5 Turbo能力更强，GPT-4o mini的上下文长度为65k ，是GPT-3.5 Turbo的四倍，推理上下文长度为128k ，是GPT-3.5 Turbo的八倍。

这就意味着，若使用GPT-4o mini微调版，就可以享受：以实惠的使用费用，使用更长的上下文、更聪明的*大模型。阿尔特曼更是在推特发文表示，GPT-4o mini以1/20的价格在lmsys上实现了与GPT-4o接近的性能表现，他还希望大家能够多多使用GPT-4o mini 微调版本。

此次以发布GPT-4o mini 微调版为盾，不仅是对Meta开源大模型步步紧逼的反击，也同时将硅谷AI价格战的火药味推得更浓。

用价格“围剿”

即使推出可免费使用的小模型，但比起同为大模型的产品，Llama 3.1 405B的价格比GPT-4o仍然要低很多。

公开数据显示，Llama 3.1的价格在平台上是每1百万的输入/输出价格是3美元，而GPT-4o每1百万的输入价格是5美元，输出价格是15美元。此外， 3.5 的每1百万的输入价格是3美元，输出价格是15美元。

这不是硅谷在AI方面的*次“价格战”。

今年5月，发布GPT-4o并支持免费试用，调用API的价格也比GPT-4-Turbo降低一半——打响了硅谷大模型价格战*枪，同时这也是2023年起的第4次降价。7月18日深夜，GPT-4o mini的正式亮相，与GPT-3.5相比性能更强，也更便宜，连阿尔特曼都曾建议大家不要再用GPT-3.5了。

用低价“围剿”已成大模型公司们的惯例。公开信息显示，与GPT-4o相比较，各大公司的最新发布的产品分别是：Meta的Llama 3.1，谷歌的 1.5 pro， 3 ，新近的 AI，这些最新大模型价格均低于GPT-4o。

国际头部大模型公司产品价格表，信息来源各大模型官网。制表：孙欣

而大模型的价格战在国内也已开始。5月6日，初创大模型公司深度求索将输入价格定为1元/百万。紧接着智谱AI的GLM-3-Turbo模型、字节跳动的豆包大模型，以及阿里巴巴的通义系列模型、百度的文心一言模型纷纷跟牌。

低价，正在成为一种趋势。

小模型或将成为AI新风口

一直以来，大模型的发展受困于成本。斯坦福HAI研究所发布的《斯坦福2024年人工智能指数报告》指出，AI模型的培训成本已经达到了前所未有的水平。例如，的GPT-4估计使用了7800万美元用于计算训练，而谷歌的 Ultra花费了1.91亿美元用于计算。2017年训练最初的模型的成本仅为约900美元。

而现在，小模型成了AI公司们降本增效的利器。

掀起新一轮价格战前，先手开卷小模型。7月18日，发布小模型GPT-4o mini，并称其为“迄今为止*成本效益的小模型”，正是上周（北京时间7月25日凌晨）宣布免费使用的GPT-4o mini微调版的真身；苹果公司在 Face上发布了DCLM-7B开源小模型；不久后，英伟达和法国明星AI独角兽联合发布了名为 NeMo的小模型，称可以直接替换任何使用 7B的系统。

小模型，通俗来说就是比大模型处理数据能力略小的模型，可以理解为mini版的大模型。在AI领域，参数规模越大，大模型学习能力越强，诸如GPT-4这些模型通常拥有数十亿甚至数百亿的参数。然而据介绍，小模型GPT-4o mini在MMLU上的得分为82%，甚至某些表现优于大模型GPT-4。

对大部分用户来说，小模型是大模型的“平替”，*性价比。尽管小模型在处理复杂任务上不具优势，但在小任务上具备更快的推理能力。同时对计算机存储需求也更小，耗能也更小。根据各公司的大、小模型产品对比来看，小模型价格较低。根据的统计，美国AI公司主流“小模型”中，GPT-4o mini的价格*，在无需处理复杂任务的“普通用户”中或许将更受欢迎。

低价来自成本的降低。阿尔特曼在推特上发文指出，2022年世界上*的模型text--003，它比GPT-4o mini差得多，但成本要贵上100多倍。这一波抢先布局小模型，就是想通过显著降低AI使用成本，扩大AI使用范围。

OpenAI

Meta 开源大模型 Llama 3.1 与 OpenAI 低价策略 GPT-4o mini 之间的竞争

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号