大模型价格战打响:免费时代已来,未来走向何方?

aixo 2024-06-01 09:17:31
大模型 2024-06-01 09:17:31

本报记者 秦枭 北京报道

大模型问世仅仅一年,就迎来了免费时代。

在字节跳动的大模型喊出比行业便宜99.3%之后,其“行业最低价”正在被不断打破。近日,阿里云、百度等巨头公司纷纷宣布将大模型价格降到更低,百度甚至直接宣布免费。科大讯飞更是宣布,其讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放。

多位业内人士在接受《中国经营报》记者采访时表示,尽管宣布降价的模型产品众多,但真正大规模、高性能并且支持高并发的大模型推理仍然需要收费,降价幅度有限。不过,可以明确的是,这场关于大模型免费使用的价格战才刚刚开始。也许很快人们就会看到,在大模型这场比赛中,大多数的大模型公司都将被淘汰。

没有最低,只有更低

5月22日,腾讯云正式对外宣布了全新的大模型升级方案,其核心模型之一的混元-lite模型价格策略发生重要调整,由原先的0.008元/千调整为全面免费使用。同时,最高配置的万亿参数模型混元-pro也进行了价格优化,从原有的0.1元/千下降至0.03元/千。

短短数日,百度、阿里云、腾讯、字节跳动、科大讯飞等各家大模型厂商均已投入到这场“价格战”中。而国内这场“价格战”最早可追溯到5月6日,幻方量化旗下发布第二代MoE(专家模型)-V2,API定价为每百万输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。

token既是大模型文本处理的最小单位,也是最基础的计量计费单位,用于衡量产品服务使用量和商业化收费标准。

大模型在生成内容的过程中,需要先把人们对话输入的文本转化成一个个的token,然后根据对上下文中信息的理解和分析,预测接下来应该生成的内容,并将这些生成的转换成人们熟悉的文本内容进行输出。

国内外的计算标准并不统一,按已有惯例,1个token≈1—1.8个汉字,而在英文文本中,1个token≈3—4个字母。

从各家公布的价格来看,一元就能买到字节跳动豆包主力模型的125万,大约是200万个汉字,相当于3本《三国演义》。同样,花一元在通义千问上最多可以买到200万,相当于5本新华字典。

“由于各家不同模型的规格和支持的长度各不相同,直接进行价格的横向对比过于片面。”一位业内人士对记者表示:“尽管此次降价为我们带来了一定的经济优惠,但可以看到,对于一些在特定使用需求下的模型或功能,一些厂家并没有采取免费,只是通过不同程度的降价手段来尽量保持市场地位。”

九三学社中央科技委委员陈根坦言:“这背后更多的是无奈与挑战。由于大模型构建在强大的算力基础之上,而这些算力的硬件投入与日常运维,都需要庞大的资本支出。因此,大部分公司都难以满足算力的支出需求。为了尽可能减少亏损,只能是最大程度地减少免费使用的范围。”

北京社科院副研究员王鹏认为,高性能模型推理服务主要面向企业级用户,他们对服务的稳定性、可靠性和性能有更高要求。企业级用户通常愿意为这些增值服务支付额外费用。

“幕后推手”

实际上,真正让国内大模型神经紧张的是引领了此次AI大模型时代的。

从2023年年初发布GPT-3至今,已经进行了4次降价。5月13日发布的GPT-4o不仅实现了性能跃升,价格也下降了50%。5月22日凌晨,在微软 Build开发者大会上,微软CEO纳德拉便表示,过去一年 GPT-4的性能提升了6倍,但成本降低到了之前的1/12,对应性能/成本提升了70倍。

“国产大模型大幅降价的核心在于最近不断推出的各种免费模式,并且以超乎大部分大模型公司预计的速度迭代了技术。这就意味着,更强大的模型采取了更开放的策略,并且便捷到不用注册就能使用。”陈根表示:“当然推动大模型免费的策略,主要的目的有两方面:一方面是为了更大程度地垄断用户数据与资源,以迭代其技术,并获取更多的用户行为数据;另一方面是为了提高并保持领先的用户数量。国产大模型厂家面对的免费策略,如果要留住用户,并且获得用户的人机交换数据来推动技术升级,就必然要跟进免费的策略。”

然而,在上述业内人士看来:“大模型最终的结果会像之前的互联网之战一样,只会剩下两三家而已。”

中国民协元宇宙工委创办人吴高斌表示,这种简单粗暴的“价格战”打法,可能会在一定程度上扰乱市场秩序,对大模型行业的健康发展造成影响。尤其对于中小企业及初创企业来说,面临巨大的竞争压力,可能会在价格战中逐渐消失。

天使投资人、资深人工智能专家郭涛认为,从目前的趋势来看,大模型行业已经进入了洗牌期。在这轮价格战中,中小企业和初创企业都面临着巨大的压力,部分企业可能会被淘汰。然而,这并不意味着这些企业一定会消失。一些具有核心竞争力和创新能力的企业仍然有机会在竞争中突围,成为行业的新领军者。

零一万物 CEO 李开复也强调:“大模型从训练到服务都很昂贵,算力紧缺是这一赛道的集体挑战,行业应当共同避免陷入不理性的ofo式流血烧钱打法,让大模型能够健康地蓄能长跑。”

的确如此,“千团大战”“O2O混战”“网约车补贴大战”等互联网企业的案例在此刻隐隐若现。

但在百川智能创始人王小川看来:“‘千团大战’‘网约车补贴大战’等背后都带有网络效应,那种商业模式改变了生产关系,改变了司机和乘客之间、外卖员和用户之间的关系。这次价格战并没有改变生产关系,而是直接做生产力供给,是B端市场的价格战。”

陈根也认为,这与互联网的概念炒作有本质的区别。大模型本身就是一项重资产、重资本的产业变革技术,并且在人和财两方面都是重资产模式。

他认为,从这个角度来看,免费对于大模型而言是一件好事,至少可以加速淘汰市场上各种杂乱无序的投机与炒作公司,让资源集中到头部公司中,从而加速中文大模型的完善。从目前的技术发展趋势来看,在加速实现通用AI的这一目标。这对于国产大模型而言,危与机并存,核心就取决于我们是否能率先在通用AI的技术上实现突破。

“终点”在哪儿

“站在整个 AI 业界的角度,我想说,降价是个拍脑袋就可以做的简单策略,但是真正的 to B 商业成功更难。”.ai创始人贾扬清公开表示,“今天不是说 API 贵才没有人用,而是因为要搞清楚,到底怎么用起来产生业务价值。”

2024年是大模型商业化落地的元年,应用落地成为行业竞争焦点。经过过去一年的发展,目前国内大模型的头部梯队已接近GPT-4的能力,打磨“内功”同时将目光瞄向用户,通过降价来换取更大的市场空间。而这场“价格战”的目的被归结为加速AI应用。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发:“我们预计未来大模型API的调用量会有成千上万倍的增长。”

科大讯飞方面表示,对开发者和企业而言,大模型大幅降价甚至免费,将很大程度解决大模型落地的成本问题,能够让开发者以更低的成本实现大模型在各个场景的落地,也加速了大模型技术的普及和商业化进程。

IDC预测,2026年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用的关键期。麦肯锡的报告也指出,在其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿—4.4万亿美元的增长。此轮国内大模型轮番降价,既是“百模大战”竞争的进一步加剧,也是大模型商业化拐点将至。

华龙证券在研报中表示,通过降低价格门槛,大模型厂商有望吸引更广泛的企业用户群体。同时,更多消费端用户有望免费使用基础AI应用,庞大的访问量有助于企业进一步提升大模型的服务能力,完成良性循环。

郭涛表示,大模型的“终点”可能是实现真正的通用人工智能(AGI),即一种能够像人类一样在各种任务和领域中表现出高水平智能的系统。目前,大模型在很多任务上已经取得了显著的成果,但要实现AGI仍然面临诸多挑战,如知识表达、推理能力、自适应学习等。

而在萨摩耶云科技集团首席经济学家郑磊看来,大模型的“终点”目前还没有一个明确的答案。大模型技术的发展是一个不断演进的过程,未来的发展方向可能会受到多种因素的影响,包括技术进步、市场需求、政策法规等。因此,对于大模型的研究和开发者来说,需要不断地探索和尝试,不断地适应市场和需求的变化。

海量资讯、精准解读,尽在新浪财经APP