大模型的现在进行时:走出对话框,走向产业端
红杉资本在Al Ascent 2024的开场演讲中提到,大模型的创造能力和推理能力,第一次实现了以类似人类的方式进行交互,将支撑起数十万亿美元的市场。
然而和AGI的遥远梦想相比,大模型的创业者们却不得不正视摆在眼前的现实挑战:大模型的训练成本高达数千万元,但至今还鲜见杀手级应用,在“先射箭后画靶”的质疑声中,生存仍然是最先要考虑的问题。
一面是重构千行万业的机会,一面是必须要翻越的高山,2024年的大模型市场,还会翻出怎样的浪花?
01 大模型的数量快速收敛
据不完全统计,国内已经有200多个大模型,并且引发了“百模大战”的说法。可稍微理性一些就能明白,“大炼模型”不过是早期过于狂热的产物,不少大模型存在“套壳”的嫌疑,有机会上牌桌中终归只有头部几家。
市场研究机构CB Insights发布的《2023年人工智能行业现状报告》显示,2023年中国AI领域的投融资数量约为232笔,同比下降38%;融资总额约为20亿美元,同比下降70%。大模型热度空前的局面下,资本市场却罕见“降温”。
对2023年的融资数据再深挖一层,融资额度在5000万元以上的项目只有26个,其中还包括少数几家企业的多轮融资。而大模型本就是一门“烧钱”的生意,那些拿不到钱的创业者,注定会悄无声息地消失。
事实也是如此。大模型热潮进入到第二年,真正有机会进入决赛圈的企业,似乎只剩下两个流派。
一派是有资源、有技术、有人才的科技大厂,比如百度的文心大模型、阿里的通义系列大模型、华为云的盘古大模型等。在ChatGPT走红之前,这些科技大厂就已经开始探索大模型的方向,对大模型价值的理解也更加深刻。
比如华为云在2023年7月发布的盘古大模型3.0,被定位为“一个面向行业的大模型系列”,注意力聚焦在了产业层面。百度创始人李彦宏也曾多次公开表示,“卷大模型没意义,卷AI原生应用才有价值。”
另一派是被互联网大厂青睐的明星创业者,目前主要是智谱AI、月之暗面、百川智能、零一万物和Minimax,被媒体形容为“大模型五虎”。
五家“独角兽”拿走了大模型领域40%以上的融资,但总融资额不到200亿元,而亚马逊已经为Anthropic投资了40亿美元,微软对OpenAI的注资早已超过100亿美元。“缺钱”仍将是国内大模型创业者的常态。
需要说明的是,现阶段的大模型市场远没有到决赛时刻,淘汰赛才刚刚开始,新的大模型仍有机会崛起,一些熟面孔也可能跑不到最后。但可以笃定的是,大模型不是一场毫无章法的无序竞争,并不难猜测接下来的走向。
当前大模型被普遍认可的有三个价值,即效率、体验和创造,且都不缺少落地的土壤:在体验层面优化人机交互,创造层面已经产生了大量的AIGC内容,效率层面的直接例子就是编程和研发效率的提升。
而价值体现的唯一路径,正是将模型和各行各业的需求融合。也就意味着,“炼大模型”将是小部分玩家的战场,将大模型的能力落地到千行万业,才是每一个开发者都可以参与其中的事,才会是大模型的终极方向。
02 走出对话框,走向产业端
互联网技术的普及,在很多人眼中是先To C再To B的路线,不管是电商、搜索还是网络游戏,目标对象都是个体为单位的消费群体,直到国内的人口红利见顶,“产业互联网”的概念才渐渐被讨论。
以至于在大模型浪潮兴起后,不少人想要重走互联网的“老路”。可把视角放大一些的话,互联网的繁荣其实是网络传输技术落地应用的“果”,借用业内普遍将算力比作电力的比喻,算力和数据是“燃料”,而大模型对标的是蒸汽时代的发动机、电力时代的电动机,扮演的是“引擎”的角色。
以电动机为例,在日常生活中无处不在,却几乎没有人会注意到,因为创造价值的是电动机驱动的空调、洗衣机、榨汁机等产品。沿用同样的逻辑,对话式AI就像是给电动机加了扇叶,目的是给人们演示电动机的作用,想要进一步释放大模型的价值,必须要走出对话框,走向产业端。
科技大厂选择“面向行业”的原因也就不难理解。尽管大模型产业应用的时间并不长,价值却早已被验证。
早期是科研等领域的试水。
2018年的时候,谷歌大脑团队就宣布完成了可识别蛋白质结晶的计算机视觉技术,用于辅助多种疾病的药物研发。
预训练大模型诞生后,不少科研机构开始将大模型能力应用到药物研发领域。比如西安交通大学第一附属医院的刘冰教授团队,基于盘古药物分子大模型发现了全球40年来首个新靶点、新类别的抗生素,将先导药物的研发周期缩短至1个月,研发成本较传统方式降低了70%。对比新药研发“平均需要10年时间、花费10亿美元”的铁律,大模型的能力几乎可以用“降维打击”来形容。
然后是大中型企业的探索。
不同于外界印象中的“守旧”形象,拥有丰富私有数据资源的大中型企业,在大模型落地应用中,可以说是名符其实的先驱。
可以找到的案例也更多。蚂蚁金服发布了金融大模型,涵盖理财顾问、保险代理、投研、金融营销、保险理赔等业务;山东能源集团在华为云上搭建了“盘古矿山大模型”,涵盖9大专业40多个应用场景,推进人工智能大规模“下井”;广发证券通过盘古大模型大幅提升了预测精度,企业财务异常识别准确率高达90%……有别于自上而下的赋能,大中型企业已经学会了使用工具。
现在越来越多行业开始拥抱大模型。
比起缺乏付费意愿的C端用户,一旦大模型释放的生产力被印证,B端客户对新技术的渴求要更加强烈。
IDC曾在2023年第四季度进行过一场AI应用调研,结果显示超过九成企业已经布局了AI应用,已经接触大模型并且有明确预算的企业占比24%、34%的企业开始制定潜在应用场景、35%的企业开始进行试点,仅有7%的企业对生成式AI完全没有规划。历史上的每一次工业革命,都离不开新旧生产力迭代,只要大模型能够做出场景创新,大大小小的企业总能在权衡后做出正确的选择。
不过,大模型的落地是个相当复杂的系统工程,除了在方向上达成共识,还要找到更高效、更普适的路径。
03 终端和大模型加速融合
智能手机、PC、智能汽车、智能音箱等数量庞大的终端,俨然是大模型落地中不可或缺的一环。如果把大模型比作“超级大脑”,智能手机、智能汽车等终端就是人类走向AI时代的“器官”。
所以在过去一年中,端侧AI的说法被频频提及。
华为在2023年8月的鸿蒙4.0发布会上,官宣了小艺智能助手的升级,不仅支持用户使用自然语言进行交互,还能帮助用户输出小作文、图片、视频等内容;三星将生成式AI作为Galaxy S24系列的最大卖点,实现了即圈即搜、通话实时翻译、笔记助手;即使是慢了半拍的苹果,也在不久前公布了自己研发的MM1多态大语言模型……大模型和终端的融合已经是一种现在进行时。
端侧AI的理念,让外界看到了人机交互再次被重构的可能。就像触摸屏淘汰了传统的键盘和鼠标,打开了超级APP的格局,大模型让“人机对话”成为现实,和智能助手聊聊天就能点外卖、打车、购物。
倘若只是从“入口之争”的角度看待大模型和终端的关系,不仅和大模型走出对话框的趋势相悖,也低估了终端厂商的决心。
不久前结束的第21届华为分析师大会上,华为副董事长、轮值董事长徐直军在主题演讲中提到了两个不应被忽略的信息:
第一个是打造统一的开发者平台,面向鲲鹏、昇腾和鸿蒙生态所有的开发者,将基于华为云打造一个统一的开发者平台,给开发者一个统一的入口,让开发者在这三个生态上自由地移动。
第二个是打造“小艺”超级智能体,基于盘古大模型把“小艺”打造成为超级助手,并把HarmonyOS Next打造成为一个原生智能的操作系统,统一AI能力底座,构建系统级原生智能。
统一的开发者平台和系统级原生智能,既是进一步打通产业端和消费端的关键,也是对大模型和终端深度融合的注解。
比如开发者可以通过盘古大模型理解和匹配用户的高阶意图,结合意图框架做服务管理和分发,精准地触达目标用户,在电商、政务、金融、教育等场景中提供用户需要的个性化服务;再比如加速大模型工程化,在数据工程、模型开发和应用开发等环节外,不断简化应用部署和分发的流程,原本需要面向不同终端开发不同APP的服务,也许只需要唤醒“小艺”就能满足。
做一个大胆的预测,在HDC2024披露更多关于盘古大模型5.0以及端模融合的消息后,将有越来越多的终端厂商跟进,讨论的焦点将不再局限于端侧大模型,而是怎么打通生态、怎么为开发者赋能,跳出“入口之争”的思维误区,推动大模型从尝鲜期走向落地期,从“好玩”走向“好用”。
有别于行业端落地的润物无声,数以亿计、乃至十亿计的智能终端,直接影响着普罗大众的体验和感知。终端和大模型的结合,不单单是终端厂商的“战争”,关系着每一个开发者的前途命运。大模型的行业应用和用户教育,不再是两条平行线,2024年将是交叉的开始。
04 结语
回顾每一次工业革命的历程,比发明更重要的其实是推广,怎么将新技术推向千行万业。
大模型代表的新一轮工业革命也是如此。大模型的价值,不在于有多少参数,甚至不在于有多么“逆天”的能力,而是让大模型被越来越多的人使用,通过场景化的创新产生价值。2024年也许就是大模型市场的拐点,不再是“炼模型”的时代,而是“用模型”的时代。