李开复创办零一万物,逐浪大型语言模型,他究竟看见了什么?

aixo 2024-08-26 16:08:56
大模型 2024-08-26 16:08:56

LLM_llm法学_llm模型

李开复

出生:

1961年

经历:

曾任苹果、SGI和微软等企业高阶主管,于微软工作任内创立微软中国研究院(微软亚洲研究院),后至担任全球副总裁与大中华区总裁。2009年创立创投机构创新工场,2023年创办零一万物

荣誉:

《时代杂志》百大全球最具影响力人物、《时代杂志》全球25大AI领袖

文:曾子轩

“我这个年纪创业(能招募人才),肯定不只是因零一万物的AI算法做得比别人好。”说出这句话的,是年过花甲的李开复。当人工智能掀起巨潮,他却重回海景第一排逐浪,他究竟看见什么?

李开复创办的“零一万物”,主攻瞩目程度最高、竞争也最激烈的大型语言模型( Model, LLM)。既要对标美国世界级的玩家,也得和中文世界的大厂和新创业者抗衡,不只比拼模型性能,还要在价格上维系竞争力。

从硬件、基础建设、开发者工具、应用到模型,生成式AI的每个领域都已烽火连天。李开复如何深度解读这场大型语言模型之战?

注入智能,AI赋能一切应用

自2009年创办并操盘“创新工场”,李开复在科技创投领域耕耘超过十年。去年3月隐士出山,亲自下场筹划,以基础模型为题创业,只因他已看见全新机会。

去年接受《远见》专访,李开复表示,在生成式AI的带动之下,软件应用将能重生、用户接口出现改变、商业模式更会进化。一年过去,预言逐步成真。

全面进化,已能读懂图片和声音,微软让笔电搭载,苹果更宣言,将在手机中注入智能,从装置到应用,让时隔一年再度接受《远见》专访的李开复乐观表示,“」时代已然来临。

他分析,计算机时代能用“ every ”总结,当人们的办公桌放上计算机,提升生产力的便成为杀手级应用。“ ”则是移动网络时代的标记,四处迁徙的消费者时刻连网,应用程序能获取位置信息,Uber、美团因此带来价值。

将时间快转至今,得到AI赋能的应用,不再只是解决疑难杂症,甚至代理人类完成工作。生成式AI与大型语言模型之所以标志AI2.0的开展,正是因为AI作为生产要素的成本下降,从专用走向通用,运算不再昂贵,应用就此得到智能,“你要善用这些应用程序的聪明才智,做过去不方便或不可能做的任务。”

推论成本将是关键

不过,虽然生成式AI刮起的旋风未停,但目前获益最多的,仍是卖铲子的人。云端服务商对AI服务器的需求激增,催动辉达等芯片生产商接满订单,效应也外溢到台厂第三方,但真正让消费者有感的应用还在半途,软件厂商也在寻觅应用场景。

李开复解读,无论是对企业或者消费者,生成式AI都有市场。前者在企业后勤单位如财务、人资领域中,增加员工效率的效益已浮现,帮助消费者完成任务的用法,也在陆续发生。

然而,AI时代和移动时代的巨大差异之一,在于每次大型语言模型运作服务时,皆会产生推论成本。“在移动互联网时期,都是先获取大量用户,不收任何费用,待用得开心后,再从他们身上收费。”搜索引擎、社交网络和短视频应用,皆遵循此法则。

⋯⋯现在每次回答问题,我们都在烧GPU,最后用户不付费就破产。”无论是和对答,还是以Bing生成图像,与微软都得在云端上消耗算力,这也是后者力推AI PC的原因之一。

但AI时代很难靠着补贴式战法打下江山,因为用户变多,不会带来规模经济成本降低的益处。“以前你去烧用户(成本补贴),烧不掉太多什么,

即便向消费者收费,若费用无法超过获客成本和推论成本的总和,服务仍无法延续。李开复以近期他提倡的概念“TC-PMF”( Cost- Fit)提醒生成式AI创业者,在寻找产品与市场契合程度时,需关照技术成本的变动。

静态来说,要在模型价格和生成内容质量之间取舍,例如,GPT-4表现优异但所费不赀,GPT-3.5同等模型效果差却便宜。动态来看,每过9到12个月,基础模型能力便会显著升级,例如GPT-3.5至GPT-4的换骨夺胎,以及GPT-4到GPT-4o的化蛹为蝶。

当新模型面世,调用旧等级的模型费用,将下降到原先的十分之一,因此创业者不能只看PMF,而要考虑变动的TC,惟有掌握动态变化,才能生存。

李开复认为,自研基础模型、搭建AI基础设施、推出AI优先应用的“三位一体”战略,是大模型创业者第一时间捕捉到TC-PMF的关键,“零一万物”目前正在实践当中。

llm法学_LLM_llm模型

南港信息展AI摊位,苏义杰摄

中美AI竞争各有优势

有许多人关注科技战,对中国发展AI带来负面影响。李开复表示,添购显卡的问题没有想象中严重,关键差异在融资。“美国的创业公司,比中国公司更愿意花钱买GPU,理由就是美国市场给这些有能力做大模型的公司,更高的估值。”

这既影响企业发展走向,也影响商业模式。李开复解释,虽然中国大型语言模型企业算力较少,但人们愿意花心思、下苦功,“刻苦耐劳做一些不那么光鲜耀眼的事情。”例如,调校GPU、修改架构和配合软件,挤出每张显卡的最大价值。

李开复分析,美国企业人才顶尖,能开拓出科技最尖端的创新,中国则擅长改善产品、在成本效益间找到甜蜜点。“美国公司做不出拼多多,但是中国公司也做不出。”即便大型语言模型领域中国落后半年,但很难说后发一定无法先至。

以大型语言模型企业来看,对比中、美环境,李开复分析,后者消费者付费意愿和客单都高于前者,这让中国创业者需要在商业模式上下功夫。“因为用户付费习惯不够多,反而要逼自己找新的商业模式。”例如,当年主打免费的淘宝,便是靠着收取广告费的另辟蹊径击败eBay。

观察零一万物发展,既有面向消费者的应用“万知”,同时也在中国海外推行企业用服务。万知背后旗舰模式YI-Large,中文能力足以和GTP-4o相提并论,因此消费者愿意埋单,这正是由技术实力撑起;在海外市场拓展也颇有成绩,无论是付费意愿或者平均客单价都高过中国竞业,稳定的SAAS服务,让零一万物不用在客制化AI、无法规模化的红海中,与他人争抢微薄利润。

虽然阿里巴巴、百度和科大讯飞等大厂在价格战中逐底,甚至有部分模型的调取费用压低至零,但李开复并不担忧价格战,甚至正面看待降价情形。不忧虑自家企业,全因零一万物模型性能优异,在多项国际评测中成绩斐然;不担心整体产业,则是因降价反映技术进展,更代表生成式AI将有机会扩散到更多地方。

他坚定表示,大型语言模型至少还有两代巨大的模型提升,不只带动应用发展,同时降低推论成本的定价,未来两年生成式AI应用将会看到剧烈竞争。

在李开复眼里,想在大型语言模型竞赛做出成绩,是最短的时间窗口之内,最有挑战性的难题。

正如《离骚》中所言,“路漫漫其修远兮,吾将上下而求索。”一辈子在人工智能领域打滚,如今重返前线迎难而上,这是李开复的“吾虽艰险,心中乐之”。

(本文为第22届《远见》高峰会专稿)

LLM