李开复:模型六小虎中充分暴露在镁光灯下的创始人,工作行程魔鬼,每天仅休息 5 小时

aixo 2024-11-10 13:08:29
大模型 2024-11-10 13:08:29

李开复很忙。

在过去的一个月左右时间里,他在国内办了两场重要的发布会,在硅谷参加了多场公开演讲,又去了趟沙特等中东国家参加投资会议,在这些公开活动之外,他密集见人,并接受了多个专访,还参与了一场长达2个多小时的直播。

李开复显然成了今天“模型六小虎”里,难得的充分把自己暴露在镁光灯下的创始人。成了外界观察这些明星公司现状的难得切入口。

这几乎是个魔鬼行程。“今年李开复平均每天休息5个小时左右,其他时间都在工作。”零一万物内部人士告诉硅星人。这与十年前媒体观察他的工作状态并无二致,当时他一天的工作从5点多起床就开始了,给各项目负责人写各种关于产品、推广建议的长邮件。

这些行程都在围绕他零一万物创始人的身份展开,这家他六十岁之后创立的的公司正经历挑战,而承诺“十年都不会变现”的他显然要负责寻找答案。

显然是答案的重要来源。

在硅谷,李开复见了很多人,与内部一些年轻人进行深度交流,发现他们对AGI(通用人工智能)过度乐观;一些的前员工笑着告诉李开复,从来不相信生态系统,只想花钱烧出AGI,“到时候所谓APP就是一层薄皮,挂在AGI上面,用户要付钱给你们么,还不如付钱给我们。”在和一位斯坦福经济学教授攀谈时,对方提到用 o1等于能少招一个博士生。

这些都令李开复对的未来垄断感到忧心忡忡。

怎么应对?预训练成了其中的决策关键。在他与硅谷的各路人马交流的同时,国内传出的“放弃预训练“传闻,让李开复很生气。今年起,零一万物、、月之暗面、智谱AI、百川智能、阶跃星辰,从融资上开始处在最前列,被称为GenAI行业的六小虎,但他们也在同一时间开始受到质疑。不再做预训练是其中最微妙的指责——这些公司如此高估值的根基、以及外界如此高关注的缘由,都是他们在预训练模型上的能力,如果不再做了,就意味着有人掉队了。

这不只是中国公司的困境。Grand View 北美合伙人 Xu日前发文指出,海外还在做预训练的基础模型公司也只剩5家,OAI,XAI,Meta,,。与技术能力上有明显区别的和都属于半掉队的状态。

这背后是能掌握的资源的差异在变大,有媒体曝光了马斯克旗下人工智能企业xAI的 AI超级计算机集群,其花费仅十余日集成了个英伟达()H100 GPU,号称是目前全球最强大的AI超级计算机集群。同时也在不停传出在芯片等领域布局的动作,Sam 的超级计算中心也在建设中。

“零一万物一直在做预训练。”李开复在朋友圈直接辟谣。“建议自媒体可以先删稿。”

然后零一就连续举办了两场发布会,李开复想用模型说话直接否定传言。按照全球惯常节奏,基础模型公司每三个月需要完成一次重大升级,每9-10个月需要放个大招,推出新模型。而零一万物比其他家节奏明显更勤奋,他们保持了5到6个月出一款新模型的节奏,去年11月提出开源的首款预训练大模型Yi-34B,今年5月提出闭源的Yi-Large,再到10月16日推出当家预训练大模型Yi-。李开复拿UC伯克利大模型竞技场( Arena)作为评判标准,他形容“零一万物是世界第三的模型公司,做出了世界第六的模型,打败了所有开源模型。”

从效果来看,这些新模型基本都能够达到5-6个月之前世界领先的水平。

“这6家公司融资额度都是够的,我们做预训练 run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”李开复在发布会上被问到预训练的问题时这样回答。

这句话里没说的是,能决定这些付得起的钱是否要付的可能不只是这些创业公司自己。

也就是,预训练如果是要做的,那更关键的是认清现实后要怎么做。

不仅在硅谷直接感受到们训练模型的情况,在中东,李开复也感慨于当地土豪一掷千金的投入,他关心正在聚集于此的庞大数据资源和计算资源将带来什么变化。这些都是他近期不停主动提到的话题。

惯常花费1亿美金左右的预训练作为一种深度学习模型训练的策略,能对模型性能提升起到重要作用,而当预训练的 Law逐渐被推理侧替代,已有大量10亿美金级公司开始认为纯粹的基础模型预训练意义已经不大。

“我们用了大约2000张H800,训练了一个月。”李开复在上周的一场直播里说,之后他也在多个国际活动上强调了这个成绩——他们用马斯克二十分之一的GPU,训练出了一个可以跟Grok打平的预训练大模型Yi-。

他形容零一花了300万美金“白菜价”训练出了一个当家预训练大模型。

这显然进入了一个新的阶段,上一个阶段,大家都在通过“烧钱”训练模型来得到更多弹药,但估值的抬高,以及模型能力大迭代的放慢,伴随而来的就是融资难度的加剧。有媒体报道,随着这几家大模型公司估值跨上200亿元台阶,其最新单轮次融资规模达50亿元左右。当上述AI独角兽初创估值都超出了VC射程,到达了需要说服拥有更成熟财务模版PE投委阶段时,他们就开始面临“灵魂拷问”。

李开复在最近的直播中提到,“我告诉要求看EBIT(息税前利润)的PE投资人,我谈不出哪一天打平,就不要想拿你的钱,我看不出单位经济模型(Unit ,指平台从单个用户身上获取的价值),也不要想拿你的钱。”

估值已经奇高的大模型初创面临不太友善的融资环境时,他并不想讲一个仅给投资人听的理想故事,而想用现实的生存逻辑说话。毕竟,作为投资人的他,现在站在了自己的对面。十年前,就有创业者评价他的投资风格——是最难被忽悠的一个投资人,要看数据、要做背景调查,要做系统分析。

但显然,依然身着那套藏蓝色西服套装,梳着三七分发型的李开复,作为六小龙里最有经验的创始人,相信自己能解这个左右为难的难题。

与其他几家纷纷开始显示出聚拢的倾向不同,李开复传递出的信号是他要一手抓模型一手抓产品,一手做toC,一手做toB。同时,还会很好的赚钱活下去。李开复认为AI在效率改进上的价值很可能并不会强烈的区分消费者和企业,这股趋势正在慢慢传导至国内。

在担忧的垄断的同时,李开复显然也在“学习”Sam 。他形容把关人就是Sam ,他会战略性选择发布哪个产品,“还藏了很多好东西没有放出来,我们千万不要低估它。”而这也是他在零一的做法:细数下来,零一万物今年发布的重要模型已有4个:Yi-Large、Yi-、Yi-1.5系列、Yi-coder,这个矩阵兼顾了开源的品牌效应,小模型的前瞻部署和预训练模型的旗舰站位。而且,这些模型会在需要它的时候出现,就像每次狙击的时机选择那样。

同时,他也是难得的可以游走在多个市场,抓住看似已经不再能抓住的不同机会的企业家。在最近一次发布会上,李开复相比三周之前更明确了零一万物从C端向B端转向的意图,他高举高打“国内重to B,海外重to C”,在x上,他不停推广着AI搜索产品Beago,同时在国内,他用了重量篇幅展现零一于传统行业的To B业务打法。

他有一个营销侧的细节数据:目前做to C产品面临着流量成本走高的难题,“友商用户从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个环境里,我们会非常谨慎,先不推出中国本土新的to C应用。”把更多精力放在海外做to C产品。

根据5月公布的数据,零一万物上线9个月的海外产品用户已经接近千万,其单一产品今年收入达到1亿人民币,产品ROI(投资回报率,指通过投资而应返回的价值)接近1。但这未必能复刻到国内。“现在还没有SaaS订阅的妄念。”他在极客公园的直播中称。

而在国内,他要做的toB生意也不是过往那种利润率极低的工作,而反而要把它变成零一的“印钞机”。李开复为此进行了生动描述,他说B端尽量不做项目制,咬牙把解决方案开发做出来,“一落地就惊艳,一落地就变成一个印钞机”,他称,已经找到了几个领域或者单一的公司能跟零一万物双赢。目前看李开复把这些领域落脚在零售、游戏、能源、智算行业。

数字人是他重点介绍的案例。在最近的发布会上,联合创始人祁瑞峰在他身边扮演了数据分析师的角色。后者给外界算了好几笔账,证明零一用完数字人解决方案,会立刻获得毛利增长的账目。李开复甚至说自己面对B端业务时,会变成公司最大的销售。

在这些密集的行程和分享中,李开复再次让人回想起当年一篇报道对他的描述,“感觉像是跟Siri聊天”。

零一万物是李开复把他一生企业家和投资人经验集于一身的公司,这公司有着他明显的烙印。他不太相信其他更年轻或者更单一背景的同行解决不了的问题,他也解决不了。这就是他选择的方式,他应该会继续忙下去。