对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI
钛媒体App获悉,5月13日上午,创新工场董事长兼CEO、零一万物CEO李开复博士在北京发布全新零一万物千亿参数Yi-Large闭源模型,以及包括开源模型等产品矩阵,并披露今年公司To C单一产品收入达1亿元人民币。
李开复表示,随着一年前ChatGPT风靡全球,以Yi-Large为核心的中国大模型从此前“追赶”到如今性能超越GPT-4大模型,中美大模型差距越来越小。
“一年前,中国大模型感觉太落后(于美国)了。但今天我们非常自豪的说,我们(零一万物)狂奔了一年,在模型方面至少赶上了美国最顶尖、一年前发布的(大模型)产品,当然以后还要继续努力。但我们对未来会需要有一个沉淀和展望,不能只是拼命狂奔。”李开复表示。
当被问及杨植麟套现话题,李开复回应称,尽管不点评公司情况,但他创立零一万物的时候向投资人承诺,10年不“套现”,而且他认为最好的套现方式是“赶快上市”,这是其未来两年努力的目标。
针对中国如何追赶美国大厂不断迭代新模型,李开复回应钛媒体App称,零一万物的新模型已训练一半,之后会朝着美国大模型继续进步。“我们不能保证一定赶上它(美国模型)、超过它,或者gap有多少,但是我们用适合我们的方法快速推进,既然我们不能用10万张GPU来训练,我们就会寻找别的方式,依然能做出非常好的效果。”
据悉,零一万物(01.AI)成立于2023年5月16日,致力于打造全新的 AI 2.0 平台与AI-first生产力应用的全球化公司,由创新工场董事长兼CEO李开复创立,并担任零一万物CEO。
2023年11月,零一万物发布首款研发的开源 AI 大模型系列“Yi”,包括60亿、340亿参数的Yi-6B、34B两个版本,性能超越;今年3月,零一万物公布基于全导航图的新型向量数据库,名为笛卡尔(Descartes)。
今年5月,零一万物推出首款免费一站式 AI 工作平台“万知”,不仅可以速读60万字《马斯克传》,做会议纪要、周报、写作助手,而且还可以解读财报、论文等各类文件,以及帮你手机一键生成PPT。同时,零一万物宣布李开复出任万知首席体验官。
融资层面,截至目前,零一万物已完成由阿里云领投的融资,估值已超过10亿美元,跻身独角兽行列。
距离“万知”发布仅隔了不到一周,今天,零一万物CEO李开复再度进行演讲,并且“破天荒”地在抖音开设新账号进行直播。
李开复演讲主要分为三部分:零一万物产品矩阵介绍;沉淀和TC-PMF(Technolog-Cost-Product-Market-Fit,技术成本X产品市场契合度)理论;以及最后对话问答。
首先,李开复公布零一万物整个产品矩阵,包括开源Yi-34B、Yi-9B、Yi-VL、Yi-6B、Yi-Spark API、Yi-Medium API、Yi-Vision API六个模型组成的开源系统,闭源包括Yi-Large API、Yi-XLarge APl、2C 生产力应用 “万知”以及更多Al-First应用。
零一万物称,在国际领先的底座模型之上,零一万物实现了从应用到生态。李开复认为,这不是一个模式,不是一个产品,而是众多的矩阵。零一万物要让全世界的人都能用上这个模式,肯定要顾及到开源、闭源,To B、To C等各个领域。
性能基准层面,李开复以千亿参数规模的Yi-Large为例。在第三方权威评测中,零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。在最新斯坦福评测机构AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度) 排到了世界第二,仅次于GPT-4 Turbo,Win Rate更排到了世界第一。此外,零一万物将开源Yi-34B、Yi-9B/6B升级为Yi-1.5 系列,每个版本达到同尺寸中 SOTA 性能最佳。
商业化层面,零一万物今天面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。
其中,Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读20万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。
李开复强调,零一万物的千亿参数模型在评测阶段已超越GPT-4。而且零一万物已经与GPT-4“并列全球第一”。
“我们也深深了解国外的大厂都在做产品更新,包括OpenAI可能不久之后也会有发布,所以我们也不会认为今天并列世界第一是最低的宗旨,它只是一个开始,之后随着国外模型进步,我们也会进步,希望能够在彼此互相敦促之下,让全世界的用户都能享用到最好的模型。”李开复称。
另外,对于C端应用,零一万物透露,接入自研向量数据库后,其C端应用在保证响应速率与准确性的前提下,成本大幅降至了原用第三方向量数据库时的18%。在端到端 FP8 训练的前提下,零一万物能够采用技术和工程手段得到与更高精度类型相媲美的训练结果,与此同时模型训练所需的显存占用、通讯带宽都极大降低。在背后,零一万物还与英伟达进行合作。
零一万物称,Yi-Large 训练环节的平均 MFU(模型算力利用率)为 58%,峰值可达 63%,已显著超越业内平均水平。多方面优化后,其千亿参数模型的训练成本同比降幅达一倍之多。
其次是大模型沉淀和“模基共建”等理论,以及零一万物的发展目标。
李开复表示,在大模型时代狂飙一年后,他认为PMF 这一概念已经不能完整定义以大模型为基础的 AI-First 创业,应当引入 Technology(技术)与 Cost(成本)组成四维概念——TC-PMF。
“做 Technology-Cost Product-Market-Fit(TC-PMF),技术成本 X 产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统 PMF 难上一百倍。” 李开复表示。
李开复提到,可以预见AI技术未来有几个趋势:持续Scaling Law(尺度规律),大模型能力快速增长,超过任何技术;同时,大模型训练和推理成本持续大幅下降(GPT价格年内多次下调);另外,需要顶级模型推理能力,才能实践最佳AI-First应用,但有些应用会先爆发,同时要考虑推理成本和商业模式的平衡,寻找TC-PMF难度远远大于PMF,是大模型行业集体的挑战和机遇。
“我觉得一定是最终产品的胜出,要靠非技术一些优势达到口碑的传播,比如,抖音为什么能在这么强大的微信之下依然能够出来,那就是因为它在短暂的时间做了一个很棒的用户体验,做了一个非常好的短视频体验,而且专注它的用户体验,做出了这样一个大型的短视频市场机遇,但是今天我们一方面不能忘记PMF的重要性,而不是胡乱去烧钱。”李开复呼吁关注TC-PMF,拒绝Ofo式烧钱打法——ofo曾是中国最火爆的共享单车企业,但最终却因为烧钱太多、无法还债导致停摆,目前全国已看不到ofo单车了。
李开复谈到零一万物的未来发展方向有四点:全球化布局、模基共建、模应一体、Al-First。
其中,零一万物重点发力海外,聚焦生产力、社交赛道于海外应用展开探索,已有 4 款产品陆续上线。目前零一万物海外生产力应用总用户接近千万,营收今年预期过亿人民币,已实践出大模型 2C 产品的 TC-PMF——产品 ROI 为1,初步摆脱烧钱获客,海外已产生规模化收入;模基共建重点是发力自研 AI Infra,而模应一体就是模型、产品的体系化联动。
随着API、万知等应用共同构建起了零一万物的商业落地版图。李开复规划,零一万物将作为具有前瞻性的务实者一步步实现落地,并最终达到 TC-PMF,打造出 AI 2.0 时代的超级应用,实现让通用人工智能普惠各地,人人受益。
最后一部分是对话。接近一小时中,李开复主要回应 AI 大模型行业的发展趋势、泡沫化以及他个人在短视频上的一些布局等。
谈及推理芯片,李开复表示,“我认为国产训练芯片和推理芯片都要全力支持,但是两个的差别是比较大的,因为训练芯片还是有一定难度,主要还是CUDA;而推理芯片它的几个好处,一个是它本身比较简单,第二它没有CUDA这么强的依赖性,制造过程也不难,所以我们对国产推理芯片是看好的,我们也会在合适的时候去采用,我们在创新工场也一直在关注这方面的投资机会。”
对于独角兽的发展机会,李开复认为,OpenAI从独角兽做到超级独角兽,而零一万物有自己的特点,是可以走出一条适合自己的路。相对于追逐GPU,零一万物的模式可能会更务实一点。
“我们是务实的AGI信仰者,所以我们一定要用最少的芯片最低的成本训练出我们能训练最好的模型,同时我们会不断的去摸索找这个TCM。国内初创公司相对硅谷公司的一个差异,我们能够仰望星空,但也能脚踏实地;第二怎么把推理成本做到最低,让我们能点燃。第三是找到PMF需求,因为如果大家谈大模型的时候,往往会觉得说美国这方面论文写的最多、人才密度最高,这都是毋庸置疑的,但是同时你要考虑到,做一个伟大的大模型公司,它不只是底层,底层当然不能差。我们当然相信AGI会发生,我们也希望我们能推进AGI的发生,但AGI是梦想,但是你用梦想去指点一个公司的执行,而你又没有这种财力去做一个超级大力出奇迹,其实就是徒劳无功的事情。”李开复称。
李开复认为,如果一年降低10倍的推理成本,2年100倍,所以有100倍的推理成本下降,假如只要今天GPT 1/100的价钱来做推理成本,很多应用肯定是可以爆发的。
谈到国内大模型C端商业化,李开复回应钛媒体App称,当前零一万物主要以国外为主,海外用户已经有付费意愿。但对于国内来说,今天万知还没有收费计划,因为要考虑给用户带来的价值。”至于整个行业用户是否愿意对某些功能或产品付费,我们还在观察中,国外的是已经进入了一个roi为正的状态,也就是国外我们去买的流量是低于我们能够收到的订阅费用,所以没有比这个更好的。”
“已经有用户自己掏腰包买单,所以我们对此有相当大的信心可以做到(C端商业化)。”李开复称。
谈到个人抖音账号规划,李开复表示,此前一直没做视频号,如今做,主要是认为很有必要,一部分是因为有技术产品希望和大家分享,以及科普 AI 领域的重要性,“我也希望能够用我的抖音号来做一个非常实诚的分享,然后让大家了解怎么去把这个工具用好,别只看到会不会取代我们的工作”。
李开复暗示,零一万物接下来可能会做类似 AI 搜索的产品服务,更多聚焦于生产力效率的提升。
至于其他方向,他认为,未来 AI 大模型需要看用户的粘性很强,传播力很强的赛道,然后去找商盈利性,与移动互联网商业化有些类似。“所以移动互联网最终出了视频月费模式,我们也要在 AI 领域找到。移动互联网诞生出抖音、微信、滴滴、美团,因此在 AI 领域,我们要不断去探索哪些领域技术足够好,推理足够便宜,用户需求足够强。而付费层面,再用别的商业模式的挖掘。”李开复表示。
最后,关于月之暗面CEO杨植麟套现数千万美元话题,李开复表示,“我之所以做这件事情(零一万物),这是我40多年的梦想,从我申请博士论文的前一年,这才是催化推动我的努力的主要动力。至于变现,我还确实跟投资人一年前做了一个承诺,基本是一个自愿主动的承诺,就是我10年不套现。对于我的原创和团队,当然他们比我年轻,也会经过各种手段,但是我会让他们能够合理得到套现,但更重要的是,最好的套现方式是赶快上市,这个是我们未来两年会努力的目标。”
钛媒体App了解到,零一万物仍在规划下一轮融资,同时启动新的性能最强大模型Yi-XLarge MoE研发,从而推高下一代模型的性能和创新。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)