李彦宏回应GPU遭遇进口限制情况下如何重构搜索关键问题

aixo 2024-05-20 17:56:53
大模型 2024-05-20 17:56:53

一言文心入口_文心一言_一言文心下载

5月17日,百度在港交所交出了2024年一季报:总收入315.13亿元,同比增长1%。虽然归属百度的净利润54.48亿元,同比下降6%,但以Non-GAAP(非国际会计标准利润)计算,归属百度的净利润为70.11亿元,同比增长22%,这一数据超出了市场预期。

当日晚间,百度CEO李彦宏在业绩交流会上全英文分析了百度的一季度业绩,并回应了GPU遭遇进口限制的情况下如何训练大模型、AI如何重构搜索等关键问题。

01

增长主要靠AI

飞桨平台可兼容本土芯片

电话会议上,李彦宏首先强调了一季度百度智能云收入同比增长了12%,在Non-GAAP的基础上继续交付营业利润,“我们正在把公司从以互联网为中心的业务到以AI为首的业务上来。”

Non-GAAP披露要求允许调减的费用项目包括某些一次性、非常规的支出,比如,重组费用( )、收购费用( cost)、股权激励费用等。据了解,巨额的期权费用是许多处于高增长模式的科技公司和大型互联网公司的通病。因此,这些高新技术公司往往会在财报中单列出意向调整后的利润,即Non-GAAP。

李彦宏称,公司的目标是未来继续在Non-GAAP的基础上继续产生营业利润。他强调,云在这个季度表现不错,最关键的还是因为AI,增长主要由生成式AI和基础模型推动,“虽然百度在短期内曾经历过较低收入,但我仍然有信心,从长远来看AI将带来持续收入和利润。”

李彦宏表示,大部分收入来自模型训练,但模型推理收入也一直在快速增长,“客户向AI云支付款项的15%被分配给了生成式AI和基础模型。”此外,他还透露一些使用过百度GPU云服务的客户,后来也成了百度CPU云服务的客户。

值得注意的是,在英伟达A100、H100等训练AI用GPU遭遇进口管制的情况下,李彦宏称,百度把来自不同供应商的GPU集成到统一的计算集群中,以训练大语言模型,“我们的平台在GPU集群上展示了非常高的效率,该集群由成百上千的GPU组成,这是在进口GPU受到限制的背景下取得的重要突破。”

“这使百度能够将不太先进的芯片用于高度有效的模型训练和推理,百度飞桨平台已经兼容了50多种不同芯片,许多是本土设计的,开发者社区已经增长至1300万。”李彦宏说。

02

生成式AI补充了传统搜索市场

但目前还不打算收费

在英文业绩交流会中,

一言文心下载_一言文心入口_文心一言

记者注意到,文心一言的英文名为“Ernie”,似乎既非直译也非意译,那为什么起了这个英文名呢?原来谷歌在2018年发布的AI模型名称为“Bert”,这是来源于美国著名儿童节目《芝麻街》中的角色的名字,而和“Bert”住在一起的好友就叫Ernie。可见即便从搜索领域一直竞争到了大模型阶段,百度也依然在向谷歌看齐。

在两天前的谷歌开发者大会上,谷歌展示了搜索界面中的“AI概述”能力,并强调未来用户只要“会问”,AI就能生成一切用户想要的内容。而反观百度,虽然目前还不能达到谷歌“AI概述”功能的水平,但李彦宏用AI重构搜索的决心是坚定的。

李彦宏称,被生成式AI和大语言模型重建后,百度文库一季度付费用户同比增长达到两位数,而文心一言对百度搜索的影响和渗透预计要持续更长时间,因为百度搜索的用户有数亿之多,而且对成本和响应时间非常敏感,因此需要不同尺寸的文心一言模型,针对不同场景进行优化,以获得最佳性价比,“我们经过了几个季度的试错,现在正在坚定战略。”

李彦宏表示,生成式AI对传统搜索做了补充,扩大了可搜索的部分,“去年第二季度开始,我们就已经使用文心一言重建百度搜索,现在越来越多的搜索结果是文心一言以不同格式如文本、图像、第三方链接等组合而成的。当然,我们仍然处于用文心一言重建百度搜索的早期阶段,鉴于百度搜索的历史跨度超过20年,用户行为将逐渐发展,这一过程需要时间。”

在AI搜索的成本方面,李彦宏表示本季度的亮点之一是扩大和增强了文心一言的模型组合,“在模型构建上我们提供了3种轻质模型和2种针对特定任务的模型,这有助于平衡模型的性能,以触及更广泛的受众。我们还使用了专家混合模型,为用户的一次查询分配为不同的任务,让最适合的模型处理任务,最复杂的才使用文心一言3.5或4.0来处理,这样既可以平衡成本更快响应,也可以保持高性能。”

在回答高盛提出的问题时,李彦宏表示目前百度有约11%的搜索结果由AI生成,这些结果的语言经过组织,更准确更直接,使用户能够做到以前做不到的事。不过,对于AI生成结果的功能,百度暂时还没打算收费,所以“来自这方面的收入还得有一段时间才能赶上。”

目前,百度正逐渐提升AI生成的搜索结果,并且增加了“互动”栏,将搜索完全改为问答式搜索。虽然AI直接生成的搜索结果尚未实现商业化,短期内对广告收入有所影响,但李彦宏坚信,长期来看,这将是持续改善用户体验、增强用户黏性的重要举措,“技术创新使我们能够更好地与开发者和商家接触,以更自然的方式将用户意图与产品服务连接。”