英伟达 GPU 遭大客户自研计划挑战,苹果 AI 大模型也转用谷歌 TPU

aixo 2024-07-30 17:24:50
大模型 2024-07-30 17:24:50

界面新闻记者 | 李彪

界面新闻编辑 | 文姝琪

客户也是竞争对手,一直是外界关注英伟达这家公司时常常会提出的质疑。

微软、谷歌、亚马逊等云计算巨头在过去一年里采购了大量的英伟达GPU,同时,这些大客户也都在布局自家的芯片自研计划。黄仁勋此前谈及这种情况时表示,英伟达要面对的面对的竞争比“地球上任何人都多”。

即使是在眼下英伟达风头正盛的时刻,这种情况仍在发生。7月29日据路透社报道,苹果在发表的一篇研究论文中提到,公司正在开发的AI大模型底层使用的是谷歌TPU(张量处理器),而非业界常用的英伟达GPU(图形处理器)。

作为最后入场战局的科技大厂,苹果在公开报道并未有大规模采购英伟达的GPU记录,苹果AI“花落谁家”也一直是市场关注的焦点。报道称,苹果为了建立在和其他装置上运行的AI模型,使用了2048个及8192个TPUv4,用来支持AI模型的训练与推理。

目前英伟达对此消息未作评价回应。

TPU最初是谷歌为其机器学习框架定制设计的专用芯片。自2015年推出以来,TPU已经发展到第六代,基本上保持了每年迭代一次的更新节奏。在此之前,TPU一直主要供谷歌内部自用,后期虽然也通过与谷歌云服务绑定起来对外使用,但一直未有大的向外扩张动作。

去年AI大模型的爆发使得AI芯片遭遇市场疯抢,高端GPU一卡难求,英伟达在这一领域一举拿下了超八成以上的市场份额,是当之无愧的霸主。但与此同时,谷歌也在TPU上暗中发力。据统计,谷歌去年自用的TPU芯片量预估超过200万颗,市场份额仅次于英伟达和英特尔,已经成为了全球第三大数据中心芯片设计厂商。

尽管有了自己的TPU芯片,但谷歌依然是全球最大的英伟达GPU买家之一。在市场调研机构Omdia撰写的报告中,统计了去年抢购的英伟达H100 GPU的主要买家名单,Meta和微软以15万块H100 GPU的购买量并列位居第一,谷歌、亚马逊、甲骨文以及腾讯则分别购买了5万块,并列第二。

谷歌云去年与英伟达也有密切合作。谷歌不仅在内部使用英伟达的GPU,还在其云服务平台上提供基于英伟达GPU的服务,以满足客户对高性能计算和AI应用的需求。

除了谷歌以外,亚马逊AWS、微软等云巨头都在基于Arm架构自研芯片,云计算大厂的造芯一直被外界看作英伟达的威胁。但英伟达一直坚称自己面对竞争具有独家优势。

早在2017年谷歌推出第二代TPU时,黄仁勋曾经接受CNBC采访时就表示“并不担心谷歌TPU的竞争”。在他看来,尽管一些云计算大客户可能会开发自己的AI服务器芯片,减少对英伟达芯片的依赖,但英伟达依然能够凭借其GPU的卓越性能保持其在AI领域的领先地位。

成本也是英伟达一直坚称自家产品的杀手锏。按照黄仁勋主张的“买的越多,省的越多”说法,由于规模经济效应,平均成本会降低,所以当企业大量购买英伟达的GPU时,虽然初期投资可能较大,但从长期来看,高性能GPU的使用寿命长,维护成本较低,客户整体的总运营成本(TCO)更低。而竞争对手若要与其正面竞争,“对手即使是免费,最后算下来仍不够便宜”。

海量资讯、精准解读,尽在新浪财经APP

AI