英特尔等科技巨头成立新组织,挑战英伟达在 AI 加速器领域的地位

aixo 2024-05-31 10:13:45
算力 2024-05-31 10:13:45

英特尔、谷歌、微软、Meta以及其他科技巨头周四宣布成立一个新的行业组织——“Ultra Link () 推广组”,意在制定行业标准,领导数据中心中AI加速器芯片之间连接组件的发展,挑战英伟达在AI加速器一家独大的地位。

联合制定AI加速器连接标准,挑战英伟达

除以上公司外,该组织成员还包括AMD、惠普企业、博通和思科等,Arm尚未参加。推广组正在提出一项新的行业标准,以连接日益增多的服务器中的AI加速器芯片。

“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值,”AMD数据中心解决方案总经理 表示。“行业需要一个允许创新快速进行且不受任何单一公司限制的标准。”

广义上讲,AI加速器是指GPU及其他定制设计的解决方案,用于加速AI模型的训练、微调和运行的芯片。提议的标准版本一, 1.0,将连接多达1024个GPU AI加速器,组成一个计算“集群”(pod),意指服务器中的一个或多个机架。根据推广组的说法,基于包括AMD的 在内的“开放标准”, 1.0将允许AI加速器所附带的内存之间的直接加载和存储,并且与现有互连规范相比,总体上将提高速度,同时降低数据传输延迟,。

该组织表示,将在第三季度创建一个名为的联盟,以监督规范的发展。 1.0将在同一时间段内向加入联盟的公司提供,而带有更高带宽的迭代版规范 1.1,预计将在2024年第四季度推出。表示,第一批产品将在“未来几年内”推出。

英伟达:不想参加,也没必要

分析认为,由于明显缺少了当今最大的AI加速器生产商英伟达,该组织的成立就是为了挑战英伟达在AI领域一家独大的地位。目前,英伟达AI加速器的市场占有率估计在80%到95%。

目前英伟达对此事未予置评,但很明显,该公司并不热衷于支持。分析认为,英伟达已经为数据中心服务器内的GPU链接提供了自己的专有互连技术,所以可能不太愿意支持基于竞争对手技术的规范。

而且,英伟达在AI领域的地位和影响力非常强大。在最近一个财季,英伟达的数据中心销售额(包括AI芯片销售)同比增长超过400%。如果继续保持当前的轨迹,英伟达今年将有可能超越苹果,成为全球市值第二高的公司。

因此,英伟达不想参与,也不必参与。

而另一个尚未加入的大公司则是亚马逊。分析认为,亚马逊可能处于“观望”模式,因为该公司也在不断发展自己的内部加速器硬件努力。AWS也可能认为,与供应其客户大量GPU的英伟达对抗没有太大的战略意义。

微软、Meta、谷歌最有动力

分析认为,除了AMD和英特尔,的最大受益者似乎是微软、Meta和谷歌,这三家公司总计已经花费了数十亿美元购买英伟达的GPU,以支持其云服务并训练其不断增长的AI模型。它们都希望摆脱英伟达作为AI硬件生态系统供应商过于强势的局面。

在最近的一份报告中,估计,今年服务器中使用的AI加速器的价值将达到210亿美元,到2028年将增加到330亿美元。与此同时,预计,到2025年AI芯片的收入将达到334亿美元。

谷歌有用于训练和运行AI模型的定制芯片——TPU和Axion。亚马逊拥有几个AI芯片家族。微软去年也加入了这场竞争,推出了Maia和。而Meta则在不断完善自己的加速器产品线。

此外,据报道,微软及其密切合作伙伴计划在超级计算机上投资1000亿美元,用于训练配备未来版本的和Maia芯片的AI模型。而这些芯片需要某种方式连接——也许这就是的用途。