AMD 宣布 2024 年下半年推出 3nm EPYC Turin,AI 处理比 Intel Xeon 快 5.4 倍

aixo 2024-07-26 13:07:29
芯片 2024-07-26 13:07:29

AMD宣布,将于2024年下半年推出的3nm EPYC Turin,具有192个内核和384个线程,在AI处理方面比Intel Xeon快5.4倍——英特尔开始回击。

随着英特尔和AMD争夺在CPU上运行的AI工作负载的领导地位,AI基准测试之争正在升温。

这两天就发生了比较好玩的事儿,随着两家公司宣布推出最新芯片,在AI基准测试方面的针锋相对开始愈演愈烈。

AMD:Turin在AI处理方面比XEON快5.4倍

这个说明来自AMD老大Lisa Su。她在2024年台北国际电脑展主题演讲中宣布,AMD备受期待的第五代EPYC Turin处理器将于2024年下半年推出,它们在关键AI工作负载方面比英特尔的当前的64核Xeon 8592+最多快5.4倍:

英特尔官网_英特尔_英特尔cpu

在 LLM AI 模型(聊天机器人)中,AMD 有高达 5.4 倍优势

英特尔_英特尔官网_英特尔cpu

Turin 模型在科学 NAMD 工作负载中具有 3.1 倍的优势

Turin兼容现有SP5主板

将于2024年下半年推出的3nm AMD EPYC Turin,具有两种版本:一种配备多达128个标准Zen 5内核,另一种配备密度更高的192个Zen 5c内核。苏姿丰还宣布,AMD目前已占据数据中心市场的33%。

其中,192核EPYC Turin芯片专为最高核心密度而设计,支持与全功能Zen 5核心相同功能,这使其对超大规模计算企业极具吸引力(AMD表示它拥有该细分市场的50%份额)。

英特尔_英特尔官网_英特尔cpu

3nm AMD EPYC Turin最高 192 个内核

新的Zen 5c芯片将配备多达192个内核和384个线程,与6nm I/O芯片(IOD)配对。

标准Zen 5 EPYC处理器将与英特尔推出的Xeon 6系列竞争。Turin将安装在与第四代EPYC Genoa和相同的SP5插槽主板上,这样现有套件就可以轻松升级为速度更快的芯片。这种策略还可以加快较新主板和服务器的质检速度,从而缩短上市时间。

英特尔:当前一代XEON比AMD Turin反而更快

在当下竞争激烈的AI领域,5.4倍的性能差距足可以影响用户的购买选择。

于是英特尔立刻开始反击,在官方博客中重点介绍了其当前一代Xeon处理器在其自身基准测试中的表现,声称其目前正在出货的第五代Xeon芯片,比AMD即将在2024年下半年推出的3nm EPYC Turin处理器更快!

英特尔表示,AMD的基准测试“不能准确反映”Xeon的性能,并分享了自己的基准测试来反驳AMD的说法。

在英特尔自己内部测试中,被AMD用于对比的Xeon 8592+系统,要比AMD的基准测试快5.4倍,而且还要好于AMD的Turin系统。

英特尔cpu_英特尔_英特尔官网

AMD声称Turin在NAMD的分子动力学工作负载中快3.1倍,英特尔并没有对AMD该说法提出反驳,但是在AI领域的文本翻译和内容摘要应用方面,英特尔也提出不同的数据,表示如果和AMD当前一代,也就是第四代AMD EPYC 9754相比,英特尔Xeon 8592+的性能反而超出很多。

英特尔cpu_英特尔_英特尔官网

测试数据差别巨大的原因

英特尔表示,AMD没有分享其用于基准测试的软件的详细信息或测试所需的SLA,并声称AMD的结果与自己内部广泛使用的开源软件(英特尔扩展)的基准测试结果不符。英特尔为其基准测试设定了“严格”的50ms P99延迟约束,并使用了相同的INT4数据类型。

这样看来,双方基准测试数据差别巨大的可能原因,或许是英特尔对AMX(高级矩阵扩展)数学扩展的支持。这些矩阵数学函数极大地提高了AI工作负载的性能,值得注意的是,AMX支持BF16/INT8,因此软件引擎通常会将INT4权重转换为更大的数据类型以通过AMX引擎进行驱动。

但双方的来回“拉扯”,也许是即将到来的服务器芯片市场激烈竞争的预兆。英特尔已经宣布推出了E核心驱动的144核Xeon 6“ ”处理器,288核型号明年推出;P核驱动的 型号将于2024年第三季度推出。明年初,英特尔将提供最多拥有128个内核的 。

与此同时,已开始出货192核处理器,明年将推出采用台积电N3工艺技术制造的全新256核处理器。

可以预见的是,从今年下半年开始,服务器处理器市场一定会掀起一波又一波激烈鏖战。

好戏马上开场。