液冷散热成必然选择:AI 技术爆发下的数据中心散热挑战与解决方案

aixo 2024-09-29 18:07:36
算力 2024-09-29 18:07:36

【】随着AI技术的应用爆发,高性能、高密度计算设备部署成为数据中心新常态。为了应对高密度计算带来的高热负荷和散热挑战,液冷以其高效的散热性能和节能特点,成为理想解决方案。

日前,在2024中国云计算和数据中心国际峰会上,网宿科技子公司绿色云图运营总监徐明微与一众专家共同探讨了液冷技术的发展趋势。

徐明微强调,风冷和液冷在散热能力上存在一个分界点,风冷可以很好地满足250W以下的散热需求,但随着芯片功耗的不断攀升,如一般GPU的功耗已达到350至700W, B200的功耗超过1000W、GB200的功耗高达2700W,这些已经远远超出风冷的散热极限,液冷散热是必然选择。比如绿色云图新一代的液冷方案就能满足kW级功耗芯片的散热需求。

数据显示,截至2022年底,数据中心的液冷技术渗透率仅为5%至8%。而根据全球高科技产业研究机构集邦咨询的最新调查,随着 新平台预计于2024年第四季出货,将推动液冷散热方案的渗透率明显增长,预计从2024年的10%增长至2025年的超过20%。

在业界共识中,一方面,由高密度计算所带来的散热需求以及政策对PUE的严格管控是液冷技术发展的主要驱动力,另一方面,数据中心的总体拥有成本(Total Cost of , TCO)也是推动液冷技术规模化应用的关键因素。

会上,徐明微举例阐释了液冷技术对数据中心TCO的好处。

风冷的PUE值大概在1.4,浸没液冷PUE值可以达到1.1以下,甚至到1.05。传统服务器,风扇占到功耗的10~20%,液冷模式去除了风扇的功耗,以一台100W的服务器为例,拆掉风扇后就变成了80W,乘以PUE1.1的系数,液冷模式下的整体功耗就是88W,而风冷的模式下,整体功耗是140W。这样一来,液冷相较于风冷可以降低功耗37.14%。

“数据中心建设过程中,投资成本(CAPEX)以及运营成本(OPEX)分别占到30%、70%,那液冷的节能就体现在OPEX环节,节能30%以上。在CAPEX没有明显增加的情况下,显然液冷的TCO优于风冷,对数据中心长远来说具有更好的经济效益。”徐明微表示。

与会专家也指出,从运营角度,出于TCO成本的考虑,为了达到数据中心一个好的投资回报率,液冷将成为主流的散热方式,没有之一。

最后,谈及AI芯片对液冷技术的影响,徐明微表示,“尽管芯片功率上升到了kW级别,但芯片的面积也随之增加了,也就是单位面积的功耗没有大的提升。在这种情况下,我们认为,现有的液冷技术是完全可以来进行高效散热的。芯片不是单纯的发热器件,而是超大规模的集成电路,真正的难点在于怎么有效地将热量传递到芯片表面。我们现阶段要做的事情就是把液冷技术不断地优化,做到更安全可靠。”

据悉,绿色云图作为国内领先的液冷数据中心解决方案提供商,近年来不断提升液冷技术的性能和效率,以满足高算力设备的散热需求,并已在大型超算场景中成功实施液冷方案。与此同时,绿色云图积极携手戴尔科技、英特尔、华鲲振宇等合作伙伴,开展液冷散热系统的研发、测试、验证等系列工作,以产业生态力量加快推动液冷技术的规模化普及。(御风)