2024 年 MWC 上海站:新华三集团武家春阐述构建面向智算的基础设施建设思路

aixo 2024-06-28 12:52:11
算力 2024-06-28 12:52:11

6月27日,以“未来先行( First)”为主题的2024年世界移动通信大会上海站(MWC上海)持续火热进行中,来自全球的行业领袖和创新先锋齐聚一堂,碰撞思想火花。紫光股份旗下新华三集团云与计算存储产品线副总裁、产品支持与解决方案部总经理武家春受邀出席“构建人工智能就绪基础设施”主题峰会,并发表“算力×联接,让未来更智能”的主题演讲,深入阐述了新华三如何构建面向智算的基础设施建设思路和技术布局。

算力_以太币算力_力算科技

新华三集团云与计算存储产品线副总裁、产品支持与解决方案部总经理武家春

AIGC大模型的快速进化极大地推动了行业应用创新和生产效率的提升,随之而来的是算力需求呈现爆发式增长,全球范围内正在掀起智算数据中心建设热潮。因此,如何构建更强大高效的智算基础设施,推动算力产业高质量可持续发展,成为各行业关注的焦点议题。对此,武家春在演讲中深度诠释了新华三集团“算力 x 联接”技术理念,围绕算力多元高效、联接标准灵活两方面深刻剖析了两者深度融合所带来的倍增效应和技术优势。

“依托‘算力 x 联接’技术理念,新华三致力于算力、存力、运力的协同演进及数据价值的升华,为大规模人工智能计算提供可持续发展的高效解决方案。”

——新华三集团云与计算存储产品线副总裁、产品支持与解决方案部总经理武家春

算力多元开放,打造极致高效体验

会上,武家春分别从算力多元化、调度统一化、存储智能化、数据标准化四个方面向与会嘉宾分享了新华三对开放多元算力的建设思路:

算力多元化:H3C 系列服务器为AIGC提供澎湃算力支持

● 多元异构,开放包容:打造多CPU平台,并支持10+种AI加速卡;满足不同场景需求,提升供应链供给保障

● 拥抱OAI规范,互联标准化:采用OAM标准适应不同GPU的功耗需求,提供GPU互联高带宽定制化设计,满足不同互联带宽需求

● CXL演进,存算分离:内置CXL异构资源池,内存池(10TB+),提供数据低时延无损共享,为业界提供机柜级内存资源多机弹性管理解决方案

调度统一化:傲飞平台云化智能调度,全面拥抱“算力即服务”

● 异构算力统一智能调度:实现多元CPU和GPU异构算力统一调度;通过自研统一集合通信库UCCL,有效提升23%算力;支持万卡规模集群的算力调度

● AI业务调优:集成多种模型框架及工具,提供对AI大模型训练/微调/推理全流程开发服务的高效支撑

● 大规模智算中心运维:以业界领先的1天内自动化算力方案开局;提供高可靠算力任务保障,3秒内故障检测,5秒内自动隔离,10秒内启动算力替换,分钟内恢复业务

存储智能化:系列存储为大模型训练提供超强的存储性能

● 极致性能提升:单节点支持百万级IOPS和50GB/s l/O带宽,实现了120%的性能提升

● GPU数据直通:主流GPU厂商完成GPU直通方案,单GPU性能提升50%以上

● 更低TCO:超高空间利用率(94%),大容量高密节点,更低能耗,整体TCO降低超过20%

● 灵犀助手:基于大模型,在业内率先支持存储智能助手,提升用户使用体验

● 智能分层:基于深度学习技术,通过AI算法分析应用指纹,缓存命中率提升20%以上

● 智能降耗:根据业务负载动态调整CPU、硬盘功耗,减少整体功耗

数据标准化:绿洲平台为大模型提供高质量的语料数据集

● 多模态:结构化数据多模数据集处理,高效构建全域数据湖

● 高质量:建立数据质量实时反馈治理机制,数据集质量提升30%

● 高效率:50余数据预处理算子,向导式数据治理,效率提升10倍

● 强安全:敏感数据自动过滤,隐私数据智能保护

武家春表示,新华三集团的算力产品和解决方案通过不断升级进化和应用优化,打出一套算力服务的组合拳,为百行百业的用户提供算力多元化、调度统一化、存储智能化和数据标准化精细服务。

联接标准灵活,打造高速无损网络

武家春表示,在算力联接方面,新华三目前已实现联接标准化和组网灵活化。通过以太网统一GPU服务器节点间网络连接,可实现集群Scale out;依托OAM+高速联接可实现集群内部高速域Scale up;并且服务器内/外联接标准达成归一化,有助于构建异构GPU智算集群,降低算力部署和应用的成本。

组网灵活方面,新华三所提供的、S98系列、+S98系列智能交换机可分别实现单框单层组网、盒-盒两层组网、框-盒两层组网等模式的灵活组网,提升网络带宽的利用率至95%,将网络的故障收敛时间降低至微秒级。

同时,在绿色节能方面,新华三全栈液冷解决方案,为数据中心的绿色发展提供了创新思路。新华三液冷整机柜方案将计算密度提升240%,实现运维免手动,全盲插快接。箱式浸没和油类浸没方式可适配传统机柜,解决浸没部署难题,突破油冷散热瓶颈。全冷板系统实现 0.3W以上热敏部件全覆盖,集中式冷板设计实现I/O热插拔。两相散热采用冷凝回流设计,液体循环使用散热效率提高70%以上。新华三围绕国家“双碳”战略的实施,践行可持续发展理念,依托全栈液冷的技术路线,为客户提供高效节能、绿色低碳的全套方案。

通过多元化算力和标准化联接的深度融合,新华三集团能够更灵活极致地调度和释放算力,给模型的训练、推理带来更高效、更稳定的支持,为迎接不断变革的未来做好充分的准备。作为AIGC时代的数字化解决方案领导者,未来,新华三将持续深化“AI in ALL”技术战略,并加速推进“AI for ALL”行业赋能战略,充分发挥“算力×联接”的倍增效应,为数字经济发展贡献不竭力量!