“软硬”双封杀,国产AI芯片能否“翻盘”?
通信世界网消息(CWW)国产AI芯片正陷入一场前所未有的突围战,是挑战,更是机遇。
2024年是AI手机的元年,更是AI原生应用爆发的元年,AI浪潮已然势不可挡,智能算力需求亦水涨船高,AI芯片作为算力发展的底层基石也迎来了前所未有的机遇。据Gartner最新预测,2024年AI芯片市场规模将较2023年增长25.6%,达671亿美元。到2027年,AI芯片市场规模将是2023年规模的两倍以上,达到1194亿美元。目前业内主流AI算力芯片是CPU、GPU、ASIC和FPGA,其中GPU更适合人工智能计算,英伟达也凭借高性能GPU和完善的CUDA生态,确立了自己在AI时代的龙头地位,几乎垄断了近80%的市场份额。
虽然AI应用和AI芯片双万亿级“蓝海”市场蓄势待发,但其“后勤保障”却面临重重挑战。近年来美国持续收紧AI芯片出口,英伟达被美国禁止向中国销售高端GPU芯片,为了做中国市场的生意,英伟达多次推出“特供版”芯片,也一次次被美国封锁出口,同时由于性能的大幅度削弱,国内厂商似乎也并不买账。且AI芯片的竞争点不只芯片本身,软件生态同样是GPU厂商的重要竞争屏障,但由于国产AI芯片起步较晚,生态建设相对滞后。更雪上加霜的是,英伟达近日在CUDA 11.6以上的用户许可协议中明确提到:“您不能逆向工程、反编译或反汇编使用此SDK生成的任何结果,并在非英伟达平台上进行转译。”这意味着中国厂商以后无法通过模拟转译的方式兼容CUDA平台,自研生态才有望实现自主可控破局。
当前,中国已成为AI技术的发展“热土”,而软硬件方面的双重阻碍,使得国内市场对英伟达GPU的需求缺口越来越大,业界整体面临算力从哪来的问题,国内相关企业正用行动给出答案。科技企业积极调整产业策略,减少使用英伟达芯片,加大国产芯片使用力度。阿里和腾讯等云厂商将一些先进的半导体订单转移给华为等本土公司,并更多地依赖其内部开发的芯片,百度和字节跳动等企业也采取了类似措施,国内企业开始“英伟达+自研+国产芯片”三管齐下进行探路。
芯片厂商加速国产化替代,逐步积累足够的技术储备支撑国内需求。一方面,我国政府提出了中国芯片自给率要在2025年达到70%的目标,并给出大力支持,除了对集成电路领域企业给予“十年免税”的优惠政策外,还设立专项扶持基金、放宽所得税限度、贷款贴息等扶持政策。另一方面,巅峰时期,英伟达在中国市场的收入占其总收入的三分之一,英伟达的遗憾离场,把偌大的市场空间还给了中国厂商,国产芯片加速从“实验室”走向“应用场”,逐步具备替代能力,华为海思、寒武纪、海光信息、平头哥、昆仑芯、壁仞、燧原等新兴企业冉冉升起。
据了解,华为昇腾910B性能已基本可与英伟达A100芯片对标,寒武纪思元370系列产品也在多家头部企业完成产品导入,海光信息“深算二号”GPU在大数据处理、人工智能、商业计算等领域实现商业化应用。与此同时,多款国产GPU性能取得突破,如壁仞科技BR100系列GPU芯片的16位浮点算力超过了1000T,8位定点算力更是达到2000T以上,单芯片的峰值算力已经触及PFLOPS等级。此外,华为针对AI场景推出异构计算架构CANN,寒武纪推出实现训练推理一体化的AI计算平台Neuware),国内厂商正进一步加强与软件、硬件等厂商的合作,建立更加完善的生态系统。
而除了GPU这样的AI加速卡快速演进,我国渲染类GPU的性能也稳步提高,直追英伟达和AMD,比如芯动科技推出的高性能的4K级显卡GPU芯片“风华1号”,采用12nm工艺,性能略优于英伟达的GTX980显卡。再如,摩尔线程专为游戏玩家打造的独立显卡MTT S80,能够提供多达14.4TFLOPS的单精度浮点算力。与此同时,国内厂商还积极布局NPU、HPU、计算视觉等AI芯片,使其广泛应用到智能手机、VR设备、CV、机器人、ADAS等领域。
前路艰险,更要勇往无前,此前挡在国产半导体面前的,一直是外部过于廉价的供应,将产业磨灭在萌芽期,而在美国“小院高墙”的策略之下,国内芯片发展正迎来绝佳窗口期。如今的中国有政策、资金的大力支持,有行业人士赓续“两弹一星”精神,矢志科技自立自强,只要给中国芯片产业以时间,实现自主可控并不遥远。