2024 年中国大模型领域突破:北京 AI 第一城的崛起与成就

aixo 2024-08-16 15:31:14
大模型 2024-08-16 15:31:14

2024年,细数中国在大模型领域的种种突破,颇为令人振奋:

百度文心一言、智谱GLM-4等国产模型在全球权威测试中打败GPT-4;月之暗面等三家国产大模型独角兽冲破200亿元估值“大关”;“国产Sora”黑马爱诗科技、生数科技等将AI视频生成时长刷新到6秒、14秒、30秒;万卡集群冲出摩尔线程等国产GPU黑马,支持训练万亿参数AI大模型……

这些,都与我国的“AI第一城”北京有关。

今年7月,相关负责人在2024全球数字经济大会人工智能专题论坛上提到,截至当时全国已通过备案的大模型产品166个,其中北京有71个,接近占全国一半。从公开信息可知,北京大模型独角兽数量占全国八成,同时,这些大模型已加速落地到了互联网、教育、医疗、金融、政府等多个领域。

▲2024全球数字经济大会人工智能专题论坛

7月底,智东西曾统计了2024年上半年及7月我国大模型产业相关企业超千万元融资情况,结果显示,北京企业获得了43笔融资,上海和深圳则分别为11笔、9笔,展现出明显的差距。(《大模型热钱汹涌:半年百个亿级融资,最高超500亿元》)

种种迹象表明,北京正在成为中国“大模型第一都”。

从起跑到领跑,北京大模型产业的突围仅花了一年多时间。2023年5月,北京发布《北京市促进通用人工智能创新发展的若干措施》,公布了“开展大模型创新算法及关键技术研究”等21项措施,在全国城市中率先打响大模型第一枪。

一年多之后,北京已形成全面覆盖大模型、AI算力、数据、应用、方案全产业链及产学研融合的大模型“路线图”。在北京,不仅看中国,也看世界。

每一次“首个”、“最强”、“重磅”北京进展的背后,中国大模型产业已经从追赶走向引领。为什么是北京?北京又是如何占据“百模大战”的C位的?让我们来一起探究。

一、备案大模型接近全国一半,顶尖大模型“北京造”

进入2024年,北京“盛产”大模型的实力不断得到印证。

在3月的第二届北京人工智能产业创新发展大会上,北京市相关负责人提到,北京AI相关企业数量约2200家,约占全国4成;

在7月的2024全球数字经济大会上,北京宣布已通过备案上线的大模型数量达71个,接近占全国总数166个的一半。

此前在2023年10月,《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,我国10亿参数规模以上的大模型厂商约一半在北京,数量高达122家。

明星大模型产品和公司“北京造”,在中国科技圈接连发生。

科技大厂掀起「百模大战」,北京成为最前沿的创新根据地。阿里、腾讯、百度、字节、华为、三六零、京东、小米、网易等科技大厂都公布了最新大模研发及应用进展,大模型电商、大模型上车、AI手机发新等成热门趋势。

比如,百度在2023年10月推出了对标GPT-4的文心大模型4.0版本,10多款AI原生应用及大模型硬件随之推出,到年底用户规模已破亿,今年又升级了AI编程助手、数字人平台、智能客服平台、知识管理平台等多款应用。

国产大模型“创业五虎”涌现,成为估值直逼200亿元的独角兽。其中智谱AI、百川智能、月之暗面和零一万物四家都注册于北京,一家位于上海。

创立于2019年的智谱AI于2024年1月推出新一代基座大模型GLM-4,整体评测结果逼近GPT-4;2024年7月推出“中国版Sora”清影,支持生成6秒视频。该公司今年获得了超4亿美元融资,最新估值突破200亿元。

由前搜狗公司CEO王小川创立于2023年的百川智能,目前已推出了-7B/13B,-7B/13B、-192K、 4、“鹏城-百川·脑海33B”等12款大模型。该公司于今年7月刚刚完成了50亿元A轮融资,估值也突破200亿元“大关”。

创立于2023年的月之暗面以其独特的“To C”战略,将Kimi打造为月访问超2000万人次的AI爆款产品,公司在2024年2月获得超10亿美元融资,刷新国内AI领域最大单笔融资纪录,最新估值高达30亿美元,也超200亿人民币了。

由李开复博士亲自带队孵化的AI2.0公司零一万物,于2024年3月开源了Yi-9B模型,并发布了Yi大模型API开放平台,近期也已传出完成了数亿美元的新一轮融资。

一些大模型“新苗子”还未跻身独角兽阵营,但仅成立1年左右已成为细分赛道“王者”。

在热门的AI视频生成领域,由前字节视觉技术负责人王长虎领衔的爱诗科技早在2024年1月就推出了类Sora视频生成产品海外版,由清华大学教授朱军等坐镇的生数科技于2024年4月推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu,都领先于的“期货”产品Sora。

在备受关注的AI基础设施(AI Infra)领域,前创始人及CEO袁进辉创办的硅基流动,在6月刚刚推出一站式大模型API云服务平台,据悉其自研的大模型推理引擎生成速度较同类开源产品快10倍以上。

产学研联合创新成为趋势。比如在通用大模型领域,北京智源人工智能研究院与中国电信于2024年7月联合发布了全球首个低碳、高性能开源多语言大模型Tele-FLM,并预告接下来将发布千亿、6000亿、万亿参数大语言模型。

大模型行业应用落地初见成效。2023年6月,北京发布首批10个行业大模型典型应用案例,百度、智谱华章、中科院自动化所、科大讯飞、云知声、科学智能研究院、第四范式、毫末智行、衔远、面壁智能等10家技术供给方的应用案例入选,覆盖能源、医疗、金融、消费、智驾、政府、地产等多个行业领域。

▲北京首批10个行业大模型典型应用案例

2024年7月,北京市行业大模型创新应用大赛颁奖,最终有6家企业获得一等奖,分别是瑞莱科技(政务)、中科闻歌(金融)、瑞泊(产业升级)、数坤科技(医疗)、中科大脑(文化教育)、中科睿鉴(智慧城市)。

短短一年时间,北京主力大模型的数量从2023年7月的40个,生长到现在2024年7月的71个,科技大厂布局大模型算力、算法和应用全产业链,数十家独角兽和细分赛道头部创企赶超国际同行,产学研融合推动应用落地成果井喷,并在全国率先形成了AI大模型集聚区。

北京跑出了大模型产业发展的中国速度,也赛出了中国强度。

二、四大E级智算中心启动,3.6万P智能算力激活数据要素

打开北京“模”力,离不开算力这把“钥匙”。

截至2023年12月,北京已形成1.2万P(,千万亿次浮点运算/秒)的算力供给规模——其中通用算力8672P,智能算力3402P,超算算力340P。首都云服务商在津冀、晋蒙区域部署的智能算力约4082P,更是为大模型产业发展提供了坚实基础。

这是什么概念?1P是指每秒1000万亿次计算速度,100P就相当于5万台高性能计算机的算力,比如要在20万颗天体的星空图中要定位某种特征星体,仅100秒。1.2万P将为北京带来什么样的“模”力,可想而知。

进入2024年,北京的智能算力基础设施建设依然强劲,为大模型产业发展持续供能。

2024年1月,位于海淀区的北京人工智能公共算力平台(上庄)发布,一期500P算力已正式上线,为大模型产业发展提供普惠算力服务。

2024年3月,作为北京规模最大的公共算力平台,北京亦庄人工智能公共算力平台正式启用,可提供算力3000P,相当于超过百万台高性能电脑的算力。

该区每年将发布“1亿算力券+1亿模型券”服务企业;面向未来,该平台所处的经开区规划了超的算力规模。

2024年5月,位于朝阳区的北京数字经济算力中心项目基础设施建设已于启动施工,预计2024年年底完成,投产后将累计实现智能算力供给。

▲北京数字经济算力中心效果图

根据最新发布的《北京市算力基础设施建设实施方案(2024—2027年)》,北京计划打造的4个E(,浮点运算次数百亿亿次/秒)级智能算力高地,到2027年新增智能算力将达3.6万P。

北京不仅从算力层面为大模型产业发展提供了动力,还从数据要素方面提供充足“燃料”。

北京市经信局数据显示,北京国际大数据交易所实现牌照落地后,截至2023年11月,该所发放27张数据资产登记凭证,数据交易规模超过20亿元。

背后,北京率先创建了全国首个数据基础制度先行区,发布数据基础制度先行区创建方案和政策清单;出台数据资产首登记、首交易、首入表和首开放等创新的奖励措施,持续释放政策红利。

2024年3月,北京启用国内第一个AI数据训练基地,同时以“监管沙盒”制度保障大模型训练。AI数据训练基地与北京算力基础设施联合起来,大大助力了大模型领域企业练就“最强大脑”。

可以看到,抓住模型、算力和数据三大要素,北京抓住了大模型技术产业发展的“牛鼻子”。

三、30年AI进化,北京成中国“大模型第一都”

北京是如何一步步成为AI之都的?这还要从30多年前说起。

北京AI产业的崛起具备悠久的历史源头。中科院的人工智能研究始于1987年,微软亚洲研究院成立于1998年,著名的清华姚班创立于2005年……它们为北京AI发展创造了一批又一批人才,伴随着2010年代初商汤、旷视、智源研究院等掀起的第一波AI浪潮,也在2020年代成为当下大模型产业发展的中流砥柱。

厚积薄发,随着以计算机视觉为代表的AI技术产业落地成熟,2020年中国AI落地的爆发年,也是北京AI的第一次大爆发。

根据北京智源人工智能研究院发布的《2020北京人工智能发展报告》,2019年北京人工智能相关产值规模已达1700亿元规模;AI创企截至2020年6月底融资总额超3000亿元,并催生了商汤、旷视等32家人工智能独角兽企业;AI相关论文发布、专利申请量均居全国第一,并产出了一批具有国际影响力的重大原创性成果,均居于全国第一。

这离不开北京能在AI纲领性政策上踩准节点。

2017年9月,中关村科技园区管理委员会率先发布了北京首个AI政策《中关村国家自主创新示范区人工智能产业培育行动计划(2017—2020年)》,12月北京市印发了《北京市加快科技创新培育人工智能产业的指导意见》,为北京AI产业的发展提供了政策基础和支持。2019年,北京获批成立首个国家新一代人工智能创新发展试验区,也为其AI爆发提供了条件。

因势利导,伴随着以为代表的大模型应用爆火全球,2023年是北京AI产业的进化年。

1、打响全国AI大模型政策第一枪,1000亿元支持投融资环境

在AI大模型纲领性政策方面,北京起得早、不犹豫、不观望。

2023年5月30日,北京率先打响地方大模型政策第一枪。北京市政府发布《加快建设具有全球影响力的人工智能创新策源地实施方案》、《北京市促进通用人工智能创新发展的若干措施》两大政策,提出加强大模型训练数据采集及治理工具研发等21条措施,为北京大模型产业发展定调。

2023年9月,北京市海淀区首先出手打样。该区发布《中关村科学城通用人工智能创新引领发展实施方案》(简称“方案”),该方案提出要打造2300亿元核心产业规模,从人才落户、资金补贴,公租房等多方面给予人才补贴。

2024年4月,北京市再放政策大招。发展改革委等部门进一步联合发布《北京市关于加快通用人工智能产业引领发展的若干措施》(简称“措施”),措施聚焦提升智能算力供给、加快大模型创新应用等提出10条措施,并从算力、模型、数据、应用及环境全方位给大模型企业发放真枪实弹的“大礼包”。

这些“大礼包”包括但不限于:对于纳入国家重大战略任务的AI技术攻关项目最高重奖1亿元,对打造人工智能标杆应用的项目最高支持5000万元,未来5年投资超1000亿元优化投融资环境,通过资金补贴、发放算力券、模型券等方式降低大模型企业运营成本等。

2、打造智算供给,国产算力支撑万亿级参数大模型训练

在大模型基础设施建设方面,北京保持着此前的强大投入力度。

2024年4月,北京市经济和信息化局、北京市通信管理局印发《北京市算力基础设施建设实施方案(2024—2027年)》(简称“方案”)。方案提出,到2025年,北京市智算供给规模达到;到2027年,实现智算基础设施软硬件产品全栈自主可控,整体性能达到国内领先水平,具备100%自主可控智算中心建设能力。

北京市还宣布打造超过200个智能算力驱动的行业标杆案例,重点建设海淀、朝阳、亦庄、京西(石景山、门头沟)等E级智能算力高地,优先加快两个大规模智算集群建设进度。

但北京的算力版图不止于此,打造京津冀蒙算力供给走廊,规划建设支撑万亿级参数大模型训练需求的超大规模智算集群,使其加快人工智能大模型商业化落地的更宏大布局。

值得一提的是,加快推动核心软硬件产品自主可控将是重点任务。

北京在方案中提出,对采购自主可控GPU芯片开展智能算力服务的企业,实施方案提出的保障措施是按照投资额的一定比例给予支持,加速实现智算资源供给自主可控。

而在5月的《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,北京也明确提出推动国产人工智能芯片实现突破。积极引导大模型研发企业应用国产人工智能芯片,加快提升人工智能算力供给的国产化率。

北京对国产算力的真刀实枪投入也是“大手笔”。

比如在2023年10月,北京市经济和信息化局昨晚发布《2023年北京市高精尖产业发展资金实施指南(第二批)》,就提出重点支持集成电路设计产品首轮流片奖励等方向,单个企业年度奖励金额不超过3000万元。

3、筑巢引凤,发动全国科技力量“组局”,做活政产学研资生态

政产学研资生态融合,是北京大模型产业发展的活力源泉。

筑巢引凤,北京在寸土寸金的首都拨出了多块地来发展AI产业。

2023年9月,“中关村人工智能大模型产业集聚区”揭牌,打造五道口人工智能产业园、北大西门人工智能产业园、中关村西区人工智能产业园、以及清华科技园四大产业园区,覆盖面积达67万平方米,这为北京大模型产业的宏伟蓝图提供了宽阔的物理空间。

2024年7月,人工智能创新街区概念发布。北京计划在海淀南部的53平方公里范围打造人工智能创新街区,串联起52个全国重点实验室、10个新型研发机构、106个国家级科研机构、37所顶尖高校、89位全球顶尖学者、1.23万位人工智能学者、1300家人工智能企业、90余家大模型相关单位、37家备案大模型单位。

通过一系列伙伴计划、联盟,北京让一片片AI创业空间“活起来”。

2023年5月,北京发布通用人工智能产业创新伙伴计划,当月公布首批39家成员名单,7月公布了第二批63家企业,包括阿里云、北京超级云计算中心等算力伙伴,北京市大数据中心、北京市科学技术研究院、北京智源人工智能研究院等数据伙伴,百度、智谱AI、阿里达摩院、昆仑万维等模型伙伴,北京市政务服务管理局、北京银行、金山办公等应用伙伴,IDG资本、鼎晖创新、奇绩创坛等投资伙伴。

2024年7月,中关村人工智能产业联盟发起成立,启动通用人工智能产业创新生态计划。联盟成员包括北京通用人工智能研究院、中国信通院、北京大学、清华大学、中国人民大学、中国科学院自动化研究所、智源研究院、海天瑞声、智谱AI、腾讯、中国中车、百度、百川智能、中关村科学城公司等上百家高校、机构。

可以看到,为体现市场化开放合作对接机制,北京发动了大半个中国的投资界、产业界、学术界力量,共同助力大模型产业的发展。

而这些行动促成的成果,最终也不只是“秀肌肉”,而是为全国打样,用成果​反哺全国大模型产业和数字经济发展。

结语:打造数字经济标杆,北京占据“百模大战”C位

从数字化到智能化,北京再次走在了时代跨越的前列。

1994年中国首次接入互联网,北京于1997年就率先成立了市信息办,并在1999年制定了长远的“数字北京”三步走目标:2000—2010年,形成“数字北京”基本框架。2011—2020年,提高首都的数字化水平。2021—2050年,将北京建设成为现代化国际数字城市。

引领互联网宽带、高清数字电视等风潮,踩准电商、数字物流、数字政府等风口,打造了载入史册的“首都之窗”网站开通、市政交通一卡通普及、2008年数字奥运、3G网络服务通网……根据官方数据,北京数字经济增加值在2015年达到8719亿元,到2022年已经增长至1.7万亿元,成为经济增长的主要引擎之一。

AI作为数字化的重要子题,作为新质生产力的代表,不仅在北京数字化的沃土中生根,更在积极的AI专项政策浇灌下萌芽。政策、产业、学研、资本、应用多管齐下,北京已成为国内甚至全球首屈一指的人工智能产业人才中心,中国大模型第一城背后,北京的护城河,俨然越来越深。