全球大模型生态发展步伐及新兴应用,国内城市如何抢滩大模型阵地

aixo 2024-08-28 00:22:37
大模型 2024-08-28 00:22:37

撰文/“中国视谷”融媒体中心 苏会会

当前,全球技术创新步入密集活跃期,国内“百模大战”酣战一年格局初显,人工智能大模型整体呈现爆发式发展,逐渐成为产业新型基础设施,加速转动商业化应用齿轮。

大势之下,让我们一起探寻全球大模型生态的发展步伐与涌现了哪些强悍的大模型,崛起了哪些新兴应用?以杭州为代表的国内城市又是如何抢滩大模型阵地,打造新质生产力加速发展的重要“引擎”?

一、溯源进阶:科技巨头引领全球创新潮流

大模型是全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。

追溯AI大模型的发展进程,2017年,提出基于自注意力机制的神经网络结构——架构,奠定了大模型预训练算法架构的基础。次年,和分别发布了GPT-1与BERT大模型,预训练大模型成为自然语言处理领域的主流。

图 大模型技术迭代历程 来源:《人工智能图景展望:跃迁点来临(2023)》报告

2022年,AIGC初步呈现爆发态势,最引发市场关注的是 和。尤其是惊艳问世,在全球范围里掀起了一轮AIGC创新热潮,开启“人机互生”新阶段。2023年3月15日成为AIGC时代来临的关键节点。发布多模态预训练大模型GPT-4,由此引发了全球科技巨头“互掰手腕”、中国市场“百模大战”的连锁反应。随后,又在今年打造了现象级“爆款”——视频生成大模型 Sora,60s一镜到底的电影级视频“硬控”了每一位见证者。

图 国内外大模型基座发展示意图 来源:《大模型关键技术与未来发展方向——从 谈起》报告

从全球范围看,世界各地积极推动大模型研发和应用,美国、中国是主要“玩家”,而英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。

现阶段,国外大模型领域主要呈现三大发展模式,包括“龙头大模型+原有业务”、“龙头大模型+外部行业数据”、“开源大模型+自有行业数据搭建行业大模型”,最具代表性的有模式、微软模式、谷歌模式等,已在自然语言处理、计算机视觉、智能语音等领域取得了标志性技术突破,在模型精度、通用性和泛化能力等方面实现了跨越式发展。

二、大模型之争:“千模大战”与“四省争霸”

大模型之争在国内产业界日趋“白热化”,“百模大战”逐渐演变为“千模大战”。

相比国外大模型“龙头效应”显著,国内大模型的发展模式主要包括“自有通用大模型+外部行业数据”以及“自有或其他开源大模型+自有行业数据”。

而根据应用场景和目标人群的不同,可分为通用大模型和行业大模型两大类。我国具有代表性的通用大模型主要包含百度“文心一言”、阿里巴巴“通义千问”、科大讯飞“讯飞星火认知”等;行业大模型主要涵盖蜜度“文修”、容联云“赤兔”、用友“”等。根据运行载体不同形成了端侧和云侧大模型,如端云结合的有vivo“蓝心”大模型,端侧主要以蔚来“NOMI GPT”大模型为代表。

截至目前,国内AI大模型市场尚未出现爆款级应用,面临着算力限制和高质量训练数据集匮乏两大难题,有望倒逼算力基础设施建设加强,以及数据在大规模、多模态、高质量三大维度上的全面提升,其红利和贡献还远未被发掘。

图 基于大语言模型的多模态大模型通用结构 来源:《大模型关键技术与未来发展方向——从 谈起》报告

大模型不仅在行业内“争奇斗艳”,也在城市之间“打”得火热,托举中国大模型实力稳居全球第一梯队。

截至2024年3月28日,通过国家互联网信息办公室备案的大模型名单有117个,其中,北京51个,上海24个,广东19个,浙江9个,大模型数量占全国总模型数量的88%。

图 浙江省生成式人工智能服务已备案信息 来源:杭州市“中国视谷”专项工作组

其中,浙江是大模型孕育的繁荣之地、大模型应用的领先之地。截至2024年4月29日,浙江已备案如阿里巴巴“通义千问”、新华三“百业灵犀”、同花顺“问财”等11项生成式人工智能服务。还有一大批垂直类大模型以及处于内测、未开放给公众的大模型不断壮大。

综合来看,浙江省泛人工智能企业主要集中在环杭州湾地区,省内现有大模型也大多数诞生于杭州,来自“中国视谷”产业生态企业,成了杭州助力浙江加快培育新质生产力的强大引擎。

图:“中国视谷”精神堡垒 来源:杭州市“中国视谷”专项工作组

例如,“中国视谷”正前瞻布局一批大模型相关未来产业,培育发展超大模型类脑计算,将推进知识增强、跨模态统一建模、提示学习、持续学习等技术在超大模型中的创新应用,加快超大模型在机器视觉、多模态、人机交互等领域应用。同时,鼓励龙头企业、科研院所开展多模态通用大模型研发并向中小企业开放模型应用,围绕模型开发搭建开源开放平台(社区),构建基于开源开放技术的软件、硬件、数据、应用协同的产业生态。

三、城市案例:杭州打造“模型即服务”新模式

当前,杭州加速引领全省人工智能产业的特色化发展,推进“模型即服务”新模式,支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,推动“中国视谷”产业生态企业合力探索大模型的商业化应用进程,形成了“1+N+X”的协同创新、双向赋能产业生态。

图 MaaS模式下的AGI基础业态分析 来源:《人工智能图景展望:跃迁点来临(2023)》报告

例如阿里巴巴“通义千问”已迭代2.5版本,落地应用速度不断加快,赋能天文、PC、文旅、航空、矿业等多个领域。根据阿里云公布的最新数据,目前通义大模型已经服务超9万家企业,通义开源模型累计下载量突破700万。