腾讯研究院发布《向AI而行,共筑新质生产力——行业大模型调研报告》

aixo 2024-05-14 05:47:10
大模型 2024-05-14 05:47:10

日前,腾讯研究院正式发布了《向AI而行,共筑新质生产力——行业大模型调研报告》(下文简称“报告”)。所谓 “行业大模型”,指的是利用大模型技术,针对特定数据和任务进行训练或优化,形成具备专用知识与能力的大模型及应用。与通用大模型相比,行业大模更专注于提高性价比、增强专业性并保障数据(特别是私有数据)的安全性。

模型大师_模型大班什么意思_大模型

“人工智能大模型正在催生新一轮技术创新与产业变革,也将为工业、金融、广电等行业数字化转型和高质量发展带来新动能。当前市场以基础大模型为主,通识能力强,但缺少行业专业知识。如何将大模型融入千行百业,是下一阶段的发展重点。”中国工程院院士邬贺铨在报告序言中提出。

这份报告结合腾讯研究院发起的对人工智能与大模型领域百余名专家的深度访谈“大模型百人百问”,深入剖析了行业大模型发展、应用、实现、治理与未来发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。

大模型的“不可能三角”: 专业性、泛化性和经济性的平衡与取舍

提出的“规模定律”( Law)驱动了大模型的快速发展,传统AI模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级,并已发展到过万亿级的规模。大模型带来了AI性能突破,也激发业界向通用人工智能(AGI)领域进发的新热潮。

不过,大模型存在专业性、泛化性和经济性“不可能三角”问题,导致目前行业实际落地应用进程并不快。

“专业性”,指大模型处理特定领域问题或任务的准确性与效率。“泛化性”,指大模型处理训练数据集之外新样本的能力。而“经济性”则指大模型训练和应用的投入产出比,三者很难同时得兼。

例如,GPT为代表的通用大模型以发展通识能力为主要目标,更侧重泛化性,在专业性和经济性方面目前很难充分满足具体行业的特定需求,因此需要行业大模型来针对性解决。

模型大班什么意思_模型大师_大模型

中国互联网投资基金管理有限公司总经理李筱强认为,大模型的出现使得AI再次受到资本市场的广泛关注,其核心逻辑在于大模型实现提质增效创造价值的同时,也提供了实现通用人工智能的可能选择。在算力、算法、数据、场景等四个决定大模型发展的关键要素中,数据和场景是我们相对优势的领域。而要更好地利用场景,成功实现商业落地,高质量的行业大模型必不可少。

三个核心发现

从目前情况看,行业大模型整体处于发展早期,尚未出现大规模成熟应用的范例。

本报告主要尝试厘清三个问题:一是行业大模型既有模型、也含应用;二是行业大模型大多生长在通用大模型之上,基于通用大模型进行再开发;三是行业大模型具备定制特征,本质是解决方案,而非产品。

行业大模型中的产品通常是“毛坯房”,客户需要因地制宜地“装修”才能满足需要。

按照埃弗雷特·罗杰斯( M. )《创新的扩散》一书中对创新阶段的界定,行业大模型应用阶段可划分为探索孵化期、试验加速期、采纳成长期和落地成熟期,“百人百问”访谈和研究显示,目前大部分行业处于前两个阶段,还没有行业达到落地成熟期。

在实际应用方面,数字原生行业(如各类互联网应用)是行业大模型应用的先行者,传统行业中生产性服务业(广告、金融等)进展相对快,而重资产行业(建筑、制造、能源等)进展相对慢。《报告》发现,其中有两大核心影响因素是需求的适配度和数据的可得性,越高的行业进展越快。

模型大班什么意思_大模型_模型大师

《报告》还发现,行业大模型应用场景的快慢呈现“微笑曲线”特征。在产业链高附加价值的两端(研发、设计和营销、服务),大模型应用落地较快。造成这种情况的原因之一是,大模型带来“智力即服务”的范式变化。这种服务特别适配微笑曲线两端的知识密集型和服务密集型领域,而在低附加价值的中部(生产、组装等),大模型应用进程较慢。

模型大师_模型大班什么意思_大模型

虽然不同行业与大模型结合的进展和侧重点存在差异,但也存在三大共性需求,包括:内容生成与创意设计、信息提炼与专业辅助、任务调度与智能交互。

针对业界普遍关心的“如何衡量行业大模型成功与否”问题,《报告》总结构建出2-3-1原则:要避免片面追求技术性能或短期收益的2个误区,应评估降本提效、业务创新和体验增强上的3类价值,并重点构建1个高质量数据飞轮的模式。

模型大班什么意思_大模型_模型大师

其中有两个容易陷入的误区:

一是误将技术指标当作证明大模型成功的标准。事实上技术指标的高低无法直接反映出大模型价值的大小,应关注用户数、使用量、收入等业务指标,这些指标能直观反映价值,作为评判成功的标准更具说服力。

二是过度看重投资收益中的短期产出部分而忽视长期投入。合理的方式是将大模型作为研发或孵化项目,不强求短期的财务指标绝对值达成,转而关注业务、技术等指标的相对提升,采取广泛的组合投资策略长期持续投入才可能真正见效。

行业大模型目前主要有四种技术实现方式,从易到难分别是:提示工程、检索增强生成、精调和预训练。实际应用中这些方式通常是组合使用,以实现最佳效果。

模型大班什么意思_模型大师_大模型

提示工程适用于刚接触大模型的企业新手,采用这种方式能以最小资源投入、快速探索应用。局限性也很明显,若大模型内含的行业数据较少,效果较差。

检索增强生成适用于处理企业自有数据,通过大模型外挂知识库,更准确检索并生成知识库范围内的内容。该方式模型本身不会调整,算力等投入就不会太大,已成为部署行业大模型应用的主流选择,局限在于对知识库外的专业问题反馈效果有限。

精调适用于解决行业特定任务,通常是基于特定数据集局部调整模型参数,提高任务处理的效果和效率。精调是对大模型定制优化和成本投入的折中选择,算力和数据等投入明显增加,但比预训练更低。

预训练适用于行业专业性较高、数据类型和任务与主流通用大模型差异较大的情况,例如生物/医药研发。这种方式投入最大,不仅需要收集大量数据,还需要对模型进行全参数训练调整,甚至从头搭建一个模型。

行业大模型的发展方向:人工智能体(AI Agent)与模型即服务(MaaS)的发展,对行业大模型的意义重大

在“人工智能+”等重要政策指引下,行业大模型有望加速在传统行业的落地应用。在云智一体的基础设施支持下,行业大模型向多模态、人工智能体、端侧及小型化等方向发展,将更深入嵌入各行业的工作流程中,从而提升生产力。

一些与工作流程深度耦合的AI Agent已经开始涌现,有望逐步发展成为各行各业不可或缺的新型生产力工具。在办公领域,如 365 及其个人版 Pro;在社交领域,如Meta AI等产品;在工业领域,如等工业视觉检查机器人的应用;在营销领域,则诞生了等平台……

随着AI应用的深入,模型的规模、类型和复杂性将不断增加,MaaS(模型即服务)将日益成为行业用户云上用智的主流方式。

用户或直接调用云的大模型API,或借助全生命周期的大模型训练工具,生成适用于自身场景的大模型,并托管在云上,为最终用户提供高质量智能服务。为此,面向AI的、更高性能的算力底座必然不可或缺。通过计算、存储、通信、训练等各层面的优化,全面提升模型训练、开发和应用效率。

大模型_模型大班什么意思_模型大师

AI大模型在各行业的应用,将会加速社会共同迈向智能新时代。例如,中国广告协会会长、国际广告协会全球副主席张国华认为,大模型是效率、体验和创造力的倍增器,它正在重塑着广告行业的未来;中国工程院院士李伯虎提出,“AI+制造”能够提高生产效率、提升产品质量、实现个性化定制、优化资源配置、促进绿色环保、实现人才结构优化等,进而加快推进中国工业的五个转型升级,实现工业的数字转型与智能化升级,促进新质生产力形成。