大模型不是万能的,超级应用仍需努力

aixo 2024-08-26 17:09:30
大模型 2024-08-26 17:09:30

为什么“大模型不是万能的”

■本报记者 赵广立 通讯员 孙中婵

“大模型不是万能的,不能过度神化它。”

这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在中国计算学会太原分部主办的“大模型赋能文物古建保护与传承论坛”上。

自2022年底大语言模型产品问世以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,国内各大高校院所、企业也纷纷加入,至2024年5月底,国内已发布300多个大模型产品。

然而,大模型至今仍未实现它的“超级应用”。相比国内数以十亿计的移动互联网用户数量,大模型产品的日活用户数至多只有百万量级。如此之低的渗透率,不免让人对“大模型不是万能的”这句话更有共鸣。

赋能古建保护?大模型还差点火候

地上文物看山西。山西古建筑资源丰厚,价值极高。数据显示,山西全省目前保存的古建筑有28027座,数量居全国之首;其中遗存最少、价值最高的唐代到金代的木结构建筑,山西拥有120多座,占全国80%以上。由于文物古建不可替代、不可复制、不可再生,科学保护文物古建成为重要课题。

如何利用大模型技术为山西文物古建资源提供更为精准、高效的保护与传承方案?在“大模型赋能文物古建保护与传承论坛”上,专家就此展开了探讨。

事实上,珠玉在前。在“2024中国·AI盛典”上,山西省永乐宫壁画保护研究院院长席九龙等人就分享了利用生成式人工智能技术修复永乐宫壁画《朝元图》的故事,用人工智能之笔重现了800年前的中国色彩。不过,在文物古建的保护命题上,一些文物专家对数智化技术的应用仍持观望态度。

太原市文物保护研究院科技信息部副主任韩宏斌谈到,目前文物界对于数字化手段能否真正还原文物原貌存在较大争议。“以晋祠为例,用增强现实(AR)等技术修复后的壁画,虽然轮廓复原了,但是色彩的沉稳度、笔触的生动性没有得到展现。”

而具体到文物古建保护,目前大模型的应用似乎更加有限。韩宏斌介绍说,游客呼出的气体、温度湿度、大气变化、微生物等因素都会造成建筑本体的破坏。如何利用智能化技术对相关问题进行预测,以及如何抓取利用相关数据实施可行性保护,仍是难题。

论坛上多位专家也谈到,文物保护涉及生物、化学、物理等多个学科领域,仅靠大模型“赋能文物保护”有些勉为其难。山西大学自动化与软件学院副院长郭威认为,目前文物古建筑领域的数据量级有限、案例有待丰富,倒不如先在文化传承领域下功夫,例如用AR技术等数字化手段进行场景化研学、沉浸式游览。

哈尔滨工业大学计算机科学与技术学院教授冯骁骋谈到,文物古建的修复不一定需要大模型技术。例如,基于物联网技术的“古建筑健康智能监测系统”可以对古建筑进行健康监测和预警保护;基于三维激光扫描技术的无损检测能够对古建筑文物内部结构以及损伤程度进行检测,为修复工作提供精准的数据支撑等。

大模型发展仍在初级阶段

一位要求匿名的行业专家告诉《中国科学报》,大模型在古建保护领域“吃瘪”并不是个别现象。现阶段大模型发展虽然十分迅猛,但仍处于初级阶段,规模化落地尚待进一步探索。

北京智源人工智能研究院大模型行业应用总监周华认为,目前大模型在原理上还存在一定的“幻觉”,这导致大模型在规模落地方面存在着类似“最后一公里”的问题。

“许多人工智能企业或厂商在通用模型方面做得相当不错,能够通过考试并获得高分,但当涉及特定行业的应用,尤其是那些需要深度知识和高准确性、可靠性的应用时,行业大模型还有很大的探索和发展空间。”周华说,现阶段大模型主要在一些容错性较高的领域落地,如在智能客服、文档处理等方面能够发挥更多辅助作用。

大模型作为人工智能领域的关键工具,其层级构建逻辑是通用大模型居底层,具备广泛适用性但专业深度有限;行业大模型在通用大模型之上,针对特定领域深化专业性;垂直大模型则进一步聚焦于行业内的细分领域,强化专业服务能力。

腾讯研究院大模型研究课题组的报告显示,影响行业应用大模型速度的两个关键因素是数据可得性和需求适配度。高质量数据越容易获取,行业模型应用进展越顺利;同时,行业核心业务与大模型创意生成和交互能力越匹配,应用落地进展越快。

该报告进一步举例说明:互联网、数字游戏等数字原生行业,由于数字化程度高、数据积累丰富、技术接受能力强,容易成为大模型落地较快的行业;而文物古建领域由于线下生产流程的复杂性和高度的专业化,尚处于局部试点探索阶段。