商汤科技日日新大模型一年内迭代至5.0版

aixo 2024-05-24 09:51:40
大模型 2024-05-24 09:51:40

模型大师_大模型_模型大班什么意思

去年4月,商汤科技日日新大模型体系在“百模大战”中首次亮相,一年内已迭代至5.0版。“大模型能力每隔3个月就会显著提升。”商汤科技董事长兼CEO徐立表示,最新版本已可对标GPT-4 Turbo的能力。

作为人工智能(AI)领域的新风口,大模型竞争是当下全球的焦点。在“模都”上海,以商汤科技为代表的一批大模型公司不仅快速驶入赛道,而且在更快持续迭代上踩下油门,加速推动形成新质生产力。

这种“快”,体现在掌握更多新本领上。商汤科技产品负责人贾安亚介绍,日日新5.0已实现基础能力的重大升级,特别是在语言、知识、推理、数学、代码等方面的能力提升。比如,当被问到“13位小朋友玩老鹰抓小鸡,已抓5只,还剩几只”这样的数理逻辑题时,日日新5.0会准确作出回答。“像这类题目,过往很难去判断大模型是因为‘见过记住’还是‘理解会做’。”贾安亚解释,为此,新版大模型能够自动生成代码来对用户提出的数学问题求解,确保是在了解游戏规则后形成的正确思考。这种数理逻辑能力,恰恰是理解和解决各种问题的底层工具。

让大模型更“快”并不容易,需要上下游产业链的支撑。曾有人把大模型比作树干,算力大装置就是树根,巩固树根才能让树干快速吸收数据“养分”,长出枝繁叶茂的应用生态。

放眼整个行业,能做到“大装置+大模型”的企业屈指可数。而在日日新出世之前,商汤科技就已提前打下大装置的“桩基”:2020年在临港建设智算中心,并于2022年投运,打造AI算力“样板间”。“2021年提出大装置时,我将其比作AI的粒子对撞机。”徐立表示,去年,商汤科技主要聚焦在模型本身的技术发布,今年则更多关注行业场景的落地。如今,由日日新基础大模型所衍生出的商量、秒画、如影、大医、格物、琼宇等应用已开始在各行各业落地。最近,商汤科技还推出代码小浣熊推理一体机,提供落地办公场景的提效方案,兼顾数据隐私安全与价格亲民。(徐晶卉)