对话智元首席科学家:具身智能不应过度类比大模型,以免造成最大误读

AI世纪 2025-04-06
大模型 2025-04-06

具身智能非短期可突破

具身智能是一个结构复杂且技术要求高的领域,单纯依赖算力提升或模型叠加难以取得显著进展,这需要持续的技术沉淀。尽管与大型模型存在某些技术上的共通之处,但两者并不能直接等同。若将大型模型的发展历程与具身智能相提并论,则忽视了作业智能与行动智能所面临的特殊难题。具身智能的技术提升需经过长期的探索过程,不宜急于求成。

软件难题与解决方案

罗剑岚提到,尽管大模型在软件领域表现出强大的能力,但在处理长时间跨任务、分层控制以及实时反馈等方面仍存在挑战。未来,我们不会依赖单一模型来解决所有问题,而是会根据不同行业特点,构建多个相对标准化的模型和方案。在实施过程中,机器人可以先在封闭或半封闭环境中进行测试,将约百分之七八十的潜在可能性转化为实际运作,并通过收集数据反馈来优化系统。

数据现状与算法设计

目前数据规模巨大,特斯拉去年披露的道路行驶数据高达500亿英里,导致数据中心承受巨大压力。鉴于此,重点应转向算法设计的优化,以实现数据的有效整合。那些在产品与生态方面具备实力、能独立部署机器人的具身智能企业,将获得领先的市场优势。

全栈路线的优势

在具身智能这一领域,软硬件同步迭代的全栈发展路径受到青睐。即便仅专注于“大脑”研发,与硬件结合同样可行,但全栈模式更有利于软硬件的协同进步,从而在长期竞争中占据优势。展望未来,若具身智能企业能够实现全栈布局,其竞争力将显著增强。

技能展示与领域现状

当前,众多具身智能企业普遍展示出它们在执行长期、复杂任务方面的能力,且各具特色。自2016年谷歌发布深度机器人学习相关论文以来,基于该理论的机器人虽在现实世界中有所应用,但情况似乎有所变化。尽管全球已有超过500万台机器人被部署至实际场景,但这些机器人主要依赖精确的定位操作,从事的是重复性的编程任务,可被视为缺乏自主能力的“盲”机器人。

多元力量入局与发展前景

大模型的出现推动了强化学习在具身智能领域的流行。在这一领域,众多参与者持有不同观点,包括计算机视觉领域的专业人士、大模型相关人士以及核心机器人研发团队。目前,众多大型企业、产业界和消费电子企业开始涉足具身智能领域。尽管像智元这样的初创企业面临诸多挑战,但它们仍有可能通过独特的创新在激烈的市场竞争中占据一席之地。全能型理想机器人可能需十年或更长时间才能问世,然而,具备特定场景应用价值并能持续进行自我学习的机器人预计将提前问世。

在激烈的市场竞争中,这些创业公司是否能在具身智能领域成功突破大厂的封锁,实现自身的突出表现?

LLM