在奥地利维也纳落幕的2026年国际机器人与自动化会议(ICRA)上,一场关于具身智能的全球性较量引发关注。由中国科学院自动化研究所模式识别实验室牵头研发的NeoVerse-ABot模型,在图像质量与动作跟随两大核心指标中力压群雄,以0.829分的成绩登顶世界模型赛道冠军。这一突破标志着中国团队在机器人智能领域实现了从"执行工具"到"智能体"的关键跨越,为全球具身智能技术发展提供了全新范式。
传统机器人长期受困于"所见即所行"的机械模式,其操作高度依赖实时视觉反馈,却缺乏对物理世界的理解能力。当面临物体滑落、轨迹偏移等复杂场景时,这类机器人往往因无法预判风险而出现操作失误。研究团队指出,这种局限性正是区分"高级机器"与"智能体"的核心差异——真正的智能体需要具备"物理想象力",能在行动前通过内部模拟推演行为后果。
NeoVerse-ABot模型的突破性在于构建了感知与决策的闭环系统。该模型通过整合机器人当前视觉场景与计划动作序列,精准预测机械臂、物体与环境间的动态交互过程。相较于以往单纯追求画面精美的技术路线,此次竞赛特别强调模型必须严格遵循物理规律与动作指令,避免出现"脑补"虚假画面的"动作幻觉"问题。中国团队研发的模型在双重约束下仍能生成高清画面,同时确保物体运动轨迹与控制信号高度匹配,展现出强大的物理推理能力。
破解"动作幻觉"成为技术攻关的关键。研究团队颠覆传统认知,将夹空、滑落等失败交互数据视为宝贵训练资源,通过提升长尾样本权重使模型充分学习真实物理交互的完整分布。同时引入强化学习反馈机制,构建以动作匹配度、因果合理性为核心的评估体系,从根源上抑制虚假画面生成。经过多轮优化,模型已能准确区分成功操作与失败场景,在非理想条件下真实预判物体状态变化。
这项技术突破正加速推动中国机器人产业升级。当前我国机器人硬件生态日趋完善,但"智能大脑"的缺失长期制约着规模化应用。传统研发模式依赖真机试错,存在数据采集成本高、长尾场景覆盖难等痛点。NeoVerse-ABot作为高可信神经仿真器,可通过虚拟环境预演生成海量物理真实数据,将真机测试成本降低60%以上,显著缩短研发周期。在工业制造领域,该技术已助力柔性生产机器人实现复杂工序的自主适配,操作风险预判准确率提升至92%。
从仓储物流到家庭服务,从养老医疗到特种作业,具身智能技术正在重塑人机协作模式。在某汽车零部件工厂的试点应用中,搭载该模型的机器人成功处理了200余种异形零件的抓取任务,将生产线换型时间从45分钟压缩至8分钟。在商业服务场景,高频次作业机器人通过自主策略调整,使物品损坏率下降73%。研究团队透露,相关技术已延伸至自动驾驶仿真测试领域,为智能车辆提供极端天气下的决策训练平台。
随着"十五五"规划将具身智能列为重点发展产业,中国团队正持续深化技术研发。当前工作聚焦于模型推理速度优化与虚拟仿真体系完善,目标是将控制延迟压缩至100毫秒以内,同时构建覆盖95%以上真实场景的标准化训练库。这项起源于实验室的技术突破,正在转化为推动产业变革的核心动能,为中国在全球人工智能竞赛中抢占战略制高点提供关键支撑。
