天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 营养美食 大燕公益 商业快讯

具身智能机器人破局之道:聆动通用季超详解“大小脑结合”技术

2025-07-28来源:天脉网编辑:瑞雪

在2025年世界人工智能大会(WAIC)的盛会上,人形机器人展区成为了万众瞩目的焦点,吸引了络绎不绝的参观者。这一热潮不仅映射出具身智能领域前所未有的关注度,也预示着该领域正逐步跃升为AI赛道上的璀璨明星。

随着机器人亮相春晚舞台、全球首场人形机器人马拉松比赛的成功举办,具身智能技术正以前所未有的速度从理论迈向实践。在这样的背景下,安徽聆动通用机器人科技有限公司(简称“聆动通用”)于2024年12月正式宣告成立,成为安徽省首家实现“大脑-小脑-本体”全链路自主可控的硬科技企业,同时拥有丰富的多场景商业应用经验。

在WAIC大会上,聆动通用震撼发布了其最新研发成果——具身智能采训推一体机。这款产品的问世,标志着公司在AI技术与应用领域的又一重大突破。

聆动通用CEO、科大讯飞机器人首席科学家季超在接受采访时表示,此次展出的采训推一体机,是公司针对行业级具身数据缺失问题提出的创新解决方案,旨在通过“消费级与工规级融合方案”,助力具身智能机器人提升真实场景下的技能水平,从而迈出从实验室走向工业产线的重要一步。

实际上,在聆动通用成立之前,科大讯飞已在机器人领域进行了深入布局。自2022年初启动“讯飞超脑2030计划”以来,科大讯飞不断取得突破性进展。2023年,季超团队成功发布了业界首个集成全自主国产认知大模型的具身智能人形机器人,率先在国内打通了大模型与具身智能相结合的全链路。而在2024年的世界机器人大会上,科大讯飞更是展示了一款性能卓越的人形机器人,其整体运动性能提升了两倍,复杂任务拆解成功率超过95%,开放场景物体寻找成功率也高达85%。科大讯飞还推出了AI扫拖机器人X3、AI助教机器人X1等多款针对不同场景的机器人产品。

具身智能在工业场景中的应用,面临着技术逻辑上的核心矛盾。一方面,工业生产要求机器人具备极高的可靠性,任何微小的误差都可能导致生产线停摆;另一方面,当前通用大模型与机器人在实际场景中的规划成功率尚未达到工业级标准,高质量数据的稀缺与跨场景适配的复杂性,使得机器人难以突破“实验室好用、工厂不好用”的困境。针对这一问题,季超团队对采训推一体机的研发进行了深入探索,试图通过“消费级与工规级融合”的硬件创新以及“全栈数据链打通”的软件架构,在成本与精度、通用与专用之间找到最佳平衡点。

季超坦言,具身智能的终极战场并非舞台,而是产业应用。聆动通用与科大讯飞致力于将机器人技术真正应用于人类生产,推动生产力的革新。

在谈及采训推一体机的关键技术节点时,季超指出,该设备需要解决跨不同本体的适配问题,如构型、协议和格式的差异,以及数据清洗等挑战。同时,采训推一体机将基于科大讯飞的星火大模型这一“大脑”核心支撑,开发属于自己的具身智能大模型,形成平台与赛道相结合的逻辑。

关于采训推一体机采用消费级与工规级融合方案的原因,季超表示,这一方案旨在解决高质量数据稀缺的问题。工业场景需要长时间、高强度的数据采集,但纯工规级方案成本高昂。因此,公司选择在关键环节采用工规级方案,其他部分则采用消费级方案,以控制成本并满足模型训练需求。与其他数据采集设备相比,聆动通用的采训推一体机不仅提供硬件,还负责后续数据的治理和使用,形成了“数据采集—模型训练—硬件部署—场景落地”的全链条闭环。

在工业场景中,机器人数据采集和模型训练的痛点主要表现为SKU种类繁多、数据格式和接口协议不统一等问题。小模型的开发成本高,且数据难以互通。聆动通用的“大小脑结合”技术路径则通过少量真机数据微调基座模型,快速适配多SKU零件分拣,并在“类”级任务之间实现低成本泛化。

针对通用大模型与工业要求之间的可靠性差距,季超提出,通过提高数据质量降低幻觉风险是解决之道。公司提出的解决方案核心价值在于“用真实数据对抗幻觉”,从大脑、小脑以及硬件层面共同提升工业级应用的可用性和可靠性。

季超认为,具身智能领域的发展路径与大模型相似,将是机器人行业的范式革命。聆动通用的核心竞争力在于科大讯飞在大模型领域的积累、团队的行业场景理解和数据积累以及AI+供应链的理解和整合能力。未来,聆动通用希望在全球竞争中步入具身+高端制造业领域的“国家队”序列,推动机器人技术从科研、消费领域进入工业实际生产,满足各行各业的需求,构建新一代生产力工具。