天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

具身智能数据瓶颈如何破?姚卯青携觅蜂科技探索数据采集新路径

2026-05-23来源:天脉网编辑:瑞雪

在具身智能领域,数据正成为推动技术进步的核心要素。姚卯青,这位曾在谷歌、甲骨文和蔚来汽车等科技巨头任职的行业资深人士,如今以觅蜂科技董事长兼CEO的身份,带领团队在数据赛道上加速奔跑。他指出,具身智能的发展瓶颈已从算法转向数据,行业亟需构建高效的数据采集与处理体系。

据姚卯青介绍,当前全球具身智能领域有效数据量仅约几十万小时,而要实现类GPT-3.5的初步智能水平,至少需要一亿小时数据。这一巨大缺口促使觅蜂科技提出雄心勃勃的目标:2026年达到千万小时级数据产能,2030年突破百亿小时。他强调,百亿级高质量数据有望让机器人具备GPT-4级别的专家能力,推动智能涌现现象的出现。

为突破数据瓶颈,觅蜂科技探索出一条全民参与的采集路径。公司通过众包和加盟模式,联合职业院校、劳务平台及专业数据团队,构建覆盖零售、物流、家居等场景的采集网络。姚卯青透露,无本体可穿戴设备的使用显著提升了采集效率——8小时工作可产出约5小时有效数据,接近真机采集的两倍。配套的数据治理平台MEgo Engine则通过自动化标注和预处理技术,进一步压缩了数据处理成本。

在数据标准化方面,觅蜂科技提出"蜂巢数据共创行动",吸引场景提供方、数据生产商及运营团队加入生态。姚卯青认为,标准需在实践中迭代形成,而非闭门造车。通过与模型团队的闭环验证,觅蜂正推动行业形成统一的数据格式与质量评估体系。这种模式已得到机器人企业、大厂具身团队及世界模型研发者的认可,他们急需物理交互数据提升模型智能化水平。

面对行业对数据壁垒的争议,姚卯青主张"开源与闭源并行"。他曾在智元时期开源百万级机器人轨迹数据集,但认为这只是行业启动阶段的权宜之计。长远来看,定制化闭源数据将成为主流,企业更倾向于与专业平台合作获取场景化数据。这种判断基于他对机器人发展阶段的观察:当本体技术趋于成熟,大规模部署需求将倒逼数据采集范式转型,无本体设备因其可扩展性正成为重要补充。

觅蜂科技的实践正在重塑具身智能的数据生态。通过将数据采集设备与处理平台解耦,公司为行业提供了水电般即取即用的基础设施。这种模式既降低了中小企业参与门槛,也为头部企业构建数据壁垒提供了可能。随着2026年被业界视为"具身数据元年",这场由数据驱动的智能革命正进入关键加速期。