在科技日新月异的今天,人形机器人领域正迎来一场前所未有的变革。网络知名博主“稚晖君”,本名彭志辉,近期在B站平台上发布了一段震撼人心的视频,向公众展示了其团队最新研发的具身智能人形机器人——灵犀X2原型机。这一创新成果不仅吸引了业界的广泛关注,也让彭志辉这位科技界的新星再次成为人们瞩目的焦点。
彭志辉,这位1993年出生于江西吉安的年轻科学家,自幼便对科技展现出了浓厚的兴趣。他在电子科技大学信通学院深造后,于2018年研究生毕业,并加入OPPO研究院AI实验室,迅速以其卓越的科研能力崭露头角。2020年,彭志辉凭借出色的表现,成功入选“华为天才少年计划”,并以最高档年薪201万元加入华为,致力于昇腾AI芯片和AI算法的研究。然而,对科技梦想的执着追求和创业的热情,让他最终决定离开华为,于2022年年底离职,并于次年2月联合创立了智元机器人公司,担任首席技术官,开启了人形机器人研发的新征程。
3月11日,彭志辉在B站发布的最新视频中,详细介绍了灵犀X2的卓越性能和独特功能。这款人形机器人重达33.8千克,全身拥有28个自由度,且未采用任何并联结构,展现了极高的灵活性和智能水平。灵犀X2不仅能够自如地行走,还能完成跑、旋转、跳舞等高难度动作。更令人惊叹的是,它还具备举重、踩滑板车、玩平衡车以及骑自行车等多种技能,充分展示了其在运动智能领域的非凡实力。
彭志辉透露,灵犀X2的持续学习和进化得益于数据驱动的算法范式。智能体能够从每秒数万次的环境交互和动作数据中不断寻找突破运动瓶颈的方法,有望彻底解决人形机器人的运动智能问题。智元团队还为灵犀X2开发了一套基于Diffusion(扩散模型)的生成式动作引擎,使机器人不仅四肢强健,而且具备出色的思维能力。借助当前热门的大语言模型技术,灵犀X2被训练成具备复杂交互能力的“灵动机器人”,拥有毫秒级的交互反应速度。
在智元机器人的研发历程中,彭志辉和他的团队并未止步于灵犀X2的成功。3月10日,智元机器人官方宣布发布了首个通用具身基座大模型Genie Operator-1(GO-1)。这一大模型通过学习人类视频,能够协助机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。视频中展示了仿真数据采集及大规模真机数据采集的过程,引发了人们对未来人形机器人应用的无限遐想。
据智元机器人介绍,GO-1大模型在各项任务中的成功率显著领先,平均成功率提高了32%,尤其在“倒水”、“清理桌面”、“补充饮料”等任务中表现尤为突出。为了有效利用高质量的AgiBot World数据集以及互联网大规模异构视频数据,增强策略的泛化能力,智元提出了Vision-Language-Latent-Action(ViLLA)架构。这一架构使GO-1大模型能够快速适应新任务,并支持部署到不同的机器人本体上,为人形机器人的研发注入了新的活力。
去年底智元机器人联合上海人工智能实验室等单位宣布开源百万真机数据集项目AgiBot World。该项目涵盖超100种真实场景,包括40%的家居场景和20%的工业场景,共收录80余种人类生活必备技能。这一举措为人形机器人的研发提供了宝贵的资源和支持,进一步推动了人形机器人技术的发展。