在科技日新月异的今天,一段机器人与人类同桌竞技麻将的视频在网络上引起了广泛关注。在这段视频中,机器人不仅能够熟练地进行翻牌、摸牌等操作,还能根据牌局的变化灵活调整策略,展现出了惊人的智能水平。
这一壮举的背后,是灵初智能公司研发的强化学习算法模型Psi R1的功劳。该模型不仅展示了机器人在开放场景下处理复杂任务的能力,还是全球首个实现“动作感知-环境反馈-动态决策”全闭环的端到端具身VLA(视觉语言动作)模型。
具身智能的浪潮正席卷全球,机器人技术正逐步从科幻想象走向产业实践。从春晚的舞台表演到地库里的自行车骑行,再到如今的麻将桌竞技,每一次突破都让人激动不已。而在这场科技盛宴中,灵初智能以其独特的声音吸引了众多目光。
灵初智能成立于2024年,由拥有丰富产品经验的王启斌、斯坦福大学访问学者陈源培以及机器人及无人驾驶领域的专家柴晓杰博士共同创立。灵初智能还与北京大学合作成立了北大-灵初智能具身灵巧操作联合实验室,进一步推动了相关技术的研发。
尽管在具身智能领域,灵初智能似乎是一个后来者,但王启斌对此并不以为意。他认为,灵初早在2022年就开始了技术布局,且就VLA模型和灵巧手操作的定位而言,此时入局并不算晚。作为硬件领域的资深人士,王启斌凭借在京东和云迹机器人等公司积累的经验,为灵初选择了“双臂轮式机器人”这一务实的产品形态。
王启斌透露,灵初智能目前已有明确的海外物流客户,并计划在半年内将产品交付至欧美仓库。这一消息无疑为灵初智能的未来发展注入了强劲动力。
操作一直是机器人技术的难点所在。许多对人类来说轻而易举的动作,对机器人来说却异常艰难。在VLA模型出现之前,VLM(视觉语言模型)虽然能让机器人同时处理和理解视觉和语言信息,但难以实现对机器人物理动作的直接控制。而VLA模型的诞生,则打破了这一局限。
VLA模型不仅能够解析图像和文本信息,还能通过动作解码器直接输出动作路径,使机器人具备类人推理和全局理解能力。王启斌认为,只有具备长程操作的机制和能力,机器人才能在半开放、随时有动态变化的环境中观察、决策、判断和操作,最终达到人类期望的结果。
对于麻将竞技这一应用场景,王启斌表示,这只是展示灵初智能技术实力的一种方式。未来,这些技术还有望应用于商超、物流等更广泛的领域,解决更多实际问题。
在谈及资本市场对具身智能的态度变化时,王启斌坦言,与去年相比,当前投资人对具身智能的商业化前景有了更明确的期待。这也为灵初智能等相关企业提供了更多的发展机遇。
灵初智能目前团队规模已达80人左右,其中包括与北大联合实验室的30名实习生。随着业务的不断拓展,团队规模仍在持续扩大。
在硬科技创业潮中,灵初智能凭借其深厚的技术积累和务实的产品形态,正稳步前行。未来,灵初智能将继续致力于推动具身智能技术的发展,为人类带来更多惊喜和便利。