天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

DeepMind Genie 2引领变革:机器人训练迈入新纪元?

2025-04-22来源:天脉网编辑:瑞雪

谷歌DeepMind在机器人训练领域取得重大突破,其最新AI模型Genie 2展现出前所未有的潜力。

DeepMind的联合创始人兼首席执行官Demis Hassabis在一档知名节目中亲自展示了这一创新技术。他强调,Genie 2不仅能够创建可交互的3D环境,更能在加速机器人学习方面发挥巨大作用。

据介绍,Genie 2具有从单一静态图像生成可探索3D虚拟世界的能力。这一功能为AI代理和机器人提供了一个极为逼真的模拟环境,使它们能够在其中进行各种学习和训练。

在一次演示中,DeepMind的研究科学家Jack Parker-Holder向观众展示了一张加州瀑布顶部的照片。通过Genie 2的处理,这张照片被转化为了一个类似第一人称视角的视频游戏场景。用户或AI代理可以在这个虚拟环境中自由移动,探索瀑布周围的各个角落,甚至发现原始照片中并未呈现的景象。

实机演示:Genie 2将加州瀑布照片转化为视频游戏场景

Hassabis指出,Genie 2的“世界模型”能够动态生成环境,并模拟现实世界的物理特性。这使得它不仅在娱乐领域有着广泛的应用前景,如生成游戏和视频内容,更重要的是为AI和机器人的训练提供了一个高效且低成本的平台。

传统的机器人数据采集过程复杂且成本高昂,数据量有限且收集速度缓慢。而Genie 2的模拟环境则可以生成近乎无限的数据量,允许机器人在虚拟世界中进行初步的学习,之后再通过少量的现实世界数据进行微调,从而大幅提升训练效率。

在另一个演示中,一个由AI控制的骑士角色在由Genie 2生成的3D环境中自主完成了任务,如从多个门廊中选择正确的路径并爬上楼梯。Hassabis表示,这种技术可以让机器人在模拟环境中学习复杂的导航、物体交互和决策制定等任务,从而减少对现实世界数据的依赖。

实机演示:AI骑士在Genie 2生成的3D环境中自主完成任务

Hassabis还透露,DeepMind正在探索利用谷歌地图、谷歌地球和街景视图等地理数据来进一步增强AI的世界理解能力。这些数据将为AI提供丰富的现实世界背景信息,有助于机器人更好地适应真实环境。

Genie 2还能将静态图像(如街景照片或个人度假照片)转化为交互式3D场景,为机器人训练和用户体验带来了全新的可能性。

开启未来新体验 巴可亮相北京InfoComm China 2025
4月16日至18日,InfoComm China 2025展会在北京国家会议中心隆重开幕,巴可盛大参展,现场亮点纷呈!沉浸式体验与混合会议两大展区,不仅带来了“沉浸环宇”的震撼视听效果,还首次展示了可立享全家族五大产品阵容,吸引了众多目光。此外,巴可可立享无线会议屏上市会等精彩活动,呈现令人惊艳的新颖体验与创新科技。巴可沉

2025-04-22