在科技与娱乐的交汇点,一场别开生面的直播吸引了众多目光。近日,人工智能公司Anthropic在Twitch平台上开启了“Claude玩宝可梦”的直播活动,展示了其最新AI模型Claude 3.7 Sonnet挑战经典游戏《宝可梦红版》的精彩过程。
这并非AI首次涉足电子游戏领域,从《街头霸王》到《你画我猜》,各种游戏都曾被用作测试AI新模型的舞台。然而,与以往更多偏向娱乐性质的尝试不同,Anthropic将《宝可梦红版》视为Claude 3.7 Sonnet的有效测试基准,旨在检验其解决复杂谜题的能力。
Claude 3.7 Sonnet的表现令人瞩目,相较于其前身Claude 3.5 Sonnet在游戏初期就遭遇挫折,新版本已成功获得三个道馆徽章。通过“推理”能力,Claude 3.7 Sonnet能够应对专为儿童设计的电子游戏挑战,展现了AI技术的显著进步。
尽管Claude 3.7 Sonnet在游戏中取得了不俗的成绩,但它仍面临诸多挑战。在直播过程中,模型被一堵岩石墙阻挡去路,无论如何尝试都无法穿越。这一困境引发了Twitch用户的热烈讨论,有人甚至戏称:“是投入数千小时编程的AI会赢,还是一堵石墙更胜一筹?”最终,Claude通过绕路成功解决了这一难题。
直播过程中,Claude的“思考过程”与实时游戏画面同步呈现,为观众带来了独特的观看体验。Claude在探索过程中展现出的谨慎与深思熟虑,虽然有时令人着急,但也极具吸引力。例如,在大木博士的实验室里,Claude因场景中的其他NPC而感到困惑,错误地与一个已交谈过多次的NPC对话,而非博士本人。这一插曲让Twitch聊天室里的观众反应各异,有人焦躁不安,有人则显得较为淡定。
此次直播不禁让人回想起十多年前的“Twitch玩宝可梦”事件,当时数百万用户共同参与《宝可梦红版》的在线游玩,通过Twitch聊天控制角色,虽然游戏过程混乱,但却以一种意想不到的方式将人们紧密联系在一起。如今,AI驱动的“Twitch玩宝可梦”重现虽然同样有趣,却也让人感受到一丝惆怅。
西雅图软件工程师Peter Whidden曾发布视频,分享他如何训练强化学习算法来玩宝可梦的经历。他的AI花了超过50,000小时才学会如何成功游玩,其中一个挑战是AI更倾向于欣赏游戏场景而非实际参与游戏。这一案例进一步证明了AI在电子游戏领域的潜力与挑战。
随着AI技术的不断发展,我们的在线体验正悄然发生变化。从共享的群体活动到更加孤独的个人行为,这一趋势在“Claude玩宝可梦”的直播中得到了生动体现。曾经,我们是共同努力克服游戏难关的队友;如今,我们却成了旁观者,看着AI模型挑战我们儿时便已掌握的游戏。这一变化不仅令人感慨,也引发了人们对未来在线社交方式的深刻思考。