近日,一段关于索尼PlayStation团队正在开发的技术演示视频意外泄露,引起了业界的广泛关注。据外媒报道,这段视频由匿名人士提供,展示了《地平线:西之绝境》女主角埃洛伊的AI驱动版本,玩家可以通过语音指令与游戏内的NPC进行实时对话。
在这段一分钟的演示视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,展示了这一突破性技术的实际应用。AI驱动的埃洛伊不仅能够理解玩家的语音提问,还能通过合成语音和动态面部表情即时回应,实现了前所未有的游戏交互体验。
据透露,这项技术已经与《地平线:西之绝境》的实际游戏场景相融合,但索尼强调,这仅仅是一个与Guerrilla Games合作开发的原型内部技术验证演示。视频展示了角色与玩家实时对话的场景,角色能够根据不同的对话内容做出相应的嘴型和表情回应,令人印象深刻。
在技术架构方面,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。通过OpenAI的Whisper技术将玩家语音转为文字,随后调用GPT-4和Llama3双引擎进行决策和生成对话内容。再经由索尼自研的情感语音系统(EVS)输出拟真声线,最终通过Mockingbird技术将音频实时转化为角色面部动画。
值得注意的是,虽然这次演示是在PC上运行的,但该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。这表明,索尼已经在为未来的游戏交互模式做好了准备。
索尼表示,这次演示只是探索可能性的冰山一角,因为这项技术对于游戏的实际意义仍然在研究中。例如,当玩家在《地平线:西之绝境》中扮演埃洛伊时,与她对话的意义是什么?随着NPC学会“思考”,游戏开发者将如何规划它们的“意识”?这些问题都引发了业界深思。
除了索尼之外,英伟达和微软等大厂也在AI领域有所投入。英伟达推出的ACE技术同样支持玩家与NPC自由对话,而微软则与Inworld AI联手,打造Xbox生态的生成式AI角色系统。随着AI技术的突飞猛进,游戏行业的交互模式正在发生深刻变革。
然而,AI技术的快速发展也加剧了游戏从业者的担忧。根据2024年游戏开发者大会(GDC)的一项调查报告显示,近半数的受访者表示其工作场所正在使用生成式AI工具,而有超过三成的受访者表示其个人也在使用相关技术。此次索尼技术泄露正值GDC大会前夕,预计将在大会期间引发更多的相关技术讨论。