近期,全球AI领域的竞争再度升温,各大科技巨头纷纷亮出自家的最新研发成果。OpenAI在其为期12天的年终技术盛宴中,连续两天发布了重磅产品,拉开了这场AI狂欢的序幕。
12月5日,OpenAI发布了推理大模型o1的“满血版”和进阶模式,以及定价高达每月200美元的ChatGPT Pro订阅服务。与9月的预览版相比,“满血版”o1在回答用户问题时,能形成类似人类的思维链条,不仅速度更快、功能更强大、准确性更高,还增加了多模态输入能力。OpenAI表示,该模型现在的思维方式更加简洁,且在回答复杂现实问题时,出现重大错误的概率减少了34%。ChatGPT Pro服务则允许用户无限制地使用o1模型及其他高级功能,定价是ChatGPT Plus的10倍。
紧接着,在12月6日,OpenAI又推出了强化微调(Reinforcement Fine-Tuning)技术。这项技术利用强化学习算法,通过少量示例就能有效提升模型在特定领域任务中的推理能力和准确性。据OpenAI透露,强化微调甚至能让简易版推理模型o1 mini的表现超越“满血版”o1,预计将于2025年初公开发布。
与此同时,其他科技公司也不甘落后。斯坦福大学教授、被誉为“AI教母”的李飞飞创立的World Labs,在本周发布了能用单张静态图片生成3D世界的AI产品。用户可以通过浏览器实时渲染并自由探索由AI生成的场景,体验极具真实感的交互体验。尽管World Labs目前只发布了关于该技术的博客,并未放出代码和模型,但其潜力已经引起了业界的广泛关注。
谷歌DeepMind团队也不甘示弱,发布了大型基础世界模型Genie 2。该模型可通过单张图片和文字描述生成种类多样的游戏3D世界,用户可以在其中进行实时渲染、操控和交互。与Genie 1相比,Genie 2拥有长期记忆功能,即使角色短暂离开画面,也能在重新进入视野后被精准还原出来。这一突破标志着AI在虚拟世界生成领域的又一次飞跃。
meta也推出了今年的压轴AI大模型Llama 3.3 70B。据meta生成式AI副总裁表示,该模型能以更低的成本实现与meta最大Llama模型——Llama 3.1 405B相同的性能。在一系列行业基准测试中,Llama 3.3的表现甚至优于谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o和亚马逊近期发布的Nova Pro。
随着大模型竞赛的深入,AI的竞争焦点也逐渐转向智能体和通用人工智能(AGI)。清华大学电子工程系长聘教授吴及表示,基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。他强调,智能体融合将成为AI应用解决特定场景问题的一个重要技术前景或发展方向。
据外媒报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。目前,这一决定尚未最终确定,OpenAI董事会将决定何时实现AGI。随着AI技术的不断发展和突破,未来将有更多令人惊叹的应用和场景等待我们去发现和探索。