谷歌最新人工智能模型Gemini 3正式登场,一经发布便在行业内引发巨大反响。这款被谷歌首席执行官桑达尔·皮查伊盛赞为“最智能模型”的产品,早在发布前就备受关注,如今终于揭开神秘面纱,展现出强大的实力。
与早期小步快跑的探索模式不同,Gemini 3的发布是一次全面且充分的展示。据Gemini团队介绍,它不仅是全球领先的多模态理解模型,更是目前最强大的智能体和氛围编程模型,其基础是先进的推理能力。网友们在看到Gemini 3的评测表现后纷纷惊叹,直言终于明白谷歌为何能成为股神巴菲特的“心头好”。
Gemini 3的发布可谓不给竞争对手留机会,在各大评测集中表现卓越。它以1501分的成绩强势夺回LMArena大模型竞技场榜首位置,超越了此前马斯克xAI发布的Grok 4.1模型。从测试结果来看,Gemini 3 Pro凭借领先的推理能力和强大的多模态功能,性能显著超越前一代的Gemini 2.5 Pro,对OpenAI的最新模型GPT - 5.1更是呈现出“碾压”态势。
在“人类终极考试”中,Gemini 3 Pro未使用任何工具,得分率就达到了37.5%;在GPQA Diamond基准测试中,准确率高达91.9%;在“地狱模式”数学测试MathArena Apex中,以23.4%的成绩达到最先进水平,为数学领域的前沿模型树立了新标杆。除了文本能力,Gemini 3 Pro在MMMU - Pro上取得81%的成绩,在Video - MMMU上达到87.6%,在SimpleQA Verified基准测试中也获得了72.1%的当前最先进得分,展现出在事实准确性方面的显著进步,具备解决跨越科学和数学等广泛主题复杂问题的能力。在AI界的图灵测试“ARC - AGI - 2”中,Gemini 3 Pro拿下31.1%的高分,远超GPT - 5.1的17.6%,这表明AI开始展现出类似人类的智力和思维方式,能在未见过的任务模式下进行推理。
Gemini 3的出色表现也得到了行业大佬的认可。OpenAI联合创始人、CEO山姆·奥特曼发推评价“Gemini 3看起来很不错”,xAI创始人、CEO埃隆·马斯克也表示“干得很好”。
即日起,Gemini全面融入谷歌的产品生态,这也是谷歌首次在产品发布当日就将Gemini引入搜索领域。同时,Gemini 3同步向Gemini app用户、AI Studio和Vertex AI的开发者,以及全新的智能体开发平台Google Antigravity推出,彰显出谷歌用AI定义整个生态每个支点的平台级野心。
本次发布的Gemini 3 Pro深度思考版本模型虽尚未全面开放,但从测试表现可知其Benchmark水平比Gemini 3 Pro高出一个数量级。谷歌表示,将在未来几周向Google AI Ultra订阅者开放,目前该模型还在进行安全评估。
Gemini 3的功能十分强大且多样。它可以编写代码来可视化托卡马克中的等离子体流动,还能创作诗歌捕捉聚变的物理原理。如果用户想学习家族传统菜肴,它能解读并翻译不同语言的手写食谱,生成可分享的食谱。对于想学习新领域知识的用户,把学术论文、讲座视频等素材提供给Gemini 3,它能生成交互式记忆卡片、可视化或其他格式的代码,帮助用户掌握相关知识。它还能充当教练角色,观看打球运动视频指出改进之处并生成训练计划。在搜索模式下,使用Gemini 3可实现新的生成式UI体验,如沉浸式视觉布局、交互式工具和模拟等。它还能编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界以及更具实用性的网页等,令极客论坛上的前端开发者感叹其不仅能高效写代码,还能理解审美,动画效果恰到好处。
2025年,AI行业“模型即智能体”的热潮席卷全球,大模型从被动的“预测引擎”升级为主动的“行动实体”,具备自主决策和执行能力。然而,to C智能体产品普遍面临“叫好不叫座”的困境,用户体验可靠好用的产品较少,这背后考验的是基础模型推理、工具运用与任务规划的综合实力。Gemini 3率先取得突破,成为第一个在模型界面融入通用Agent能力并支持执行多种复杂任务的产品。其工具使用能力相比2.5 Pro提升了30%,不仅能更准确选择正确工具,还能理解何时需要不同工具组合完成复杂任务。
此次发布中,谷歌还带来了全新Agent开发平台Google Antigravity。借助Gemini 3的高级推理、工具使用和智能编码能力,Google Antigravity将AI辅助从开发者工具包中的工具转变为活跃伙伴。虽然其核心仍沿用熟悉的AI集成开发环境(IDE),但智能体被提升到专属界面,可直接访问编辑器、终端和浏览器,能代表开发者自主规划和执行复杂的端到端软件任务,并自行验证代码。
谷歌还提到,Gemini 3是迄今为止最安全的模型,接受了Google AI模型中最全面的一套安全评估,展现出更低的谄媚性、更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。值得一提的是,Gemini 3的训练完全基于自家TPU,在全球AI公司等待英伟达GPU发货时,谷歌有肆意扩张参数的底气。随着Gemini 3加入模型“角斗场”,谷歌宣告王者归来,围绕大模型的新一轮竞争已全面打响。
