谷歌Gemini 3发布即登顶：碾压竞品获赞，凭TPU优势成AI新王者-天脉财经

谷歌最新人工智能模型Gemini 3正式登场，一经发布便在行业内引发巨大反响。这款被谷歌首席执行官桑达尔·皮查伊盛赞为“最智能模型”的产品，早在发布前就备受关注，如今终于揭开神秘面纱，展现出强大的实力。

与早期小步快跑的探索模式不同，Gemini 3的发布是一次全面且充分的展示。据Gemini团队介绍，它不仅是全球领先的多模态理解模型，更是目前最强大的智能体和氛围编程模型，其基础是先进的推理能力。网友们在看到Gemini 3的评测表现后纷纷惊叹，直言终于明白谷歌为何能成为股神巴菲特的“心头好”。

Gemini 3的发布可谓不给竞争对手留机会，在各大评测集中表现卓越。它以1501分的成绩强势夺回LMArena大模型竞技场榜首位置，超越了此前马斯克xAI发布的Grok 4.1模型。从测试结果来看，Gemini 3 Pro凭借领先的推理能力和强大的多模态功能，性能显著超越前一代的Gemini 2.5 Pro，对OpenAI的最新模型GPT - 5.1更是呈现出“碾压”态势。

在“人类终极考试”中，Gemini 3 Pro未使用任何工具，得分率就达到了37.5%；在GPQA Diamond基准测试中，准确率高达91.9%；在“地狱模式”数学测试MathArena Apex中，以23.4%的成绩达到最先进水平，为数学领域的前沿模型树立了新标杆。除了文本能力，Gemini 3 Pro在MMMU - Pro上取得81%的成绩，在Video - MMMU上达到87.6%，在SimpleQA Verified基准测试中也获得了72.1%的当前最先进得分，展现出在事实准确性方面的显著进步，具备解决跨越科学和数学等广泛主题复杂问题的能力。在AI界的图灵测试“ARC - AGI - 2”中，Gemini 3 Pro拿下31.1%的高分，远超GPT - 5.1的17.6%，这表明AI开始展现出类似人类的智力和思维方式，能在未见过的任务模式下进行推理。

Gemini 3的出色表现也得到了行业大佬的认可。OpenAI联合创始人、CEO山姆·奥特曼发推评价“Gemini 3看起来很不错”，xAI创始人、CEO埃隆·马斯克也表示“干得很好”。

即日起，Gemini全面融入谷歌的产品生态，这也是谷歌首次在产品发布当日就将Gemini引入搜索领域。同时，Gemini 3同步向Gemini app用户、AI Studio和Vertex AI的开发者，以及全新的智能体开发平台Google Antigravity推出，彰显出谷歌用AI定义整个生态每个支点的平台级野心。

本次发布的Gemini 3 Pro深度思考版本模型虽尚未全面开放，但从测试表现可知其Benchmark水平比Gemini 3 Pro高出一个数量级。谷歌表示，将在未来几周向Google AI Ultra订阅者开放，目前该模型还在进行安全评估。

Gemini 3的功能十分强大且多样。它可以编写代码来可视化托卡马克中的等离子体流动，还能创作诗歌捕捉聚变的物理原理。如果用户想学习家族传统菜肴，它能解读并翻译不同语言的手写食谱，生成可分享的食谱。对于想学习新领域知识的用户，把学术论文、讲座视频等素材提供给Gemini 3，它能生成交互式记忆卡片、可视化或其他格式的代码，帮助用户掌握相关知识。它还能充当教练角色，观看打球运动视频指出改进之处并生成训练计划。在搜索模式下，使用Gemini 3可实现新的生成式UI体验，如沉浸式视觉布局、交互式工具和模拟等。它还能编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界以及更具实用性的网页等，令极客论坛上的前端开发者感叹其不仅能高效写代码，还能理解审美，动画效果恰到好处。

2025年，AI行业“模型即智能体”的热潮席卷全球，大模型从被动的“预测引擎”升级为主动的“行动实体”，具备自主决策和执行能力。然而，to C智能体产品普遍面临“叫好不叫座”的困境，用户体验可靠好用的产品较少，这背后考验的是基础模型推理、工具运用与任务规划的综合实力。Gemini 3率先取得突破，成为第一个在模型界面融入通用Agent能力并支持执行多种复杂任务的产品。其工具使用能力相比2.5 Pro提升了30%，不仅能更准确选择正确工具，还能理解何时需要不同工具组合完成复杂任务。

此次发布中，谷歌还带来了全新Agent开发平台Google Antigravity。借助Gemini 3的高级推理、工具使用和智能编码能力，Google Antigravity将AI辅助从开发者工具包中的工具转变为活跃伙伴。虽然其核心仍沿用熟悉的AI集成开发环境（IDE），但智能体被提升到专属界面，可直接访问编辑器、终端和浏览器，能代表开发者自主规划和执行复杂的端到端软件任务，并自行验证代码。

谷歌还提到，Gemini 3是迄今为止最安全的模型，接受了Google AI模型中最全面的一套安全评估，展现出更低的谄媚性、更高的抗提示注入能力，并强化了抵御网络攻击滥用的保护措施。值得一提的是，Gemini 3的训练完全基于自家TPU，在全球AI公司等待英伟达GPU发货时，谷歌有肆意扩张参数的底气。随着Gemini 3加入模型“角斗场”，谷歌宣告王者归来，围绕大模型的新一轮竞争已全面打响。