天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 天脉教育 大燕公益 商业快讯

谷歌Gemini 3发布即登顶:碾压竞品获赞,凭TPU优势成AI新王者

2025-11-19来源:天脉网编辑:瑞雪

谷歌最新人工智能模型Gemini 3正式登场,一经发布便在行业内引发巨大反响。这款被谷歌首席执行官桑达尔·皮查伊盛赞为“最智能模型”的产品,早在发布前就备受关注,如今终于揭开神秘面纱,展现出强大的实力。

与早期小步快跑的探索模式不同,Gemini 3的发布是一次全面且充分的展示。据Gemini团队介绍,它不仅是全球领先的多模态理解模型,更是目前最强大的智能体和氛围编程模型,其基础是先进的推理能力。网友们在看到Gemini 3的评测表现后纷纷惊叹,直言终于明白谷歌为何能成为股神巴菲特的“心头好”。

Gemini 3的发布可谓不给竞争对手留机会,在各大评测集中表现卓越。它以1501分的成绩强势夺回LMArena大模型竞技场榜首位置,超越了此前马斯克xAI发布的Grok 4.1模型。从测试结果来看,Gemini 3 Pro凭借领先的推理能力和强大的多模态功能,性能显著超越前一代的Gemini 2.5 Pro,对OpenAI的最新模型GPT - 5.1更是呈现出“碾压”态势。

在“人类终极考试”中,Gemini 3 Pro未使用任何工具,得分率就达到了37.5%;在GPQA Diamond基准测试中,准确率高达91.9%;在“地狱模式”数学测试MathArena Apex中,以23.4%的成绩达到最先进水平,为数学领域的前沿模型树立了新标杆。除了文本能力,Gemini 3 Pro在MMMU - Pro上取得81%的成绩,在Video - MMMU上达到87.6%,在SimpleQA Verified基准测试中也获得了72.1%的当前最先进得分,展现出在事实准确性方面的显著进步,具备解决跨越科学和数学等广泛主题复杂问题的能力。在AI界的图灵测试“ARC - AGI - 2”中,Gemini 3 Pro拿下31.1%的高分,远超GPT - 5.1的17.6%,这表明AI开始展现出类似人类的智力和思维方式,能在未见过的任务模式下进行推理。

Gemini 3的出色表现也得到了行业大佬的认可。OpenAI联合创始人、CEO山姆·奥特曼发推评价“Gemini 3看起来很不错”,xAI创始人、CEO埃隆·马斯克也表示“干得很好”。

即日起,Gemini全面融入谷歌的产品生态,这也是谷歌首次在产品发布当日就将Gemini引入搜索领域。同时,Gemini 3同步向Gemini app用户、AI Studio和Vertex AI的开发者,以及全新的智能体开发平台Google Antigravity推出,彰显出谷歌用AI定义整个生态每个支点的平台级野心。

本次发布的Gemini 3 Pro深度思考版本模型虽尚未全面开放,但从测试表现可知其Benchmark水平比Gemini 3 Pro高出一个数量级。谷歌表示,将在未来几周向Google AI Ultra订阅者开放,目前该模型还在进行安全评估。

Gemini 3的功能十分强大且多样。它可以编写代码来可视化托卡马克中的等离子体流动,还能创作诗歌捕捉聚变的物理原理。如果用户想学习家族传统菜肴,它能解读并翻译不同语言的手写食谱,生成可分享的食谱。对于想学习新领域知识的用户,把学术论文、讲座视频等素材提供给Gemini 3,它能生成交互式记忆卡片、可视化或其他格式的代码,帮助用户掌握相关知识。它还能充当教练角色,观看打球运动视频指出改进之处并生成训练计划。在搜索模式下,使用Gemini 3可实现新的生成式UI体验,如沉浸式视觉布局、交互式工具和模拟等。它还能编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界以及更具实用性的网页等,令极客论坛上的前端开发者感叹其不仅能高效写代码,还能理解审美,动画效果恰到好处。

2025年,AI行业“模型即智能体”的热潮席卷全球,大模型从被动的“预测引擎”升级为主动的“行动实体”,具备自主决策和执行能力。然而,to C智能体产品普遍面临“叫好不叫座”的困境,用户体验可靠好用的产品较少,这背后考验的是基础模型推理、工具运用与任务规划的综合实力。Gemini 3率先取得突破,成为第一个在模型界面融入通用Agent能力并支持执行多种复杂任务的产品。其工具使用能力相比2.5 Pro提升了30%,不仅能更准确选择正确工具,还能理解何时需要不同工具组合完成复杂任务。

此次发布中,谷歌还带来了全新Agent开发平台Google Antigravity。借助Gemini 3的高级推理、工具使用和智能编码能力,Google Antigravity将AI辅助从开发者工具包中的工具转变为活跃伙伴。虽然其核心仍沿用熟悉的AI集成开发环境(IDE),但智能体被提升到专属界面,可直接访问编辑器、终端和浏览器,能代表开发者自主规划和执行复杂的端到端软件任务,并自行验证代码。

谷歌还提到,Gemini 3是迄今为止最安全的模型,接受了Google AI模型中最全面的一套安全评估,展现出更低的谄媚性、更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。值得一提的是,Gemini 3的训练完全基于自家TPU,在全球AI公司等待英伟达GPU发货时,谷歌有肆意扩张参数的底气。随着Gemini 3加入模型“角斗场”,谷歌宣告王者归来,围绕大模型的新一轮竞争已全面打响。

马斯克AI再发力:Grok 4.1发布,情商智商双提升,团队或成“全华班”
马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。 整体来看,本次Grok 4.1的发…

2025-11-20

科创50ETF富国(588940)11月19日跌1.15%,最新规模达5.02亿元
科创50ETF富国(588940)成立于2025年5月21日,基金全称为富国上证科创板50成份交易型开放式指数证券投资基金,基金简称为富国上证科创板50成份ETF。 规模方面,截止11月18日,科创50ET…

2025-11-20

AI赋能智慧城市新篇章 广西南宁创新应用大赛火热启幕
本次大赛以“智慧城市·智赋新篇”为主题,通过搭建竞赛平台,全面激发广西住建系统应用人工智能的工作热情,挖掘一批兼具AI技术能力与住建行业发展认知的复合型人才;深度挖掘一批可在住建领域推广的人工智能应用场景及解…

2025-11-20

2025-2026赛季VEX机器人亚洲公开赛国际签名赛12月18日北京启幕
11月18日,北京青年报记者从2025-2026赛季VEX机器人亚洲公开赛国际签名赛新闻发布会上了解到,2025-2026赛季VEX机器人亚洲公开赛国际签名赛定于2025年12月18日至21日在北京石景山区首…

2025-11-20

芯片与AI双星闪耀:陈氏兄弟携手,以智慧共筑科技新高峰
在中国科技界,陈天石与陈云霁兄弟的故事堪称一段佳话。正是这种对技术趋势的敏锐洞察和敢于探索未知的勇气,推动他们带领一支20多人的团队,在2015年成功研发出世界首款深度学习专用处理器原型芯片。陈氏兄弟的传奇…

2025-11-20

专访联想创投梁颖:具身智能挑战犹存,投资转向核心部件谋新局
我们在大量项目考察与投资实践中发现,许多公司初期均宣称要打造“全场景多任务人形机器人”,例如在工厂场景中无需专门训练,半小时内即可切换插螺丝、搬箱子等不同作业任务,但真正推进落地时,多数企业不得不转向科研市场…

2025-11-20