天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

谷歌Gemini 3 Deep Think上新!编程超绝仅7人能敌 清华姚顺宇参与研发

2026-02-13来源:快讯编辑:瑞雪

谷歌最新发布的Gemini 3 Deep Think模型正在重塑人工智能的能力边界。这款专为复杂推理任务设计的升级版模型,在数学、编程及多学科领域展现出超越人类顶尖水平的实力,标志着AI技术进入全新发展阶段。

在数学竞赛领域,该模型以48.4%的准确率刷新"人类终极考试"基准测试纪录,且未借助任何外部工具。更令人瞩目的是,其在2025年国际数学奥林匹克模拟赛中达到金牌标准,并在凝聚态物理基准测试(CMT-Benchmark)中取得50.5%的成绩。编程能力方面,模型在Codeforces平台获得3455分,排名全球第八,较前代OpenAI模型提升近千分,成本却降低数百倍。

工程应用场景同样见证突破性进展。杜克大学团队利用该模型优化半导体材料制备工艺,成功设计出可生长100微米以上厚度薄膜的制造方案,突破传统方法精度极限。罗格斯大学物理学家Lisa Carbone则借助模型完成高能物理论文审核,发现人工评审遗漏的逻辑漏洞,验证了AI在专业学术领域的实用价值。

技术实现层面,模型通过深度融合科学理论与工程实践,将抽象概念转化为可操作方案。其最新功能支持将二维草图直接转换为3D打印文件,自动完成复杂几何建模与结构优化。这种跨领域能力源于谷歌与科研机构的深度合作,清华物理系姚顺宇等学者参与开发,确保模型在科学问题处理上的严谨性。

商业落地方面,Deep Think已通过Gemini应用向Ultra订阅用户开放,同时通过API向特定企业及研究机构提供服务。在ARC-AGI系列测试中,模型分别取得96.0%(ARC-AGI-1)和84.6%(ARC-AGI-2)的成绩,每任务成本控制在7.17至13.62美元区间,较前代模型降低两个数量级。这种效率跃升正在推动AI从辅助工具向独立科研伙伴转型。

2025年我国网民规模破11.25亿 互联网赋能数字社会与产业出海双跃升
我国在线政务服务用户达9.4亿,“高效办成一件事”成为常态,彰显了互联网发展服务于民、暖心为民的价值导向。 此外,在人工智能等新技术的深度赋能下,我国产业出海正迎来从规模增长到价值跃迁的转折点,不仅输出“中国…

2026-02-13

科大讯飞以开放平台为翼:拓展AI应用边界 驱动多行业智能化变革
科大讯飞的开放平台战略以“技术共享”为核心,通过提供API、SDK等一系列工具,大幅度降低了企业和开发者接入人工智能技术的门槛。 这种开放合作模式不仅重塑了人工智能产业的发展格局,也为行业的数字化转型提供了…

2026-02-13