天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

谷歌深夜发力!Deep Research智能体更新,MCP与图表生成重塑AI研究格局

2026-04-22来源:快讯编辑:瑞雪

谷歌近期在人工智能领域动作频频,先是联合创始人谢尔盖·布林重启“创始人模式”,亲自带领精英团队,全力提升Gemini在AI编程和自主智能体等关键能力,以追赶Anthropic等竞争对手。紧接着,谷歌深夜宣布重大更新,推出两款基于Gemini 3.1 Pro模型构建的新一代自主研究智能体——Deep Research和Deep Research Max,引发行业广泛关注。

这两款智能体在模型底层强化了推理能力,还积极推动自主研究智能体向企业级和开发者平台方向拓展。谷歌通过API开放、支持私有数据、后台异步任务等多种方式,试图在“AI研究/分析工具”这一高价值场景中抢占先机,应对来自OpenAI(Hermes)、Perplexity等对手的竞争。它们首次允许开发者通过单次API调用,融合开放网络数据与企业专有信息,并在研究报告中原生生成图表和信息图,还能通过Model Context Protocol(MCP)连接任意第三方数据源。目前,这两款智能体即日起通过Gemini API的付费套餐以公开预览版形式开放,可通过谷歌于2025年12月首次推出的Interactions API进行访问。不过,这些新智能体目前仅能通过API使用,普通用户在Gemini的App里无法使用,即便付费订阅也不行,这让部分用户感到不满。

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)亲自在X上宣传这两款智能体:“当你需要速度和效率时,请使用Deep Research;当你追求最高质量的上下文收集与综合时,请使用Max版本——它通过扩展测试时计算,达到了DeepSearchQA 93.3%和HLE 54.6%的成绩。”

谷歌还将这两款智能体与竞品进行了对比。不过,与OpenAI的GPT - 5.4和Anthropic的Opus 4.6比较并不完全公平。GPT - 5.4在自主网络搜索方面表现出色,但未针对深度研究专门优化,OpenAI提供的DR智能体在2月更新后切换到了GPT - 5.2。OpenAI最强的搜索模型GPT - 5.4 Pro,谷歌未将其纳入对比范围。根据OpenAI的数据,GPT - 5.4 Pro在智能体搜索基准测试BrowseComp上得分最高可达89.3%,GPT - 5.4得分为82.7%。基于Anthropic自己的报告,Opus 4.6在BrowseComp上得分高于谷歌展示的数值,为84%,且该得分是在关闭推理功能的情况下取得的,模型表现优于谷歌在API基准测试中使用的高强度推理设置。这些差距可能源于测试方法不同,谷歌的数据虽未必错误,但解读需谨慎。

本次发布中,新增对Model Context Protocol(MCP)的支持或许是最具影响力的功能。MCP是一种新兴的开放标准,用于将AI模型连接到外部数据源,让Deep Research能安全查询私有数据库、内部文档库以及专业的第三方数据服务,且敏感信息无需离开原始环境。实际应用中,一家对冲基金可同时将Deep Research指向其内部交易流数据库和金融数据终端,要求智能体结合两者与网络公开信息,综合生成洞见。谷歌正与FactSet、标普(S&P)和PitchBook等公司合作设计其MCP服务端,表明其正寻求与华尔街及更广泛金融服务行业依赖的数据提供商深度整合。谷歌DeepMind产品经理Lukas Haas和Srinivas Tadepalli撰写的博客文章称,目标是让共同客户将金融数据产品集成到由Deep Research驱动的工作流中,利用海量数据宇宙,以极快速度收集上下文,实现生产力飞跃。这一功能解决了企业采用AI时的一大痛点,即模型在开放互联网上能找到的信息与组织实际决策所需信息存在巨大差距,此前弥合这一差距需大量定制化工程工作,而MCP支持结合Deep Research的自主浏览和推理能力,将大部分复杂性简化为一次配置即可完成。

原生图表和信息图生成是另一个重磅功能。之前的Deep Research版本只能生成纯文本报告,用户需将数据导出自行制作图表,这削弱了“端到端自动化”的定位。现在,新一代智能体能在报告中原生内嵌高质量图表和信息图,以HTML或谷歌的Nano Banana格式动态渲染复杂数据集,使其成为分析叙事的一部分。对于金融和咨询行业等需要产出可直接交付给利益相关者成果的企业用户来说,这一功能让Deep Research从“加速研究阶段”的工具转变为能生成接近最终分析产品的工具。

新系统还结合新增的协作式规划功能(允许用户在执行前审查、指导和优化智能体的研究计划)以及实时流式输出中间推理步骤,让开发者能对调查范围进行细粒度控制,同时保持监管行业要求的高度透明度。

谷歌的官方博客文章明确指出,当开发者使用Deep Research智能体进行构建时,调用的是为谷歌旗下多款热门产品(如Gemini App、NotebookLM、Google Search和Google Finance)提供研究能力的同一套自主研究基础设施。这表明,通过API提供的智能体并非谷歌内部版本的简化版,而是同一套系统以平台规模对外提供服务。

谷歌在自主研究智能体领域的演进十分迅速。2024年12月,谷歌首次在Gemini App中推出Deep Research,作为C端功能,由Gemini 1.5 Pro驱动,被描述为个人AI研究助手,能在几分钟内综合网络信息,帮助用户节省数小时工作时间。2025年3月,谷歌使用Gemini 2.0 Flash Thinking Experimental对Deep Research进行升级,并向所有人开放试用,随后升级至Gemini 2.5 Pro Experimental,谷歌报告称评测者对它的报告偏好度超过竞争对手的2比1。2025年12月是重要转折点,谷歌推出Interactions API,首次以编程方式提供Deep Research,由Gemini 3 Pro驱动,并同步发布开源的DeepSearchQA基准测试。驱动本次改进的底层模型是Gemini 3.1 Pro,该模型于2026年2月19日发布,在核心推理能力上实现重大飞跃,在评估模型解决新型逻辑模式的ARC - AGI - 2基准测试中,3.1 Pro得分达到77.1%,是Gemini 3 Pro的两倍多。