谷歌发布Gemini Embedding 2模型：支持多模态数据，简化流程提升检索精度-天脉财经

谷歌近日宣布推出其首个原生多模态嵌入模型——Gemini Embedding 2，标志着人工智能在跨模态数据处理领域迈出重要一步。该模型突破了传统嵌入模型仅支持文本的局限，能够同时处理文本、图像、视频、音频和文档五种数据类型，并将它们映射到统一的向量空间中，为机器理解复杂信息提供了全新工具。

与生成式AI模型如Gemini 3不同，嵌入模型的核心功能在于数据理解而非内容创作。Gemini Embedding 2通过将非结构化数据转换为数学向量形式，使计算机能够精准捕捉语义关系。例如，在法律诉讼场景中，该模型可同时分析合同文本、监控视频和音频证据，快速定位关键信息。测试数据显示，在处理数百万条记录时，多模态嵌入技术使检索精度提升显著，尤其在图像和视频搜索方面表现突出。

该模型支持100种语言的语义意图识别，并设定了明确的数据处理规范：文本输入上限为8192个token，图像支持PNG/JPEG格式且单次最多处理6张，视频输入时长限制在120秒内（支持MP4/MOV格式），音频可直接处理无需转录，文档则支持最多6页的PDF文件。这种设计既保证了处理效率，又覆盖了主流应用场景的需求。

谷歌工程师透露，Gemini Embedding 2已通过Gemini API和Vertex AI平台开放预览服务。现有用户可在保持gemini-embedding-001文本模型使用的同时，体验新模型的多模态能力。技术文档显示，该模型特别优化了"图像+文本"混合输入场景，能够自动分析不同媒体间的关联性，为智能客服、内容推荐等应用开辟新可能。

行业分析师指出，多模态嵌入技术的成熟将重塑信息检索范式。传统关键词搜索依赖精确匹配，而向量搜索通过语义理解可返回更符合上下文的结果。例如，当用户搜索"蓝色连衣裙"时，新模型不仅能识别商品图片，还能理解描述文字中的材质、款式等细节，甚至关联到穿搭建议视频。这种能力在电商、医疗、教育等领域具有广泛应用前景。

重庆东玄古佰调研宜宾临港：洞察酒店格局，解锁精品酒店发展新机遇

2026-04-26

2026南京江宁家装：数字化赋能与品质升级下的企业实践探索

2026-04-26

中俄稀土合作新动向：俄方投巨资建产业链，中国技术援助成悬念

2026-04-26

2026智能制造浪潮下，掌握机器人夹爪知识，精准甄选专业生产厂商

对于企业而言，深入了解夹爪的技术原理与应用场景，并据此挑选具备核心研发能力与稳定交付能力的正规生产厂商，是实现产线智能化升级的关键一步。在众多专注于工业智能制造的企业中，深圳市大寰机器人科技有限公司（简称“…

2026-04-26

人形机器人从科幻照进现实！产业链全解析+核心关节模组企业大盘点

！执行器（关节模组）的技术壁垒高，成本也最高（占整机成本近50%），是产业链的“核心命脉”，行业代表企业有：绿的谐波（谐波龙头）、良质关节（行星关节行业标杆，性价比高，交货快）、中大力德（产品线全，国内少数能…

2026-04-25

AI智能体掀起工作变革：高效助力是事实，“一键搞定”需理性看待

AI 智能体的爆发确实给工作模式带来了巨大变革，能极大提高工作效率，让许多重复、机械性的工作得以快速完成，但要说 “一键搞定工作”则有些夸大其词。（不让说名字，游戏要的私信）细数 AI 智能体助力工作亮点，…

2026-04-25

辞任董事长未满一周陆宏达被指在美国涉性侵案再引关注
2026-04-25

雷军车展被粉丝热情邀约坐超跑，一句“你好香”让千亿总裁秒变可爱担当

2026-04-25

AI算力缺口下应流股份业绩飙升：新签两机订单火爆，下游交付排至2030年

2026-04-25

达辰威科技南京交博会亮剑：融合通信、酒检、智慧交通全场景赋能

AI执法记录仪融合了边缘计算与人工智能算法，能够在执法现场实现智能识别与实时分析，为一线执法提供了从单兵记录到云端协同的全链条支撑。达辰威在此背景下的三大类解决方案，恰好回应了这一趋势——通过融合通信打通前端…

2026-04-25