天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

阿里千问3向量模型开源,性能跃升40%,领跑谷歌OpenAI等巨头

2025-06-06来源:天脉网编辑:瑞雪

近日,阿里巴巴开源了通义千问3系列的全新向量模型——Qwen3-Embedding(简称千问3向量模型)。该模型在千问3大模型的基础上进行了专门优化,针对文本表征、检索和排序等核心任务,性能相比前代提升了高达40%。在权威的MTEB等专项榜单上,千问3向量模型超越了谷歌、OpenAI、微软等国际巨头的顶尖模型,荣获同类模型的最佳性能(SOTA)表现。

Qwen3-Embedding 系列模型示意图

千问3向量模型被视为AI领域的“翻译器”,它能够将文本、图片等非结构化信息转换为机器更易理解的向量空间表示,从而高效地进行信息分类、检索和排序。这一特性对于提升AI的语义理解能力、信息检索效率以及多模态融合能力具有重大意义。通义团队基于千问3模型,采用对比训练、SFT、模型融合等先进技术,精心打造了全新的千问3向量模型系列,包括文本嵌入模型Qwen3-Embedding和文本排序模型Qwen3-Reranker。

与前代相比,千问3向量模型在文本检索、聚类、分类等核心任务上的性能提升显著,最高可达40%以上。在评估向量模型通用能力的MTEB多语言排行榜上,Qwen3-Embedding-8B模型表现优异,超越了谷歌的Gemini Embedding、OpenAI的text-embedding-3-large以及微软的multilingual-e5-large-instruct等顶尖模型,荣获同类模型的最佳性能SOTA。得益于千问3的多语言能力,千问3向量模型系列支持超过100种语言,涵盖多种编程语言,具备强大的多语言、跨语言及代码检索能力。

为方便开发者使用,此次阿里巴巴开源了9款千问3向量模型,涵盖0.6B、4B、8B等不同尺寸及GGUF版本。开发者可以根据自身需求选择合适的模型,自由组合模块,并自定义向量或指令,以实现特定任务、语言和场景的深度优化。例如,开发者可以在智能搜索、推荐系统中采用Qwen3-Embedding进行文本向量化,或者在RAG实践中利用Qwen3-Reranker提升最终结果的相关性和准确性。千问3向量模型还可以与视觉理解模型结合,探索前沿的跨模态语义理解领域。

目前,千问3 Embedding和Reranker模型已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者还可以直接通过阿里云百炼使用API服务。自4月29日千问3大模型开源以来,该系列模型已在Artificial Analysis、LiveBench、LiveCodeBench、SuperClue等多个国内外权威榜单上荣获全球开源冠军。