天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 营养美食 大燕公益 商业快讯

阿里通义千问一周三连击,开源模型实力问鼎全球巅峰

2025-07-27来源:天脉网编辑:瑞雪

近日,阿里巴巴旗下的通义千问团队再次在人工智能领域掀起波澜,宣布开源了其最新的Qwen3系列模型——Qwen3-235B-A22B-Thinking-2507。

这款新模型拥有2350亿参数,其中2200亿参数可被激活,支持高达256K的上下文长度。在编程、数学、知识推理、人类偏好对齐等多项能力测评中,Qwen3-235B-A22B-Thinking-2507的表现媲美Gemini-2.5 pro和o4-mini等顶尖闭源模型,同时大幅超越了DeepSeek-R1等开源模型,创下了全球开源模型的最佳性能记录。

此次开源并非孤立事件,过去一周内,通义千问团队已连续发布三款模型,分别在全球权威测评中夺得基础模型、编程模型和推理模型领域的开源冠军。其中,Qwen3-Coder-480B-A35B-Instruct作为全球最强编程模型之一,引发了开发圈的广泛关注,连推特和Hugging Face的创始人也纷纷推荐。

通义千问团队的这一系列动作,不仅展示了其强大的技术实力,更体现了其对开发者需求的敏锐洞察。Qwen3-235B-A22B-Thinking-2507的推出,正是基于开发者的建议,放弃了混合思考模式,转而分别训练Instruct和Thinking模型,以获得更佳表现。这一决策迅速得到了开发者的积极响应,甚至在模型发布之初,就有开发者催促推出更小尺寸的版本,团队负责人也承诺将在下周推出“flash”版本。

Qwen3-235B-A22B-Thinking-2507已在魔搭社区和Hugging Face平台开源,采用宽松的Apache2.0协议,允许用户免费下载并商用。用户还可以通过QwenChat体验该模型,进一步拓宽了其应用场景。

在测评方面,Qwen3-235B-A22B-Thinking-2507在知识、推理、编码、一致性、Agent和多语言能力等多项测试中均取得了优异成绩,全面超越了DeepSeek-R1等开源模型,并逼近或赶超了OpenAI o3、Gemini-2.5 Pro等顶尖闭源模型。这一表现不仅赢得了开发者的广泛赞誉,也进一步巩固了通义千问在全球大模型竞争中的地位。

值得注意的是,此次阿里还推出了为三款最新Qwen3模型大规模RL训练提供支持的算法——组序列策略优化(GSPO)。相较于传统算法,GSPO在稳定性、效率、性能和底层友好度方面均具有显著优势,为强化学习中大型MoE模型的训练提供了新的解决方案。

通义千问的这一系列开源举措,不仅为开发者提供了强大的工具,也展示了中国企业在全球AI领域的竞争力和影响力。随着开源浪潮的持续推进,通义千问有望在全球大模型产业格局中扮演更加重要的角色。