天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里千问Qwen3-Coder-Next发布:以低推理成本解锁高效编程智能体新可能

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴千问团队近日正式发布了一款名为Qwen3-Coder-Next的开放权重语言模型,该模型专为编码代理和本地开发场景设计,通过创新架构与训练方法实现了性能与效率的显著提升。与传统的参数扩展模式不同,新模型聚焦于智能体训练信号的扩展,采用混合注意力机制与MoE(专家混合)架构,在降低推理成本的同时强化了编程能力与智能体交互水平。

在训练方法上,团队构建了多阶段强化体系:首先通过持续预训练让模型吸收代码与智能体相关数据,随后利用高质量智能体轨迹数据进行监督微调,并针对软件工程、QA测试、Web/UX开发等垂直领域开展专家训练。最终通过知识蒸馏技术将专家能力整合到单一可部署模型中。这种训练策略特别强化了长程推理、工具调用及错误恢复能力,使其更适应真实开发环境的需求。

基准测试数据显示,当集成SWE-Agent框架时,该模型在SWE-Bench Verified基准上取得超过70%的准确率,在多语言版本及更具挑战性的Pro版本中仍保持竞争力。值得注意的是,尽管其激活参数规模仅为30亿,但在TerminalBench 2.0和Aider等智能体评测中,性能表现可与激活参数量高10-20倍的开源模型媲美,展现出显著的效率优势。

效率对比图表进一步证实,在SWE-Bench-Pro任务中,Qwen3-Coder-Next的3B激活参数版本已达到行业领先水平,其性能曲线处于帕累托前沿位置。虽然全注意力架构的专有模型在绝对指标上仍占优势,但新模型在低成本智能体部署场景中展现出更强的实用性,特别适合资源受限的开发环境。

该模型现已通过ModelScope和Hugging Face平台开源,开发团队表示将持续优化模型的推理决策能力,扩展其任务支持范围,并根据用户反馈进行快速迭代。此次发布标志着编程智能体领域在效率优化方向取得重要突破,为开发者提供了更具性价比的选择。

机器人ETF万家(560630)午盘飘红涨1.74% 重仓股多数上扬成交额超五百万
来源:新浪基金∞工作室 2月3日,截止午间收盘,机器人ETF万家(560630)涨1.74%,报1.170元,成交额500.53万元。机器人ETF万家(560630)重仓股方面,科大讯飞截止午盘涨0.61%,…

2026-02-04

马斯克再出大动作:SpaceX与xAI合并 剑指太空数据中心新蓝海
据估算,SpaceX的星舰研发与星链部署每年消耗约50亿—70亿美元,而xAI在高端GPU芯片采购及模型训练上的年资本开支也高达50亿—80亿美元。商业航天与人工智能结合,将创造出1+1>2的效果,1.25万…

2026-02-04

聚焦AI前沿:“CCF走进深圳河套学院”共探人机互生社会新趋势
研讨会以“Agentic Intelligence for Human–AI Society”为主题,来自北京大学、哈尔滨工业大学、武汉大学等多所高校和科研机构的院士、专家学者及青年科研人员齐聚一堂,共有两…

2026-02-04

2026学习平板大比拼:科大讯飞LUMIE10等四款,哪款能成学生心头好?
本文将对科大讯飞人工智能学习机LUMIE10(6+128GB)进行深入测评,并与华为MatePad、荣耀平板、XiaomiPad等同类产品进行对比,帮助读者找到最适合自己的学习工具。 在对比以上几款产品后,…

2026-02-04