阿里巴巴千问团队近日正式发布了一款面向编码代理与本地开发场景的开放权重语言模型——Qwen3-Coder-Next。该模型通过创新架构与训练方法,在编程能力与推理效率之间实现了突破性平衡,为开发者提供了更高效的智能编程工具。
基于Qwen3-Next-80B-A3B-Base架构,研发团队采用混合注意力机制与MoE(专家混合)架构,构建了新一代智能编程模型。通过大规模可执行任务合成、环境交互反馈与强化学习技术,模型在降低推理成本的同时,显著提升了代码生成与智能体交互能力。训练过程中突破传统参数扩展模式,重点强化智能体训练信号的扩展性,采用四阶段优化策略:首先在代码与智能体数据集上进行持续预训练,随后通过高质量智能体轨迹数据监督微调,接着针对软件工程、QA、Web/UX等领域开展专家训练,最终将多领域能力蒸馏至单一可部署模型。
在编程智能体基准测试中,该模型展现出强劲竞争力。使用SWE-Agent框架时,在SWE-Bench Verified基准上取得超过70%的准确率,在多语言环境及更具挑战性的SWE-Bench-Pro测试中保持领先。特别值得注意的是,尽管激活参数规模仅为3B,其性能已可媲美参数量高10-20倍的开源模型,在TerminalBench 2.0和Aider等基准测试中同样表现优异。
效率与性能的平衡优化成为该模型的核心优势。测试数据显示,在SWE-Bench-Pro基准上,3B激活参数的Qwen3-Coder-Next与参数量大数十倍的模型性能相当,在低成本智能体部署场景中占据帕累托前沿。这种突破得益于训练方法对长程推理、工具使用和错误恢复能力的针对性强化,使模型更适应真实开发环境中的复杂需求。
目前,该模型已通过ModelScope和Hugging Face平台开放下载,开发者可自由获取模型权重进行本地部署与二次开发。研发团队表示,后续将持续优化模型的推理决策能力,扩展任务支持范围,并根据用户反馈快速迭代更新,为智能编程领域提供更强大的技术支撑。



