天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里千问Qwen3-Coder-Next发布:低推理成本赋能高效编程智能体新突破

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴千问团队近日正式发布了一款面向编码代理与本地开发场景的开放权重语言模型——Qwen3-Coder-Next。该模型通过创新架构与训练方法,在编程能力与推理效率之间实现了突破性平衡,为开发者提供了更高效的智能编程工具。

基于Qwen3-Next-80B-A3B-Base架构,研发团队采用混合注意力机制与MoE(专家混合)架构,构建了新一代智能编程模型。通过大规模可执行任务合成、环境交互反馈与强化学习技术,模型在降低推理成本的同时,显著提升了代码生成与智能体交互能力。训练过程中突破传统参数扩展模式,重点强化智能体训练信号的扩展性,采用四阶段优化策略:首先在代码与智能体数据集上进行持续预训练,随后通过高质量智能体轨迹数据监督微调,接着针对软件工程、QA、Web/UX等领域开展专家训练,最终将多领域能力蒸馏至单一可部署模型。

在编程智能体基准测试中,该模型展现出强劲竞争力。使用SWE-Agent框架时,在SWE-Bench Verified基准上取得超过70%的准确率,在多语言环境及更具挑战性的SWE-Bench-Pro测试中保持领先。特别值得注意的是,尽管激活参数规模仅为3B,其性能已可媲美参数量高10-20倍的开源模型,在TerminalBench 2.0和Aider等基准测试中同样表现优异。

效率与性能的平衡优化成为该模型的核心优势。测试数据显示,在SWE-Bench-Pro基准上,3B激活参数的Qwen3-Coder-Next与参数量大数十倍的模型性能相当,在低成本智能体部署场景中占据帕累托前沿。这种突破得益于训练方法对长程推理、工具使用和错误恢复能力的针对性强化,使模型更适应真实开发环境中的复杂需求。

目前,该模型已通过ModelScope和Hugging Face平台开放下载,开发者可自由获取模型权重进行本地部署与二次开发。研发团队表示,后续将持续优化模型的推理决策能力,扩展任务支持范围,并根据用户反馈快速迭代更新,为智能编程领域提供更强大的技术支撑。

机器人ETF万家(560630)午盘飘红涨1.74% 重仓股多数上扬成交额超五百万
来源:新浪基金∞工作室 2月3日,截止午间收盘,机器人ETF万家(560630)涨1.74%,报1.170元,成交额500.53万元。机器人ETF万家(560630)重仓股方面,科大讯飞截止午盘涨0.61%,…

2026-02-04

马斯克再出大动作:SpaceX与xAI合并 剑指太空数据中心新蓝海
据估算,SpaceX的星舰研发与星链部署每年消耗约50亿—70亿美元,而xAI在高端GPU芯片采购及模型训练上的年资本开支也高达50亿—80亿美元。商业航天与人工智能结合,将创造出1+1>2的效果,1.25万…

2026-02-04

聚焦AI前沿:“CCF走进深圳河套学院”共探人机互生社会新趋势
研讨会以“Agentic Intelligence for Human–AI Society”为主题,来自北京大学、哈尔滨工业大学、武汉大学等多所高校和科研机构的院士、专家学者及青年科研人员齐聚一堂,共有两…

2026-02-04

2026学习平板大比拼:科大讯飞LUMIE10等四款,哪款能成学生心头好?
本文将对科大讯飞人工智能学习机LUMIE10(6+128GB)进行深入测评,并与华为MatePad、荣耀平板、XiaomiPad等同类产品进行对比,帮助读者找到最适合自己的学习工具。 在对比以上几款产品后,…

2026-02-04