天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里Qwen3.7-Max模型在Code Arena编程榜全球第二,Design Arena也获佳绩

2026-05-26来源:快讯编辑:瑞雪

全球人工智能领域权威编程评测榜单Code Arena近日迎来重要更新,阿里自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。根据最新公布的排名,该模型在编程能力评估中位列第四,仅落后于Claude系列三款模型,在大模型厂商中稳居全球第二,展现出强劲的技术实力。

作为人工智能领域最具公信力的编程能力评估平台之一,Code Arena的评测机制以严格著称。与常规学术测试不同,该榜单通过真实场景下的代码生成、调试和重构任务,全面检验模型的实战能力。为确保评估结果的客观性,平台采用用户随机盲测模式,所有测试题目均对模型保密,从根源上杜绝了"刷榜"可能,要求模型必须具备扎实的代码生成功底。

在技术对比层面,Qwen3.7-Max的表现尤为突出。数据显示,该模型不仅超越了Claude-opus-4-6版本,更在整体编程能力上领先GLM-5.1、Kimi-k2.6等知名模型。值得注意的是,阿里技术团队此次提交的评测版本为qwen3.7-max-20260517,其1541分的成绩较前代实现显著提升,标志着国产大模型在代码处理领域已达到国际顶尖水平。

除了在编程专项榜单中的突破,Qwen3.7-Max在综合性AI评测平台Design Arena同样表现亮眼。作为被业界誉为"AI奥林匹克"的权威评测体系,Design Arena通过真实用户盲测的方式,对模型的多模态能力进行全方位检验。在该榜单最新公布的排名中,阿里旗舰模型成功跻身全球前十,进一步验证了其技术架构的先进性与泛化能力。

行业专家指出,Code Arena与Design Arena的双重认可,标志着国产大模型在核心技术指标上已实现质的飞跃。特别是在代码生成这类对逻辑推理要求极高的任务中,Qwen3.7-Max展现出的上下文理解能力和复杂问题拆解能力,为工业级应用落地提供了重要技术支撑。随着评测数据的持续公开,全球AI竞争格局正在发生深刻变化,中国科技企业的创新能力正获得国际社会更广泛的关注与认可。

从夸克到千问:阿里AI战略“换马”纠错,千问能否成超级入口?
其实回顾阿里的AI战略,我们会发现,阿里AI内部正在呈现“夸克失宠,千问上位”,这更像是吴泳铭和阿里的自我纠错,当在夸克身上砸下海量资源,却得到市场反馈后,千问APP作为救世主,接起了阿里打造“AI入口”的…

2026-05-26