天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里通义千问Qwen3.7系列发布:跻身全球前十五,国产大模型综合实力领跑

2026-05-21来源:快讯编辑:瑞雪

在近期举办的阿里云峰会上,阿里巴巴集团副总裁、阿里云智能CTO周靖人宣布,通义千问Qwen3.7系列大模型正式面世。其中,旗舰版Qwen3.7-Max被定位为“全能智能体基座”,在编程、推理、工具调用等核心能力上实现了显著突破,并在多项国际权威评测中刷新国产大模型纪录,成为全球科技界关注的焦点。

在综合性能方面,Qwen3.7-Max表现尤为突出。根据Arena AI全球大模型文本总榜最新数据,该模型以第13名的成绩跻身国际顶尖行列,超越Gemini 3 Flash、GPT-5.5等国际知名模型,成为榜单前15名中唯一的中国大模型。细分领域中,其数学能力位列全球第7,编程能力排名第10,在专家级应用、软件及IT领域均取得第9名的佳绩。Qwen3.7-Plus预览版在视觉总榜中排名第16,推动阿里实验室整体视觉能力跃升至全球第5,展现出多模态技术的全面进步。

在知识与逻辑推理等主流评测中,Qwen3.7系列同样展现强劲实力。对比国内及国际最新模型,如Kimi K2.6、智谱GLM5.1、DeepSeek V4 Pro等,Qwen3.7在多项测试中全面领先,稳居国内第一。这一成绩不仅验证了模型在基础能力上的扎实积累,更凸显其在复杂场景下的适应性优势。

工具调用与编程能力的升级是本次发布的核心亮点。Qwen3.7的编程智能体已支持复杂工程开发,在TerminalBench 2.0测试中取得69.7分,超越DS-V4-ProMax的67.9分;在SWE-Pro和SciCode等编程基准测试中,分别以60.6分和53.5分的成绩领先同类模型。更引人注目的是,在一项持续35小时、涉及超1000次工具调用的长周期实验中,Qwen3.7始终保持稳定推理能力,成功实现端到端任务闭环,为自动化流程提供了可靠技术支撑。在办公场景中,该模型在SpreadsheetBench-V1测试中以87.0分的高分,展现出行业顶尖的表格处理与自动化水平。

谷歌Ask Play革新应用搜索:连续问答精准匹配,Gemini主动推荐更贴心
Ask Play 能理解完整上下文,不仅能基于用户提出的首个需求搜索合适内容,还能继续补充限制条件,系统会把前后语义合并后再推荐应用。 在谷歌官方给出的示例中,用户先找“无广告、无付费墙的小众科幻策略游戏”…

2026-05-20

谷歌Gemini 3.5 Flash亮相:编码智能体双突破,开启AI应用新篇章
Kavukcuoglu 表示,这种速度对于 Flash 的智能体工作设计至关重要,在智能体工作中,多个 AI智能体可以同时运行,执行长时间运行的任务。新模型还将为Gemini Spark提供支持,Gemi…

2026-05-20

科技赋能春耕路 黑龙江“插秧专列”焕新启程 农机课堂与智能服务同行
如今,大数据、人工智能设备深度赋能农业生产,特别是以北大荒农垦集团为代表的大型农业企业率先完成农业智能化升级,智能插秧机、农事无人机广泛投入田间,种植户依托手机APP便可全程监控农作物生长,农业全产业链数字化…

2026-05-20