天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里发布Qwen3-Max-Thinking模型,性能比肩国际顶尖,推理能力创新高

2026-01-27来源:快讯编辑:瑞雪

阿里正式推出其最新旗舰推理模型——千问Qwen3-Max-Thinking,该模型在多项权威评测中刷新全球纪录,成为国内最接近国际顶尖水平的AI大模型,性能表现可与GPT-5.2和Gemini 3 Pro相媲美。

作为阿里规模最大、能力最强的千问推理模型,Qwen3-Max-Thinking拥有超过万亿参数,并基于36T Tokens的预训练数据构建。通过极致扩展总参数、强化学习及推理计算规模,新模型在科学知识、数学推理和代码编程等关键性能基准测试中取得突破性进展,刷新多项全球纪录。

在推理能力提升方面,千问团队创新性地引入测试时扩展(Test-time Scaling)机制。该机制突破传统推理计算中简单增加并行路径的局限,通过“经验提取”方式对过往推理结果进行提炼,实现多轮自我迭代。这一设计使模型在相同上下文中完成更高效的推理计算,显著提升性能与效率。例如,在“人类最后的测试”(HLE)中,Qwen3-Max-Thinking以58.3分的成绩超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,创下当前所有模型的最高分。

面向智能体(Agent)时代需求,Qwen3-Max-Thinking进一步强化了自主调用工具的原生Agent能力。通义团队在完成初步工具使用微调后,通过规则奖励与模型奖励联合强化学习训练,使模型具备智能结合工具进行思考的能力。在QwenChat平台上,用户可体验模型自主调用搜索、个性化记忆和代码解释器等核心Agent工具,获得专业级回答。这种自适应工具调用机制不仅提升了回答的智能性与流畅度,还大幅降低模型幻觉,为解决复杂任务提供可靠支持。

目前,开发者可通过QwenChat平台免费体验Qwen3-Max-Thinking模型,企业用户可通过阿里云百炼获取API服务,普通用户则可通过千问PC端和网页端直接试用。千问App即将完成新模型接入,届时所有用户均可免费体验这一国内最强AI大模型的强大能力。

宇树科技三度牵手春晚,工业舞台双开花引领机器人新风潮
其与春晚的缘分始于2021年牛年春晚宇树机器牛“犇犇”的初次亮相。 宇树的四足和人形机器人也在工业场景中默默耕耘。 此外,近日,银河通用机器人宣布成为2026年春晚指定具身大模型机器人;魔法原子也官宣将以“智…

2026-01-27

银河通用等企业人形机器人官宣上2026年春晚,具身智能领域成果引关注
他创立并领导了北京大学具身感知与交互实验室(EPICLab),研究方向覆盖多模态、具身大模型、自动驾驶、三维视觉感知等前沿领域,重点关注具身机器人在三维复杂环境中的感知和交互问题。 据悉,银河通用凭借自主研…

2026-01-27

中国科研团队攻克AI逻辑推理难题 “通矩模型”实现自主出题解题新跨越
论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚…

2026-01-27

众擎PM01人形机器人携手穿越者,开启中国智造太空探索新征程
来源:滚动播报 (来源:财闻) 众擎自主研发的具身通用智能体PM01将作为核心载体,携手穿越者向浩瀚太空发起中国智造的探索之旅。 1月26日,据众擎机器人官微消息,近日,众擎机器人与穿越者达成深度战略合作,…

2026-01-26

众擎与穿越者携手,具身智能人形机器人开启太空探索新征程
IT之家 1 月 26日消息,众擎机器人官方今日发文宣布,其近日与穿越者达成深度战略合作,正式启动人形机器人宇航员探索计划,这也是国内具身智能人形机器人首次冲击太空探索任务。该版本机器人在众擎 PM01 …

2026-01-26