阿里Qwen3大模型性能登顶，中国AI应用或迎黄金时代？-天脉网

人工智能领域迎来了又一里程碑事件！阿里巴巴正式揭晓了其最新一代通义千问模型——Qwen3（以下简称“千问3”），这一消息迅速在全球科技界掀起了波澜。

千问3的最大亮点在于其卓越的效率与成本效益。据透露，该模型的体积仅为同类性能模型的三分之一，但其性能却全面超越了包括R1和OpenAI-o1在内的全球顶尖模型，成功登顶全球最强开源模型宝座。

尤为千问3是国内首个“混合推理模型”，它将“快思考”与“慢思考”巧妙融合于同一模型中。简而言之，面对简单问题，千问3能以低算力实现快速回应；而面对复杂问题时，则能通过多步骤的深度思考，显著节省算力消耗。这一设计完美实现了推理机制与最低成本之间的平衡。

千问3开源后，上下游供应链迅速响应，连夜进行适配和调用。NVIDIA、联发科、AMD等多家头部芯片厂商已成功适配千问3。华为官方也宣布昇腾支持千问3全系列模型部署，开发者在MindSpeed和MindIE中即可开箱即用，实现千问3的0Day适配。

为了验证千问3的实力，数据猿第一时间对其在数学、代码生成、文字创意等方面进行了实测。例如，输入了一道2024年高考数学题，千问3在“无思考”和“思考”模式下均给出了正确答案。数据猿还要求创建一个红白机风格的“贪吃蛇”游戏，包含自动演示AI功能，并使用纯HTML/CSS/Javascript实现为单文件。千问3同样不负众望，成功生成了游戏代码。

据介绍，千问3在推理能力、指令遵循、工具调用及多语言能力等方面均有显著提升，创造了国产模型及全球开源模型的新性能高峰。千问3拥有五大关键特性：独特的混合推理能力、显著增强的推理能力、卓越的人类偏好对齐、突出的智能体能力以及强大的多语言能力。在AIME25、LiveCodeBench、ArenaHard等评测中，千问3均取得了优异成绩，甚至超越了OpenAI-o1及DeepSeek-R1。

千问3之所以表现出如此强劲的实力，秘密在于其独特的“混合推理”模式。这一模式相当于将顶尖的推理模型和非推理模型集成到同一个模型中，既能快速回应简单问题，又能深度思考复杂问题。目前，热门模型中只有千问3、Claude3.7以及Gemini 2.5 Flash能够做到这一点。

千问3还可通过API设置“思考预算”，即预期最大thinking tokens数量，进行不同程度的思考，从而在性能和成本间取得更好的平衡。这一特性使得千问3在提升模型智能水平的同时，整体降低了算力资源消耗。

除了性能提升，千问3开源还显著降低了部署成本。现在，仅需4张H20显卡即可轻松部署千问3旗舰版，将大模型的部署门槛大幅降低。为了满足不同场景的应用需求，千问3共开源了8款模型，包括2款MoE模型和6款参数规模各异的稠密模型。这些模型针对不同的应用场景进行了优化，如小参数模型适用于实验和科研，4B模型适合手机端，8B模型适合电脑或汽车端等。

千问3的开源，无疑将加速AI大模型在终端上的应用落地。特别是其各种小尺寸模型，对后续手机、智能眼镜、智能驾驶、人形机器人等智能设备和场景的部署更为友好。再加上所有企业都可免费下载和商用千问3系列模型，或将大大推动AI技术的普及和应用。

千问3还为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中，千问3创下新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型。同时，千问3原生支持MCP协议，并具备强大的工具调用能力，将大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务。

千问3系列模型依旧采用宽松的Apache2.0协议开源，并首次支持119多种语言，全球开发者、研究机构和企业均可免费下载模型并商用。这一举措意味着更多国家和地区的人们能够使用自己的语言享受AI技术带来的便利。

从2023年至今，阿里通义团队已开源200多款模型，包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列。通义千问Qwen衍生模型数量已突破10万，成为全球第一AI开源模型。在Huggingface全球开源大模型榜单中，排名前十的开源模型全部都是基于千问Qwen二次开发的衍生模型。