天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

MiniMax M2.5模型上线:以低成本高性能开启Agent2.0新时代

2026-02-14来源:快讯编辑:瑞雪

在人工智能领域竞争愈发激烈的背景下,MiniMax公司于春节前夕正式推出新一代文本模型——MiniMax M2.5。这款被定位为"原生Agent生产级模型"的产品,在各大厂商围绕"春节档"展开密集发布时入场,为这场被业界称为"AI诸神之战"的竞争增添了新的变量。

在编程能力方面,M2.5展现出显著优势。权威测试显示,该模型在SWE-Bench Verified榜单中取得80.2%的得分,Multi-SWE-Bench得分达51.3%,较前代产品实现大幅提升。特别是在多语言复杂环境测试中,其表现超越了Opus 4.6等国际主流模型。更值得关注的是,M2.5展现出独特的"原生Spec能力",能够在编码前自主完成架构拆解与功能规划,这种工作模式更接近人类架构师的实际操作流程。

工具调用与搜索能力是M2.5的另一大突破。在BrowseComp、Wide Search等Agent任务测试中,该模型以更低的交互轮次达成更优效果,较前代提升20%,达到行业顶尖水平。办公场景测试同样亮眼,在Word、PPT、Excel金融建模等高阶应用中,GDPval-MM测评框架显示其平均胜率达59.0%,显著优于同类产品。

成本与效率的平衡是M2.5的核心竞争力。其轻量化版本M2.5-lightning支持每秒100次以上的输出速度,是主流模型的两倍。在价格方面,输入成本约0.3美元/百万Token,输出成本约2.4美元/百万Token。以每秒输出100 Token计算,连续运行一小时成本仅约1美元;若按每秒50 Token计算,成本可降至0.3美元。这种性价比优势使得理论上1万美元即可支持4个Agent全年无休运行。

支撑M2.5快速迭代的,是MiniMax独创的Agent强化学习体系。过去108天内,该模型从M2版本连续升级至M2.5,SWE-Bench Verified成绩从69.4%跃升至80.2%。其自研的Forge框架通过解耦训练引擎与Agent,实现对各类工具的泛化优化,配合异步调度与树状合并策略,使训练效率提升约40倍。算法层面采用的CISPO优化与过程奖励机制,有效解决了长上下文场景中的信用分配难题。

M2.5于2月12日在MiniMax Agent平台正式上线,次日即实现全球开源并支持本地化部署。上线不到24小时,全球用户已在该平台创建超过1万个专业Agent,且数量持续快速增长。公司表示,将在持续提升模型能力的同时,着力构建可扩展的Agent生态体系,推动AI技术从专业领域向日常办公、创作娱乐等场景全面渗透。

AI浪潮席卷大厂:打工人被卷入智能化漩涡,是机遇还是危机?
新的焦虑也随之冒了出来:我们究竟是在使用AI,还是在给AI当燃料,一步步把自己变成可被替代的流程?最开始说是为了让大家在项目里顺手把工具用起来,但没过多久,内部就上线了一个追踪员工AI使用频率的系统。 作为…

2026-04-06

AI浪潮下程序员新机遇:从Coding到Prompting的转型开发全攻略
AI工程化提示词的开发,是一套标准化、可复用、可迭代的工程化流程——这与传统程序员熟悉的“需求分析→设计→开发→测试→迭代”流程高度契合,只是每个环节的核心任务发生了转变。 提示词专家设计优化完提示词后,需…

2026-04-06

特斯拉D3芯片登场:突破地球算力瓶颈,太空开启AI算力新征程
然而,随着特斯拉工程团队依托即将推出的 AI5 与 AI6 处理器,逐步统一 FSD 与擎天柱机器人的架构,同时 xAI 采用商用 GPU搭建吉瓦级大规模算力集群,不少行业分析师曾推测 Dojo 项目已名…

2026-04-05