国产大模型领域迎来重要突破,MiniMax公司于近日正式推出新一代通用模型——MiniMax M3。该模型凭借自研的稀疏注意力架构MiniMax Sparse Attention(MSA),在编程与智能体能力、超长上下文处理以及原生多模态支持等关键领域实现了代际跨越。
作为国内首款同时具备前沿编程能力、100万token超长上下文窗口以及原生多模态处理能力的大模型,MiniMax M3在开源生态中独树一帜。其核心技术MSA架构通过优化注意力机制,将长文本场景下的计算成本降低至传统模型的二十分之一,同时将上下文窗口扩展至百万级规模。这一特性使得模型在处理复杂代码库、多轮对话任务以及长文档分析时,能够保持更完整的信息连贯性。
技术评测数据显示,MiniMax M3在编程相关能力上表现突出。在衡量代码生成质量的SWE-Bench Pro基准测试中,该模型得分超越GPT-5.5和Gemini 3.1 Pro,与行业领先的Opus 4.7模型差距显著缩小。在SVG图形生成性能的SVG-Bench测试中,M3更以绝对优势超越Opus 4.7,展现出强大的多模态处理能力。
商业化应用方面,MiniMax同步推出Token Plan订阅服务体系。该体系包含三个版本:每月49元的Plus版提供6亿token使用量,119元的Max版提供18亿token,而469元的Ultra版则提供高达55亿token的月度配额。这种分层定价策略为不同规模的企业用户提供了灵活的选择空间。
行业分析指出,MiniMax M3的推出标志着国产大模型在核心技术自主化方面取得重要进展。其创新的MSA架构不仅解决了长文本处理效率的行业痛点,更通过开源策略推动了技术生态的共建。随着多模态能力与编程性能的同步提升,该模型有望在智能客服、代码辅助开发、复杂文档处理等领域引发新一轮应用变革。
