小米公司近日宣布,其自主研发的大模型MiMo-V2-Pro在国际权威评测中取得突破性进展。在衡量复杂逻辑推理能力的Model Rank榜单中,该模型以稳定表现跻身全球第五;在实验室综合研发实力评估的LabRank维度,小米在Text Arena(文本竞技场)和Code Arena(代码竞技场)分别位列全球第四和第五,展现出强大的技术积累。
据介绍,MiMo-V2-Pro是专为Agent时代设计的旗舰基座模型,针对现实世界中高强度的智能体工作场景优化。该模型采用创新的混合注意力架构,总参数量超过1T(激活参数42B),支持1M超长上下文处理能力。其技术突破体现在从编程(Coding)到机械臂控制(Claw)的跨领域泛化能力,显著拓展了智能体的动作空间。
在评测机制方面,Text Arena榜单采用的"双盲测试"模式引发行业关注。该机制通过隐藏模型身份、由全球真实用户基于回答质量实时投票,有效避免了传统评测中针对特定数据集优化的问题。这种评估方式更贴近实际应用场景,为模型性能提供了更具参考价值的验证标准。
国际权威榜单Artificial Analysis的最新数据显示,MiMo-V2-Pro在综合智能评估中位列全球第八、国内第二。自上线以来,该模型已吸引全球开发者的广泛关注,其开放的生态架构为智能体应用开发提供了强大支持。小米持续加大在Agent场景的算力投入,通过规模化扩展推动技术边界,为人工智能落地更多现实场景奠定基础。
