在AI领域沉寂近一年后,meta以全新旗舰模型Muse Spark重返公众视野。这款被定义为“从零重构”的模型,不仅是meta超级智能实验室(MSL)成立后的首个公开成果,更被视为扎克伯格重夺AI竞争主动权的关键布局。据内部人士透露,Muse Spark的研发历时9个月,涉及训练基础设施、推理架构和数据策略的全面重建,而非基于既有模型的迭代升级。
过去两年,meta在AI赛道上的处境颇为尴尬。尽管其开源的Llama系列模型在开发者社区积累了一定口碑,但在产品完整度和模型性能上,始终难以与OpenAI的ChatGPT、Anthropic的Claude等头部产品抗衡。扎克伯格曾公开承认对meta的AI进展不满,并承诺启动全面革新。此次Muse Spark的推出,正是这一战略转向的直接体现。
技术团队的重组是这场变革的核心。去年,meta斥资143亿美元收购AI数据公司Scale AI 49%股权,并任命其创始人Alexandr Wang为首席AI官,主导重建工程。与此同时,meta从OpenAI、Anthropic和谷歌等公司高薪挖角顶尖研究人员,组建了全新的AI核心团队。这一系列动作被外界解读为:扎克伯格在AI领域的野心已从“跟随”转向“领先”。
第三方评测机构Artificial Analysis的数据显示,Muse Spark在综合智力指数上以52分跻身全球前五,仅次于谷歌Gemini 3.1 Pro Preview、OpenAI GPT-5.4和Anthropic Claude Opus 4.6,远超meta此前最强模型Llama 4 Maverick的18分。在具体能力维度上,Muse Spark表现尤为突出:视觉理解得分80.5%,全球第二;科学推理得分11%,超越Claude 4.6 Sonnet和Gemini 3 Flash;在“人类终极考试”中,借助外部工具时达到58.4分的高水准。更引人注目的是,其Token消耗效率与Gemini 3.1 Pro Preview相当,远低于Claude Opus 4.6和GPT-5.4,实现了性能与效率的双重突破。
Muse Spark的架构设计颇具创新性。其“多智能体并行”模式允许模型在处理复杂任务时,协调多个子智能体并行推理,从而在保持低延迟的同时提升输出质量。以旅行规划为例,模型可同时完成行程安排、目的地对比和活动筛选,最终整合输出完整方案。作为原生多模态模型,Muse Spark支持文本、图像等多种输入形式,具备跨模态理解与交互能力。
在应用场景上,meta聚焦健康和视觉STEM两大垂直领域。在健康领域,meta与超过1000名医生合作优化训练数据,使模型在提供医疗建议时更具专业性和安全性,意图将其打造为“个人健康助手”而非简单信息检索工具。在视觉STEM领域,模型可处理家用电器故障排查、交互小游戏生成和技术图纸理解等任务。Muse Spark还能接入Instagram、Facebook等平台用户内容,提供个性化推荐,并在meta AI眼镜上实现更强的环境感知能力,成为其“具身AI”战略的关键一环。
然而,Muse Spark的发布也伴随着争议。作为曾经的开源AI生态旗手,meta此次选择了闭源策略——模型仅通过meta.ai和meta AI应用提供,API仅向部分合作伙伴开放私有预览,普通开发者无法直接调用。扎克伯格解释称,未来仍计划发布开源模型,但Muse Spark本身需暂守技术秘密。这一转变被解读为meta在军备竞赛中的策略调整:既需防止核心能力被竞争对手借鉴,也需通过闭源API实现商业变现,以支撑每年数百亿美元的AI投入。
Muse Spark的定位远不止于一个聊天机器人。扎克伯格将其描述为通往“个人超级智能”的第一步,暗示meta的野心在于打造能够替代人类完成任务的AI代理。这一战略与meta庞大的社交用户基础紧密结合——Instagram的内容推荐、WhatsApp的日程管理、AR眼镜的实时辅助……meta试图将AI嵌入用户数字生活的每一个角落。但这一愿景也伴随着隐私风险:目前,使用Muse Spark需通过Facebook或Instagram账号登录,而meta长期利用公开用户数据进行模型训练的习惯,已引发监管机构和公众对数据边界的持续关注。
从追赶者到竞争者,meta的转型并非一蹴而就。Muse Spark的52分综合评分、全球第二的视觉理解能力和领先的Token效率,证明其已具备与顶尖AI公司正面交锋的技术实力。而35.8亿日活用户、跨平台社交数据网络和AR硬件生态,则构成了meta独特的护城河。一旦模型能力与平台生态深度融合,meta在AI应用层的潜力可能远超市场预期。这场AI领域的翻身仗,或许才刚刚拉开序幕。
