李飞飞团队“50美元”AI模型真相：基于阿里云通义千问微调？-天脉财经

人工智能领域近期传来一则引人注目的新闻，引发业界广泛关注。

据报道，斯坦福大学和华盛顿大学的研究团队，在李飞飞的带领下，以极其低廉的云计算成本——不足50美元，成功打造了一款名为s1的人工智能推理模型。该模型在数学及编程能力测试中的表现，据称能与OpenAI的O1和DeepSeek的R1等顶尖推理模型相媲美。这一消息在AI界掀起了轩然大波。

然而，深入探究后发现，s1模型的训练并非从零构建，而是基于阿里云的通义千问（Qwen）模型进行了监督微调。这意味着，s1模型之所以能以如此低的成本实现高效能，很大程度上得益于通义千问这一开源基础模型的强大支撑。

根据李飞飞团队的研究论文，s1模型的训练仅采用了1000个样本数据。在AI训练领域，这一数据量微不足道，通常不足以支撑起一个具备推理能力的模型。上海交通大学人工智能学院的谢伟迪副教授指出，仔细研读斯坦福s1的论文会发现，s1模型的神奇之处在于它以通义千问模型为基座进行了微调，这1000个样本数据更像是起到了“点睛”的作用。

国内某知名大模型公司的CEO也表达了类似的观点：“从论文原文来看，所谓用50美元训练出的新推理模型，实际上只是对通义千问模型进行了监督微调，使用了从谷歌模型中提炼的1000个样本。这种微调的成本确实很低，但显然是站在了既有领先模型的肩膀上。”

谢伟迪还提到，国内外有多个团队声称以极低的成本训练出了具备推理能力的新模型，但仔细阅读其论文后不难发现，这些模型都是基于通义模型进行微调的。

国外多位人工智能研究者也指出，许多所谓的“新”模型都是在通义模型的基础上建立的。

谢伟迪强调，虽然以通义千问模型为基座，可以用极少的样本数据达到产生新推理模型的效果，但如果换成其他基座模型，新模型的能力并不会有任何提升。因此，真正神奇的是Qwen模型，而非s1。

尽管s1模型的低成本训练在某种程度上展示了AI训练的巨大潜力，但其局限性同样不容忽视。这种低成本训练方式严重依赖于已有的强大基座模型，如阿里通义千问模型。若无此类基座模型的支撑，低成本训练的效果将大打折扣。同时，1000个样本数据的训练量在多数情况下难以满足复杂任务的处理需求。

低成本训练的成功还引发了对AI模型知识产权和伦理问题的广泛讨论。随着越来越多的研究依赖于已有基座模型进行微调，基座模型开发者的权益保障、AI技术的公平使用和共享等问题亟待业界深入探讨和解决。