大模型预训练“狼人杀”，谁悄然落后成悬念？-天脉网

在中国AI领域，一场关于大模型初创公司未来方向的深刻变革正在悄然上演。近期，市场传言称，被誉为“AI六小虎”的智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰中，已有两家公司决定调整战略，逐步退出预训练模型的研发，转而聚焦AI应用领域。这一动态不仅揭示了当前AI行业的严峻挑战，也预示着大模型初创公司正面临前所未有的抉择。

预训练，作为AI模型构建的基础环节，其重要性不言而喻。它如同为模型打下坚实的语言和理解基础，使模型能够广泛学习语言的统计规律、语义知识等通用特征。这一过程类似于给一个孩子提供大量学习资料，让其通过广泛阅读和学习，积累丰富的知识储备。然而，预训练的高昂成本和不确定性，却让不少初创公司望而却步。据行业专家透露，当前顶级模型的训练成本已高达数亿甚至数十亿美元，且未来仍有上涨趋势。

对于资源丰厚的行业巨头而言，预训练是不可或缺的投入。马斯克为了提升自家xAI的Grok系列模型，不惜斥巨资购置了10万张GPU卡。然而，对于“AI六小虎”这样的初创公司来说，预训练的高门槛却成为了一道难以逾越的障碍。一方面，预训练需要强大的算力和高质量数据支持；另一方面，其复杂的算法和技术也对团队能力提出了极高要求。

预训练不仅是模型的地基，更是大模型公司技术实力的试金石。在预训练阶段，模型能够学习到广泛的语言理解能力和基础智能表现，为后续针对特定任务的微调提供坚实基础。GPT-3的成功便是一个典型例证，其通过海量数据的预训练，在自然语言处理任务中展现出了卓越的性能。然而，预训练的高成本和高门槛，也让不少初创公司开始重新审视自己的战略定位。

在“AI六小虎”中，智谱AI、零一万物、DeepSeek等公司凭借强大的技术实力和资源支持，继续在预训练领域深耕细作。智谱AI作为“清华系国家队”，在融资和算力方面得天独厚；零一万物则凭借李开复的深厚背景和AI Infra布局，在预训练领域取得了显著成果；DeepSeek背靠幻方量化，拥有上万张GPU资源，同样在预训练领域占据一席之地。然而，月之暗面、阶跃星辰、MiniMax等公司却开始逐步调整战略，转向AI应用领域。

在全球大模型竞技场（ChatBot Arena）等权威盲测平台上，零一万物的Yi-Lightning、智谱AI的GLM-4-Plus以及DeepSeek V2.5等模型取得了出色成绩，展现了中国大模型初创公司的技术实力。然而，月之暗面、MiniMax等公司却未在榜单上展现出显著进步，其基座模型的消息也显得颇为模糊。业内有声音指出，这些公司可能已转向利用开源模型进行调优和应用开发，以降低成本和提高投入产出比。

在当前行业基础模型过剩、破圈应用产品稀缺的背景下，不少初创公司开始重新审视预训练的价值。对于某些公司来说，利用开源模型进行调优和应用开发，或许是一个更为务实的选择。然而，这也意味着他们将放弃在预训练领域的竞争，将模型和应用的上限拱手让给开源模型。在这场关于预训练的豪赌中，什么样的玩家能够留在牌桌上，答案已经日渐清晰。

随着中美科技竞争的加剧，顶尖人才资源的争夺战也愈发激烈。多位猎头反馈称，自ChatGPT爆火之后，国内对于AI领域顶级研发人才的需求持续走高。字节跳动、零一万物等公司纷纷加大人才引进力度，以期在预训练领域取得突破。然而，随着竞争壁垒的不断提高，单靠挖角已难以解决根本问题。预训练人才的流动虽然频繁，但真正能够推动技术进步的，还是团队的整体实力和技术底蕴。

在这场变革中，中国大模型“小虎”们的道路已经出现分野。从预训练开始，技术领先者已经脱颖而出，而部分公司则开始寻找新的发展方向。无论是继续坚守预训练领域，还是转向AI应用开发，每家公司都在根据自己的实际情况和资源禀赋做出选择。在这场关乎未来的竞争中，谁能够笑到最后，还需拭目以待。