小模型成新宠？微软、英伟达齐出手，大模型不香了？-天脉网

【天脉网】8月26日，AI新趋势：小型语言模型挑战传统巨头地位

在人工智能领域，一场关于模型规模的较量正在悄然进行。长久以来，大型语言模型（LLM）因其庞大的规模和强大的性能而备受推崇，但如今，小型语言模型（SLM）正以其独特的优势，逐渐挑战着“越大越好”的传统观念。

据天脉网了解，SLM的崛起并非偶然。近期，微软和英伟达相继发布了Phi-3.5-mini-instruct和Mistral-NeMo-Minitron8B两款小型语言模型，它们以在计算资源使用和性能之间的良好平衡，迅速吸引了市场的关注。

人工智能初创公司Hugging Face的首席执行官Clem Delangue大胆预测，2024年将成为SLM的崛起之年。这一预测并非空穴来风，据统计，包括meta、微软、谷歌在内的科技巨头们今年已经发布了多达9款小型模型。

大型语言模型面临的挑战与SLM的崛起密切相关。AI初创公司Vellum和Hugging Face发布的性能比较显示，尽管LLM在性能上仍在不断提升，但顶级模型之间的差异正在迅速缩小，特别是在特定任务中。

然而，与有限的性能提升相比，LLM的训练成本却在不断攀升。海量数据和数以亿计甚至万亿个参数导致了极高的资源消耗。训练和运行LLM所需的计算能力和能源消耗令人咋舌，这使得小型组织或个人难以参与到核心LLM的开发中来。

相比之下，SLM作为LLM的精简版本，具有更少的参数和更简单的设计。它们需要更少的数据和训练时间，这使得SLM更加高效，更易于在小型设备上部署。此外，SLM的另一个主要优势是其针对特定应用的专业化，这使它们在实际应用中更加高效。

SLM在特定领域内也不易出现“幻觉”现象，因为它们通常在更窄、更有针对性的数据集上进行训练，这有助于模型学习与其任务最相关的模式和信息。

尽管SLM的专业化是一大优势，但也存在一定的局限性。这些模型可能在其特定训练领域之外表现不佳，缺乏广泛的知识库。这一限制要求用户可能需要部署多个SLM来覆盖不同的需求领域，从而使AI基础设施复杂化。

然而，随着AI领域的快速发展，小模型的标准也可能会不断变化。东京的小型模型初创公司Sakana的联合创始人兼首席执行官David Ha表示，“大小总是相对的。”这句话或许正揭示了SLM未来的无限可能。

在这场AI的规模较量中，SLM正以其独特的优势逐渐崭露头角。它们不仅降低了开发和部署的成本，也为商业客户提供了更经济的解决方案。随着技术的不断进步，我们有理由相信，SLM将在未来的AI领域扮演越来越重要的角色。

对于这场AI领域的新变革，你有什么看法呢？是否看好SLM的发展前景？欢迎留言讨论，分享你的观点。