RSI热潮来袭：海外探索正酣，国内厂商悄然跟进，挑战与机遇并存-天脉财经

最近，“递归式自我改进”（RSI）这个概念在人工智能领域掀起了一阵热潮。从初创公司到顶尖实验室，许多机构都开始将这一理念纳入自己的发展蓝图，甚至直接以“递归”为核心命名新企业。RSI，即“递归自我改进”，指的是人工智能系统通过自我训练和优化，实现能力的持续提升。这一概念被视为AI技术进步的重要标志，与记忆、推理和多模态能力并列，成为行业关注的焦点。

RSI的核心理念是让AI系统摆脱对人类干预的依赖，通过自我迭代实现能力的飞跃。这一设想听起来充满科幻色彩，甚至让人感到一丝不安，但回顾AI行业的发展历程，类似的狂热并非首次出现。从AlphaGo击败人类围棋冠军，到ChatGPT引发全球关注，再到如今大模型参数的激烈竞争，AI行业始终在追逐下一个“颠覆性”突破。在许多专家看来，RSI或许就是下一个风口。

今年5月，知名AI研究员理查德·索彻（Richard Socher）创立了一家名为“递归超级智能”（Recursive Superintelligence）的公司，明确将RSI作为核心目标。他表示，公司的使命是构建真正意义上的递归自我改进超级智能，整个研究过程将完全自动化，无需人类参与。这一宣言引发了广泛讨论，也让RSI的概念进一步进入公众视野。

卡帕西的动向并非孤立事件。今年早些时候，他加入了Anthropic的预训练团队，而Anthropic正是知名大模型Claude的开发者。如果将卡帕西的“自动研究”方法与Anthropic的模型结合，大模型与自训练循环的融合可能带来质的飞跃。与此同时，另一家初创公司Adaption推出了“自动科学家”（AutoScientist）工具，旨在自动化前沿模型的训练过程。与卡帕西的渐进式改进不同，Adaption的目标是直接构建全尺寸模型的训练闭环，商业化意图更为明显。这两条路径的竞争，或将决定RSI的未来走向。

尽管RSI的概念炙手可热，但并非所有人都持乐观态度。谷歌CEO桑达尔·皮查伊（Sundar Pichai）在近期的一次播客中表示，RSI代表了一种“量级级的加速”，但目前行业尚未达到这一阶段。他承认AI技术正在进步，但认为RSI的实现仍需时间。皮查伊的谨慎态度反映了行业内部的分歧：一方面，RSI的潜力令人兴奋；另一方面，其技术挑战和伦理风险也不容忽视。

今年1月，Anthropic的一位程序员透露，团队近100%的代码由Claude Code生成，这标志着AI在某种程度上已经开始替代人类编写代码。然而，这种“自我驱动”的能力仍存在明显缺陷。Anthropic的内部调查显示，尽管部分工程师认为Claude Code已具备替代中级程序员的能力，但它在管理复杂任务、理解组织优先级和验证结果等方面仍存在不足。而这些能力，恰恰是RSI的根基。

对于RSI的未来，学术界也存在不同观点。乔治城大学安全与新兴技术研究中心（CSET）去年组织了一批专家进行评估，结果呈现明显分裂：一部分人认为“超级智能爆炸”即将到来，另一部分人则预计进展会更缓慢，最终触达瓶颈。尽管观点不一，但专家们普遍认为，递归将使未来变得难以预测。METR研究员阿杰亚·科特拉（Ajeya Cotra）提出了一套分析框架，将RSI的进程分为三个阶段：第一阶段是“足够性”，即系统在无人干预下仍能进行研究；第二阶段是“对等性”，即AI的研究质量与人类相当；第三阶段是“超越性”，即AI的表现超过人类与AI协作的系统。科特拉认为，行业已接近第一阶段，但第二阶段的到来时间尚不明确。不过，她警告称，一旦第二阶段实现，后续进展可能极其迅速。

与海外的热烈讨论相比，国内对RSI的公开讨论相对较少。然而，这并不意味着国内厂商在这一领域毫无作为。以DeepSeek为例，该公司通过优化算法效率，在推理任务上取得了显著进展，其成本仅为OpenAI的十分之一。这种“聪明迭代”的路径与RSI的核心逻辑不谋而合：通过模型自身的优化，而非单纯依赖算力堆砌，实现能力的提升。百度的文心大模型也采用了类似方法，通过强化学习驱动模型自我优化，尽管未使用RSI的名称，但实质上已融入了递归改进的理念。

尽管国内厂商在RSI的探索上仍处于跟随状态，但其成本控制能力和落地场景密度可能成为未来竞争的关键变量。然而，RSI的实现仍面临诸多挑战。例如，AI生成的数据质量可能随着迭代次数增加而下降，导致模型坍缩。RSI的理想环境需要无限算力和全球开放协作的研究生态，而现实中的芯片短缺、能源限制和数据流通障碍，都为这一目标的实现蒙上了阴影。

从大规模预训练到RLHF（基于人类反馈的强化学习），再到如今的RSI，AI行业正在逐步将人类从决策链条中剔除。这一趋势未必是坏事，但它不可逆：一旦某个环节被自动化接管，人类在该领域的能力将逐渐退化。到那时，我们或许连自己使用的工具是如何诞生的都难以理解。