最近,“递归式自我改进”(RSI)这个概念在人工智能领域掀起了一阵热潮。从初创公司到顶尖实验室,许多机构都开始将这一理念纳入自己的发展蓝图,甚至直接以“递归”为核心命名新企业。RSI,即“递归自我改进”,指的是人工智能系统通过自我训练和优化,实现能力的持续提升。这一概念被视为AI技术进步的重要标志,与记忆、推理和多模态能力并列,成为行业关注的焦点。
RSI的核心理念是让AI系统摆脱对人类干预的依赖,通过自我迭代实现能力的飞跃。这一设想听起来充满科幻色彩,甚至让人感到一丝不安,但回顾AI行业的发展历程,类似的狂热并非首次出现。从AlphaGo击败人类围棋冠军,到ChatGPT引发全球关注,再到如今大模型参数的激烈竞争,AI行业始终在追逐下一个“颠覆性”突破。在许多专家看来,RSI或许就是下一个风口。
今年5月,知名AI研究员理查德·索彻(Richard Socher)创立了一家名为“递归超级智能”(Recursive Superintelligence)的公司,明确将RSI作为核心目标。他表示,公司的使命是构建真正意义上的递归自我改进超级智能,整个研究过程将完全自动化,无需人类参与。这一宣言引发了广泛讨论,也让RSI的概念进一步进入公众视野。
卡帕西的动向并非孤立事件。今年早些时候,他加入了Anthropic的预训练团队,而Anthropic正是知名大模型Claude的开发者。如果将卡帕西的“自动研究”方法与Anthropic的模型结合,大模型与自训练循环的融合可能带来质的飞跃。与此同时,另一家初创公司Adaption推出了“自动科学家”(AutoScientist)工具,旨在自动化前沿模型的训练过程。与卡帕西的渐进式改进不同,Adaption的目标是直接构建全尺寸模型的训练闭环,商业化意图更为明显。这两条路径的竞争,或将决定RSI的未来走向。
尽管RSI的概念炙手可热,但并非所有人都持乐观态度。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在近期的一次播客中表示,RSI代表了一种“量级级的加速”,但目前行业尚未达到这一阶段。他承认AI技术正在进步,但认为RSI的实现仍需时间。皮查伊的谨慎态度反映了行业内部的分歧:一方面,RSI的潜力令人兴奋;另一方面,其技术挑战和伦理风险也不容忽视。
今年1月,Anthropic的一位程序员透露,团队近100%的代码由Claude Code生成,这标志着AI在某种程度上已经开始替代人类编写代码。然而,这种“自我驱动”的能力仍存在明显缺陷。Anthropic的内部调查显示,尽管部分工程师认为Claude Code已具备替代中级程序员的能力,但它在管理复杂任务、理解组织优先级和验证结果等方面仍存在不足。而这些能力,恰恰是RSI的根基。
对于RSI的未来,学术界也存在不同观点。乔治城大学安全与新兴技术研究中心(CSET)去年组织了一批专家进行评估,结果呈现明显分裂:一部分人认为“超级智能爆炸”即将到来,另一部分人则预计进展会更缓慢,最终触达瓶颈。尽管观点不一,但专家们普遍认为,递归将使未来变得难以预测。METR研究员阿杰亚·科特拉(Ajeya Cotra)提出了一套分析框架,将RSI的进程分为三个阶段:第一阶段是“足够性”,即系统在无人干预下仍能进行研究;第二阶段是“对等性”,即AI的研究质量与人类相当;第三阶段是“超越性”,即AI的表现超过人类与AI协作的系统。科特拉认为,行业已接近第一阶段,但第二阶段的到来时间尚不明确。不过,她警告称,一旦第二阶段实现,后续进展可能极其迅速。
与海外的热烈讨论相比,国内对RSI的公开讨论相对较少。然而,这并不意味着国内厂商在这一领域毫无作为。以DeepSeek为例,该公司通过优化算法效率,在推理任务上取得了显著进展,其成本仅为OpenAI的十分之一。这种“聪明迭代”的路径与RSI的核心逻辑不谋而合:通过模型自身的优化,而非单纯依赖算力堆砌,实现能力的提升。百度的文心大模型也采用了类似方法,通过强化学习驱动模型自我优化,尽管未使用RSI的名称,但实质上已融入了递归改进的理念。
尽管国内厂商在RSI的探索上仍处于跟随状态,但其成本控制能力和落地场景密度可能成为未来竞争的关键变量。然而,RSI的实现仍面临诸多挑战。例如,AI生成的数据质量可能随着迭代次数增加而下降,导致模型坍缩。RSI的理想环境需要无限算力和全球开放协作的研究生态,而现实中的芯片短缺、能源限制和数据流通障碍,都为这一目标的实现蒙上了阴影。
从大规模预训练到RLHF(基于人类反馈的强化学习),再到如今的RSI,AI行业正在逐步将人类从决策链条中剔除。这一趋势未必是坏事,但它不可逆:一旦某个环节被自动化接管,人类在该领域的能力将逐渐退化。到那时,我们或许连自己使用的工具是如何诞生的都难以理解。
