近日,AI领域迎来了一项重要更新,DeepSeek R1,这款备受瞩目的模型悄然增加了对FunctionCall(函数调用)的支持,引发了开发者和用户的广泛关注。
此前,DeepSeek R1的一大痛点在于不支持函数调用,这限制了其在实际应用中的灵活性和能力范围。GitHub上的众多开发者纷纷表达了对这一功能的渴望。然而,在一次由知名AI博主@赛博禅心组织的小聚会后,用户惊讶地发现,DeepSeek R1悄然上线了支持函数调用的新版本。
函数调用功能的加入,使得LLM(大型语言模型)能够成为一个更加智能的“操作员”。通过标准化的接口,LLM可以调用外部工具和服务,从而极大地扩展其能力边界。具体而言,函数调用的实现流程包括用户输入、LLM生成回应并意识到需要工具调用、暂停原有Token生成并开始生成函数调用参数、外部系统执行并返回结果、LLM基于返回结果和前文继续生成完整回应。
为了更直观地理解这一过程,有人基于Claude生成了一个演示动画,展示了函数调用在实际应用中的工作流程和效果。
函数调用对LLM的价值不言而喻。将LLM比作数字员工,为了使数字员工更好地完成任务,需要赋予其基本的认知基座、外部信息的补充以及规约能力。然而,传统的LLM在这些方面往往存在不足,导致生成的结果可能出现逻辑不合理或信息缺失等问题。而函数调用的加入,则能够有效解决这些问题,提升LLM的准确性和实用性。
清华系开源智能体框架Eko对函数调用的应用非常出色。其通过规划层和执行层的分工合作,实现了对复杂任务的自动化处理。规划层负责生成工作流并以函数调用的方式反馈给执行层,而执行层则负责执行具体的任务。这种框架为DeepSeek R1等推理模型提供了广阔的应用前景。
在实际应用中,DeepSeek R1已经展现出了强大的函数调用能力。例如,当用户提出一个无需调用联网搜索插件的问题时,模型能够自主判断并给出回复。而当用户要求查询B站上的热搜并制作思维导图时,模型则能够主动调用相应的插件并生成正确的结果。
当然,目前的DeepSeek R1在函数调用方面还存在一些偶发的小问题,如不知道何时应调用函数、参数输入不完全准确等。但这些问题并不影响其作为AI领域的一项重要更新所带来的积极影响和广阔前景。
值得注意的是,本周五,DeepSeek的开发者们还参加了阶跃星辰发布会,预计将有更多更新和进展公布。对于关注AI领域发展的用户来说,这无疑是一个值得期待的时刻。