大型语言模型(LLMS)已经证明了需要解决任务计划和使用外部工具(例如天气和计算器API)组合的任务的熟练程度。但是,现实世界中的复杂系统提出了有关任务计划和工具使用情况的三个普遍的挑战:(1)实际系统通常具有许多API,因此将所有API的描述以LLMS的提示馈送是不切实际的,因为代币长度有限; (2)实际系统是为处理复杂任务而设计的,基本LLM几乎无法为此类任务计划正确的子任务订单和API呼叫顺序; (3)实际系统中API之间的类似语义和功能在区分它们时都为LLM甚至人类都带来了挑战。回应,本文介绍了一个旨在增强现实世界中LLM代理的任务计划和工具使用(TPTU)功能的综合框架。我们的框架包括三个旨在应对这些挑战的关键组件:(1)API猎犬在广泛的API集合中选择最相关的API; (2)LLM FineTuner对基本LLM进行调整,以增强其在任务计划和API调用方面的能力; (3)演示选择器检索与难以区分的API相关的演示,该演示进一步用于秘密学习以提高最终性能。我们使用现实世界中的行业系统和开源的学术数据集验证我们的方法,证明了每个组件以及集成框架的功效。
主要关键词