Loading...
机构名称:
¥ 1.0

摘要在最近的研究中,在大型语言模型的工具学习中取得了重大进步。寻求未来的高级研究,完全自主工具利用的问题特别有趣:只有查询,语言模型可以自主决定是否使用工具,哪种特定工具选择以及如何使用这些工具,而无需上下文中的任何工具特定提示。为了实现这一目标,我们为微调语言模型引入了一个统一,高效且可扩展的框架。基于工具依赖性的程度,我们最初将查询分为三种不同类型。通过将整个过程通过条件概率分解将整个过程转换为顺序决策问题,我们的方法统一了三种类型,并自动重新加索会生成决策过程。同时,我们引入了专门为有效数据注释而设计的“指示,执行和重构”策略。通过在包含26种不同API的注释数据集上的端到端培训,该模型展示了一种自我意识,必要时自动寻求工具帮助。在多个评估指标上,它显着超过了原始的指令调整的开源语言模型和GPT-3.5/4。为了满足现实世界的可扩展性需求,我们通过动态的彩排策略来增强我们的框架,以持续学习,被证明需要最小的新注释才能表现出杰出的表现。

语言模型中的自主工具利用

语言模型中的自主工具利用PDF文件第1页

语言模型中的自主工具利用PDF文件第2页

语言模型中的自主工具利用PDF文件第3页

语言模型中的自主工具利用PDF文件第4页

语言模型中的自主工具利用PDF文件第5页

相关文件推荐