Loading...
机构名称:
¥ 1.0

由于大型语言模型(LLMS)通过不同的提示方法(例如思想链,思想计划)显示出有效性,因此我们发现这些方法在数学原因任务上彼此形成了极大的互补性。在这项工作中,我们提出了XOT,这是一个通过不同的推理思想提示LLM来解决问题的解决框架。对于每个问题,XOT始终从选择最合适的方法开始,然后迭代执行每种方法。在每次迭代中,XOT都会积极检查一般答案的有效性,并结合了外部执行者的反馈,从而使其能够在不同的提示中的不同提示之间进行动态切换。通过对10个流行数学推理数据集的大量实验,我们证明了我们提出的方法的有效性,并彻底分析了每个模型的优势。此外,经验结果表明,我们的框架与最近的工作是正交的,该工作改善了单个推理方法,并且可以进一步推广到逻辑推理领域。通过允许切换方法,XOT为统一框架中各种推理思想的协作整合提供了新的视角。

计划,验证和切换:与多样的X的集成推理

计划,验证和切换:与多样的X的集成推理PDF文件第1页

计划,验证和切换:与多样的X的集成推理PDF文件第2页

计划,验证和切换:与多样的X的集成推理PDF文件第3页

计划,验证和切换:与多样的X的集成推理PDF文件第4页

计划,验证和切换:与多样的X的集成推理PDF文件第5页