通过大语言模型的测试时间缩放生成符号世界模型__

通过大语言模型的测试时间缩放生成符号世界模型

可下载资源数量

已经购买

下载数量：1

单价	0 3.0
Coupon	100% 0%
Total	0 3.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过大语言模型的测试时间缩放生成符号世界模型

¥ 3.0

热度

解决复杂的计划问题需要大型语言模型（LLMS）明确对状态过渡进行建模，以避免规则违规，遵守限制并确保操作性 - 这是由自然语言固有的歧义所阻碍的任务。为了克服这种歧义，规划域定义语言（PDDL）被杠杆化为一种计划，以实现精确和正式的状态描述。使用PDDL，我们可以生成一个象征性的世界模型，其中经典的搜索算法（例如A ∗）可以无缝地找到最佳计划。但是，由于缺乏PDDL培训数据，直接生成具有当前LLM的PDDL域仍然是一个开放的挑战。为了应对这一挑战，我们建议扩大LLMS的测试时间计算以增强其PDDL推理功能，从而使高质量的PDDL域的产生。具体来说，我们引入了一种简单而有效的算法，该算法首先采用了最佳的N采样方法来提高初始解决方案的质量，然后通过口头化的机器学习以细粒度的方式优化解决方案。我们的方法在PDDL域的产生中大大优于O1-Mini，在两个任务上达到了超过50％的成功率（即，从自然语言描述或PDDL问题中生成PDDL域）。这是在不需要额外培训的情况下完成的。通过利用PDDL作为状态抽象，我们的方法能够在几乎所有竞争级的计划任务上都超过当前最新方法。

添加pdf代下载 VIP点击下载文件