Loading...
机构名称:
¥ 1.0

扩散模型已成为一种有前途的数据驱动规划方法,并已展示出令人印象深刻的机器人控制、强化学习和视频规划性能。给定一个有效的规划器,需要考虑的一个重要问题是重新规划——何时应由于动作执行错误和外部环境变化而重新生成给定的计划。直接执行计划而不进行重新规划是有问题的,因为来自单个动作的错误会迅速累积,并且环境是部分可观察和随机的。同时,在每个时间步重新规划会产生大量的计算成本,并且可能会阻止任务成功执行,因为不同的生成计划会阻止任何特定目标的一致进展。在本文中,我们探讨了如何使用扩散模型有效地进行重新规划。我们提出了一种原则性方法来确定何时重新规划,该方法基于扩散模型对现有生成计划的估计可能性。我们进一步提出了一种重新规划现有轨迹的方法,以确保新计划遵循与原始轨迹相同的目标状态,这可以有效地引导先前生成的计划。我们说明了我们提出的附加功能组合如何显著提高扩散规划器的性能,使其在 Maze2D 上的性能比过去的扩散规划方法提高了 38%,并进一步实现了随机和长视界机器人控制任务的处理。视频可在匿名网站上找到:https://vis-www.cs.umass. edu/replandiffuser/ 。

利用扩散模型进行自适应在线重新规划

利用扩散模型进行自适应在线重新规划PDF文件第1页

利用扩散模型进行自适应在线重新规划PDF文件第2页

利用扩散模型进行自适应在线重新规划PDF文件第3页

利用扩散模型进行自适应在线重新规划PDF文件第4页

利用扩散模型进行自适应在线重新规划PDF文件第5页

相关文件推荐

2024 年
¥1.0