Loading...
机构名称:
¥ 1.0

摘要 - 在这项工作中,我们提出了一位用于创建开环轨迹的计划者,该轨迹可以使用非恐怖分子的方法来解决不确定性下的重排计划问题。我们首先将蒙特卡洛树搜索算法扩展到了不可观察的域。然后,我们提出了两项​​默认政策,使我们能够快速确定实现目标的潜力,同时考虑到重新安排计划至关重要的联系。第一个策略使用从一组用户演示中生成的学习模型。可以快速查询此模型的一系列动作,这些操作试图创建与对象并实现目标。第二策略在全州空间的子空间中使用了启发式指导计划者。使用这些目标知情政策,我们能够快速找到该问题的初始解决方案,然后在时间允许的情况下不断地重新填充解决方案。我们在桌子上的7个自由度操纵器移动对象上演示了我们的算法。

不可观察的蒙特卡洛计划非骚扰重排任务

不可观察的蒙特卡洛计划非骚扰重排任务PDF文件第1页

不可观察的蒙特卡洛计划非骚扰重排任务PDF文件第2页

不可观察的蒙特卡洛计划非骚扰重排任务PDF文件第3页

不可观察的蒙特卡洛计划非骚扰重排任务PDF文件第4页

不可观察的蒙特卡洛计划非骚扰重排任务PDF文件第5页