我们提出了Mujoco Manipulus,这是一种由Mujoco物理模拟引擎提供动力的新型开源基准测试,旨在加速机器人学习的进步以进行工具操作。我们的基准包括用于操纵工具的各种任务 - 该领域目前缺乏统一的基准。不同的研究小组依赖于定制设计的任务或封闭式设置,从而限制了交叉可靠性并阻碍了该领域的重大进展。为此,我们的基准提供了16个具有挑战性的工具操纵任务,包括倒入,sc sc,刮擦,堆叠,聚集,锤击,迷你高尔夫球和乒乓球的变体。基准测试支持基于州立和基于视觉的观察空间,与体育馆API完全集成,并与广泛使用的深入强化学习库相连,以确保社区轻松采用。我们在基准上进行了广泛的强化学习实验,我们的结果表明,对于培训工具操纵策略,要取得进展。可以在我们的匿名项目网站:mujoco-manipulus.github.io上找到我们的代码库和其他学识的策略的其他视频。
主要关键词