Loading...
机构名称:
¥ 1.0

摘要:这项工作探讨了使用可区分的模拟进行四足运动的潜力。可区分的模拟通过使用机器人动力学计算低变化的一阶梯度来承诺快速转化和稳定训练。但是,它对腿部机器人的使用仍然仅限于模拟。主要挑战在于由于不连续动态而引起的机器人任务的复杂优化格局。这项工作提出了一个新的可区分类似框架来克服这些挑战。我们的方法结合了用于正向动力学的高保真度,非差异的模拟器,简化的表面模型用于梯度后传播。这种方法通过将替代模型的机器人状态与精确的,不可差的模拟器对齐来保持模拟精度。我们的框架使学习可以在几分钟内在仿真中学习四倍,而无需并行化。随着GPU并行化的增强,我们的方法允许四倍的机器人在几分钟内在挑战地形上掌握各种运动技能。我们证明,可差异的模拟通过实现明显提高样品效率的同时,在处理大规模环境中的有效性时,可以优于强化学习算法(PPO)。我们的方法代表了可区分模拟到现实世界四倍的机车运动的第一个成功应用之一,它为传统RL方法提供了令人信服的替代方案。视频:https://youtu.be/wenq_w715xm

使用可区分的模拟学习四倍的运动

使用可区分的模拟学习四倍的运动PDF文件第1页

使用可区分的模拟学习四倍的运动PDF文件第2页

使用可区分的模拟学习四倍的运动PDF文件第3页

使用可区分的模拟学习四倍的运动PDF文件第4页

使用可区分的模拟学习四倍的运动PDF文件第5页

相关文件推荐