在陆地机器人自主导航的背景下,创建用于代理动力学和感官的现实模型是机器人文献和商业应用中的广泛习惯,在该习惯中,它们用于基于模型的控制和/或用于本地化和映射。另一方面,较新的AI文献是在模拟器或Ai-thor的模拟器或端到端代理上进行训练的,在这种模拟器中,重点放在照相现实渲染和场景多样性上,但是高效率机器人动作具有较少的特权角色。所得的SIM2REAL差距显着影响训练有素的模型转移到真正的机器人平台。在这项工作中,我们探讨了在设置中对代理的端到端培训,从而最大程度地减少了Sim2real Gap,在感应和驱动中。我们的代理直接预测(离散的)速度命令,这些命令是通过真实机器人中的闭环控制维护的。在修改的栖息地模拟器中鉴定并模拟了真实机器人的行为(包括底盘的低级控制器)。探视和定位的噪声模型进一步促进了降低SIM2REAL间隙。我们在实际导航方案上评估,探索不同的本地化和点目标计算方法,并报告与先前的工作相比的性能和鲁棒性的显着增长。
主要关键词