摘要 - 基于学习的方法已经实现了四足动力的强大性能。然而,一些挑战阻止了四足动物学习需要与环境和人类互动的有用室内技能:缺乏操纵的最终效果,仅使用模拟数据使用有限的语义介绍,以及在室内环境中的较低的遍历性和可及性。我们提出了一个在室内环境中进行四足动物移动操作的系统。它使用前式握把进行对象操纵,这是一种低级控制器,在模拟中培训了以egile的深度进行训练,以攀登和全身倾斜等敏捷技能,以及预先训练的视觉语言模型(VLMS),并具有第三人称Fisheye和Egentric RGB摄像头,以探索fishereye和Egincentric RGB摄像头,以进行儿子理解和指挥生成。我们在两个看不见的环境中评估了我们的系统,而没有任何现实数据收集或培训。我们的系统可以零射对这些环境并完成任务,例如遵循用户的命令在攀登女王大小的床上,成功率为60%。
主要关键词