建筑原则。我们开发了一个模块化系统,解决了任务基础的关键挑战:(i)(ii)开放世界人类环境中使用单眼相机进行视觉导航,并具有(iii)低频,高潜伏期感应和控制。不可靠的传感器流与嘈杂的本体感受相结合,在单眼环境中具有准确的深度和比例估计,具有挑战性。要解决(i),选择了依靠语义图像提示,而不是放弃3D度量几何估计,而是专注于2D图像空间中的遍历性估计。为了概括(ii)的不同场景和外观变化,使用了大规模数据集上预测的视觉特征,并在frodobots-2k数据的精选部分上进行了微调。由于硬件限制和延迟的不可预测性,(iii)很难直接解决。该系统的重点是处理次优路径找到引起的导航故障和较差的Trajectory跟踪,这是由于通信不良引起的。这是通过使用可靠的故障检测和恢复来增加导航管道来实现的。在高水平上,系统(图1)由受到启示,控制和故障检测和恢复模块组成。感知模块估计了从RGB输入的遍历性,并且还向下一个路点发出以自我为中心的方向向量。控制模块选择与Waypoint向量对齐并生成控制命令的基因差异可行的轨迹。感知。故障检测和恢复模块是对原始RGB进行的监督监视器,并预测从感知到检测失败的遍历性,覆盖控制模块以在必要时执行启发式恢复行为。鉴于需要在开放世界的人类环境中进行操作而没有由于单眼设置而没有可靠的深度感应,因此使用了基于场景语义的视觉遍历性预测。感知模块将RGB图像作为输入,并根据输入图像输出遍历性掩码,并在[0,1]中以遍历性得分为单位。在内部,快速的遍历性估计器会产生一个初始面膜,然后通过聚类启发式方法进一步进行后处理,以识别并强烈惩罚可能的障碍。估算器使用验证的恐龙视觉特征,可以对各种环境进行强有力的概括,并允许进行样品有效的训练和填充来适应新场景。在捕获不同地形上的偏好时,要训练轮式Frodobot配置的估计器,这是一种自动从Frodobots-2K
主要关键词