摘要 - 视觉探测器(VO)对于自主系统的导航至关重要,以合理的成本提供准确的位置和方向估计。虽然传统的VO方法在某些条件下脱颖而出,但它们会面临诸如可变照明和运动模糊之类的挑战。深度学习的VO虽然更适应性,但在新环境中可能会面临概括问题。解决这些缺点时,本文提出了一种新型的混合视觉探光(VO)框架,该框架利用了姿势的超级视觉,提供了稳健性和对广泛标签的需求之间的平衡解决方案。我们提出了两种具有成本效益和创新的设计:一种自我监管的同谱预训练,用于从唯一的姿势标签中增强光流学习,以及一个随机的基于贴片的显着点检测策略,以进行更准确的光流贴片提取。这些设计消除了对训练的密集光流标签的需求,并显着提高了系统在多样化和挑战性环境中的概括能力。与密集的光学流程监督最终的最新方法相比,在极端和看不见的情况下,在极端和看不见的情况下,在标准数据集以及更大的鲁棒性和概括能力上实现了竞争性能。
主要关键词