摘要。基于网格的场景表示,提供了一个有希望的方向,可简化大规模的层次视觉定位管道,根据全局特征(检索)(检索)和基于本地特征的视觉定位步骤来组合视觉位置识别步骤。现有工作证明了网格对视觉定位的可行性,但在Visual Place识别中使用从它们中呈现的合成数据库的影响仍然很大程度上尚未探索。在这项工作中,我们研究了大规模视觉位置识别(VPR)的密集3D纹理网格。使用基于合成网格的图像数据库与现实世界图像进行检索相比,我们确定了显着的性能下降。为了解决这个问题,我们提出了一种新型的VPR管道Meshvpr,它利用轻量级的特色对齐框架来弥合现实世界和合成域之间的差距。MESHVPR利用了预训练的VPR模型,对于全市范围的部署是有效且可扩展的。我们使用可自由使用的3D网眼的新型数据集,并从柏林,巴黎和墨尔本手动收集了查询。广泛的评估表明,MESHVPR通过标准VPR管道实现竞争性能,为基于网格的本地化系统铺平了道路。数据,代码和交互式可视化可在https://meshvpr.github.io/
主要关键词