Loading...
机构名称:
¥ 1.0

摘要。从单个图像中,视觉提示可以帮助推断出固有和外在的摄像头参数,例如焦距和重力方向。此单图像校准可以使各种下游应用程序受益,例如图像编辑和3D映射。当前解决此问题的方法是基于带有线条和消失点的经典几何形状,或者是基于训练有素的端到端的深神经网络。学习的方法更强大,但很难概括到新的环境中,并且不如其经典同行准确。我们假设它们缺乏3D几何形状所提供的约束。在这项工作中,我们介绍了Geocalib,这是一个深层神经网络,通过优化过程利用3D几何的通用规则。GeoCalib是端对端训练的,以估算摄像机参数并学会从数据中找到有用的视觉提示。在各种基准测试中的实验表明,与现有的经典和学识渊博的方法相比,Geocalib更健壮,更准确。其内部优化估计不确定性,有助于标记故障案例并受益于下游应用程序,例如视觉定位。代码和训练有素的模型可在https://github.com/cvg/geocalib上公开获得。

Geocalib:通过几何优化学习单图像校准

Geocalib:通过几何优化学习单图像校准PDF文件第1页

Geocalib:通过几何优化学习单图像校准PDF文件第2页

Geocalib:通过几何优化学习单图像校准PDF文件第3页

Geocalib:通过几何优化学习单图像校准PDF文件第4页

Geocalib:通过几何优化学习单图像校准PDF文件第5页

相关文件推荐