Loading...
机构名称:
¥ 1.0

单眼深度估计是计算机视觉中的持续挑战。变压器模型的最新进展证明了与该领域的召开CNN相比,具有显着的优势。但是,了解这些模型如何优先考虑2D图像中不同区域的优先级以及这些区域如何影响深度估计性能。探索变压器和CNN之间的差异,我们采用了稀疏的像素方法对比分析两者之间的区别。我们的发现表明,尽管变形金刚在处理全球环境和错综复杂的特征方面表现出色,但它们在保留深度梯度连续性方面落后于CNN。为了进一步增强在单眼深度估计中的变压器模型的性能,我们提出了深度梯度改进(DGR)模块,该模块通过高阶分化,特征融合和重新校准来完善深度估计。此外,我们利用最佳运输理论,将深度图视为空间概率分布,并采用最佳传输距离作为损失函数来优化我们的模型。实验结果表明,与插件深度梯度改进(DGR)模块集成的模型以及所提出的损失函数可增强性能,而无需增加室外Kitti和室内NYU-DEPTH-V2数据集的复杂性和计算成本。这项研究不仅提供了深入估计转换器和CNN之间区别的新见解,而且还为新颖的深度估计方法铺平了道路。

对CNN

对CNNPDF文件第1页

对CNNPDF文件第2页

对CNNPDF文件第3页

对CNNPDF文件第4页

对CNNPDF文件第5页