在过去的几年中,深入的学习有了立体声匹配的精度,但恢复急剧的界限和高分辨率产出有效仍然充满挑战。在本文中,我们提出了立体声混合物网络(SMD-NETS),这是一个简单而有效的学习框架,与宽阔的2D和3D体系结构兼容,可改善这两个问题。特别是,我们利用双峰混合物密度作为输出代表,并表明这允许几乎不连续的尖锐而精确的差异估计,同时明确地构建了观测中固有的不确定性。此外,我们将差异估计作为图像域中的一个连续问题,从而使我们的模型以任意空间精度查询差异。我们对新的高分辨率和高度逼真的立体声数据集进行了全面的实验,该数据集由8MPX分辨率以及现实世界立体声数据集组成。我们的实验表明,在物体边界附近的深度准确性以及对标准GPU上高分辨率差异图的预测。,我们通过提高各种立体主杆的性能来证明我们技术的灵活性。
主要关键词