摘要:我们提出了一种方法,将其转换为2D蓝图转换为3D模型从原始单视图像中的可变形对象类别,完全没有外部监督。我们的方法利用了一个自动编码器框架,该框架将每个输入图像分解为四个基本组件:深度,颜色校正,观点和照明。没有明确标签就可以实现此分解。我们利用转换对象外观的事实,基础结构通常保持对称,可用于指导分离过程。要处理可能表现出部分对称性的对象,我们引入了一个学习的对称概率图,该图被整合到模型中,并与其他组件一起端到端学习。我们的方法能够从单视图像中准确恢复各种可变形物体的3D形状,例如人的脸,猫的脸和汽车,而无需依赖任何监督或先前的形状模型。在实验评估中,我们证明了我们的无监督方法显着优于依赖2D图像对应关系的有监督方法,从而在3D形状重建方面达到了卓越的准确性。这项工作为无监督的3D对象学习提供了有希望的步骤,并在计算机视觉和图形中使用了潜在的应用。关键字:OPENCV,深度处理,MIDAS,图像处理,Pytorch。
主要关键词