摘要我们介绍了PIX2GENTALT,这是一个用于零拍摄分段的框架,该框架学会了估计仅在闭塞背后部分可见的整个对象的形状和外观。通过利用大规模扩散模型并将其表示形式转移到该任务中,我们学习了一个有条件的扩散模型,用于在挑战零摄像的案例中重新构造整个对象,包括破坏自然和物理先验的示例,例如艺术。作为培训数据,我们使用了一个合成策划的数据集,其中包含遮挡对象与整个对应物配对。实验表明,我们的方法在既定基准上都超过了受监督的基准。我们的模型还可以用来显着改善在遮挡存在下的现有对象识别和3D重构方法的性能。