详细内容或原文请订阅后点击阅览
计算机视觉中的 GAN - 条件图像合成和 3D 对象生成
计算机视觉中的 GAN 系列的第二篇文章 - 更深入地了解生成对抗网络、模式崩溃、条件图像合成和 3D 对象生成、配对和非配对图像到图像生成。
来源:AI夏令营上一篇文章或多或少介绍了 GAN、生成学习和计算机视觉。我们达到了在 128x128 图像中生成可区分图像特征的程度。但如果您真的想了解 GAN 在计算机视觉领域的进展,您就必须深入研究图像到图像的转换。虽然这是第一个成功的模型,但它们设计 GAN 的原理仍然被考虑在内。
帖子因此,在这一部分中,我们将继续我们的 GAN 计算机视觉之旅,检查更复杂的设计,以获得更好的视觉效果。我们将重新讨论模式崩溃、3D 对象生成、单个 RGB 图像到 3D 对象的生成以及改进的质量图像到图像映射。让我们直接进入内容吧!
AC-GAN(带辅助分类器 GAN 的条件图像合成 2016)
AC-GAN这篇令人惊叹的论文全面介绍了首次尝试生成详细的高分辨率图像样本(当时为 128x128),且类别间(类内变异性)具有高变异性。正如我们已经看到的,类别是条件标签。在这项工作中,训练了一个 GAN,它同时尝试生成 10 个不同的类别!
高分辨率 高变异性众所周知,当您尝试强制模型执行其他任务(多任务学习)时,原始任务的性能可以显著提高。但是,您该怎么做呢?使用重建损失!
辅助或重建损失
结合 InfoGAN(信息正则化)和条件 GAN(使用图像标签)的思想,AC-GAN 是使用边信息(提供图像类别)的 GAN 的扩展。它们不只是为 G 和 D 提供条件信息,而是让 D 学习重建这些边信息(所谓的重建损失)。
使用边信息的 GAN 的扩展 G D D 辅助解码器网络输出训练数据的类标签 独立于类标签, 重建目标 第 1 部分 AC-GAN