详细内容或原文请订阅后点击阅览
MIT 成就:AI 现在生成高质量图像的速度提高了 30 倍
麻省理工学院的研究人员开发了一个新框架,将图像生成简化为一个步骤。该团队通过展示新框架快速创建高质量视觉内容的能力,增强了现有模型(如稳定扩散)。
来源:QudataMIT 成果:AI 生成高质量图像的速度提高了 30 倍
MIT 计算机科学与人工智能实验室 (CSAIL) 的研究人员推出了一种名为分布匹配蒸馏 (DMD) 的突破性框架。这种创新方法将传统的扩散模型多步骤过程简化为一个步骤,解决了以前的局限性。
分布匹配蒸馏传统上,图像生成是一个复杂且耗时的过程,需要多次迭代才能完善最终结果。然而,新开发的 DMD 框架简化了这个过程,显著减少了计算时间,同时保持甚至超越了生成图像的质量。在麻省理工学院博士生 Tianwei Yin 的带领下,研究团队取得了一项了不起的成就:将当前的扩散模型(如稳定扩散和 DALL-E-3)的速度提高了惊人的 30 倍。只需比较一下 50 步后的 Stable Diffusion(左图)和仅一步后的 DMD(右图)的图像生成结果。质量和细节令人惊叹!
DMD 成功的关键在于其创新方法,该方法将生成对抗网络 (GAN) 的原理与扩散模型的原理相结合。通过将更复杂模型的知识提炼为更简单、更快速的模型,DMD 只需一步即可实现视觉内容生成。
创新方法但 DMD 是如何实现这一壮举的?它结合了两个组件:
1. 回归损失:这锚定了映射,确保在训练期间对图像空间进行粗略组织。
2. 分布匹配损失:它将使用学生模型生成图像的概率与其在现实世界中的出现频率对齐。
通过使用两种扩散模型作为指导,DMD 最大限度地减少了生成图像和真实图像之间的分布差异,从而加快了生成速度,同时又不影响质量。