无分类器指导是一种预测器-校正器

我们研究了无分类器指导 (CFG) 的不合理有效性。CFG 是文本到图像扩散模型的条件采样的主要方法,但与扩散的其他方面不同,它的理论基础仍然不稳定。在本文中,我们通过展示 CFG 与 DDPM 和 DDIM 的交互方式不同,并且 CFG 的采样器都不会生成伽马驱动分布,从而反驳了常见的误解。然后,我们通过展示它是一种在去噪和锐化之间交替的预测校正 (PC) 方法来阐明 CFG 的行为,我们称之为……

来源:Apple机器学习研究

我们研究了无分类器指导(CFG)的不合理有效性.CFG是文本到图像扩散模型的有条件采样的主要方法,但尚未取消扩散的其他方面,它仍然处于摇摆理论的基础上。在本文中,我们通过证明CFG与DDPM和DDIM的相互作用不同,与CFG相互作用不同,而CFG的采样器都不会产生γ功率的分布。然后,我们通过表明它是一种预测型(PC)的方法来阐明CFG的行为,以表明它在demodor and profance neward offerction the PCERTACTION(PC)指南(我们均可表现为PC)。 DDPM-CFG等效于PCGWITH应用于条件分布的DDIM预测变量,而Langevin Dynamics Crorceor将其应用于伽马驱动的分布。虽然标准PC校正器适用于条件分布并提高采样精度,但我们的校正器促进了分布。

图1:无分类器的指导已成为现代文本到图像扩散产生的重要组成部分,但仍然对其进行了鲜明的理解。我们证明,CFG是一种预测 - 校正器,在DeNoising和锐化之间交替使用,即,在锐化分布上退火的Langevin动力学。