详细内容或原文请订阅后点击阅览
无分类器指导是一个预测器 - 校准
我们研究了无分类器指导(CFG)的理论基础。 CFG是文本对图像扩散模型的条件采样的主要方法,但与扩散的其他方面不同,它仍然保持在摇摇欲坠的理论基础上。在本文中,我们通过证明CFG与DDPM(Ho等,2020)和DDIM(Song等,2021)的相互作用来反驳共同的误解,并且CFG都不会产生gamma驱动的分布P(x | c)^γp(x)^γp(x)^{1- = {1-γ}。然后,我们通过证明它是一种预测器 - 矫正器方法来阐明CFG的行为(Song等,2020)…
来源:Apple机器学习研究我们研究了无分类器指导(CFG)的理论基础。 CFG是文本对图像扩散模型的条件采样的主要方法,但与扩散的其他方面不同,它仍然保持在摇摇欲坠的理论基础上。在本文中,我们通过证明CFG与DDPM(Ho等,2020)和DDIM(Song等,2021)的相互作用来反驳共同的误解,并且CFG都不会产生gamma驱动的分布P(x | c)^γp(x)^γp(x)^{1- = {1-γ}。然后,我们通过证明它是一种预测器 - 矫正器方法(Song等,2020)来阐明CFG的行为,它在Denoising和锐化之间交替,我们称之为预测器 - 矫正器指导(PCG)。我们证明,在SDE限制中,CFG实际上相当于将条件分布的DDIM预测与Langevin Dynamics校正器一起使用伽马驱动的分布(带有精心选择的伽马)。因此,我们的工作为理论上的CFG提供了一种镜头,通过将其嵌入更广泛的原则采样方法的设计空间中。