图像生成扩散模型的主要轴是图像质量,结果的变化量以及结果与给定条件(例如类标签或文本提示)的对齐程度。流行的无分类器指导方法使用无条件模型来指导有条件的模型,从而以减少变化的成本,同时及时迅速排列和更高质量的图像。这些效果似乎固有地纠缠,因此很难控制。我们令人惊讶的是,可以通过使用模型本身的较小,训练较低的版本而不是无条件模型来指导生成,而不是通过指导生成来获得对图像质量的控制的控制,而不会损害变化的量。使用公开可用的网络,这会导致ImageNet生成的显着改善,为64×64的创纪录FID定为1.01,为512×512,为512×512的FID定为1.01。此外,该方法还适用于无条件扩散模型,可大大提高其质量。
主要关键词