Loading...
机构名称:
¥ 2.0

扩散模型从噪声中创建数据(Song等,2020)。他们经过训练,可以将数据的向前路径逆转到随机噪声,因此,可以使用神经网络的近似和泛化特性,可用于生成训练数据中不存在的新数据点,但遵循训练数据的分布(Sohl-Dickstein等人。,2015年; Song&Eron,2020)。这种生成建模技术已被证明非常有效地对高维,感知数据(例如图像)进行建模(Ho等人,2020)。近年来,扩散模型已成为产生具有令人印象深刻概括能力的自然语言输入的高分辨率图像和视频的事实方法(Saharia等人,2022b; Ramesh等。,2022; Rombach等。,2022; Podell等。,2023; Dai等。,2023; Esser等。,2023; Blattmann等。,2023b; Betker等。,2023; Blattmann等。,2023a; Singer等。,2022)。由于其迭代性质和相关的计算成本以及推理期间的较长采样时间,对这些模型进行更多有效训练的制剂的研究和/或更快的采样速度有所增加(Karras等人,2023;刘等。,2022)。

高分辨率图像合成的缩放矫正流量变压器

高分辨率图像合成的缩放矫正流量变压器PDF文件第1页

高分辨率图像合成的缩放矫正流量变压器PDF文件第2页

高分辨率图像合成的缩放矫正流量变压器PDF文件第3页

高分辨率图像合成的缩放矫正流量变压器PDF文件第4页

高分辨率图像合成的缩放矫正流量变压器PDF文件第5页