Loading...
机构名称:
¥ 1.0

摘要。文本对图像扩散模型是尖端的深属模型,在产生高质量图像方面具有令人印象深刻的功能。但是,这些模型容易受到源自网络规模的文本图像训练对的隐式偏见,这可能导致对图像属性进行建模的不准确性。这种敏感性可以表现为不符合人类伦理和偏好的次优样本,模型偏差和图像。在本文中,我们提出了一种可扩展的算法,用于使用强化学习(RL)增强扩散模型,具有多种奖励功能,包括Human的偏好,组成性和社会多样性,超过数百万图像。我们演示了我们的方法如何显着胜过将扩散模型与人类偏好对准模型的方法。我们进一步说明了这是如何实质上改善验证的稳定差异(SD)模型的,从而生成了人类比基本SD模型的样本偏爱的样本,同时增强了对象组成和样品的多样性。

扩散模型的大规模增强学习

扩散模型的大规模增强学习PDF文件第1页

扩散模型的大规模增强学习PDF文件第2页

扩散模型的大规模增强学习PDF文件第3页

扩散模型的大规模增强学习PDF文件第4页

扩散模型的大规模增强学习PDF文件第5页