Improving GFlowNets for Text-to-Image Diffusion Alignment
这篇论文被 ICML 2024 的 Foundation Models in the Wild 研讨会接受。扩散模型已成为生成视觉数据的实际方法,这些模型经过训练以匹配训练数据集的分布。此外,我们还希望控制生成以满足所需的属性,例如与文本描述的对齐,这可以通过黑盒奖励函数来指定。先前的工作通过基于强化学习的算法对预训练的扩散模型进行了微调,以实现此目标。尽管如此,它们仍存在一些问题,包括信用分配缓慢……
生成流网络 (GFlowNets) 解决了机器学习中从非正则化概率分布中采样的复杂挑战。通过在构造的图上学习策略,GFlowNets 通过一系列步骤促进有效采样,近似目标概率分布。这种创新方法通过提供强大的框架来处理帖子这项机器学习研究试图在 GFlowNets 的背景下形式化泛化并将泛化与稳定性联系起来,首次出现在 AI Quantum Intelligence 上。