于 2022 年 8 月。作为 OpenAI 的竞争对手,谷歌提出了两种可以生成逼真图像的文本转图像模型:基于扩散的模型 Imagen [Saharia et al。,2022a] 和 Pathways 自回归文本转图像模型 (Parti) [Yu et al。,2022]。除了文本转图像任务外,扩散模型还广泛用于图像转图像 [Saharia et al。,2022b;Whang et al。,2022] 和文本转视频模型,例如 Runway [Runway,2022]、Make-A-Video [Singer et al。,2022]、Imagen Video [Ho et al。,2022] 和 Phenaki [Villegas et al。,2022]。稳定扩散已适用于各种应用,从医学成像 [Chambon 等人,2022] 到音乐生成 [Agostinelli 等人,2023]。除了图像和视频生成之外,文本生成还极大地影响了人类的生活,从创作一篇文章或整篇文章到协助工程师编写代码。