最近,ChatGPT 与 DALL-E-2 [ 1 ] 和 Codex [ 2 ] 一起引起了社会的广泛关注。因此,许多人对相关资源产生了兴趣,并试图揭开其令人印象深刻的表现背后的背景和秘密。事实上,ChatGPT 和其他生成式人工智能 (GAI) 技术属于人工智能生成内容 (AIGC) 类别,涉及通过人工智能模型创建数字内容,例如图像、音乐和自然语言。AIGC 的目标是使内容创建过程更加高效和易于访问,从而能够以更快的速度生成高质量的内容。AIGC 是通过从人类提供的指令中提取和理解意图信息,并根据其知识和意图信息生成内容来实现的。近年来,大规模模型在 AIGC 中变得越来越重要,因为它们可以提供更好的意图提取,从而改善生成结果。随着数据和模型规模的增长,模型可以学习的分布变得更加全面和更接近现实,从而产生更现实和高质量的内容。本综述从单模态交互和多模态交互两个角度全面回顾了生成模型的历史、基本组成部分以及人工智能生成模型的最新进展。从单模态的角度介绍了文本和图像的生成任务和相关模型。从多模态的角度介绍了上述模态之间的交叉应用。最后,我们讨论了人工智能生成模型中现有的开放问题和未来的挑战。
主要关键词