UniVG: A Generalist Diffusion Model for Unified Image Generation and Editing
文本对图像(T2I)扩散模型在以用户提示后生成视觉吸引人的图像时显示出令人印象深刻的结果。在此基础上,各种方法进一步调整了针对特定任务的预训练的T2I模型。但是,这需要单独的模型体系结构,培训设计和多个参数集来处理不同的任务。在本文中,我们介绍了Univg,这是一个通才扩散模型,该模型能够支持具有一组权重的各种图像生成任务。 Univg将多模式输入视为统一条件,以使各种下游……