最近开发的离散扩散模型在文本到图像任务中表现出色,显示出处理多形式信号的巨大希望。在这项工作中,我们利用这些特征,并提出一个可以使用单个模型,基于文本的,基于图像的,甚至具有远见性的同时生成的统一的模型模型,该模型可以执行“模态翻译”和“多模式生成”任务。具体而言,我们通过提出一个统一的过渡矩阵来统一多模式信号的离散扩散过程。此外,我们设计了一个具有融合嵌入层和统一的目标函数的相互注意模块,以强调模式间链接,这对于多模式生成至关重要。广泛的实验表明,我们提出的方法可以与各种一代任务中的最新解决方案相当地执行。