图像和视频着色是图像恢复中最常见的概率之一。这是一个不足的问题,已经提出了多种方法,从更传统的计算机视觉策略到具有基于变压器或生成的神经网络模型的最新开发。在这项工作中,我们展示了如何对文本到图像综合进行预培训的潜在扩散模型,以进行图像着色,并为各种场景提供了灵感的解决方案:高质量的直接着色,并具有多样化的效果,并通过用户指导的颜色,通过色彩勾勒,文本图像或参考图像或网状色彩和纯净的颜色和纽约。一些已经使用分解模型进行了调查的一些作品,但是所提出的SO措施通常更为复杂,需要训练指导DeNoising Process(àlaControlNET)的侧模型。这种方法不仅增加了参数的数量和计算时间,而且还会在我们显示的时导致次级最佳着色。我们的评估
主要关键词