在生成ai

如果您想将自己置于流行的图像或视频生成工具中 - 但是您已经足够出名,无法以基础模型识别您 - 您需要使用自己的照片集来训练低级改编(Lora)模型。创建后,这种个性化的Lora模型允许生成模型[…]生成AI中为零击的斗争首先出现在Unite.ai上。

来源:Unite.AI

如果您想将自己置于流行的图像或视频生成工具中 - 但是您已经足够出名,无法以基础模型识别您 - 您需要使用自己的照片集来训练低级改编(Lora)模型。创建后,这种个性化的LORA模型允许生成模型将您的身份包括在将来的输出中。

低级适应

这通常在图像和视频综合研究领域中称为自定义。它首先在2022年夏天稳定扩散出现后的几个月后出现,Google Research的Dreambooth项目提供了高贵的定制模型,该模型在封闭的式架构中很快被爱好者改编并释放给社区。

自定义 Dreambooth

Lora型号迅速遵循,并提供了更轻松的训练,并且以最低或无需质量的成本提供了更轻松的文件尺寸,迅速在稳定扩散及其后继产品的自定义场景中占主导地位,后来的型号(如Flux)以及现在的新生成视频模型(如Hunyuan Video和Wan 2.1)。

flux Hunyuan视频 WAN 2.1

冲洗和重复

正如我们之前指出的那样,每当新模型出现时,它都需要培训新一代的洛拉斯,这代表了洛拉 - 生产者的摩擦,他们可能会训练一系列自定义模型,以发现模型更新或流行的新型模型意味着他们需要重新开始。

正如我们在

因此,零射击定制方法最近已成为文献中的强大链。在这种情况下,您只需提供一个或多个主题的照片即可注入生成,而不是需要策划数据集并训练自己的子模型,而是将这些输入源解释为混合输出。

下面我们看到,除了面对面,这种类型的系统(此处使用Pulid)还可以将ID值纳入样式传输:

Pulid 使用PULID系统的面部ID转移示例。 和流行