Loading...
机构名称:
¥ 1.0

(1)问题1:复杂组合中缺少特征(例如,左侧的字符x,使用工具y,右侧的字符z盯着x),尤其是当这些功能在训练集中从未出现在同一图像中时。部分解决方案,例如使用图像来调节新图像生成。但是,LDM不能轻易地“理解”图像足以将其用作起点。例如,一些用户提到:“我注意到肖像画,很多时候,人们出现了看起来不像图片的东西”。(2)第2期:由于培训集中的异常统计数据而引起的偏见:当一个人仅从听众面前公开知道一个人(例如,在培训数据集中,经常受到新闻工作者采访的人)时,很难获得自己做其他事情的图像。或,对于经常在圣经生物旁边描绘的著名歌手,用户报告说,牛和魔鬼之间的混合物。其他用户还报告未能复制一些模因,例如“为什么我不能握住所有这些柠檬”。但是,这种偏见的最著名的例子涉及在河里游泳的萨尔蒙人的要求,因为训练套装中有太多的鲑鱼食品图像,导致鲑鱼片在河里“游泳”,包括间歇泉,就像是鲸鱼一样,或者是熊试图抓住它们。(3)第3期:需要许多重新运行,要么是因为本地诉讼(例如,四臂的人,三眼的人,或者手指过多的人),要么是因为大规模错误(例如,不同角色的不良位置)。

交互式潜在扩散模型

交互式潜在扩散模型PDF文件第1页

交互式潜在扩散模型PDF文件第2页

交互式潜在扩散模型PDF文件第3页

交互式潜在扩散模型PDF文件第4页

交互式潜在扩散模型PDF文件第5页