机器学习的利用,尤其是深层生成模型,已在合成DNA序列产生的领域开辟了有希望的途径。虽然生成对抗网络(GAN)在此应用中获得了吸引力,但他们经常面临诸如样本多样性和模式崩溃等问题。另一方面,扩散模型是一种有希望的新的生成模型,这些模型不承担这些问题的负担,从而使它们能够达到图像生成等领域的最先进。鉴于此,我们提出了一种新型潜在扩散模型,即用于离散DNA序列产生的新型潜扩散模型。通过使用自动编码器将离散的DNA序列简单地嵌入连续的潜在空间中,我们能够利用连续扩散模型的强大生成能力来生成离散数据。此外,我们将Fréchet重建距离(FRED)作为新指标,以测量DNA序列世代的样品质量。我们的码头模型表明,就基序分布,潜在嵌入分布(FRED)和染色质曲线而言,与实际DNA紧密对齐的合成DNA序列具有能力。此外,我们还提供了来自15种的150K独特启动子基因序列的综合跨物种数据集,丰富了基因组学中未来生成建模的资源。我们已在https://github.com/zehui127/latent-dna-diffusion上公开提供代码和数据。
低场 (LF) MRI 扫描仪 (<1T) 在资源有限或电源不可靠的环境中仍然很普遍。然而,它们产生的图像的空间分辨率和对比度通常低于高场 (HF) 扫描仪。这种质量差异可能导致临床医生的解释不准确。图像质量迁移 (IQT) 旨在通过学习低质量和高质量图像之间的映射函数来提高图像质量。现有的 IQT 模型通常无法恢复高频特征,导致输出模糊。在本文中,我们提出了一种 3D 条件扩散模型来改进 3D 体积数据,特别是 LF MR 图像。此外,我们将跨批次机制整合到我们网络的自注意力和填充中,即使在小型 3D 块下也能确保更广泛的情境感知。在公开的人类连接组计划 (HCP) 数据集上进行的 IQT 和脑分区实验表明,我们的模型在数量和质量上都优于现有方法。该代码可在 https://github.com/edshkim98/DiffusionIQT 上公开获取。
摘要。概率降级扩散模型(DDMS)为2D图像生成设置了新标准。扩展3D内容创建的DDMS是一个积极的研究领域。在这里,我们提出了四个扩散模型,该模型在3D空间的四面体分区上运行,以实现有效的高分辨率3D形状生成。我们的模型会导致运算符进行卷积和转置卷积,该卷积直接作用于四面体分区,并且无缝包含诸如颜色之类的其他属性。我们的设计更加生成网状几何形状:与现有的网格扩散技术相比,四辐射的速度更快到200倍。同时,它可以减少内存消耗,并且可以比现有网格发电机以更高的分辨率运行。仅使用标准消费者硬件,它在空间细节方面设置了一个新的标准,并在一系列质量指标上优于其他网格发电机。有关其他结果和代码,请参见我们的项目页面tetradiffusion.github.io。
图像生成扩散模型的主要轴是图像质量,结果的变化量以及结果与给定条件(例如类标签或文本提示)的对齐程度。流行的无分类器指导方法使用无条件模型来指导有条件的模型,从而以减少变化的成本,同时及时迅速排列和更高质量的图像。这些效果似乎固有地纠缠,因此很难控制。我们令人惊讶的是,可以通过使用模型本身的较小,训练较低的版本而不是无条件模型来指导生成,而不是通过指导生成来获得对图像质量的控制的控制,而不会损害变化的量。使用公开可用的网络,这会导致ImageNet生成的显着改善,为64×64的创纪录FID定为1.01,为512×512,为512×512的FID定为1.01。此外,该方法还适用于无条件扩散模型,可大大提高其质量。
图上的异常检测重点是识别图形结构化数据中不规则的贴合或异常淋巴结,这显着偏离了规范。由于其在垃圾邮件检测,反洗钱和网络安全性等各个领域的广泛适用性,因此该领域的重要性很高。在图表上应用异常检测时,应对标签不平衡和数据不足所带来的challenges是显着的。生成模型(尤其是扩散模型)的最新扩散铺平了一种有希望的方式。在本文中,我们引入了潜在空间中的图扩散模型,该模型旨在减轻图表上异常检测中普遍存在的标签失衡问题。所提出的模型能够多任命生成图形结构和节点特征,并具有有条件的生成能力,仅产生积极的示例,从而减轻标签不平衡问题。我们改进了扩散模型,以应用于同质图和异质图。通过广泛的实验,我们证明了我们提出的方法对传统技术提供了显着改进。
#有些人称之为Stein分数功能,而某些人则认为“得分函数”名称令人困惑,不应使用,因为Fisher分数功能是一个相似但不同的对象。无论如何,DPM论文普遍称之为“得分函数”。
摘要。类别 - 不足的姿势估计(CAPE)旨在根据该类别的几个提供的示例来检测图像中任意看不见类别的关键。这是一项具有挑战性的任务,因为看不见的类别的有限数据使模型很难有效地进行大规模化。为了应对这一挑战,以前的方法通常会在一组带有广泛宣传的预定义的基本类别上训练模型。在这项工作中,我们建议利用货架文本对图像扩散模型的丰富知识,以有效地解决斗篷,而无需对精心准备的基础类别进行培训。为此,我们提出了一个提示姿势匹配(PPM)框架,该框架通过文本到图像扩散模型学习了伪提示,该伪提示与所提供的几个示例中的关键点相对应。这些学到的伪提示捕获了关键点的杂志信息,然后可以将其用于从图像中找到相同类型的关键点。我们还设计了一个类别共享的及时培训(CPT)方案,以进一步提高我们的PPM的表现。广泛的实验证明了我们方法的功效。
分析扩散模型如何学习高斯阶层以外的相关性,我们研究了在前进过程和向后过程下高阶累积物的行为。我们就远期过程的初始数据和属性的分布来介绍矩和累积生成功能的显式表达式。我们在分析上表明,高阶累积物在纯扩散下是在纯扩散下保守的,即在没有漂移的模型中,在正向过程中,因此,正向过程的终点维持了非平凡的相关性。我们证明,由于这些相关性是在得分函数中编码的,因此在从正常先验开始时,在向后过程中也很快学习了高阶累积物。我们在可解决的玩具模型和标量晶格场理论中确认了我们的分析结果。