扩散生成模型(DMS)在图像和图生成方面取得了有希望的结果。然而,现实世界图,例如社交网络,分子图和交通图,通常共享非欧国人拓扑和隐藏的层次结构。例如,图的度分布主要是幂律分布。当前的潜在扩散模型将层次数据嵌入到欧几里得空间中,从而导致扭曲并干扰建模分布。取而代之的是,由于其指数生长特性,已发现双曲线空间更适合捕获复杂的层次结构。In order to simulta- neously utilize the data generation capabilities of diffusion models and the ability of hyperbolic embeddings to extract la- tent hierarchical distributions, we propose a novel graph gen- eration method called, Hyperbolic Graph Diffusion Model (HGDM), which consists of an auto-encoder to encode nodes into successive hyperbolic embeddings, and a DM that oper- ates in the双曲线潜在空间。HGDM通过构造包含边缘信息的双曲线潜在节点空间来捕获Crucial图结构分布。的实验实验表明,HGDM在通用图和分子生成基准测试中获得了更好的表现,并且具有高度层次结构的图生成质量提高了48%。
摘要 — 脑的弥散加权磁共振成像 (dMRI) 具有独特的功能,包括无创探测组织微结构和结构连接。它广泛用于疾病和损伤的临床评估以及神经科学研究。分析 dMRI 数据以提取用于医学和科学目的的有用信息可能具有挑战性。dMRI 测量可能会受到强噪声和伪影的影响,并且可能表现出数据在会话间和扫描仪间的高度可变性,以及脑结构在受试者间异质性。此外,测量值与感兴趣现象之间的关系可能非常复杂。近年来,机器学习方法在 dMRI 分析中的应用越来越多。本文旨在评估这些努力,重点关注解决数据预处理和协调、微结构映射、纤维束成像和白质束分析的方法。我们研究现有方法的主要发现、优点和缺点,并提出未来研究的主题。我们发现机器学习可能非常适合解决 dMRI 分析中的一些困难任务。然而,要实现这一点,需要解决现有方法的几个缺点和尚未解决的关键问题。迫切需要改进评估实践,增加丰富的训练数据集和验证基准的可用性,以及模型的通用性、可靠性和可解释性问题。
(1)问题1:复杂组合中缺少特征(例如,左侧的字符x,使用工具y,右侧的字符z盯着x),尤其是当这些功能在训练集中从未出现在同一图像中时。部分解决方案,例如使用图像来调节新图像生成。但是,LDM不能轻易地“理解”图像足以将其用作起点。例如,一些用户提到:“我注意到肖像画,很多时候,人们出现了看起来不像图片的东西”。(2)第2期:由于培训集中的异常统计数据而引起的偏见:当一个人仅从听众面前公开知道一个人(例如,在培训数据集中,经常受到新闻工作者采访的人)时,很难获得自己做其他事情的图像。或,对于经常在圣经生物旁边描绘的著名歌手,用户报告说,牛和魔鬼之间的混合物。其他用户还报告未能复制一些模因,例如“为什么我不能握住所有这些柠檬”。但是,这种偏见的最著名的例子涉及在河里游泳的萨尔蒙人的要求,因为训练套装中有太多的鲑鱼食品图像,导致鲑鱼片在河里“游泳”,包括间歇泉,就像是鲸鱼一样,或者是熊试图抓住它们。(3)第3期:需要许多重新运行,要么是因为本地诉讼(例如,四臂的人,三眼的人,或者手指过多的人),要么是因为大规模错误(例如,不同角色的不良位置)。
摘要 - 在这项工作中,我们基于以前的出版物和基于Iffusion的GenerativeModelsForsPeechenHancement。我们介绍了基于随机微分方程的扩散过程的详细概述,并深入研究了其含义的广泛理论研究。与通常的有条件生成任务相反,我们不会从纯高斯噪声中开始反向过程,而是从嘈杂的语音和高斯噪声的混合物开始。这与我们的前进过程相匹配,该过程通过包括一个漂移术语从干净的语音到嘈杂的语音。我们表明,此过程仅使用30个扩散步骤来生成高质量的干净语音估计。通过调整网络架构,我们能够显着提高语音增强性能,表明网络而不是形式主义是我们原始范围的主要限制。在广泛的跨数据库评估中,我们表明,改进的方法可以与最近的判别模型竞争,并在评估与培训不同的语料库时可以更好地概括。我们使用现实世界的嘈杂录音和听力实验的仪器评估来补充结果,其中我们提出的方法是最好的。检查以解决反向过程的不同采样器配置,使我们能够平衡性能和计算速度驱动量。此外,Weshowthatthatthatthatthatthepropsed方法也适用于消耗,因此不限于添加背景噪声的去除。
我们的发现表明,在向后过程中,在向后过程中选择特征信息的破坏主要取决于噪声方差时间表。值得注意的是,在线性时间表下,扩散链可以分为不同的区域。以高信息保留为特征的初始阶段主要有助于样本美学而没有改变基本特征。以对称为中心的后续区域以扩散过程为中心,是特征选择的关键关头。令人惊讶的是,我们观察到这些选择不是瞬时的,而是在几个降解步骤中发展的。这种认识在解决我们的研究问题方面具有重要意义。另一个地区的第三个区域不那么有趣。样本一旦到达这些信息就会丢失所有信息,并且它们本质上过渡到该地区的正常样本。
从扩散模型中的合成样本对于训练歧视模型作为重复或增强真实培训数据集有希望。但是,我们发现合成数据集在同一数据集大小上比较它们时,合成数据集降低了分类性能。这意味着现代扩散模型的合成样本对于训练歧视任务的信息较少。本文通过分析从实际样品(扩散)(扩散)和脱氧(反向)扩散模型过程中从真实样品重建的合成样品来研究合成和真实样品之间的差距。通过改变重建的时间步骤开始反向过程的时间步骤,我们可以控制原始真实数据中的信息与扩散模型产生的信息之间的权衡。通过评估重建的样品和训练有素的模型,我们发现合成样品集中在训练数据分布的模式中,随着反向步骤的增加,它们很难覆盖分布的外边缘。相反,我们发现这些合成样本在使用真实和合成样品的数据设置中产生了显着改善,这表明模式周围的样品可作为学习分类边界的插值有用。这些发现表明,现代扩散模型目前不足以复制相同数据集大小的真实培训数据集,但适合将真实培训样本作为增强数据集进行插值。
不规则的时间序列在医疗保健中无处不在,应用程序从预测患者的健康状况到归咎于缺失值的应用。条件扩散模型中的最新开发方法,这些模型基于观察到的数据预测缺失值,对定期定期时间序列的构成有很大的希望。它还通过用注入可变量表的噪声替换部分掩盖的局部掩盖来概括了掩盖重建的自我监督学习任务,并显示了图像识别的竞争结果。尽管对扩散模型的兴趣日益增强,但它们对不规则时间序列数据的潜力,尤其是在下游任务中,仍然没有被逐渐置换。我们提出了一个有条件的扩散模型,该模型设计为一种自我监督的学习骨干,用于此类数据,集成了可学习的时间嵌入以及一种跨维度注意机制,以解决数据的复杂时间动态。该模型不仅适合有条件的生成任务,而且还获得了隐藏的状态,对歧视任务有益。经验证据证明了我们的模型在插补和分类任务中的优势。
摘要。开放式摄取分段是分割图像中可以命名的任何事物的任务。最近,大规模的视觉建模导致了开放式摄影片段的重大进展,但付出了巨大的成本,并增加了培训和注释工作。因此,我们询问是否可以使用现有的基础模型来合成特定类别集的按需有效分段算法,从而使其适用于开放式摄影库设置,而无需收集进一步的数据,注释或执行培训。为此,我们提出了Ovdiff,这是一种新颖的方法,它利用生成的文本对图像扩散模型来进行无监督的开放式摄影症。ovdiff合成支持任意文本类别的图像集,为每个类别及其周围环境(背景)创建一组原型。它仅依赖于预先训练的组件,并直接输出合成的分段,而无需训练。我们的方法在一系列基准上显示出很强的性能,在Pascal VOC上的先前工作中获得了超过5%的铅。