摘要 - 基于分数的扩散模型具有显着的生成深度学习,用于图像处理。调查条件模型也已应用于CT重建等反问题。但是,常规方法(最终以白噪声)需要大量的反向过程更新步骤和分数功能评估。为了解决这一局限性,我们提出了一个基于分数扩散模型的替代前进过程,该过程与低剂量CT重建的噪声特性一致,而不是收敛到白噪声。这种方法大大减少了所需的得分功能评估的数量,提高效率并维持放射科医生熟悉的噪声纹理,我们的方法不仅可以加速生成过程,而且还保留了CT噪声相关性,这是临床医生经常批评的深度学习重建的关键方面。在这项工作中,我们严格地为此目的定义了基质控制的随机过程,并通过计算实验对其进行验证。使用来自癌症基因组肝肝肝癌(TCGA-LIHC)的数据集,我们模拟了低剂量CT测量结果并训练我们的模型,将其与基线标量扩散过程和条件扩散模型进行了比较。我们的结果证明了我们的伪内扩散模型的优越性,并在质地上产生高质量重建的能力,这些重建在质地上熟悉的医学专业人员的得分函数评估较少。这一进步为医学成像中更有效和临床上的扩散模型铺平了道路,在需要快速重建或较低辐射暴露的情况下尤其有益。
在上一个讲座中,我们解释了具有L噪声水平的退火Langevin算法的想法。当噪声水平的数量趋向于无穷大时,我们本质上以不断增长的噪声水平扰动数据分布。首先研究退火的Langevin算法的连续类似物的收敛是很自然的,这是一个连续的时间随机过程。特别是,我们专注于[SSDK + 20]的脱氧扩散概率建模。它具有一个正向过程,该过程会生成扰动的数据分布,而反向过程将噪声转化为µ的新样本。与[CCL + 22]中的符号一致,我们同时使用Q:= µ和µ进行目标度量,以及x 1,。。。,x n用于I.I.D.Q的样品。Q的样品。
扩散模型是基于马尔可夫过程的生成模型家族。在其前进过程中,他们逐渐向数据添加噪声,直到变成完整的噪声为止。在向后过程中,数据逐渐从噪声中逐渐发出。在本教程论文中,充分说明了扩散概率模型(DDPM)。详细简化了其可能性的变异下限,分布的参数和扩散模型的损耗函数。引入了对原始DDPM的一些模型,包括非固定的协方差矩阵,减少梯度噪声,改善噪声时间表以及非标准高斯噪声分布和条件扩散模型。最后,解释了噪声表位于连续域中的随机差异方程(SDE)的连续噪声时间表。
脑电图(EEG)是一种非侵入性方法,它允许记录丰富的时间信息,并且是诊断各种神经疾病和精神病疾病的宝贵工具。脑电图的主要局限性之一是信噪比低,缺乏训练大型数据繁殖神经网络的数据可用性。共享大型医疗保健数据集对于推进医学成像研究至关重要,但是隐私问题通常会妨碍这种努力。深层生成模型已引起关注,以避免数据共享局限性,并作为生成数据以改善这些模型性能的一种方法。这项工作研究了具有光谱损失的潜在扩散模型,作为深层建模,以生成30秒的睡眠eeg信号窗口。光谱损失对于确保生成的信号在典型的EEG信号的特定频带上包含结构性振荡。我们使用两个大型睡眠数据集(Sleep EDFX和SHH)训练了模型,并使用了多尺度的结构相似性度量,Frechet Inception距离和光谱图分析来评估合成信号的质量。我们证明潜在扩散模型可以使用正确的神经振荡产生逼真的信号,因此可以用来克服脑电图数据的稀缺性。
1。J. Ho,A。Jain和P. Abbeel。 剥离扩散概率模型。 2020-12- doi:10.48550/arxiv.2006.11239 2。 A. Nichol和P. Dhariwal。 改进了扩散概率模型。 2021-02-18。 doi:10.48550/arxiv.2102.09672 3。 Jänner,M.,Du,Y.,Tenenbaum,J. B.和Levine,S。(2022)。 计划扩散,以进行柔性链球合成。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2205.09991 4。 Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。 (2023)。 运动计划扩散:通过扩散模型对机器人运动的学习和计划。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2308.01557 5。 S. M. Lavalle,计划算法,2006年,剑桥出版社6。 Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。J. Ho,A。Jain和P. Abbeel。剥离扩散概率模型。2020-12- doi:10.48550/arxiv.2006.11239 2。A. Nichol和P. Dhariwal。改进了扩散概率模型。2021-02-18。 doi:10.48550/arxiv.2102.09672 3。Jänner,M.,Du,Y.,Tenenbaum,J. B.和Levine,S。(2022)。 计划扩散,以进行柔性链球合成。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2205.09991 4。 Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。 (2023)。 运动计划扩散:通过扩散模型对机器人运动的学习和计划。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2308.01557 5。 S. M. Lavalle,计划算法,2006年,剑桥出版社6。 Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。Jänner,M.,Du,Y.,Tenenbaum,J.B.和Levine,S。(2022)。计划扩散,以进行柔性链球合成。Arxiv(康奈尔大学)。doi:10.48550/arxiv.2205.09991 4。Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。(2023)。运动计划扩散:通过扩散模型对机器人运动的学习和计划。Arxiv(康奈尔大学)。doi:10.48550/arxiv.2308.01557 5。S. M. Lavalle,计划算法,2006年,剑桥出版社6。Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。
(1)问题1:复杂组合中缺少特征(例如,左侧的字符x,使用工具y,右侧的字符z盯着x),尤其是当这些功能在训练集中从未出现在同一图像中时。部分解决方案,例如使用图像来调节新图像生成。但是,LDM不能轻易地“理解”图像足以将其用作起点。例如,一些用户提到:“我注意到肖像画,很多时候,人们出现了看起来不像图片的东西”。(2)第2期:由于培训集中的异常统计数据而引起的偏见:当一个人仅从听众面前公开知道一个人(例如,在培训数据集中,经常受到新闻工作者采访的人)时,很难获得自己做其他事情的图像。或,对于经常在圣经生物旁边描绘的著名歌手,用户报告说,牛和魔鬼之间的混合物。其他用户还报告未能复制一些模因,例如“为什么我不能握住所有这些柠檬”。但是,这种偏见的最著名的例子涉及在河里游泳的萨尔蒙人的要求,因为训练套装中有太多的鲑鱼食品图像,导致鲑鱼片在河里“游泳”,包括间歇泉,就像是鲸鱼一样,或者是熊试图抓住它们。(3)第3期:需要许多重新运行,要么是因为本地诉讼(例如,四臂的人,三眼的人,或者手指过多的人),要么是因为大规模错误(例如,不同角色的不良位置)。