遥感图像对象检测(RSIOD)旨在识别和定位卫星或空中图像中的特定对象。但是,当前RSIOD数据集中存在标记数据的稀缺性,这显着限制了当前检测算法的性能。尽管现有技术,例如数据增强和半监督学习,可以在某种程度上减轻这种稀缺性问题,但它们在很大程度上依赖于高质量的标签数据,并且在稀有对象类中的性能差。为了打扮这个问题,本文提出了一个布局控制的扩散生成模型(即燃气。据我们所知,Aerogen是第一个同时支持水平和旋转边界箱状况生成的模型,从而实现了满足特定外部外部和对象类别要求的高质量合成图像的构成。此外,我们提出了一个端到端数据增强框架,该框架集成了多样性条件的发电机和过滤器 -
摘要 - 医疗保健中的深度学习面临挑战,例如有限的注释电子健康记录(EHR),数据隐私问题和不平衡数据集。大多数综合数据方法都集中在没有隐私保护的单个数据类型上。为了克服这些限制,提议的联合隐私 - 保存多模式生成(FPMG)框架将联合学习原理集成了分散培训的联合学习原理,而无需直接数据访问。它提出了一个多模式生成对手模型,以在保留隐私时创建全面的合成数据。孤岛联合学习用于分散培训,以维持患者的隐私。多模式生成系统捕获健康特征之间的复杂关联,增强了合成数据质量和疾病的理解。初步研究成功地产生了合成图像,包括Covid-19和肺癌等罕见的共发生。I. i ntroduction
文本对图像(T2I)生成模型最近成为一种强大的工具,可以创建照片现实的图像并引起多种应用。然而,将T2i模型的有效整合到基本图像分类任务中仍然是一个悬而未决的问题。促进图像锁骨表现的一种普遍的策略是通过使用T2I模型生成的合成图像来增强训练集。在这项研究中,我们仔细检查了当前发电和常规数据增强技术的缺点。我们的分析表明,这些方法努力产生既忠实的(就前景对象)而且针对领域概念的多样化(在背景上下文中)。为了应对这一挑战,我们引入了一种创新的类数据增强方法,称为diff-mix 1,该方法通过在类之间执行图像翻译来丰富数据集。我们的经验结果是,DIFF-MIX在信仰和多样性之间取得了更好的平衡,从而导致各种图像分类场景之间的性能显着提高,包括域名数据集的少量,常规和长尾分类。
我们提出了有条件扩散模型的新应用,用于根据其物理特性创建星系的合成图像。虽然先前的工作重点是调整单个参数,但我们证明了扩散模型可以在多个物理属性上产生模型,从而使我们能够探索这些属性的组合如何与星系外观相关。我们的模型接受了Sloan Digital Sky Survey(SDSS)的数据培训,生成了以红移,恒星质量,恒星形成率和气相金属性为条件的星系图像。值得注意的是,该模型捕获了预期的人类物理趋势,例如金属性与星系颜色或形态之间的关系。然而,生成的图像不同意通过GINI系数,M 20系数和浓度 - 空气平滑度统计的SDSS验证图像,这与系统预测的弥漫性不足相一致。虽然现代生成模型能够生成逼真的图像,但将这些模型应用于天体物理学可能仍然具有挑战性。
生成对抗网络(GAN)是用于合成图像和其他数据的最新神经网络模型。gans对合成数据的质量有了可观的改进,迅速成为数据生成任务的标准。在这项工作中,我们总结了甘斯在心脏病学领域的应用,包括生成逼真的心脏图像,心电图信号和合成电子健康记录。关于研究,临床护理和学术界的gan生成数据的效用。此外,我们介绍了gan生成的心脏磁共振和超声心动图图像的说明性示例,显示了六个不同模型的图像质量的演变,这与真实图像几乎没有区别。最后,我们讨论了未来的应用,例如模态翻译或患者轨迹建模。此外,我们讨论了甘斯(Gans)需要克服的尚待挑战,即他们的培训动态,医疗保真度或数据法规和道德问题,以集成在心脏病工作流程中。
摘要。这项研究深入研究了用于用于胸部CT扫描的潜在扩散模型的合成肺结节的表征。我们的实验涉及通过二进制掩码进行定位和各种结节属性引导扩散过程。特别是,掩码指示结节在边界框的形状中的近似位置,而其他标量属性则在嵌入向量中编码。扩散模型在2D中运行,在推理过程中产生单个合成CT切片。该体系结构包括一个VQ-VAE编码器,以在图像和潜在空间之间进行转换,以及负责DeNoising过程的U-NET。我们的主要目标是评估合成图像的质量,这是条件属性的函数。我们讨论可能的偏见以及模型是否充分定位并表征合成结节。我们对拟议方法的能力和局限性的发现可能是涉及有限数据集的下游任务,因为医学成像通常是这种情况。
摘要。在本文中,我们提出了一个从部分体积(PV)图中合成3D脑T1加权(T1-W)MRI图像的框架,目的是生成具有更多积分率组织边界的合成MRI体积。合成的MRI需要扩大和丰富用于培训脑部分割和相关模型的非常有限的数据集。与当前的最新方法相比,我们的框架利用PV-MAP属性,以指导生成的对抗网络(GAN)来生成更准确和更现实的合成MRI体积。我们证明了在PV-MAP上而不是二进制映射的条件,导致合成MRIS中的精确组织边界更加准确。此外,我们的结果表明,在合成MRI体积中,深灰质区域的表示有所改善。最后,我们表明,在合成图像中反映了引入PV映射的细胞变化,同时保留了准确的组织边界,从而在新的合成MRI体积的数据合成过程中可以更好地控制。
在过去的几年中,基于深度学习的技术在医学图像处理领域取得了很大进展,例如分割和配准。这些方法的主要特点是对医学图像进行模型训练的需求量很大。然而,由于成本高昂和道德问题,获取这些数据通常很困难。因此,缺乏数据可能导致性能不佳和过度拟合。为了解决这个问题,我们在本文中提出了一种数据增强算法,用于在健康儿童脑 MRI 图像上修复肿瘤以模拟病理图像。由于肿瘤的生长可能导致周围组织变形和水肿(这被称为“质量效应”),因此使用概率 UNet 来模拟这种变形场。然后,不是直接将肿瘤添加到图像中,而是使用基于 GAN 的方法将蒙版转移到图像上,使其在视觉和解剖学上都更合理。同时,通过将变形场应用于原始标签,还可以获得不同脑组织的注释。最后,将合成图像与真实数据集一起进行训练以进行肿瘤分割任务,结果表明准确度有统计上的提高。
合成图像产生的进展使评估其质量至关重要。虽然已经提出了几种大会来评估图像的渲染,但对于基于提示的文本形象(T2I)模型至关重要,这些模型基于提示,以考虑其他范围,例如生成的图像与提示的重要内容相匹配。此外,尽管生成的图像通常是由随机起点引起的,但通常不考虑该图像的影响。在本文中,我们提出了一个基于提示模板的新指标,以研究提示中规定的内容与相应生成的图像之间的对齐。它使我们能够更好地以指定对象的类型,它们的数字和颜色来表征对齐方式。我们对最近的几个T2I模型进行了一项研究。我们通过方法获得的另一个有趣的结果是,图像质量可能会大大变化,这取决于用作图像种子的噪声。我们还量化了提示中概念数量的影响,它们的顺序以及其(颜色)属性的影响。最后,我们的方法使我们能够识别出比其他种子比其他种子更好的种子,从而开辟了有关该研究不足的主题的新研究方向。
阴影是一种脱离图像质量并降低下游视觉算法的性能的现象。尽管当前的图像删除方法已经取得了有希望的进度,但其中许多需要外部获得的阴影掩码作为输入数据的必要部分,这不仅引入了额外的工作量,而且还会导致由于面具的不准确性而导致阴影边界附近退化的性能。其中一些不需要阴影面具,但是,他们需要多种恢复亮度和颜色信息的恢复,以及保留阴影区域内的质地和结构信息而没有外部线索,这会带来高度不良的性感,并使易于制品的结果。在本文中,我们提出了第一个pol arization引导的图像sha dow re moval解决方案的pol-noss,以较少的伪影以无面膜的方式去除阴影。具体来说,它由一条两阶段的管道组成,可以重新设置不适当的状态,并为管道量身定制的神经网络,以抑制工件。实验结果表明,我们的pol-share在合成图像和现实世界图像上都达到了最先进的性能。