分割算法的疗效经常因拓扑错误,连接中断和空隙等拓扑错误而受到损害。为了解决这一问题,我们引入了一种新颖的损失函数,即拓扑 - 意识局灶性损失(TAFL),该功能将基于基于地面真实和预测段蒙版的持久性图表之间的拓扑结构术语与拓扑结构术语结合在一起。通过实施与地面真理相同的拓扑结构,拓扑的约束可以有效地解决拓扑结构,而焦点损失可以解决阶级失衡。我们首先是从地面真理和预测的分割掩模的过滤的立方复合物中构造持久图。随后,我们利用sindhorn-knopp算法来确定两个持久图之间的最佳运输计划。最终的运输计划最小化了将质量从一个分布到另一个分布的运输成本,并在两个持久图中的点之间提供了映射。然后,我们根据该旅行计划计算沃斯堡的距离,以测量地面真相和预测的面具之间的拓扑差异。我们通过训练3D U-NET与MICCAI脑肿瘤分割(BRATS)CHALLENE验证数据集来评估我们的方法,该数据需要准确地分割3D MRI扫描,从而整合各种方式,以精确鉴定和跟踪恶性脑肿瘤。然后,我们证明,通过添加拓扑约束作为惩罚项,通过将焦点损失正规化来提高分段性能的质量。
摘要。分析建筑模型的可用面积、建筑安全性或能源分析需要空间和相关对象的功能分类数据。自动化空间功能分类有助于减少输入模型准备工作量和错误。现有的空间功能分类器使用空间特征向量或空间连通性图作为输入。深度学习 (DL) 图像分割方法在空间功能分类中的应用尚未被研究。作为解决这一差距的第一步,我们提出了一个数据集 SFS-A68,它由 68 个公寓楼空间布局的数字 3D 模型生成的输入和地面真实图像组成。该数据集适用于开发用于空间功能分割的 DL 模型。我们使用该数据集训练和评估基于迁移学习和从头开始训练的实验空间功能分割网络。测试结果证实了 DL 图像分割对空间功能分类的适用性。
对于医学图像分割,想象一下如果一个模型仅使用源域中的 MRI 图像进行训练,那么它在目标域中直接分割 CT 图像的性能如何?这种设置,即具有临床潜力的通用跨模态分割,比其他相关设置(例如域自适应)更具挑战性。为了实现这一目标,我们在本文中提出了一种新颖的双重规范化模型,该模型在通用分割过程中利用增强的源相似和源不相似图像。具体而言,给定一个源域,旨在模拟看不见的目标域中可能的外观变化,我们首先利用非线性变换来增强源相似和源不相似图像。然后,为了充分利用这两种类型的增强,我们提出的基于双重规范化的模型采用共享主干但独立的批量规范化层进行单独规范化。随后,我们提出了一种基于风格的选择方案,在测试阶段自动选择合适的路径。在三个公开数据集(即 BraTS、跨模态心脏和腹部多器官数据集)上进行的大量实验表明,我们的方法优于其他最先进的领域泛化方法。代码可在 https://github.com/zzzqzhou/Dual-Normalization 获得。
卷积神经网络(CNN)在培训数据集代表预期在测试时遇到的变化时,可以很好地解决监督学习问题。在医学图像细分中,当培训和测试图像之间的获取细节(例如扫描仪模型或协议)之间存在不匹配和测试图像之间的不匹配时,就会违反此前提。在这种情况下,CNNS的显着性能降解在文献中有很好的记录。为了解决此问题,我们将分割CNN设计为两个子网络的串联:一个相对较浅的图像差异CNN,然后是将归一化图像分离的深CNN。我们使用培训数据集训练这两个子网络,这些数据集由特定扫描仪和协议设置的带注释的图像组成。现在,在测试时,我们适应了每个测试图像的图像归一化子网络,并在预测的分割标签上具有隐式先验。我们采用了经过独立训练的Denoising自动编码器(DAE),以对合理的解剖分段标签进行模型。我们验证了三个解剖学的多中心磁共振成像数据集的拟议思想:大脑,心脏和前列腺。拟议的测试时间适应不断提供绩效的改进,证明了方法的前景和普遍性。对深CNN的体系结构不可知,第二个子网络可以使用任何分割网络使用,以提高成像扫描仪和协议的变化的鲁棒性。我们的代码可在以下网址提供:https://github.com/neerakara/test- time- aptaptable-neural-near-netural-netural-networks- for- domain-概括。
临床成像工作流的主要重点是疾病诊断和管理,导致医学成像数据集与特定的临床目标密切相关。这种情况导致了开发特定于任务的分割模型的主要实践,而没有从广泛的成像群中获得见解。受到医学放射学居民培训计划的启发,我们提出了向普遍医学图像分割的转变,旨在通过利用临床目标,身体区域和成像方式的多样性和共同点来建立医学图像理解基础模型的范式。div of这个目标,我们开发了爱马仕,一种新颖的上下文 - 学习方法,以应对医学图像segmentation中数据杂基的挑战和注释差异。在五种模式(CT,PET,T1,T2和Cine MRI)和多个身体区域的大量各种数据集(2,438个3D图像)中,我们证明了通用范式比传统范式在单个模型中解决多个任务的传统范式的优点。通过跨任务的协同作用,爱马仕在所有测试数据集中都能达到最先进的性能,并显示出卓越的模型可伸缩性。其他两个数据集中的结果揭示了爱马仕在转移学习,分裂学习和对下游任务的概括方面的出色表现。爱马仕(Hermes)博学的先生展示了一个具有吸引力的特征,以反映任务和方式之间的复杂关系,这与既定的放射学解剖学和成像原则相吻合。代码可用1。
文本对图像(T2I)合成是一项艰巨的任务,该任务是对文本和图像域及其关系进行建模。最近作品实现的图像质量的实质性改进为Nuberon应用程序铺平了道路,例如语言辅助图像编辑,计算机辅助设计,基于文本的图像检索和培训数据增强。在这项工作中,我们提出了一个简单的问题:与逼真的图像一起,我们是否可以以一种不受影响的方式获得任何有用的副产品(例如前景 /背景或多类分割掩码,检测标签,检测标签),这也将使其他计算机视觉任务任务和应用受益?试图回答这个问题,我们探索了从给定文本中的逼真的图像及其相应的前景 /背景分割掩码。为了实现这一目标,我们与GAN一起实验了共进行分割的概念。具体而言,提出了一种名为“共裂”启发的GAN(COS-GAN)的新型GAN结构,该结构同时从不同的噪声矢量中同时生成两个或多个图像,并利用图像特征之间的空间关注机制来生成逼真的分段掩码,以生成生成的Im-Im-Im-Im-Im-Im-Im-Im-Im-Im-Im-Agens。这种架构的优点是两倍:1)生成的分割掩码可用于专注于前景和背景,以改善生成的图像的质量,2)分段蒙版可以用作其他任务的训练目标,例如访问本地化和分割。在CUB,Oxford-102和可可数据集上进行的广泛实验表明,Cos-Gan能够改善视觉质量,并为发电图像提供可靠的前景 /背景掩码。
现代生活的几乎所有方面都取决于太空技术。多亏了计算机视频的一般和深度学习技术的巨大进步,几十年来,全世界都见证了将深度学习的发展用于解决太空问题的问题,例如自动驾驶机器人,诸如示踪剂,类似昆虫的机器人,类似昆虫的机器人和SpaceCraft的健康监测。这些只是一些在深度学习的帮助下具有高级空间行业的重要例子。但是,深度学习模型的成功需要大量的培训数据才能具有不错的性能,而另一方面,用于培训深度学习模型的公开空间数据集非常有限。当前没有用于基于太空的对象检测或实例分割的公共数据集,部分原因是手动注释对象分割掩码非常耗时,因为它们需要像素级标签,更不用说从空间获取图像的挑战了。在本文中,我们的目标是通过释放数据集以进行航天器检测,实例分割和零件识别来填补这一差距。这项工作的主要贡献是使用太空设置和卫星的图像开发数据集,并具有丰富的注释,包括绑定的航天器和口罩的框架盒对物体部分的水平,这些盒子是通过自动程序和手动努力的混合而获得的。我们还提供了对象检测和Intance Sementation的最新方法作为数据集的基准。可以在https://github.com/yurushia1998/satellitedataset上找到下载建议数据集的链接。
数据重播是图像的成功增量学习技术。它通过保留原始或合成的先前数据的储存库来防止灾难性的遗忘,以确保模型在适应新颖概念的同时保留过去的知识。但是,它在视频域中的应用是基本的,因为它只是存储了框架以进行动作识别。本文首次探讨了视频数据重播技术的递增动作分割,重点是动作时间段。我们提出了一个时间连贯的动作(TCA)模型,该模型代表使用生成模型而不是存储单个帧的动作。捕获时间连贯性的调节变量的集成使我们的模型了解随着时间的流逝的作用进化。因此,TCA为重播产生的动作段是多种多样的,并且在时间上是连贯的。在早餐数据集上的10任任务增量设置中,与基准相比,我们的AP可以显着提高准确性高达22%。
抽象的脑肿瘤分割是对医疗保健中诊断和治疗计划很重要的重要步骤。大脑MRI图像是根据建议的方法在收集数据并准备进一步分析之前先进行预处理的。建议的研究介绍了一种新策略,该策略使用以生物启发的粒子群优化(PSO)算法来分割脑肿瘤图像。为了提高准确性和可靠性,可以调整分割模型的参数。标准措施等标准度量,例如精度,精度,灵敏度,jaccard索引,骰子系数,特异性,用于绩效评估,以衡量建议的基于PSO的分割方法的有效性。建议方法的总体准确性为98.5%。随后的绩效分析分别为骰子得分系数,Jaccard指数,精度,灵敏度和特异性的91.95%,87.01%,92.36%,90%和99.7%的结果提供了更好的结果。因此,此方法对于放射科医生来说可能是有用的工具,可以支持它们诊断大脑中的肿瘤。关键字 - 脑肿瘤,群智能,粒子群优化,磁共振图像。
