方法:视觉技术的进步对多个对象检测和场景理解的领域有重大影响。这些任务是各种技术的组成部分,包括将场景集成到增强现实中,促进机器人导航,启用自主驾驶系统以及改善旅游信息中的应用程序。尽管在视觉解释方面取得了长足的进步,但许多挑战仍然存在,包括语义理解,遮挡,定向,标记数据的可用性不足,照明不均匀,包括阴影和照明,方向变化,对象大小以及背景变化。为了克服这些挑战,我们提出了一个创新的场景识别框架,事实证明这是非常有效的,并产生了非凡的结果。首先,我们在场景数据上使用内核卷积执行预处理。第二,我们使用UNET分割执行语义分割。然后,我们使用离散小波变换(DWT),SOBEL和LAPLACIAN以及文本(本地二进制模式分析)从这些分段数据中提取特征。要识别对象,我们使用了深度信念网络,然后找到对象对象关系。最后,Alexnet用于基于图像中识别的对象将相关标签分配给场景。
这项研究研究了机器学习(ML)和数据同化(DA)技术的整合,重点是实施用于地质碳储存(GCS)项目的替代模型,同时保持后状态的高富达物理结果。最初,在通道储层中的CO 2注射模拟的背景下,我们评估了两个不同的机器学习模型(FNOS)和变压器UNET(T-UNET)的替代建模能力。我们介绍了基于替代物的混合ESMDA(SH-ESMDA),这是传统的合奏对多种数据同化(ESMDA)的改编。此方法将FNO和T-UNET用作替代模型,并有可能使标准的ESMDA过程至少更快或更高,具体取决于同化步骤的数量。此外,我们引入了基于替代的混合RML(SH-RML),这是一种差异数据同化方法,依赖于随机最大似然(RML),在该方法中,FNO和T-UNET都可以计算梯度以优化目标函数,以及用于计算较高的状态模型来进行计算。我们的比较分析表明,与案例研究的常规ESMDA相比,SH-RML提供了更好的不确定性量化。
摘要。早期发现和确定适当的治疗技术将建立癌症患者的耐力。诊断和治疗脑肿瘤的关键步骤是准确可靠的分割。鉴于其形状不平坦和不透明的边界,神经胶质瘤是最困难的脑癌之一。由于其设计存在显着差异,因此,神经胶质瘤脑生长的程序划分是一个流体主题。在本文中报告了改进的基于UNET的设计,用于自动从MRI图像中对脑肿瘤进行自动分割。培训语义部模型需要大量的精细澄清信息,这使得迅速适应不符合此要求的不熟悉类的挑战。最初的射击细分试图解决此问题,但存在其他缺陷。因此,在本文中讨论了几乎没有示意的示意图分割,以分解同时将原始分类与基本类别和足够模型分类的投机能力。上下文感知的原型学习(CAPL),用于通过利用早期信息从帮助测试中出现早期信息,并逐步增强逻辑数据到分类器,并根据每个问题图片的实质模制。结果揭示了开发模型的表现。
近年来,基于 Transformer 的模型在医学图像分割领域备受关注,研究也在探索将其与 Unet 等成熟架构相结合的方法。然而,这些模型对计算的要求很高,导致当前大多数方法都侧重于分割 MRI 或 CT 图像的 2D 切片,这会限制模型学习深度轴上语义信息的能力,导致输出边缘不均匀。此外,医学图像数据集(尤其是用于脑肿瘤分割的数据集)规模较小,这对训练 Transformer 模型构成了挑战。为了解决这些问题,我们提出了 3D 医学轴向 Transformer (MAT),这是一种用于 3D 脑肿瘤分割的轻量级端到端模型,它采用轴向注意机制来降低计算需求,并通过-distillation 来提高在小数据集上的性能。结果表明,我们的方法比其他模型具有更少的参数和更简单的结构,实现了卓越的性能并产生了更清晰的输出边界,使其更适合临床应用。代码可在 https://github.com/AsukaDaisuki/MAT 上找到。关键词:深度学习、3D 脑肿瘤分割、3D Transformer、轴向注意力、自我蒸馏
摘要。深度神经网络(DNN)越来越多地在应用科学的各种领域中使用,尤其是在计算机视觉和图像处理等领域,它们可以增强仪器的性能。各种高级相干成像技术,包括数字全息图,利用卷积神经网络(CNN)或视觉变压器(VIT)等不同的深层体系结构。这些体系结构能够提取不同的指标,例如自动关联重建距离或3D位置确定,促进自动显微镜和相位图像恢复中的应用。在这项工作中,我们提出了一种使用Gedankennet模型的改编版本的混合方法,并与UNET样模型相结合,目的是访问Micro-Objects 3D姿势测量。这些网络在模拟全息数据集上进行了培训。我们的方法在推断3D姿势时达到了98%的精度。我们表明,Gedankennet可以用作回归工具,并且比微小的(TVIT)模型更快。总体而言,将深层神经网络整合到数字全息显微镜中和3D计算机微视频中,有望显着提高全息图的稳健性和处理速度,以精确的3D位置推理和控制,尤其是在微型机器人应用中。
摘要内部可变性与起伏有关,该波动源自气候成分固有的过程及其相互作用。另一方面,强迫变异性描述了外部边界条件对物理气候系统的影响。一种方法是为了区分表面空气温度内的内部和强制变异性。使用噪声到数字的方法用于训练神经网络,在内部变异性和图像噪声之间进行类比。使用从1901年到2020年的表面空气温度数据编制了大型训练数据集,该数据是从大气 - 海洋通用循环模型模拟的合奏中获得的。用于培训的神经网络是U -NET,这是一个主要用于图像分割的广泛采用的卷积网络。为了评估性能,从两个单模型初始条件大合奏,集合平均值和U -NET的预测进行比较。U -NET在区域尺度上观察到了显着的差异,但UNET将内部变异性降低了四倍。在证明了厄尔尼诺南部振荡的有效过滤时,U -NET遇到了捕捉北大西洋变化的挑战。这种方法具有扩展到其他物理变量的潜力,从而促进了对长期外部强迫触发的气候变化的见解。
摘要 - 交通迹象对于向驾驶员提供重要信息,确保其安全并帮助他们遵守道路规则至关重要。对象检测算法(例如您只看一次(YOLO))在自动驾驶汽车中使用来监视交通标志信息。但是,大多数对象检测研究都集中在识别交通标志而不是其身体状况上。现有数据集的一个主要问题是缺乏有关培训损坏的流量标志的数据,这可能会对对象检测算法的性能产生不利影响。为了解决这个问题,我们的论文全面审查了图像到图像(I2i)算法,以修改现有的流量标志图像以展示不同的身份状态(正常和损坏)。我们使用最先进的图像式图像翻译技术,UNET视觉变压器周期符合生成对抗网络(UVCGAN)V2和能量引导的随机微分方程(EGSDE)进行实验进行实验。使用Fréchet成立距离(FID)和并排图像比较评估我们的实验结果。我们分析并讨论可能的和未来的改进。关键字 - 流量标志检测,图像生成,图像 - to-Image(I2i),生成对抗网络(GAN),循环生成对抗网络(Cyclegan),扩散模型
相对于计算机断层扫描(CT),磁共振成像(MRI)的软组织对比增加使其成为决定放射治疗(RT)的合适成像方法。当将MRI扫描用于治疗计划时,剂量计算和基于X射线的患者位置仍然需要CT扫描。这增加了工作量,由于图像注册间模式的必要条件,因此导致了不必要的,并且需要不必要的辐射。即使仅使用MR图像是有利的,但必须使用一种估计伪CT(PCT)的方式来生成电子密度映射和患者参考图像。因此,本文带来了一个有效的深度学习模型,可以使用以下步骤从MRI图像中生成合成的CT; a)在收集了CT和MRI扫描图像的数据中,b)使用图像进行预处理,以避免使用诸如Outier Emplier Empliering,数据平滑和数据归一化的技术避免异常和噪声,C)使用原理组件分析(PCA)和回归方法进行特征提取和选择,DCN和DCN(DCN)(DCN)(dcn)(dcn)(dcn)(dc)。此外,我们为此模型评估了DC,SSIM,MAE和MSE等指标。但是,我们建议的模型的精度为95%。关键字
摘要 - 频率覆盖范围图(RF地图)在无线通信方面是有效的,但是通过现场调查获得它们可能是劳动密集型,有时是不切实际的。为了应对这一挑战,我们提出了Recugan,这是一种基于生成的对抗网络(GAN)生成RF地图的方法。recugan利用信息最大化gan(Infogan)的原理来捕获RF地图的潜在特性,从而实现了无监督的分类和新的和多样的RF地图的生成。与传统方法不同,recugan不需要标记的数据或条件输入,降低复杂性,时间和成本。我们使用基于定制的梯度惩罚剂量(WGAN)功能和基于梯度的损耗功能来增强Recugan目标函数,以稳定训练和准确的地图生成。我们还提供了将多个发电机纳入recugan中的选项,从而使高分辨率的RF地图生成。通过通过实验和仿真数据进行广泛的培训证明,Recugan可以合成各种高质量的RF图,并根据RSS分布对它们进行分类。与基于UNET的有条件GAN(CGAN)相比,Recugan的平均平均百分比误差(MAPE)为1.18%,表现优于CGAN模型,CGAN模型的MAPE为2.5%。索引术语 - 生成对抗网络,RF映射,深神经网络,覆盖范围,AI。
医学图像分析在医疗保健中起着至关重要的作用,特别是在计算机视觉应用中。人工智能 (AI) 为解决医疗保健行业的各种问题做出了巨大贡献,包括疾病诊断和分类。类风湿性关节炎 (RA) 是一种导致严重健康问题的自身免疫性疾病。目前基于学习的 RA 诊断方法需要改进流水线和优化。在本文中,我们提出了一个基于深度学习的框架,称为人工智能 (AI) RA 诊断框架 (AIRADF)。该框架包括用于预处理和训练感兴趣区域 (ROI) 的功能,用于自动 RA 检测和分类。RA 检测过程利用称为 Faster RCNN 的深度学习模型,而 RA 分类由增强的 UNet 模型执行。我们引入了一种称为基于学习的类风湿性关节炎检测 (LbRAD) 的算法。我们使用 X 射线图像进行的经验研究表明,所提出的算法在 RA 检测和分类方面优于许多现有的深度学习模型,分别达到 92.81% 和 94.58% 的最高准确率。此外,我们的框架除了 RA 检测之外还能够进行多类分类,从而形成临床决策支持系统 (CDSS),可帮助医疗专业人员进行 RA 预后。关键词 – 类风湿性关节炎、深度学习、人工智能、图像处理、类风湿