基于深度学习(DL)的一般图像表示学习(IRL)对于卫星图像引起了极大的兴趣,因为它的能力:i)通过自我监督的学习来模拟大量的大量免费可用遥感(RS)数据,从而大大降低了标记数据的要求; ii)将各种RS问题概括为下游任务。基于学习的方法最初为在RS图像上使用自我监督的IRL铺平了道路(例如[1],[2])。这种方法通过最大化同一图像的两种观点之间的一致性来对卫星图像表示与卷积神经网络(CNN)进行对比度学习,这是通过数据增强策略生成的。关于RS IRL的最新研究集中在卫星图像的掩盖数据建模上,例如[3] - [10]。他们通过遮罩的自动编码器(MAE)促进了自我监督的学习,并具有视觉变压器(VITS)。通过重建卫星图像,用遮盖的零件执行有效的IRL,即他们学习了描述图像的视觉内容的功能,这些功能可用作调整下游任务的专用模型的起点。最近对MAE对卫星图像IRL的兴趣取决于两个主要原因。首先,与对比的自我监督学习相反,MAE能够学习图像表示,而无需应用任何数据增强策略。这对于卫星图像特别重要,因为大多数数据增强策略都是为自然图像而设计的,并且它们直接适应卫星可能总是可行的。)。第二,已经表明,与VIT相结合的MAE可以根据训练数据的数量成比例地将其缩放到较大的DL模型中[11],[12]。但是,当使用MAE时,所得图像表示往往为较低的语义水平[13]。这防止了他们的全部潜力,用于需要更高级别卫星图像语义的许多下游任务(例如,场景分类,土地地图生成等。
摘要 - 这项研究提供了深度学习模型的比较分析 - UNET,RES-UNET,RES-RES-UNET和NNUNET,可评估其在脑瘤,息肉和多级心脏分段任务中的表现。分析侧重于精确,准确性,召回,骰子相似性系数(DSC)和联合(IOU)的相交以评估其临床适用性。在脑肿瘤分割,RES-UNET和NNUNET中明显胜过UNET,在DSC和IOU分数中,RES-UNET领先,表明肿瘤描述的准确性均出色。同时,NNUNET在召回和准确性方面表现出色,这对于临床诊断和计划中可靠的肿瘤检测至关重要。在息肉检测中,NNUNET是最有效的,在所有类别中达到了最高的指标,并将其作为内窥镜检查中可靠的诊断工具证明了它。在复杂的心脏细分任务中,RES-UNET和RES-UNET在描述左心室方面非常出色,RES-UNET也导致右心室分割。nnunet在心肌分段中无与伦比,在精确,召回,DSC和IOU中取得了最高分数。结论指出,尽管有时会在特定指标中表现出色,但差异很小。NNUNET始终在整个实验中显示出卓越的整体性能。索引术语 - 深度学习,UNET,RES-UNET,RES-UNET,NNUNET,医学成像细分,临床应用特别是因为其高召回和准确性而引起的,这在临床环境中至关重要,可以最大程度地减少误诊并确保及时治疗,NNUNET在所有测试类别中的关键指标中的稳健表现将其确立为这些变化和复杂的分割任务的最有效模型。
共享标记数据对于获取用于各种深度学习应用的大型数据集至关重要。在医学成像领域,由于隐私法规的原因,这通常是不可行的。虽然匿名化是一种解决方案,但标准技术已被证明是部分可逆的。在这里,使用具有差分隐私保证的生成对抗网络 (GAN) 的合成数据可以成为一种解决方案,既能确保患者的隐私,又能保持数据的预测特性。在本研究中,我们实现了具有和不具有差分隐私保证的 Wasserstein GAN (WGAN),以生成用于脑血管分割的隐私保护标记的飞行时间磁共振血管造影 (TOF-MRA) 图像块。合成的图像标签对用于训练 U-net,该 U-net 根据来自两个不同数据集的真实患者图像的分割性能进行评估。此外,计算了生成的图像和真实图像之间的 Fréchet 初始距离 (FID) 以评估它们的相似性。在使用 U-Net 和 FID 进行评估时,我们探索了不同隐私级别的影响,该级别由参数 ε 表示。在更严格的隐私保障下,分割性能和 FID 与真实患者图像的相似性会下降。我们最好的分割模型是在合成数据和私人数据上训练的,在脑血管分割范例中,当 ε = 7.4 时,Dice 相似度系数 (DSC) 为 0.75,而当 ε = ∞ 时,Dice 相似度系数为 0.84(第二个测试集上的 DSC 分别为 0.69 和 0.88)。我们确定了一个阈值 ε < 5,对于该阈值,
摘要。技术渗透到不同领域并在一段时间后统治这些领域是毋庸置疑的。新技术诱惑着我们的灵魂,一旦尝到其果实,我们对它们的依赖就不可避免。作为人类,我们很容易沉迷于方便和舒适的歌曲。以及当他们以更令人愉悦和更体面的方式为我们工作时。这项工作是为了说明人工智能在图像处理中的应用。它的能力和问题是这项工作关注的关键因素。因此,这项工作概述了人工智能背后的基本思想及其在不同领域的应用,并强调了使用人工智能工具来理解所提供图片的含义时该技术的能力。还描述了可能的解决方案。
本研究尝试确定人工智能(AI)生成的图像在教育中的可用性。为此,使用了 OpenAI 开发的 DALL·E AI 工具。本研究旨在确定人工智能生成的图像在教育中的可用性,并使用定性研究设计。选择文档分析技术作为检查人工智能生成的图像的最合适技术。在此背景下,根据研究人员确定的标准检查了人工智能根据领域文本确定的类别生成的图像。当检查研究结果时,可以看出人工智能生成的图像通常非常有效和成功。除了动物、风景和物体等具体概念外,人工智能还可以将体育和娱乐等抽象概念可视化。几乎所有人工智能生成的图像都会给出与文本一致的结果,而且几乎所有图像都相当不错。因此,得出结论,人工智能生成的图像用于教育目的的潜力很高。
在一项研究发表在美国癌症研究协会 (AACR) 出版的十种期刊中的任何一种之前,它都要接受一项不寻常的额外检查。自 2021 年 1 月以来,AACR 一直在同行评审后对其暂时接受的所有手稿使用人工智能 (AI) 软件。目的是自动提醒编辑注意重复的图像,包括部分图像被旋转、过滤、翻转或拉伸的图像。AACR 是可能成为一种趋势的早期采用者。为了避免发表带有被篡改图像的论文——无论是由于彻头彻尾的欺诈还是不恰当的美化发现的尝试——许多期刊都雇人手动扫描提交的手稿以查找问题,通常使用软件来帮助检查他们发现的内容。但《自然》获悉,在过去的一年里,
关键词:光束法区域网平差、自校准、系统校准、非度量相机 摘要 使用市售的非度量相机(例如佳能、尼康)进行摄影测量操作正变得非常流行。使用它们的原因有几个,例如有效载荷更轻、传感器成本低、尺寸更小,以适应有限的机载空间(例如无人机作为数据采集平台)、快速周转项目、易于更换等。与使用数字高分辨率度量图像传感器(Hexagon DMC、Microsoft Vexcel UltraCam 系统等)相比,所有这些属性都具有优势。然而,为了获得接近使用度量系统获得的结果,必须考虑上述非度量图像传感器的所有系统误差;对它们进行建模并消除(或尽量减少)它们对所获取图像的影响。本文回顾了与使用非度量图像传感器相关的功能和随机模型。将关注传感器内部校准参数,即校准焦距、主点、对称 - 非对称 - 切向镜头畸变模式和可能严重扭曲所获取图像的其他偏差。为此,使用焦距为 50 毫米的尼康 D810 数码相机在摄影测量测试场区域“Franklin Mills Mall”进行相机校准。该场地覆盖了多个飞行高度,分别产生 15 和 30 厘米 GSD 的图像。飞行了两个垂直摄影测量飞行带,具有高端搭接和侧搭接。测试场区域拥有大约 25 个目标控制和检查点,这些点的测量精度为 2 厘米或更高。使用 PIX4Dmapper(专为从无人机或地面获取的图像而创建的软件包)对上述图像进行自动空中三角测量。导出图像观测结果(ASCII),并使用汉诺威莱布尼茨大学程序系统 BLUH 进行相应的束流区域调整,该系统能够通过附加参数(十二个标准加上不同失真模式的中型非度量数字相机)进行自我校准。调查中使用了不同数量和分布的地面控制点 (GCP) 和检查点 (ChkPts)。本文介绍了结果。
目的:评估深度学习算法在视网膜眼底图像中执行不同任务的性能:(1)检测视网膜眼底图像与光学相干断层扫描 (OCT) 或其他图像,(2)评估优质视网膜眼底图像,(3)区分右眼 (OD) 和左眼 (OS) 视网膜眼底图像,(4)检测老年性黄斑变性 (AMD) 和 (5) 检测可转诊的青光眼性视神经病变 (GON)。患者和方法:设计了五种算法。从包含 306,302 张图像的数据库(Optretina 的标记数据集)进行回顾性研究。三位不同的眼科医生(均为视网膜专家)对所有图像进行分类。数据集按患者分为训练(80%)和测试(20%)两部分。采用了三种不同的 CNN 架构,其中两种是定制设计的,以最小化参数数量,同时对其准确性的影响最小。主要结果测量是曲线下面积 (AUC),包括准确度、灵敏度和特异性。结果:视网膜眼底图像的测定 AUC 为 0.979,准确度为 96%(灵敏度 97.7%,特异性 92.4%)。高质量视网膜眼底图像的测定 AUC 为 0.947,准确度为 91.8%(灵敏度 96.9%,特异性 81.8%)。OD/OS 算法的 AUC 为 0.989,准确度为 97.4%。AMD 的 AUC 为 0.936,准确度为 86.3%(灵敏度 90.2%,特异性 82.5%),GON 的 AUC 为 0.863,准确度为 80.2%(灵敏度 76.8%,特异性 83.8%)。结论:深度学习算法可以将视网膜眼底图像与其他图像区分开来。算法可以评估图像的质量,区分右眼和左眼,并以高水平的准确度、灵敏度和特异性检测 AMD 和 GON 的存在。关键词:人工智能、视网膜疾病、筛查、视网膜眼底图像
近年来,生成模型取得了重大进展,尤其是在文本到图像合成领域。尽管取得了这些进展,但医学领域尚未充分利用大规模基础模型的功能来生成合成数据。本文介绍了一种文本条件磁共振 (MR) 成像生成框架,解决了与多模态考虑相关的复杂性。该框架包括一个预先训练的大型语言模型、一个基于扩散的提示条件图像生成架构和一个用于输入结构二进制掩码的附加去噪网络。实验结果表明,所提出的框架能够生成与医学语言文本提示一致的逼真、高分辨率和高保真的多模态 MR 图像。此外,该研究根据文本条件语句解释了生成结果的交叉注意力图。这项研究的贡献为未来文本条件医学图像生成的研究奠定了坚实的基础,并对加速医学成像研究的进步具有重要意义。
讨论从对山上现状的分析开始,试图根据去年 5 月举行的用户委员会会议的结果找出其弱点。大家普遍对光学和红外探测器的现状表示担忧,其中一些探测器似乎已经过时。造成这种相对不利状况的原因归因于拉萨利亚目前运行的 CCD 数量相当多,可能比世界上任何其他观测站都多,而且直到几年前,由于出口问题,获取现代红外探测器仍然很困难。总干事回应了 P. Vhn 和 B. Fort 对改进速度的有些悲观的看法,承诺 ESO 总部将投入大量精力尽快更换损坏的探测器;特别是在红外领域,罗克韦尔 256x256 阵列