保留所有权利。未经许可不得重复使用。 (未经同行评审认证)是作者/资助者,他已授予 medRxiv 永久展示预印本的许可。
摘要 在胸部 X 光 (CXR) 诊断领域,现有研究通常仅侧重于确定放射科医生的注视点,通常是通过检测、分割或分类等任务。然而,这些方法通常被设计为黑盒模型,缺乏可解释性。在本文中,我们介绍了可解释人工智能 (I-AI),这是一种新颖的统一可控可解释流程,用于解码放射科医生在 CXR 诊断中的高度关注度。我们的 I-AI 解决了三个关键问题:放射科医生注视的位置、他们在特定区域关注的时间以及他们诊断出的发现。通过捕捉放射科医生凝视的强度,我们提供了一个统一的解决方案,可深入了解放射学解释背后的认知过程。与当前依赖黑盒机器学习模型的方法不同,这些方法在诊断过程中很容易从整个输入图像中提取错误信息,而我们通过有效地屏蔽不相关的信息来解决这个问题。我们提出的 I-AI 利用视觉语言模型,可以精确控制解释过程,同时确保排除不相关的特征。为了训练我们的 I-AI 模型,我们利用眼球注视数据集来提取解剖注视信息并生成地面真实热图。通过大量实验,我们证明了我们方法的有效性。我们展示了旨在模仿放射科医生注意力的注意力热图,它编码了充分和相关的信息,仅使用 CXR 的一部分即可实现准确的分类任务。代码、检查点和数据位于 https://github.com/UARK-AICV/IAI。1. 简介
4 HCW给出了泡沫反应的历史,不应接受TST。HCW具有无证阳性TST反应史(除泡沫除外)可以接受TST。如果无症状HCW降低了基线TST,则不需要CXR,因为它不能替代TST。对于结核病服务推荐,应在过去6个月内完成CXR,这可以通过家庭医生完成。注意:结核病服务可能会请求最新的CXR。
简介 2021 年,世界卫生组织 (WHO) 发布了人工智能 (AI) 使用建议,确认该技术可以代替人类读者来解读胸部 X 光片 (CXR) 图像,以筛查和分诊结核病 (TB),这为卫生领域人工智能指南开创了历史性先例 [1]。该前瞻性指南强调了 CXR 在结核病中的效用,尽管 WHO 过去不愿将其用于结核病规划 [2]。在诊断算法中使用 CXR 可以识别出无症状但肺部病理提示结核病的亚临床结核病患者,并将他们转诊进行检测和诊断 [3]。CXR 还可以大大减少所需的确认测试数量,这可以节省结核病规划的成本并避免给患者带来不必要的不便 [4]。CXR 在结核病中的应用限制通常是由于缺乏设备或训练有素的读者 [5, 6]。放射科医生,甚至是训练有素的医生,并不总是那么容易找到,特别是在大城市以外的结核病高负担地区 [7]。
在结核病肆虐的地区,缺乏训练有素的放射科医生来快速处理 CXR 一直是一个挑战,影响及时诊断和患者监测。结核病患者肺部注释图像的缺乏阻碍了将面向数据的算法应用于研究和临床实践的尝试。结核病门户计划数据库 (TBPP,https://TBPortals.niaid.nih.gov) 是一个全球合作项目,整理了大量最危险、难以治愈的耐药结核病 (DR-TB) 患者病例。TBPP 拥有 1,179 例 (83%) 耐药结核病患者病例,是一个独特的集合,非常适合作为深度学习分类器的试验场。截至 2019 年 1 月,TBPP 数据库包含 1,538 张 CXR,其中 346 张(22.5%)由放射科医生注释,104 张(6.7%)由肺科医生注释,剩下 1,088 张(70.7%)没有注释。Qure.ai qXR 人工智能自动 CXR 解释工具在 TBPP 数据库中 346 张放射科医生注释的 CXR 上进行了盲测。Qure.ai qXR 对空腔、结节、胸腔积液、肺门淋巴结肿大的 CXR 预测与人类专家注释成功匹配。此外,我们还测试了 12 个 Qure.ai 分类器,以确定它们是否与治疗成功率相关(治疗医生提供的信息)。发现十个描述符具有重要意义:异常 CXR(p = 0.0005)、胸腔积液(p = 0.048)、结节(p = 0.0004)、肺门淋巴结肿大(p = 0.0038)、空洞(p = 0.0002)、不透明度(p = 0.0006)、肺扩张(p = 0.0074)、实变(p = 0.0004)、结核病指标(p = < .0001)和纤维化(p = < .0001)。我们得出结论,应用全自动 Qure.ai CXR 分析工具可用于快速、准确、统一、大规模的 CXR 注释辅助,因为它即使对于未用于初始训练的 DR-TB 病例也表现良好。在 TBPP 等不同数据集上测试人工智能算法(包括机器学习和深度学习分类器)对于临床采用的医疗数据分析自动助手至关重要。
五种用于识别导致 CXR 不理想情况的不同原因的 AI 模型具有很高的灵敏度、特异性和准确性,可用于识别未包括的解剖结构、不当暴露、大量患者旋转、低肺容量以及遮挡肺部或纵隔可见性的上覆解剖结构造成的不理想情况。所有 5 种 AI 模型的性能在不同患者年龄组、性别和放射线投影中保持一致。使用来自我们内部多机构联盟的 CXR 数据,我们能够从端到端训练五个 AI 模型。这一过程包括数据识别、报告整理、参考数据标记标准,以便在 3278 个 CXR 子集上进行模型训练和测试,整个过程在不到 8 周的时间内没有任何数据科学家或工程师的帮助。同时,我们能够将训练数据集限制在三个站点,并在其余两个站点的 CXR 上建立“本地”通用性。
对于高质量的放射科来说,X 射线成像的持续质量控制 (QC) 至关重要。有效的 QC 工作是一个持续的过程,需要医学物理学家耗费大量时间从多个成像系统收集数据并进行费力的分析。重复和拒绝的 X 射线图像会导致患者受到不必要的辐射暴露并降低放射科的效率,因此延迟拒绝的 X 射线图像是成功的 QC 程序的关键组成部分。我们认为深度学习 (DL) 算法可以最大限度地减少工作量并提高 QC 程序的准确性。在此海报中,我们介绍了对 CXR 图像执行自动 QC 检查的 DL 算法的开发和性能评估。我们重点关注 (1) 使用的采集协议是否与获取的正面 CXR 图像匹配,以及 (2) 正面 CXR 定位是否可以接受?
冠状病毒病-19 (COVID-19) 是由冠状病毒家族的新成员引起的,是一种呼吸道疾病,发病率和死亡率都很高,迅速达到大流行的程度。它在短短几个月内就对社会和世界经济产生了巨大影响。COVID-19 给医疗保健的各个方面带来了诸多挑战,包括可靠的诊断、治疗和预防方法。最初遏制病毒传播的努力因开发可靠诊断方法所需的时间而受阻。人工智能 (AI) 是计算机科学中一个发展迅速的领域,在医疗保健领域有许多应用。机器学习是 AI 的一个子集,它采用深度学习和神经网络算法。它可以识别模式并完成复杂的计算任务,通常比人类更快、更精确。在本文中,我们探索了一种简单且广泛使用的测试方法,即胸部 X 光检查 (CXR),将其与 AI 结合使用,以可靠地诊断 COVID-19。Microsoft CustomVision 是一种自动图像分类和对象检测系统,是 Microsoft Azure 认知服务的一部分。我们利用 COVID-19 肺炎患者、其他病因引起的肺炎患者和正常 CXR 的公开 CXR 图像作为数据集来训练 Microsoft CustomVision。我们训练的模型总体上显示出 92.9% 的灵敏度 (召回率) 和阳性预测值 (精确度),每个标签的结果显示 COVID-19 肺炎的灵敏度和阳性预测值为 94.8% 和 98.9%,非 COVID-19 肺炎的灵敏度和阳性预测值为 89% 和 91.8%,正常肺的灵敏度和阳性预测值为 95% 和 88.8%。然后,我们使用来自我们机构的确诊 COVID-19 患者的 CXR 以及非 COVID-19 肺炎和正常 CXR 验证了该程序。我们的模型具有 100% 的灵敏度、95% 的特异性、97% 的准确度、91% 的阳性预测值和 100% 的阴性预测值。最后,我们开发并描述了一个公开可用的网站,以展示如何在未来使这项技术随时可用。
AI 优先肺癌 (N=4408) 转诊队列 (N=107065) 肺癌百分比 转诊队列百分比 患病率 (PR) (95% CI) 所有 CXR P1 1761 17691 39.95 16.52 2.42 (2.33–2.51) P2 2071 36686 46.98 34.27 1.37 (1.33-1.42) P3 250 10853 5.67 10.14 0.56 (0.49-0.63) P4 326 41835 7.40 39.07 0.19 (0.17-0.21) 全科医生转诊 CXR P1 766 2695 47.88 11.96 4.0 (3.76-4.26) P2 633 4576 39.56 20.30 1.95 (1.82-2.08) P3 76 2423 4.75 10.75 0.44 (0.25-0.55) P4 125 12847 7.81 56.99 0.14 (0.12-0.16) 急诊科转诊 CXR P1 617 4479 36.70 17.07 2.15 (2.01-2.30) P2 822 9194 48.90 35.04 1.39 (1.32-1.47) P3 122 2997 7.26 11.42 0.63 (0.53-0.76) P4 120 9570 7.14 36.47 0.20 (0.16-0.23)
尽管可用的 CAD 解决方案种类繁多,但对用于结核病 (TB) 筛查的计算机辅助检测 (CAD) 软件的独立评估却很少。我们开发了一个胸部 X 光 (CXR) 图像测试库,由两名具有不同经验水平的结核病临床医生盲读,然后通过 12 种 CAD 软件解决方案进行处理。使用 Xpert MTB/RIF 结果作为参考标准,我们将每种 CAD 软件的性能特征与专家读者和中级读者进行了比较,使用的截止阈值是根据每个人体读者的敏感度选择的。六个 CAD 系统的表现与专家读者(Qure.ai、DeepTek、Delft Imaging、JF Healthcare、OXIPIT 和 Lunit)相当,另外一种软件(Infervision)的表现仅与中级读者相当。Qure.ai、Delft Imaging 和 Lunit 是唯一表现明显优于中级读者的软件。大多数 CAD 软件在有结核病史的参与者中表现明显较差。用于捕获 CXR 图像的放射线设备也对某些 CAD 软件的性能有影响。结核病计划实施者现在有多种优质 CAD 软件解决方案可供选择,可用于他们的 CXR 筛查计划。