未分析该数据集的人口统计学、糖尿病持续时间、种族、使用每个成像平台进行成像所需的时间以及瞳孔直径。EyeArt 和 EIDON 图像处理可能存在“黑匣子”问题(即输出计算方式缺乏透明度),因为该软件使用的参考参数或数据点可能与标准 45 度彩色眼底图像中使用的不同,因此分级可能存在差异。需要进一步研究以确定广角真彩色图像是否在 EyeArt 软件的诊断准确性方面具有优势。
抽象背景/糖尿病性视网膜病(DR)筛查程序的数字图像分级的目标是由于糖尿病患病率的增加而代表了一个重要的挑战。我们评估自动人工智能(AI)算法的性能,从英语糖尿病眼镜筛选计划(DESP)中分类视网膜图像,以测试阳性/技术失败与测试阴性,使用人类按照标准国家协议作为参考标准的人类分级。方法是根据标准的国家协议手动对来自三个英语DEST的连续筛选剧集进行的视网膜图像,并通过具有机器学习的软件Eyeart v2.1的自动化过程进行了分级。使用人类等级作为参考标准确定筛查性能(敏感性,特定的)和诊断准确性(95%顺式)。对引用的视网膜病(人类渐变,无法分级的,不可引用的大斑马病,中度至严重的非促销或增生性或增生性),Eyeart的结果敏感性(95%顺式)为95.7%(94.8%至96.5%)。对于轻度到中度的非增强性视网膜病,敏感性为98.3%(97.3%至98.9%),具有引用的baculopathy,100%(98.7%,100%)对中度至重度严重的非促进性性视网膜病和100%(97.9%,100%,100%,100%,100%)的敏感性。Eyeart与68%(67%至69%)的No VerinoPathy(特定峰)的人类等级达成一致,当与不可回顾的视网膜病变相结合时,特定的54.0%(53.4%至54.5%)的特异性。结论该算法在现实世界中的筛查服务中表现出对高风险视网膜病的敏感性水平,具体的特定城市可以使人类分布者的工作量减半。AI机器学习和诸如此类的深度学习算法可以提供相当于临床上的视网膜病的快速检测,尤其是在训练有素的员工队伍无法获得或需要大规模和快速结果的环境中。
自 2018 年以来(4、5)。该系统名为 IDx-DR,在视网膜照相机 (Topcon NW400) 上运行,并利用 AI 算法分析眼睛图像 (6)。系统的输出是建议,当系统识别出超过轻度 DR 时,将患者转诊给眼科保健专业人员,或建议 12 个月后重新筛查。因此,它是第一款提供自主筛查决策的设备,已获得美国食品药品监督管理局 (FDA) 的市场批准 (5)。出于伦理考虑,这种 AI 辅助设备的一个新颖而独特的功能需要进行严格评估:IDx-DR 有意生成自主建议,这实际上是诊断,无需医生监督,尽管医生通常负责诊断。由于该设备已经投入商业使用,因此迫切需要澄清知情同意的伦理问题。迄今为止,“告诉患者什么”是根据美国和欧盟的法律分析进行讨论的(7-9)。但是,对于用于诊断 DR 的新设备,尚未对“如果 AI 参与诊断,信息处理中应包括哪些信息”这一伦理问题提供具体答案。伦理挑战源于黑盒算法的不透明性、训练数据中的潜在偏差、改善医疗保健与创造利润之间的紧张关系以及出现性能错误时的责任(10)。这些措施旨在改进信息处理并培养患者对 AI 系统的信任。为了缓解这些伦理挑战,有人尝试性地提议对医生进行有关人工智能系统的构建、其训练数据和局限性的教育,并制定超越法律要求的伦理准则 ( 11 )。然而,目前仍不清楚在初级保健环境中使用人工智能系统诊断 DR 的信息过程中应包括哪些具体信息。虽然评论者质疑是否必须从法律角度披露诊断人工智能的参与 ( 7 ),但本文作者认为,忽略这一事实是不道德的,因为这可能构成一种欺骗行为。本文的目的是制定一份清单,以在伦理上保障知情同意过程。我们以 IDx-DR 系统为例,介绍其他可用于诊断 DR 的商业化 AI 辅助工具,例如 2020 年 6 月获得 FDA 批准的 EyeArt(12 – 14)。