摘要引言如果人工智能 (AI) 算法能够检测出癌症(包括间隔期癌症),并且不会造成过度诊断,则它们有可能提高人群乳腺癌筛查计划的有效性。研究表明,人工智能的准确度与放射科医生通常使用的“丰富”数据集相当或更高,这些数据集中的癌症患病率高于人群筛查。常规筛查结果指标(癌症检测率和召回率)无法从这些数据集中估算出来,而且准确度估计值可能受到频谱偏差的影响,这限制了其在现实世界筛查中的普遍性。我们旨在通过比较人工智能和放射科医生在连续参加现实世界人群乳腺癌筛查计划的女性队列中的准确度来解决这些限制。方法与分析 从 2016 年 11 月至 2017 年 12 月,西澳大利亚州的两年一次的人口筛查项目 BreastScreen WA (BSWA) 收集了 109,000 名不同女性的回顾性连续数字乳房 X 线摄影筛查队列。该队列包括 761 例筛查发现的癌症和 235 例间期癌症。将从 BSWA 结果数据收集中提取放射科医生双重读取的描述性特征和结果。乳房 X 线摄影结果将由商业 AI 算法 (DeepHealth) 重新解释。将根据受试者工作特征曲线下面积的差异将 AI 准确度与放射科医生单次读取的准确度进行比较。将通过将每次筛查的第一位放射科医生读数与 AI 算法配对来估计 AI-放射科医生联合读数的癌症检测率和召回率,并与放射科医生双重读取的估计值进行比较。伦理与传播 本研究已获得妇女和新生儿健康服务伦理委员会 (EC00350) 和科廷大学人类研究伦理委员会 (HRE2020-0316) 的伦理批准。研究结果将发表在同行评审期刊上,并在国家和国际会议上发表。研究结果还将传播给澳大利亚乳腺癌筛查计划的利益相关者和人口筛查的政策制定者。
主要关键词