摘要背景:人工智能 (AI) 有可能极大地改变我们的医疗保健系统。基于机器学习方法的新型 AI 技术应该在未来的临床决策中发挥关键作用。然而,它们在医疗保健环境中的实施仍然有限,主要是因为缺乏强有力的验证程序。有必要为 AI 的临床验证制定可靠的评估框架。我们在此介绍了一种评估 AI 预测三阴性乳腺癌 (TNBC) 治疗反应的方法,该方法使用来自临床数据仓库和生物库的真实数据和分子组学数据。方法:欧洲“ITFoC(面向癌症未来的信息技术)”联盟设计了一个框架,用于临床验证用于预测肿瘤学治疗反应的 AI 技术。结果:该框架基于七个关键步骤,具体规定:(1)AI 的预期用途,(2)目标人群,(3)AI 评估时间,(4)用于评估的数据集,(5)用于确保数据安全的程序(包括数据质量、隐私和安全),(6)用于衡量性能的指标,以及(7)用于确保 AI 可解释的程序。该框架构成了我们为“ITFoC 挑战赛”构建的验证平台的基础。这项全社区竞赛将使我们能够评估和比较用于预测 TNBC 治疗反应的 AI 算法与外部真实世界数据集。结论:在将 AI 技术应用于医疗保健环境之前,必须以稳健、公正和透明的方式评估其预测性能和安全性。我们相信,在精准肿瘤学和个性化护理的背景下,ITFoC 联盟的考虑将有助于在临床环境中安全地转移和实施 AI。
主要关键词