摘要 简介 个体预后或诊断的多变量预测模型的透明报告 (TRIPOD) 声明和预测模型偏倚风险评估工具 (PROBAST) 均已发布,以改进对诊断和预后的预测模型研究的报告和批判性评价。本文介绍了用于开发 TRIPOD 声明扩展 (TRIPOD-人工智能,AI) 和 PROBAST (PROBAST-AI) 工具的过程和方法,用于应用机器学习技术的预测模型研究。 方法与分析 TRIPOD-AI 和 PROBAST-AI 将按照 EQUATOR 网络发布的指导进行开发,包括五个阶段。第 1 阶段将包括两项系统评价(涵盖所有医学领域,特别是肿瘤学),以检查已发表的基于机器学习的预测模型研究中的报告质量。在第 2 阶段,我们将使用德尔菲法咨询不同的关键利益相关者群体,以确定要考虑纳入 TRIPOD-AI 和 PROBAST-AI 的项目。第 3 阶段将以虚拟共识会议的形式整合和确定 TRIPOD-AI 和 PROBAST-AI 中要包含的关键项目的优先顺序。第 4 阶段将涉及开发 TRIPOD-AI 清单和 PROBAST-AI 工具,并撰写随附的解释和阐述论文。在最后阶段,即第 5 阶段,我们将通过期刊、会议、博客、网站(包括 TRIPOD、PROBAST 和 EQUATOR 网络)和社交媒体传播 TRIPOD-AI 和 PROBAST-AI。TRIPOD-AI 将为从事基于机器学习的预测模型研究的研究人员提供报告指南,帮助他们报告读者评估研究质量和解释其结果所需的关键细节,从而减少研究浪费。我们预计 PROBAST-AI 将帮助研究人员、临床医生、系统评价者和政策制定者通过强大的标准化偏见评估工具,批判性地评估基于机器学习的预测模型研究的设计、实施和分析。
前言 COSMIN 偏倚风险工具用于评估可靠性和测量误差研究的质量,旨在透明、系统地评估所有类型结果测量工具的可靠性和测量误差研究的方法学质量。它是 COSMIN 偏倚风险检查表的扩展版本,用于 PROM 的可靠性和测量误差框 (1)。它是为临床医生报告的结果测量 (ClinROM)(包括例如基于成像模式的读数和基于观察的评级)、基于绩效的结果测量工具 (PerFOM) 或生物标志物(也称为实验室值)而开发的 (2, 3)。这些测量工具比 PROM 更复杂,因为不仅涉及患者,还涉及专业人员,有时还涉及(复杂)设备。具体来说,在可靠性和测量误差研究中,这些额外的变异源使这些研究的设计变得复杂,并可能影响其质量。由于不同的变异源可能发挥作用,因此可以进行不同的研究来评估结果测量工具的可靠性或测量误差。为了评估此类研究的质量,应该了解(1)已发表的关于可靠性或测量误差的研究结果如何告诉我们所研究结果测量工具的可靠性和测量误差,以及(2)我们是否可以通过评估 r 来信任研究中发现的结果。