关于深度学习模型(机器学习的一个高级子领域,以神经网络为特征)。9 虽然本综述确定了该领域的 20,000 多项研究,但其中只有不到 1% 的研究具有足够高质量的设计和报告,可以纳入荟萃分析。需要清晰透明地报告适合人工智能研究的方法和结果。如果没有这一点,读者就无法判断报告的结果在潜在偏见来源的背景下是否合理,以及此类研究的结果在多大程度上可重复和可推广。随着报告指南的引入,例如《综合试验报告标准》(CONSORT)10 和《系统评价和荟萃分析的首选报告项目》11,医学文献中报告的完整性得到了实质性改善。在诊断领域应用类似的报告标准更具挑战性,没有一个标准适用于所有诊断模型。诊断准确性研究报告标准 12 指南仅涉及单项测试评估的准确性研究,而多变量诊断概率函数则最好通过透明报告个体预后或诊断的多变量预测模型 (TRIPOD) 来解决。13 随着人工智能在医学领域的兴起,来自其他领域、具有不同研究背景和出版文化的研究人员进入了医学领域。虽然医学界已经习惯于遵守商定的国际报告标准,但在统计学、数学或计算科学等其他领域,这一点似乎并不那么突出。眼科一直是人工智能健康革命的领导者,尤其关注能够根据成像执行诊断或分级任务的算法的生成。因此,眼科健康已成为人工智能领域创新的试验台,并提供了丰富的案例来源,以说明机器学习算法在医学应用中的潜力,以及此类研究的设计和报告方面的缺陷。应报告的关键信息包括:技术规格(例如,使用了哪种光学相干断层扫描 [OCT] 设备);背景研究环境和队列信息(例如,资格/选择标准、人口统计、临床环境、时间段、地理位置、入组方式、患者流量、缺失数据);以及数据处理方式(例如,文件图像增强、裁剪、存储文件格式)。14 值得注意的是,ML 模型具有其他技术方面,但目前的报告指南尚未全面解决这些方面。作为回应,对几个报告的扩展
主要关键词