Loading...
机构名称:
¥ 1.0

背景:医疗保健中的预测算法的采用带来了算法偏见的潜力,这可能会加剧现有差异。公平指标来衡量算法偏见,但是它们在现实世界任务中的应用是有限的。目的:本研究旨在评估与常见的30天医院再入院模型相关的算法偏见,并评估所选公平度量标准的有用性和解释性。方法:我们在这项回顾性研究中使用了2016年至2019年从马里兰州和佛罗里达州的1060万名成人住院排放。评估了预测30天医院再入院的模型:蕾丝指数,改良的医院评分和改良的Medicare&Medicaid服务中心(CMS)再入院措施,这些措施已应用于AS-IS(使用现有系数)并重新校准(用50%的数据重新校准)。对黑人和白人种群以及低收入和其他收入组之间的所有人的预测性能和偏差度量进行了评估。偏差度量包括假阴性率(FNR),假阳性率(FPR),0-1损失和广义熵指数的均等。以FNR代表的种族偏见和FPR差异进行了分层,以探索不同人群中算法偏见的变化。结果:再训练CMS模型证明了最佳的预测性能(曲线下的面积:马里兰州0.74,佛罗里达州0.68-0.70),改良的医院分数表现出最佳的校准(Brier得分:0.16-0.19在马里兰州,佛罗里达州0.19-0.21)。结论:在解释公平措施的面值时必须谨慎。校准在白色(与黑色)人群和其他收入(与低收入)组相比的校准更好,并且曲线下的面积在黑色(与白色)种群中更高或相似。培训CMS和改良的医院评分在马里兰州的种族和收入偏见最低。在佛罗里达州,这两种模式总体上的收入偏见最低,改良的医院评分表现出最低的种族偏见。在两个州,白人和高收入的人群均显示出更高的FNR,而黑人和低收入人群则导致FPR较高和更高的0-1损失。当通过医院和人口组成进行分层时,这些模型在不同的情况和人群中表现出异质算法偏见。更高的FNR或FPR可能会反映错过的机会或浪费资源,但是这些措施也可以反映医疗保健的使用模式和护理差距。仅仅依靠偏见的统计概念可能掩盖或低估了健康差异的原因。必须仔细考虑不完美的健康数据,分析框架和基础卫生系统。公平措施可以作为检测不同模型性能的有用常规评估,但不足以为机制或政策变化提供信息。但是,这种评估是朝着数据驱动的改进以解决现有健康差异的重要第一步。

评估30天医院再入院模型中的算法偏见:回顾性分析

评估30天医院再入院模型中的算法偏见:回顾性分析PDF文件第1页

评估30天医院再入院模型中的算法偏见:回顾性分析PDF文件第2页

评估30天医院再入院模型中的算法偏见:回顾性分析PDF文件第3页

评估30天医院再入院模型中的算法偏见:回顾性分析PDF文件第4页

评估30天医院再入院模型中的算法偏见:回顾性分析PDF文件第5页

相关文件推荐

1900 年
¥4.0