Loading...
机构名称:
¥ 2.0

尽管机器学习算法对个性化医学有希望,但其临床采用仍然有限。导致这种限制的一个关键因素是样本选择偏见(SSB),它是指研究人群不太代表目标人群,从而导致偏见且潜在的有害决定。尽管在文献中众所周知,但SSB在医疗保健机器学习中几乎没有研究。此外,现有技术试图通过平衡研究和目标人群之间的分布来纠正偏见,这可能导致预测性能的丧失。为了解决这些问题,我们的研究通过检查SSB对机器学习算法的性能的影响来说明与SSB相关的潜在风险。最重要的是,我们根据目标人群识别而不是偏见校正提出了一个新的研究方向,以解决SSB。具体而言,我们提出了两个用于解决SSB的独立网络(T-NET)和一个多任务网络(MT-NET),其中一个网络/任务标识了代表研究人群的目标亚群,第二个网络/任务对已识别的亚种群进行了预测。与研究人群相比,SSB可以通过合成和半合成数据集的突出显示,SSB可以导致目标人群的算法的性能大幅下降,并且目标亚群的绩效差异很大,而目标亚群的绩效差异很大,而该目标亚群体代表了所选的患者和研究人群的非秘密患者。此外,我们提出的技术证明了各种环境的鲁棒性,包括不同的数据集大小,事件速率和选择率,表现优于现有的偏见校正技术。

医疗保健机器学习中的样本选择偏差

医疗保健机器学习中的样本选择偏差PDF文件第1页

医疗保健机器学习中的样本选择偏差PDF文件第2页

医疗保健机器学习中的样本选择偏差PDF文件第3页

医疗保健机器学习中的样本选择偏差PDF文件第4页

医疗保健机器学习中的样本选择偏差PDF文件第5页

相关文件推荐

2024 年
¥13.0
2024 年
¥1.0
1900 年
¥10.0
1900 年
¥3.0