背景:急性肺栓塞 (PE) 是一种危急的医疗紧急情况,需要及时识别和干预。准确预测早期死亡率对于识别出现不良后果风险较高的患者并实施适当的治疗至关重要。机器学习 (ML) 算法有望提高 PE 患者早期死亡率预测的准确性。目标:利用临床和实验室变量设计一种用于预测 PE 患者早期死亡率的 ML 算法。方法:本研究利用多种过采样技术来提高各种机器学习模型(包括 ANN、SVM、DT、RF 和 AdaBoost)在早期死亡率预测方面的性能。根据算法特征和数据集属性为每个模型选择合适的过采样方法。预测变量包括四项实验室测试、八个生理时间序列指标和两个一般描述符。评估使用了准确度、F1_score、精确度、召回率、曲线下面积 (AUC) 和接收者操作特性 (ROC) 曲线等指标,全面展示了模型的预测能力。结果:研究结果表明,在评估的五个模型中,具有随机过采样的 RF 模型表现出优异的性能,在预测死亡类别时实现了较高的准确度和精确度以及较高的召回率。过采样方法有效地均衡了类别之间的样本分布,并提高了模型的性能。结论:建议的 ML 技术可以有效预测急性 PE 患者的死亡率。具有随机过采样的 RF 模型可以帮助医疗保健专业人员就急性 PE 患者的治疗做出明智的决定。该研究强调了过采样方法在管理不平衡数据方面的重要性,并强调了 ML 算法在改进 PE 患者早期死亡率预测方面的潜力。
主要关键词