摘要:骨髓是许多与血液相关疾病的来源,例如血液癌和骨髓移植(BMT),也称为造血干细胞移植(HSCT),是一种挽救生命的手术程序。但是,这种治疗与死亡率高有关。因此,预测BMT后的生存对于有效而准确的治疗至关重要。BMT被认为是由于几个主要的死亡原因(例如感染,毒性和移植物抗宿主病(GVHD))引起的与治疗相关的死亡率。此外,几个危险因素会影响BMT和治疗后的长期生存的成功。因此,需要基于机器学习技术的预测系统,该技术可以预测患者是否在BMT之后生存,这绝对可以帮助医生在为患者进行手术之前做出正确的决定。在本文中,使用了加利福尼亚大学Irvine ML存储库(UCI ML存储库)的公开可用的BMT数据集,研究了不同的机器学习模型,以预测经过BMT治疗的儿童的生存状况。尤其是随机森林(RF),包装分类器,极端梯度提升(XGBOOST),自适应增强(Adaboost),决策树(DT),梯度提升(GB)和K-Nearest Neighbors(KNN)在给定的数据集上进行了培训。数据集在应用一系列预处理步骤并根据相关热图上删除多重共线性特征后,由45个变量组成。RF,Adaboost,GB和Baging技术的最佳准确度达到97.37%。然后,应用了功能工程和建模步骤来识别最重要的功能,然后使用机器学习模型来简化整体分类过程。重要的是要注意,DT和GB获得的最重要特征分别最适合训练包装分类器和KNN模型。除此之外,还将使用网格搜索交叉验证(GSCV)优化了两种方法,以提高生存预测的准确性。
主要关键词