Loading...
机构名称:
¥ 2.0

背景:全球约 7% 的人口患有先天性血红蛋白疾病,每年有超过 300,000 例 β-地中海贫血新病例。在低收入地区,诊断成本高昂且不准确,通常依赖于全血细胞计数 (CBC) 测试。本研究采用机器学习 (ML) 根据性别和 CBC 对 β-地中海贫血特征进行分类,探索对无症状携带者和非携带者进行分组的影响。方法:数据集包括来自斯里兰卡的 288 名疑似 β-地中海贫血患者。使用 11 个判别公式和 9 个 ML 模型对其进行分类。使用马哈拉诺比斯距离去除异常值,并使用合成少数过采样技术 (SMOTE) 和 SMOTE- 名义连续 (NC) 进行重采样。Mann-Whitney U 检验处理特征提取和类别分组。使用八个标准评估 ML 性能。结果:Ehsani 公式通过将沉默携带者和非携带者分组,实现了 0.66 的受试者工作特征曲线下面积 (ROC-AUC)。未进行特征提取的卷积神经网络 (CNN) 表现出更好的性能,准确率为 0.85、灵敏度为 0.8、特异性为 0.86,ROC-AUC 为 0.95/0.93(微观/宏观)。即使没有预处理,性能也能保持。结论:在使用性别和 CBC 特征对 β - 地中海贫血进行分类时,ML 模型优于经典判别公式。更大的数据集可以增强 ML 模型的泛化能力和特征提取的影响。将沉默携带者和非携带者分组可改善 ML 结果,尤其是在重新采样的情况下。就可用特征而言,沉默携带者与非携带者无法区分。

使用机器学习模型分析地中海贫血数据

使用机器学习模型分析地中海贫血数据PDF文件第1页

使用机器学习模型分析地中海贫血数据PDF文件第2页

使用机器学习模型分析地中海贫血数据PDF文件第3页

使用机器学习模型分析地中海贫血数据PDF文件第4页

使用机器学习模型分析地中海贫血数据PDF文件第5页

相关文件推荐

2021 年
¥1.0
2023 年
¥2.0
2022 年
¥6.0
2021 年
¥6.0
2024 年
¥1.0
2021 年
¥6.0