心脏病仍然是全球死亡的主要原因之一,是全球健康问题的重大因素。早期发现和准确预测心脏病可以带来更好的临床决策和可能挽救生命的干预措施。在过去十年左右的时间里,医疗保健领域的人们对机器学习应用产生了浓厚的兴趣,以解决数据分析和难以发现的数据模式,并有效地将其用于诊断和治疗决策。通过机器学习算法分析特定疾病的关键风险因素,包括年龄、胆固醇水平、血压和与心脏病相关的其他临床特征,对于预测特定个体是否患有疾病至关重要。机器学习模型包括最传统的模型,如逻辑回归、决策树、支持向量机,以及最新的模型,如神经网络、集成方法,包括随机森林和梯度提升,它们代表了构建预测模型的各种方法。可以使用历史数据训练模型,以了解心脏病的临床特征与结果之间的关系。然而,它们的性能会因数据集特征、特征选择和模型超参数等多个参数而变化。这项研究工作比较了几种机器学习算法的性能,以确定心脏病预测的最佳模型。每种算法的性能都使用常规指标来衡量,例如准确度、精确度、召回率、F1 分数和受试者工作特征曲线下面积或 AUC-ROC。此外,这项研究利用前期工作得出了一些心脏病预测模型常用的特征和算法。因此,它为选择模型和特征工程提供了基于文献的基础。目标是通过将先前研究的结果与实证分析相结合,确定在预测准确性、计算效率和可解释性方面最能平衡实际应用的算法。这项研究的结果可能有助于了解哪些算法最适合心脏病预测,指导医疗保健从业者和研究人员选择合适的模型进行临床部署。因此,它为机器学习在医疗保健中的作用(特别是在心血管健康预测模型中的作用)的知识体系做出了贡献。
主要关键词