抽象背景是使用基于经验临床知识检索的风险因素建立了心血管疾病(CVD)的先前预测算法(CVD)。本研究试图在综合可变空间中识别预测因子,然后使用机器学习(ML)算法来开发新型的CVD风险预测模型。来自英国生物库的基于纵向人群的群体的方法,包括473 611 CVD的参与者,年龄在37至73岁之间。我们实施了基于ML的数据驱动管道,以从645个候选变量中识别预测变量,这些变量涵盖了一系列与健康相关的因素,并评估了多个ML分类器,以在10年事件CVD上建立风险预测模型。该模型通过剩余的中心交叉验证进行了验证。结果在12。2年的中位随访期间,31 466名参与者在基线访问后的10年内开发了CVD。建立了一种新型的UK Biobank CVD风险预测(UKCRP)模型,其中包括10个预测因子,包括年龄,性别,性别,胆固醇和血压药物,胆固醇比(总/高密度脂蛋白),收缩压血压,先前的心绞痛或心脏病或心脏病,心脏病或心脏病,药物的数量,药物的数量,cyptatin c,胸肌C,胸部疼痛和包装吸烟和吸烟。我们获得的模型满足了接收器操作特征曲线(AUC)下0.762±0.010的区分性能,该区域的表现超过了多个现有临床模型,并且在BRIER得分为0.057±0.006的情况下进行了很好的校准。此外,UKCRP可以获得心肌梗塞(AUC 0.774±0.011)和缺血性中风(AUC 0.730±0.020)的可比性,但出血性中风的性能较低(AUC 0.644±0.026)。结论基于ML的分类模型可以从潜在的高风险的CVD参与者中学习表达性表示,他们可能会从早期的临床决策中受益。
主要关键词