摘要 脑卒中是一种脑部血液突然停止流动,脑细胞因缺氧和营养物质不足而死亡的疾病。脑卒中与主要与当今生活方式相关的风险因素有关,包括高“血糖水平、心脏病、肥胖和糖尿病”等代谢综合征。本研究使用机器学习算法开发了脑卒中预测模型:“逻辑回归 (LR)、随机森林 (RF) 和 K-最近邻 (KNN)”。上述研究所需的数据集来自 Harvard Dataverse 存储库。该数据集包含“临床、生理、行为、人口统计和历史数据”。在这方面,将通过采用过采样技术(包括“SMOTE、ADASYN 和 ROSE”)来处理类别不平衡问题。本文提出了一种新的混合机器学习模型,将 ADASYN 与随机森林相结合,称为 ADASYN-RF,其中 ADASYN 将对不平衡的数据集进行重新采样,然后将随机森林应用于重新采样的数据。此外,还采用了其他机器学习模型和过采样技术进行比较。令人惊讶的是,ADASYN-RF 模型能够达到本文提到的 99% 的最高检测准确率,证明了其在中风预测方面的有效性。因此,该方法为中风的临床诊断提供了一种廉价而精确的工具。
主要关键词