大脑中风是普遍死亡的第二大大量原因,在过去几年中一直是公共卫生的主要关注。借助机器学习技术,可以访问各种冲程警报的早期检测,这可以有效防止或减少中风。医学数据集在其类标签上经常不平衡,倾向于预测少数群体的趋势。在本文中,研究了中风的潜在危险因素。此外,还采用了四种独特的方法来改善中风数据集中少数群体的分类,这是合成重量投票分类器,合成的少数群体过度采样技术(SMOTE),主要组成部分分析,具有K-Means聚类(PCA-KMEANS)的主要成分分析(PCA-KMEANS),局灶性损失,与深度神经网络(COMPAL SERVANCY)(COMPAR)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)。通过分析结果,具有DNN-局灶性损失的Smote和PCA-KMEANS最适合有限的大型严重不平衡数据集(例如,中风数据集),这是2-4倍以优于Kaggle的工作。关键字:不平衡数据集,中风预测,集合权重投票分类器,Smote,dnn的焦点损失,PCA-KMEANS
主要关键词