图7描述了逻辑回归(LOGR)的混淆矩阵。混乱矩阵揭示了2086个真实的负面实例,2172个真实的积极实例,255个假阳性实例和152个假阴性实例。图8显示了SVM的混淆矩阵。混乱矩阵揭示了2105个真实的负面实例,2149个真实的积极实例,236个假阳性实例和175个假阴性实例。图9描述了幼稚贝叶斯(NB)的混淆矩阵。混乱矩阵揭示了2124个真实的负面实例,2019年真实的积极实例,217个假阳性实例和305个假阴性实例。图10给出了KNN的混淆矩阵。混乱矩阵揭示了345个真实的负面实例,2321个真实的积极实例,1996年的假积极实例和3个假阴性实例。
图形生成模型由于其在各种应用中的出色表现而越来越多。但是,随着它们的应用的上升,尤其是在高风险的决策情况下 - iOS,对他们的公平性的担忧正在加剧社区内。现有的基于图的生成模型主要集中于合成少数族裔节点,以增强节点分类性能。但是,通过忽略节点生成过程,该策略可能会加剧不同亚组之间的反映差异,从而进一步损害了模型的公平性。此外,现有的过采样方法通过从相应的子组中选择实例来生成样本,从而有可能由于其代表性不足而在这些亚组中过度贴合。此外,它们无法解释亚组之间边缘分布中固有的不平衡,因此在生成图形结构时引入结构偏见。为了应对这些挑战,本文阐明了现有的基于图的采样技术可以扩大现实世界中的偏见,并提出了一种新颖的框架,公平的图形合成少数族裔过度采样技术(FG-Smote),旨在在代表不同的子组方面取得公平的平衡。具体来说,FG-Smote首先从节点repentations中删除子组信息的可识别性。随后,通过从这些亚组中的脱敏节点表示中采样来生成模拟节点的嵌入。最后,采用公平链接预测器来生成图形结构信息。在三个真实图数据集上进行的广泛实验评估表明,FG-Sote在公平性上优于最先进的基线,同时还保持了竞争性的预测性能。
摘要:这项研究旨在通过整合综合少数群体过度采样技术(SMOTE)-TOMEK技术来开发一种健壮的糖尿病分类方法,用于数据平衡并使我们以极端梯度增强(XGB)为导致的机器学习合奏作为元学习者。我们提出了一个集成模型,该模型将深度学习技术(例如双向长期记忆(Bilstm)和双向门控复发单元(BIGRU)与XGB分类器作为基础学习者。使用的数据包括PIMA印第安人糖尿病和伊拉克社会糖尿病数据集,这些数据集是通过缺少价值处理,重复,归一化以及Smote-Tomek在解决数据失衡方面处理的。XGB作为元学习者,通过降低偏差和方差成功地提高了模型的预测能力,从而导致了更准确,更健壮的分类。所提出的合奏模型可在所有测试的数据集上达到完美的精度,精度,召回,特异性和F1分数为100%。此方法表明,将集成学习技术与严格的预处理方法结合在一起可以显着改善糖尿病分类性能。
摘要:中风是大脑血液供应突然中断,影响一条或多条滋养大脑的血管。这会导致大脑供氧紊乱或不足,从而导致脑细胞损伤或受损。在某些情况下,确定中风的时间和严重程度可能具有挑战性。本研究提出了一种基于人工智能的 EMS(ElasticNet - MLP - SMOTE)模型,具体利用两种机器学习算法,即 Elastic Net 和多层感知器 (MLP),并使用合成少数过采样技术 (SMOTE)。Elastic Net 算法用于特征选择以识别关键特征,然后使用 MLP 算法进行预测。使用 Elastic Net 算法是因为它结合了 L 2 和 L 1 正则化,在辨别影响模型性能的特征方面提供了良好的结果。使用 MLP 算法是因为它依赖于深度学习技术,在这种情况下产生了有希望的结果。该算法从包含与中风相关的基本特征的综合数据集中对数据进行分类。SMOTE 用于提高模型的性能。值得注意的是,之前没有研究将这三种技术(Elastic Net – MLP – SMOTE)结合在一起。EMS 的预测准确率达到 95%,MSE = 0.05。该模型有助于根据患者的历史数据预测中风的发生,从而缓解这种严重疾病的突然发作。