摘要:中风是大脑血液供应突然中断,影响一条或多条滋养大脑的血管。这会导致大脑供氧紊乱或不足,从而导致脑细胞损伤或受损。在某些情况下,确定中风的时间和严重程度可能具有挑战性。本研究提出了一种基于人工智能的 EMS(ElasticNet - MLP - SMOTE)模型,具体利用两种机器学习算法,即 Elastic Net 和多层感知器 (MLP),并使用合成少数过采样技术 (SMOTE)。Elastic Net 算法用于特征选择以识别关键特征,然后使用 MLP 算法进行预测。使用 Elastic Net 算法是因为它结合了 L 2 和 L 1 正则化,在辨别影响模型性能的特征方面提供了良好的结果。使用 MLP 算法是因为它依赖于深度学习技术,在这种情况下产生了有希望的结果。该算法从包含与中风相关的基本特征的综合数据集中对数据进行分类。SMOTE 用于提高模型的性能。值得注意的是,之前没有研究将这三种技术(Elastic Net – MLP – SMOTE)结合在一起。EMS 的预测准确率达到 95%,MSE = 0.05。该模型有助于根据患者的历史数据预测中风的发生,从而缓解这种严重疾病的突然发作。
图7描述了逻辑回归(LOGR)的混淆矩阵。混乱矩阵揭示了2086个真实的负面实例,2172个真实的积极实例,255个假阳性实例和152个假阴性实例。图8显示了SVM的混淆矩阵。混乱矩阵揭示了2105个真实的负面实例,2149个真实的积极实例,236个假阳性实例和175个假阴性实例。图9描述了幼稚贝叶斯(NB)的混淆矩阵。混乱矩阵揭示了2124个真实的负面实例,2019年真实的积极实例,217个假阳性实例和305个假阴性实例。图10给出了KNN的混淆矩阵。混乱矩阵揭示了345个真实的负面实例,2321个真实的积极实例,1996年的假积极实例和3个假阴性实例。
摘要。确保获得安全饮用水是一个基本的公共卫生优先事项。评估水质的传统方法是劳动力密集的,需要专门的设备,这对于连续监测可能是不可行的。本研究探讨了基于各种化学特性的机器学习模型来预测浸水性。具体来说,我们在存在阶级不平衡的情况下评估了逻辑回归和随机森林模型的性能,这是环境数据集中常见的问题。为了减轻这种情况,我们应用了合成的少数群体过采样技术(SMOTE)。我们的结果表明,在应用SMOTE之前,这两种模型均对多数类(非替代水)表现出很大的偏见,其精度为69.36%,Roc-AUC的准确性为0.63。然而,Smote的应用显着提高了该模型鉴定饮用水样品的能力,尤其是对于随机森林模型,该模型的准确度为67.07%,而Roc-auc的精度为0.64。相比之下,逻辑回归模型显示了SMOTE后的性能下降,这表明需要进一步优化或替代方法。本研究强调了解决机器学习任务中类不平衡的重要性,尤其是对于水质评估等关键应用程序。我们的发现表明,随机森林模型与Smote相结合,为预测浸水性提供了强大的解决方案。这些见解可以帮助环境科学家和公共卫生官员实施更高效,更准确的水质监测系统。未来的研究应探索更广泛的模型和高级技术,以进一步提高预测准确性。
大脑中风是普遍死亡的第二大大量原因,在过去几年中一直是公共卫生的主要关注。借助机器学习技术,可以访问各种冲程警报的早期检测,这可以有效防止或减少中风。医学数据集在其类标签上经常不平衡,倾向于预测少数群体的趋势。在本文中,研究了中风的潜在危险因素。此外,还采用了四种独特的方法来改善中风数据集中少数群体的分类,这是合成重量投票分类器,合成的少数群体过度采样技术(SMOTE),主要组成部分分析,具有K-Means聚类(PCA-KMEANS)的主要成分分析(PCA-KMEANS),局灶性损失,与深度神经网络(COMPAL SERVANCY)(COMPAR)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)。通过分析结果,具有DNN-局灶性损失的Smote和PCA-KMEANS最适合有限的大型严重不平衡数据集(例如,中风数据集),这是2-4倍以优于Kaggle的工作。关键字:不平衡数据集,中风预测,集合权重投票分类器,Smote,dnn的焦点损失,PCA-KMEANS
糖尿病预测是一个正在进行的研究主题,医学专家试图以更高的精度预测病情。糖尿病通常保持昏昏欲睡,并且有机会确定患者患有另一种疾病,例如对肾脏的伤害,眼睛的视网膜问题或心脏病问题,它会导致代谢问题和体内各种复杂性。在本评论中应用了各种全球学习程序,包括投票,支持和解雇。使用工程设计的少数族裔过采样程序(被摧毁)以及K跨层互批批准方法,用于实现夜晚的上课并批准发现。PIMA印度糖尿病(PID)数据集是从UCI机器学习(UCI ML)商店中积累的,并选择了此数据集。一种突出的工程技术用于计算生活方式因素的影响。已经开发了一种两相分类模型,以使用顺序最小优化(SMO)和SMOTE方法一起预测胰岛素抵抗。SMOTE技术用于在模型的第一阶段中预处理数据,而SMO类则在第二阶段使用。所有其他分类技术的表现都超过了决策树的错误率,准确性,特异性,精度,召回,F1措施和ROC曲线。使用组合的SMOTE和SMO策略进行了模型,该策略以0.1 ms的运行时获得了99.07%的校正。建议的系统的结果是提高分类器在早期发现疾病方面的表现。
准时毕业对于学术成功,影响时间,成本和教育质量至关重要。Hang Tuah University Pekanbaru(UHTP)目前正在努力实现其准时毕业率75%的目标。这项研究介绍了一种使用机器学习技术的创新方法,尤其是与堆叠机器学习Optuna Smote(SMLOS)的合奏学习,以解决此问题。我们的主要目标是提高数据分类精度,以有效地预测学生毕业时间。我们采用算法,例如K-Nearest邻居(KNN),支持向量机(SVM),决策树(C4.5),随机森林(RF)和Naive Bayes(NB)。这些与元模型结合使用,包括逻辑回归(LR),Adaboost,XGBoost,LR+Adaboost和LR+XGBoost,以创建一个强大的预测模型。为了解决阶级失衡,我们应用了合成少数族裔超采样技术(SMOTE),并利用Optuna进行超参数调整。调查结果表明,使用Adaboost Meta模型的Smlos达到了95.50%的最高精度,超过了以前的模型的性能,平均含量约为85%。这种贡献证明了将SMOTE用于类不平衡和Optuna进行超参数优化的有效性。将此模型整合到UHTP的学术信息系统中,促进了对学生数据的实时监控和分析,为通过更准确的学生绩效预测提供了一种新颖的解决方案来促进智能校园。此技术不仅有益于预测学生毕业,还可以应用于各种机器学习任务以提高数据分类的准确性和稳定性。
信用卡欺诈和Kaggle欺诈性信用卡交易数据集恶意软件和恶意事件机器学习框架用于信用卡欺诈检测和恶意的事件检测功能缩放,使用可靠的Scaleer合成少数民族过度采样技术(SMIMOTE)来减轻数据不平衡决策树•第8周:在线学习广告范围,并在线学习广告范围,并进行在线广告封锁,程序bilary Blociary Blassing,以及
摘要 为了提高学生成绩,许多大学使用机器学习来分析和评估他们的数据,从而提高大学的教育质量。为了从追踪研究数据集中获得新的见解,即大学成绩与学生在商业和行业工作能力之间的相关性,作者将使用人工神经网络 (ANN) 开发一个基于追踪研究数据集预测学生成绩的模型。为了获得与标签相对应的属性,将使用 Phi 系数相关来选择具有高相关性的属性作为特征选择。作者还使用合成少数过采样技术 (SMOTE) 执行过采样方法,因为这个数据集是不平衡的,并使用 K 折交叉验证评估模型。根据 K 折交叉验证,结果表明 K = 3 的评估分数标准差较低,是分割数据集的最佳 K 候选者。所有分数评估(准确度、精确度、召回率和 F-1 分数)的平均标准差为 0.038。将 SMOTE 应用于不平衡数据集(数据分为 65 个训练数据和 35 个测试数据)后,准确率值从 0.77 提高到 0.87,提高了 10%。关键词:人工神经网络、不平衡数据集、K 折交叉验证、学生表现、追踪研究。引言
摘要 — 随着工业 4.0 的到来,数据科学和可解释人工智能 (XAI) 在最近的文献中引起了相当大的兴趣。然而,就计算机编码和必要的数学工具而言,进入 XAI 的门槛确实很高。对于钢板故障诊断,这项工作报告了一种将基于 XAI 的见解纳入数据科学开发高精度分类器过程的方法。使用合成少数过采样技术 (SMOTE) 和中心点概念,从 XAI 工具中获得见解。已经收获了 Ceteris Peribus 配置文件、部分依赖性和故障配置文件。此外,还从优化的随机森林和关联规则挖掘中提取了 IF-THEN 规则形式的见解。将所有见解整合到一个集成分类器中,已实现 94% 的 10 倍交叉验证性能。总而言之,这项工作做出了三个主要贡献,即::基于利用 medoids 和 SMOTE 的方法,收集见解并纳入模型开发过程。其次,这些见解本身就是贡献,因为它们使钢铁制造业的人类专家受益,第三,已经开发出高精度故障诊断分类器。
摘要背景本研究的目的是为下肢关节置换术后持续使用阿片类药物使用的预测模型,并确定集合学习和超采样技术是否可以改善模型性能。我们比较了各种预测模型,以识别持续的术后阿片类药物使用,使用各种术前,术中和术后数据,包括手术程序,患者人口统计学/特征,过去的手术病史,阿片类药物使用历史,使用历史,经历了,合并症,生活方式,生活方式,生活方式,Anthesia详细信息和邮政课程。评估了六个分类模型:逻辑回归,随机森林分类器,简单喂养神经网络,平衡的随机森林分类器,平衡的装袋分类器和支持向量分类器。表现。重复分层的k-折叠交叉验证是为了计算接收器操作特性曲线(AUC)下的F1分数和面积。结果有1042例患者接受了膝关节或髋关节置换术,其中242例(23.2%)报告了持续使用的阿片类药物。没有SMOTE,逻辑回归模型的F1得分为0.47,AUC为0.79。所有合奏方法的性能都更好,平衡的包装分类器的F1得分为0.80,AUC为0.94。SMOTE基于F1分数的所有模型的性能提高了。具体来说,平衡袋分类器的性能提高到F1分数为0.84,AUC为0.96。在平衡装袋模型中最重要的特征是术后第1天使用阿片类药物,体重指数,年龄,术前阿片类药物,出院时处方的阿片类药物和住院时间。结论集合学习可以极大地改善持续使用阿片类药物的预测模型。对高危患者的准确和早期鉴定可以在临床决策和通过个性化干预措施的早期优化中发挥作用。