在本文中,我们使用复发性神经网络(RNN),该神经网络(RNN)结合了多个门控复发单元(GRUS),长期短期记忆(LSTM)和Adam Optimizer来开发用于心脏病预测的新的混合学习模型。该提出的模型的出色精度为98.6876%。该提出的模型是GRU和RNNS模型的混合体。该模型是在Python 3.7中开发的,通过整合与Keras和Tensorflow一起工作的多个GRU和RNN作为深度学习过程的后端,并得到各种Python库的支持。使用RNN的最新模型可实现98.23%的精度,而深神经网络(DNN)的精度达到了98.5%。由于神经网络的复杂设计,在神经网络模型中具有冗余性的大量神经元以及克利夫兰不平衡的数据集,现有模型的常见缺点是准确性较差。实验,结果表明,使用RNN的拟议模型和几个具有合成少数族裔过采样技术(SMOTE)的GRU达到了最高水平的性能。完成了。这是他使用Cleveland数据集的RNN最准确的结果,并且显示出对患者心脏病的早期预测的希望。
代码异味是指源代码中任何违反设计原则或实现的症状或异常。及早发现不良代码异味可以提高软件质量。如今,几种人工神经网络 (ANN) 模型已用于软件工程的不同主题:软件缺陷预测、软件漏洞检测和代码克隆检测。使用 ANN 模型时,无需了解数据来源,但需要大量训练集。数据不平衡是人工智能技术在检测代码异味方面面临的主要挑战。为了克服这些挑战,本研究的目标是基于一组 Java 项目,提出具有合成少数过采样技术 (SMOTE) 的深度卷积神经网络 (D-CNN) 模型来检测不良代码异味。我们考虑了四个代码异味数据集,即 God 类、数据类、特征嫉妒和长方法,并根据不同的性能指标对结果进行了比较。实验结果表明,所提出的具有过采样技术的模型可以为代码异味检测提供更好的性能,并且当使用更多数据集训练模型时,预测结果可以进一步改善。此外,更多的时期和隐藏层有助于提高模型的准确性。
摘要。Internet是设备的最常见连接工具,例如计算机,手机,智能手表等。这些设备与指定的服务器通信以提供信息。在这里,我们指的是连接众多称为物联网(IoT)的自动设备的系统。由于设备是不同类别的,有时很小,因此为有需要的人提供全面的安全性变得具有挑战性。但是,物联网上的传感器收集了大量数据,巨大的网络成为企业家的吸引力目标。对物联网的几项攻击之一是分发拒绝服务(DDOS)。机器学习可以在识别物联网中的这些攻击中起关键作用,因为它可以分析大量数据。机器学习模型可以学习合法的train tagre tagre模式,然后确定偏离学习模式的恶意数据包。分类技术可以根据与之相关的几个属性将恶意数据包与真正的数据包区分开。这项工作使用分类技术,例如随机森林,梯度提升和XGBoost来确定trail iC中的恶意数据包。分析表明,诸如Smote和Adasyn之类的平衡技术对于提高技术的性能至关重要。
摘要 - 随着网络犯罪的发展越来越多,智能网络入侵检测系统(NIDS)的存在在网络基础架构中是必不可少的。此外,还有许多挑战面临基于人工智能的NID设计,例如网络流量中的无关功能,罕见的恶意流量示例以及机器学习模型选择和模型的Mypermeters finetuning的努力。这项研究提出了与这些挑战有关的有效NID,以准确检测恶意行为。首先,一种并行混合特征选择方法过滤了最重要的功能。第二,为了解决数据不平衡,我们集成了一项合并的随机下采样策略和合成少数民族过采样技术 - 编辑了最近的邻居技术,以确保对少数派攻击的平衡表示。最后,堆叠的集合分类器包括通过自动化机器学习方法选择的四种最佳基本模型。使用CICIDS2017数据集(用于入侵检测研究的综合基准),我们的方法达到了令人印象深刻的99.76%的令人印象深刻的检测率,从而有效地识别了多数族裔和少数类别。索引术语 - 开为单位,异常检测器,最佳特征选择,不平衡数据集,SMOTE,集合分类器。
数据不平衡发生在许多现实世界应用领域,该领域旨在检测罕见但重要的情况。可以在信息技术领域[1,2]中找到它们;生物医学数据[3,4];工业应用[5];和财务杂志[6]。这种不平衡意味着学习算法很困难,因为它们会偏向最常见的(通常不太重要)的病例。要克服对大多数类示例的这种偏见,必须应用特定的机器学习算法。即使我们将搜索限制在近年来,列出与这些算法相关的所有相关作品也是很自命的(在过去3年中,Google Scholar中列出了6500多篇论文)。因此,我们更喜欢建议教程[7-9](以及其中的参考),向感兴趣的读者提供完整的概述。通常,解决不平衡的方法可以分为三类:1)数据级方法集中于修改训练集以使其适合标准学习算法。bal-ancing分布是 -
在社交媒体时代,情感分析对于理解公众舆论至关重要。本研究对社交媒体文本中情感分类的五种机器学习算法进行了比较分析:逻辑回归,支持向量机(SVM),随机森林,天真的贝叶斯和梯度增强。使用三个月内收集的100,000条推文的数据集,我们评估了这些算法在将情感分类为正,负或中性的表现。数据经过了广泛的预处理,包括使用SMOTE清洁,归一化和解决类不平衡。我们的结果表明,逻辑回归和SVM的总体准确性为86.22%,表明所有情感类别的表现都平衡。随机森林紧随其后的精度为82.59%,而幼稚的贝叶斯和梯度提升的表现较低,但仍然值得注意的性能分别为70.45%和69.96%。所有模型在分类负面情绪方面均表现出挑战,这表明了潜在的改进领域。该研究提供了对每种算法的优势和劣势的见解,为从业人员选择适当的情感分析任务的指导提供了指导。我们的发现有助于将机器学习应用于社交媒体交流的快速发展的景观中的复杂的情感分析任务。
本研究引入了一种创新的机器学习框架,以提高糖尿病预测准确性和模型可解释性。该方法首先通过链式方程 (MICE) 进行多次插补,以解决缺失数据并确保完整的数据集以供分析。为了解决类别不平衡问题,采用了合成少数过采样技术 (SMOTE)。使用 Z 分数异常值检测来去除异常值,进一步提高模型的稳健性。结合灰狼优化器 (GWO) 和方差分析的混合特征选择方法混合 GWAN 优化了相关特征的选择,平衡了预测能力和模型简单性。该框架的核心是自适应增强梯度增强机 (ADGB),这是一种融合了 AdaBoost 和梯度增强机 (GBM) 优势的集成学习模型。通过 Hyperband 算法进行超参数优化可以对模型进行微调,实现 97.84% 的高预测准确率。这种综合方法不仅提高了准确性,还提高了预测模型的精度、召回率和 F1 分数。通过整合这些先进技术,该框架在早期糖尿病诊断中展现出巨大潜力,强调了集成方法在医疗数据分析中的重要性以及开发可靠诊断工具的准确、可解释模型的必要性。关键词:灰狼优化器、梯度提升机、合成少数群体、公共健康 1. 介绍
摘要 脑卒中是一种脑部血液突然停止流动,脑细胞因缺氧和营养物质不足而死亡的疾病。脑卒中与主要与当今生活方式相关的风险因素有关,包括高“血糖水平、心脏病、肥胖和糖尿病”等代谢综合征。本研究使用机器学习算法开发了脑卒中预测模型:“逻辑回归 (LR)、随机森林 (RF) 和 K-最近邻 (KNN)”。上述研究所需的数据集来自 Harvard Dataverse 存储库。该数据集包含“临床、生理、行为、人口统计和历史数据”。在这方面,将通过采用过采样技术(包括“SMOTE、ADASYN 和 ROSE”)来处理类别不平衡问题。本文提出了一种新的混合机器学习模型,将 ADASYN 与随机森林相结合,称为 ADASYN-RF,其中 ADASYN 将对不平衡的数据集进行重新采样,然后将随机森林应用于重新采样的数据。此外,还采用了其他机器学习模型和过采样技术进行比较。令人惊讶的是,ADASYN-RF 模型能够达到本文提到的 99% 的最高检测准确率,证明了其在中风预测方面的有效性。因此,该方法为中风的临床诊断提供了一种廉价而精确的工具。
摘要 - 欺诈检测在现代银行业中起着至关重要的作用,旨在减轻影响个人和金融机构的财务损失。经常使用信用卡的人口中有很大一部分人口,提高财务包容性的努力导致了卡的使用量增加。此外,电子商务的兴起带来了信用卡欺诈事件的激增。不幸的是,用于识别信用卡欺诈的传统统计方法很耗时,可能无法提供准确的结果。因此,机器学习算法已被广泛采用,以进行有效的信用卡欺诈检测。本研究通过采用三种抽样策略来应对不平衡的信用卡数据集的挑战:基于集群的多数股票下采样技术(CCMUT),合成少数民族过度采样技术(SMOTE)和过度采样技术。然后使用训练数据集训练九种机器学习算法,包括随机森林(RF),K最近的邻居(KNN),决策树(DT),逻辑回归(LR),ADA-BOOST,ADA-BOOST,EXTREES,MLP,MLP分类器,天真的贝叶斯和梯度增强的Boosting Classifier。使用准确性,精度,召回,F1分数和F2分数等指标评估这些方法的性能。本研究中使用的数据集是从Kaggle数据存储库中获得的。
* Zheng,Shuaiqi是电子邮件,电子邮件:exirfaaq@outlook.com摘要:本文使用用于企业应用程序的生成性对抗网络(GAN)提出了一个新颖的实时财务欺诈检测框架。所提出的系统解决了欺诈检测中的关键挑战,包括类不平衡,实时处理要求和企业可伸缩性。实现了复杂的多层体系结构,该系统将高级预处理技术与优化的GAN模型集成了明确设计用于欺诈模式识别的模型。该框架结合了并行处理能力和自适应批处理处理机制,以保持高吞吐量,同时确保次秒延迟。实验评估使用了欧洲信用卡交易数据集的一部分,其中包括50,000笔交易,并通过战略抽样和SMOTE技术实现了平衡的表示。所提出的模型可实现97.8%的准确性,96.5%的精度和95.8%的回忆,与传统的机器学习方法相比,表现出竞争性能。实时性能分析显示出一致的低100ms延迟,同时在不同的负载条件下保持稳健的性能。该系统显示了最高32个节点的线性可伸缩性,具有高可用性和故障功能。全面评估验证了该框架在企业环境中的有效性,为面临不断发展的欺诈挑战的金融机构提供了实用的解决方案。这项研究通过创新的对抗性学习在欺诈检测中的创新应用有助于提高金融安全技术。