抽象的机器学习在我们生活的许多方面越来越重要,随着技术的发展,包括预测天气,弄清社交媒体趋势以及预测世界市场价格的价格。这种重要性调用了对有效预测模型的需求,这些模型可以轻松处理复杂的数据并提供最大的准确结果。XGBoost和随机森林是用于解决已进化并证明是可靠的机器学习挑战求解器的回归和分类问题的可升级合奏技术。在本研究论文中,我们全面分析和比较了这两种突出的机器学习算法。研究的前半部分包括对技术的意义和两种算法的演变的相关概述。这项研究的后半部分涉及随机森林和XGBoost之间的细致比较分析,仔细检查的方面,例如时间复杂性,精度和可靠性。我们研究了他们在处理回归和分类问题的独特方法,同时密切研究了他们对培训和测试数据集的微妙处理。使用各种性能指标(例如F1得分,召回,精度,平均平方误差等)进行了彻底的定量评估。
糖尿病(DM)是一项全球健康挑战,需要一种创新的早期检测方法和有效管理的方法。本研究旨在比较糖尿病类型分类中的随机森林和XGBoost算法,并使用可解释的AI(XAI)技术(例如Shap和Lime)来增加模型的解释。该研究方法包括一个公共数据集处理,其中包含70,000个条目,具有34个医疗功能,使用优化参数和解释分析的培训模型。结果表明,XGBoost具有较高的准确性(90.6%),概括良好,而随机森林的训练时间效率较高。分析识别主要因素的特征,例如年龄,血糖水平和在怀孕期间的体重增加而影响预测。这一发现提供了支持医疗决策的准确透明模型指南。
©作者2024。Open Access本文是根据Creative Commons Attribution 4.0 International许可获得许可的,该许可允许以任何媒介或格式使用,共享,适应,分发和复制,只要您对原始作者和来源提供适当的信誉,请提供与创意共享许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在伴侣的信用额度中另有说明。如果本文的创意共享许可中未包含材料,并且您的预期用途不受法定法规的允许或超过允许的用途,则您需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问http:// creativecommons.org/licenses/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdo- main/Zero/Zero/1.0/)适用于本文提供的数据,除非在信用额度中另有说明。
提交日期:2024年1月23日,审查日期:2024年1月26日修订日期:2024年1月27日接受日期:2024年1月29日,抽象糖尿病是一种可以攻击任何人的疾病,这种疾病发生,因为人体中糖含量过多。因此,需要预防糖尿病,以便可以尽早采取预防措施。在这项研究中,将使用随机森林算法,支持向量分类和XGBoost进行分类过程。本研究将使用一个数据集,该数据集由768个总数据组成,其分布非糖尿病数据为500,糖尿病数据的分布为268。对于测试后的分类结果,结果是,使用随机森林获得的分类为79.22%,使用使用支持矢量分类的测试精度获得了76.62%的测试精度,使用XGBoost的测试准确度使用逻辑回归的测试精度为79.22%的测试准确度为80.52%。使用逻辑回归算法时,获得最佳分类值,即精度为79.00%,召回77.00%,F1得分为78.00%。
1,2 印度拉杰果德马尔瓦迪大学 摘要:科学技术对医疗行业的巨大影响导致了大量数据的收集。由于数据的大量积累,医生发现在早期识别或预测患者是否患有疾病变得更加复杂。幸运的是,监督机器学习算法的进步在收集数据的处理中展示了巨大的影响,并帮助医务人员快速准确地预测高风险疾病的早期存在。这不仅有助于预防疾病的传播,还可以节省患者可能产生的巨额医疗费用。本文旨在评估疾病检测中的多种监督机器学习模型,并通过性能基准对其进行分析。主要讨论的监督学习算法是 K-最近邻 (KNN)、决策树 (DT)、朴素贝叶斯 (NB)、随机森林、XGBoost、CNN、DNN。XGBoost 在预测心脏病和糖尿病方面表现出色。 XGBoost 预测糖尿病和心脏病的精度,卷积神经网络 (CNN) 预测脑肿瘤的精度。
在金融领域,信用风险是与抵押,信用卡和其他类型贷款有关的常见现象。总是有可能借款人不会全额偿还贷款。与贷款申请有关的风险评估是贷款机构在残酷市场和盈利能力中生存的主要问题。贷款机构每天从消费者那里收到许多贷款申请,但并非所有这些贷款都得到了批准。这些机构使用各种技术来评估申请人的信息,以便做出最佳选择。尽管如此,许多人未能每年支付贷款。贷方必须处理这种巨大损失[1]。人工智能技术可以实现深度挖掘和分析大数据,以应对金融技术带来的财务风险和挑战。与传统专家评级的缺点相比,用于预测银行信用贷款违约的机器学习模型表现更好[2]。人工智能可以利用大数据和机器学习技术来分析借款人的个人信息,信用记录和其他相关数据,从而帮助银行和其他金融机构评估信贷风险并做出更准确的贷款决策。作为一种新兴技术,人工智能无疑将成为金融业发展的巨大推动力。它将降低客户贷款的违约率,并使银行的资本流程过去正常,银行和其他金融机构经常使用人工分析来确定客户的信用。基于以前的数据,人工信用分析是一种效率低下且耗时的方法。它无法处理大量数据,例如机器学习。同时,人工信用分析的准确性远低于机器学习的准确性。机器学习可以发展更多自动化
摘要。在机器学习研究中,多层感知器 (MLP) 算法在提高心脏病诊断的准确性和有效性方面起着关键作用。本文提出了一种心脏病预测方法,包括基于 RReliefF 的特征重要性评估,然后提出基于 MLP 的特征分类方法,该分类方法基于重要性得分分为三组。该研究采用三个前馈神经网络对聚类组进行有效分类。此外,集成方法利用 XGBoost 集成分类,利用增强集成学习来增强 FNN 模型输出的整体分类。通过将克利夫兰数据集划分为 70% 的训练集和 30% 的测试集,创建独立的数据集,将 MLP 输出合并到 XGBoost 模型中可获得令人满意的测试性能。混淆矩阵展示了准确的分类,准确率为 96.67%,灵敏度为 95.92%,精度为 97.92%。F1 得分为 96.91%,验证了该模型在精度和召回率方面的平衡性能。这项研究证明了整合数据处理、特征工程和集成学习技术对心血管疾病预测的有效性,为医疗保健应用提供了可靠有效的方法。
摘要:这项研究旨在通过整合综合少数群体过度采样技术(SMOTE)-TOMEK技术来开发一种健壮的糖尿病分类方法,用于数据平衡并使我们以极端梯度增强(XGB)为导致的机器学习合奏作为元学习者。我们提出了一个集成模型,该模型将深度学习技术(例如双向长期记忆(Bilstm)和双向门控复发单元(BIGRU)与XGB分类器作为基础学习者。使用的数据包括PIMA印第安人糖尿病和伊拉克社会糖尿病数据集,这些数据集是通过缺少价值处理,重复,归一化以及Smote-Tomek在解决数据失衡方面处理的。XGB作为元学习者,通过降低偏差和方差成功地提高了模型的预测能力,从而导致了更准确,更健壮的分类。所提出的合奏模型可在所有测试的数据集上达到完美的精度,精度,召回,特异性和F1分数为100%。此方法表明,将集成学习技术与严格的预处理方法结合在一起可以显着改善糖尿病分类性能。
抽象糖尿病是一种慢性疾病,其特征是血糖水平升高,导致器官功能障碍和过早死亡的风险增加。糖尿病的全球患病率一直在上升,需要进行准确,及时的诊断才能实现最有效的管理。机器学习领域的最新进展为改善糖尿病检测和管理开辟了新的可能性。在这项研究中,我们提出了一个微调的XGBoost模型,用于糖尿病检测。我们使用PIMA印度糖尿病数据集,并随机搜索超参数调整。将微调的XGBoost模型与其他六个流行的机器学习模型进行了比较,并在准确性,精度,灵敏度和F1得分方面取得了最高的性能。这项研究证明了微型XGBoost模型是糖尿病检测的强大而有效的工具的潜力。这项研究的见解可以提高医学诊断,以实现对糖尿病的有效和个性化管理。
超宽带(UWB)基于位置的服务中的视力(NLOS)识别技术准确的非线识别技术对于无人机通信和自动导航等应用至关重要。然而,使用二进制分类(LOS/NLOS)的当前方法过多地简化了现实世界中的复杂性,具有有限的概括和对变化室内环境的适应性,从而降低了定位的准确性。本研究提出了一个极端的梯度提升(XGBOOST)模型,以识别多级NLOS条件。我们使用网格搜索和遗传算法优化模型。最初,网格搜索方法用于确定整数超参数的最有利值。为了实现优化的模型配置,遗传算法用于微调浮点高参数。模型评估利用了使用Qorvo DW1000 UWB设备获得的广泛的现实测量数据集,涵盖了各种室内场景。实验结果表明,我们提出的XGBoost在开源数据集中达到了99.47%的最高总体准确度,精度为99%,召回99%,F-SCORE为99%。此外,基于本地数据集,该模型的性能最高,精度为96%,精度为96%,召回97%,F评分为97%。与文献中当前的机器学习方法相反,该建议模型提高了分类精度,并有效地解决了NLOS/LOS识别作为多类传播通道。这种方法提供了一种强大的解决方案,具有在各种数据集类型和环境中的概括和适应性,以提供更可靠,准确的室内定位技术。