糖尿病(DM)是一项全球健康挑战,需要一种创新的早期检测方法和有效管理的方法。本研究旨在比较糖尿病类型分类中的随机森林和XGBoost算法,并使用可解释的AI(XAI)技术(例如Shap和Lime)来增加模型的解释。该研究方法包括一个公共数据集处理,其中包含70,000个条目,具有34个医疗功能,使用优化参数和解释分析的培训模型。结果表明,XGBoost具有较高的准确性(90.6%),概括良好,而随机森林的训练时间效率较高。分析识别主要因素的特征,例如年龄,血糖水平和在怀孕期间的体重增加而影响预测。这一发现提供了支持医疗决策的准确透明模型指南。
超宽带(UWB)基于位置的服务中的视力(NLOS)识别技术准确的非线识别技术对于无人机通信和自动导航等应用至关重要。然而,使用二进制分类(LOS/NLOS)的当前方法过多地简化了现实世界中的复杂性,具有有限的概括和对变化室内环境的适应性,从而降低了定位的准确性。本研究提出了一个极端的梯度提升(XGBOOST)模型,以识别多级NLOS条件。我们使用网格搜索和遗传算法优化模型。最初,网格搜索方法用于确定整数超参数的最有利值。为了实现优化的模型配置,遗传算法用于微调浮点高参数。模型评估利用了使用Qorvo DW1000 UWB设备获得的广泛的现实测量数据集,涵盖了各种室内场景。实验结果表明,我们提出的XGBoost在开源数据集中达到了99.47%的最高总体准确度,精度为99%,召回99%,F-SCORE为99%。此外,基于本地数据集,该模型的性能最高,精度为96%,精度为96%,召回97%,F评分为97%。与文献中当前的机器学习方法相反,该建议模型提高了分类精度,并有效地解决了NLOS/LOS识别作为多类传播通道。这种方法提供了一种强大的解决方案,具有在各种数据集类型和环境中的概括和适应性,以提供更可靠,准确的室内定位技术。
周围区域的独特地形会引起严重的风效应,这通常会影响飞行最后阶段的机尾。当风向在 110° 到 250° 之间且风速超过 15 节时,在进近和飞行到岩石背风处的最后阶段可能会出现严重湍流。这种湍流会使着陆变得危险或无法着陆,因此机长在这种情况下进近时应极其小心。水面上经常可以看到湍流和阵风,图表 B3 表示了湍流效应。超过 25 节的西南风可能导致在接近 27 号跑道时形成水龙卷。飞越或靠近这些水龙卷已被证明是非常危险的,会导致飞机迅速失去控制,机翼严重下垂,以及姿态、高度和航迹的非指令改变。空中交通管制将会报告从塔台看到的水龙卷,但机长应注意,这种现象可能在没有任何警告的情况下迅速出现。
锂离子 (Li-ion) 电池是现代电力系统不可或缺的部件,但其性能会随着时间的推移而下降。准确预测这些电池的剩余使用寿命 (RUL) 对确保电网的可靠高效运行至关重要。在此基础上,本文提出了一种新的 Coati 集成卷积神经网络 (CNN)-XGBoost 方法,用于锂离子电池的早期 RUL 预测。该方法采用 CNN 架构,通过图像处理技术自动从电池放电容量数据中提取特征。从 CNN 模型中提取的特征与基于电池充电策略信息从前 100 个电池测量循环数据中提取的另一组特征相连接。然后将这组组合的特征输入 XGBoost 模型进行早期 RUL 预测。此外,Coati 优化方法 (COM) 用于 CNN 超参数调整,以提高所提出的 RUL 预测方法的性能。数值结果揭示了所提出方法在预测锂离子电池 RUL 方面的有效性,其中 RMSE 和 MAPE 分别获得了 106 次循环和 7.5% 的值。
摘要:这项研究旨在通过整合综合少数群体过度采样技术(SMOTE)-TOMEK技术来开发一种健壮的糖尿病分类方法,用于数据平衡并使我们以极端梯度增强(XGB)为导致的机器学习合奏作为元学习者。我们提出了一个集成模型,该模型将深度学习技术(例如双向长期记忆(Bilstm)和双向门控复发单元(BIGRU)与XGB分类器作为基础学习者。使用的数据包括PIMA印第安人糖尿病和伊拉克社会糖尿病数据集,这些数据集是通过缺少价值处理,重复,归一化以及Smote-Tomek在解决数据失衡方面处理的。XGB作为元学习者,通过降低偏差和方差成功地提高了模型的预测能力,从而导致了更准确,更健壮的分类。所提出的合奏模型可在所有测试的数据集上达到完美的精度,精度,召回,特异性和F1分数为100%。此方法表明,将集成学习技术与严格的预处理方法结合在一起可以显着改善糖尿病分类性能。
摘要。在机器学习研究中,多层感知器 (MLP) 算法在提高心脏病诊断的准确性和有效性方面起着关键作用。本文提出了一种心脏病预测方法,包括基于 RReliefF 的特征重要性评估,然后提出基于 MLP 的特征分类方法,该分类方法基于重要性得分分为三组。该研究采用三个前馈神经网络对聚类组进行有效分类。此外,集成方法利用 XGBoost 集成分类,利用增强集成学习来增强 FNN 模型输出的整体分类。通过将克利夫兰数据集划分为 70% 的训练集和 30% 的测试集,创建独立的数据集,将 MLP 输出合并到 XGBoost 模型中可获得令人满意的测试性能。混淆矩阵展示了准确的分类,准确率为 96.67%,灵敏度为 95.92%,精度为 97.92%。F1 得分为 96.91%,验证了该模型在精度和召回率方面的平衡性能。这项研究证明了整合数据处理、特征工程和集成学习技术对心血管疾病预测的有效性,为医疗保健应用提供了可靠有效的方法。
©作者2024。Open Access本文是根据Creative Commons Attribution 4.0 International许可获得许可的,该许可允许以任何媒介或格式使用,共享,适应,分发和复制,只要您对原始作者和来源提供适当的信誉,请提供与创意共享许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在伴侣的信用额度中另有说明。如果本文的创意共享许可中未包含材料,并且您的预期用途不受法定法规的允许或超过允许的用途,则您需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问http:// creativecommons.org/licenses/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdo- main/Zero/Zero/1.0/)适用于本文提供的数据,除非在信用额度中另有说明。
抽象的机器学习在我们生活的许多方面越来越重要,随着技术的发展,包括预测天气,弄清社交媒体趋势以及预测世界市场价格的价格。这种重要性调用了对有效预测模型的需求,这些模型可以轻松处理复杂的数据并提供最大的准确结果。XGBoost和随机森林是用于解决已进化并证明是可靠的机器学习挑战求解器的回归和分类问题的可升级合奏技术。在本研究论文中,我们全面分析和比较了这两种突出的机器学习算法。研究的前半部分包括对技术的意义和两种算法的演变的相关概述。这项研究的后半部分涉及随机森林和XGBoost之间的细致比较分析,仔细检查的方面,例如时间复杂性,精度和可靠性。我们研究了他们在处理回归和分类问题的独特方法,同时密切研究了他们对培训和测试数据集的微妙处理。使用各种性能指标(例如F1得分,召回,精度,平均平方误差等)进行了彻底的定量评估。
抽象糖尿病是一种慢性疾病,其特征是血糖水平升高,导致器官功能障碍和过早死亡的风险增加。糖尿病的全球患病率一直在上升,需要进行准确,及时的诊断才能实现最有效的管理。机器学习领域的最新进展为改善糖尿病检测和管理开辟了新的可能性。在这项研究中,我们提出了一个微调的XGBoost模型,用于糖尿病检测。我们使用PIMA印度糖尿病数据集,并随机搜索超参数调整。将微调的XGBoost模型与其他六个流行的机器学习模型进行了比较,并在准确性,精度,灵敏度和F1得分方面取得了最高的性能。这项研究证明了微型XGBoost模型是糖尿病检测的强大而有效的工具的潜力。这项研究的见解可以提高医学诊断,以实现对糖尿病的有效和个性化管理。
锂离子电池具有能量密度高、循环寿命长、稳定性高等优点,被广泛应用于电动汽车、电网储能等领域。为保证电池系统安全可靠运行,准确快速地估计锂离子电池的健康状态(SOH)具有重要意义。锂离子电池是一个复杂的非线性动态系统,实际工作条件下锂离子电池的健康状态无法直接测得,只能通过反映电池老化程度的外特性参数来间接估计。基于单一老化特征或模型的方法难以保证可靠性。因此,本文提出了一种数据驱动的XGBoost与卡尔曼滤波相结合的多特征SOH估计方法。首先,采用主成分分析算法基于数据重构多种电池老化特征,并基于重构的特征数据构建融合多种特征的XGBoost在线估计模型。最后,该方法通过引入基于XGBoost模型实时校正的时域卡尔曼滤波实现了锂离子电池SOH的联合优化估计。结果表明,该方法提高了估计模型的准确性和鲁棒性,实现了锂离子电池SOH的高精度联合估计。