摘要:这项研究旨在通过整合综合少数群体过度采样技术(SMOTE)-TOMEK技术来开发一种健壮的糖尿病分类方法,用于数据平衡并使我们以极端梯度增强(XGB)为导致的机器学习合奏作为元学习者。我们提出了一个集成模型,该模型将深度学习技术(例如双向长期记忆(Bilstm)和双向门控复发单元(BIGRU)与XGB分类器作为基础学习者。使用的数据包括PIMA印第安人糖尿病和伊拉克社会糖尿病数据集,这些数据集是通过缺少价值处理,重复,归一化以及Smote-Tomek在解决数据失衡方面处理的。XGB作为元学习者,通过降低偏差和方差成功地提高了模型的预测能力,从而导致了更准确,更健壮的分类。所提出的合奏模型可在所有测试的数据集上达到完美的精度,精度,召回,特异性和F1分数为100%。此方法表明,将集成学习技术与严格的预处理方法结合在一起可以显着改善糖尿病分类性能。
5自动化学校,Banasthali Vidyapith,拉贾斯坦邦,印度304022。 电子邮件:ppathak9999999999999999999999999999999. 重大的气候变化是一项非常困难的任务,会影响全世界的人们。 降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。 要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。 机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。 本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。 采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。 根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。 最终,XGB模型在统计参数方面优于其他模型。 关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。 1。 [6]。5自动化学校,Banasthali Vidyapith,拉贾斯坦邦,印度304022。电子邮件:ppathak9999999999999999999999999999999. 重大的气候变化是一项非常困难的任务,会影响全世界的人们。 降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。 要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。 机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。 本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。 采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。 根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。 最终,XGB模型在统计参数方面优于其他模型。 关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。 1。 [6]。电子邮件:ppathak9999999999999999999999999999999.重大的气候变化是一项非常困难的任务,会影响全世界的人们。降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。最终,XGB模型在统计参数方面优于其他模型。关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。1。[6]。引言大多数行业,例如生物学,建构,运输和农业都受到不利天气条件(例如洪水,降雨,干旱等)的影响,从而使天气预报是必要的要求。防止农业和财务损失的最具挑战性的解决方案之一是天气预报。天气预报始于19世纪后期,随后在[1,2]中划定了天气预报行动的进展。在过去,气象学家用来根据其专业知识来估算天气参数,但现在该过程涉及应用技术和数据[3]。常规数据管理方法尚未被证明有效或有效地处理大数据[4,5]。事实上,世界各地的不可预测的天气模式必须通过使用不同的大气属性(例如湿度,压力,温度和风速等)来开发一种新的预测技术。传统上,预测是通过人类努力来完成的,但是今天,它是由需要使用高质量设备的巨大计算方法来控制的[7,8]。尽管使用卫星知识和超级计算机使用先进的技术来适应数据,但预后剂仍然对季风的变化感到困惑,这使得对数据的智能解释和分析变得困难。在现实世界中的应用中,例如医学诊断,语音和模式识别,自然语言处理,以及在某些可再生能源应用中,例如太阳照射,生物能源和风速预测机器学习(ML)算法利用计算方法来从历史数据和提取相关特征中获得所需的信息来增强预测输出[9-10]。
摘要:风阵通常与严重危害有关,并可能造成结构和环境损害,从而使阵风预测成为天气预报服务的关键要素。在这项研究中,我们探讨了与天气研究和预测模型的数值天气预测输出集成的Ma-Chine学习(ML)算法的利用,以使风阵电位的估计与观察到的阵风相结合。我们使用了两种ML算法,即随机森林(RF)和极端梯度提升(XGB),以及两种统计技术:具有识别链函数(GLM-sidentity)的Generalized线性模型和具有原木链接功能(GLM-LOG)的广义线性模型(GLM-LOG),以预测Sover tomk for tomp form for the Somk wink for the Somest for Nouthest for Northest for Netast(NE)。我们使用了2005年至2020年间发生的61种模拟的热带和热带风暴来开发和验证ML和统计模型。为了评估ML模型性能,我们将结果与WRF的后阵风潜力进行了比较。我们的发现表明,ML模型,尤其是XGB的表现比统计模型和WRF(WRF-UPP)模型的统一后处理器表现出色,并且能够更好地与所有风暴中观察到的阵风相结合。ML模型面临着捕获阵风分布的上尾的挑战,学习曲线表明,XGB比RF更具效率,而在较少的风暴中产生更好的预测。
本队列研究旨在利用机器学习技术评估急性缺血性卒中 (AIS) 合并糖尿病患者静脉溶栓后的预后结果。分析使用来自沈阳市第一人民医院的数据进行,涉及 2018 年 1 月至 2023 年 12 月接受溶栓治疗的 3,478 名患有糖尿病的 AIS 患者,最终在筛选后关注 1,314 名患者。测量的主要结果为 90 天改良 Rankin 量表 (MRS)。采用 80/20 的训练测试分割进行模型开发和验证,采用各种机器学习分类器,包括人工神经网络 (ANN)、随机森林 (RF)、XGBoost (XGB) 和 LASSO 回归。结果表明,XGB 模型的平均准确率为 0.7355 (±0.0307),优于其他模型。溶栓后预后的关键预测因素包括美国国立卫生研究院卒中量表 (NIHSS) 和血小板计数。研究结果强调了机器学习算法(尤其是 XGB)在预测糖尿病 AIS 患者功能结果方面的有效性,为临床医生提供了有价值的治疗计划工具,并根据接收者操作特性 (ROC) 分析和准确性评估改善了患者结果预测。
摘要:阿尔茨海默病是全球范围内发病率增长最快的疾病之一,会导致脑萎缩。神经影像学揭示了有关大脑解剖结构的大量信息,并能够识别诊断特征。神经影像学中的人工智能 (AI) 有可能显著增强阿尔茨海默病 (AD) 的治疗过程。本研究的目的有两个:(1) 比较现有的机器学习 (ML) 算法对 AD 的分类。(2) 提出一个有效的基于集成的模型并对其进行比较分析。在本研究中,利用在线存储库阿尔茨海默病神经影像学计划 (ADNI) 的数据进行实验,其中包括 2125 张阿尔茨海默病 (n = 975)、轻度认知障碍 (n = 538) 和认知正常 (n = 612) 的神经影像。对于分类,该框架结合了决策树 (DT)、随机森林 (RF)、朴素贝叶斯 (NB) 和 K 最近邻 (K-NN),以及支持向量机 (SVM) 的一些变体,例如 SVM(RBF 核)、SVM(多项式核)和 SVM(Sigmoid 核),以及梯度提升 (GB)、极端梯度提升 (XGB) 和多层感知器神经网络 (MLP-NN)。之后,提出了一种基于集成的通用内核,其中结合了主从架构以获得更好的性能。所提出的模型是极端梯度提升、决策树和 SVM_Polynomial 核(XGB + DT + SVM)的集成。最后,使用统计技术以及其他 ML 模型进行交叉验证来评估所提出的方法。所提出的集成模型 (XGB + DT + SVM) 的表现优于现有的最先进算法,准确率为 89.77%。所有模型的效率都使用基于网格的调整进行了优化,经过此过程获得的结果显示出显着的改善。具有优化参数的 XGB + DT + SVM 的表现优于所有其他模型,效率为 95.75%。所提出的基于集成的学习方法的含义清楚地表明了与其他 ML 模型相比的最佳结果。这种实验比较分析提高了对上述方法的理解,并增强了它们在阿尔茨海默病早期检测中的范围和意义。
摘要在过去十年中,机器学习(ML)对风工程应用引起了极大的兴趣。先前基于机器学习的高层建筑物的基于机器学习的研究主要仅限于时间史或静态压力,而无需考虑空间坐标系。ML模型需要预测空间分布和瞬态风流,以设计风敏的高建筑物。因此,利用三维(3D)空间坐标系统,本研究采用ML来预测高建筑物上的瞬态风压。通过计算流体动态模拟获得了建筑物表面上的瞬态压力数据,这些模拟使用风洞数据验证。选择了极端梯度提升(XGB)模型作为机器学习模型,并且在训练和测试中都获得了良好的预测准确性。此外,在建筑物表面上,XGB模型已经很好地预测了诸如流动分离和陡峭压力梯度之类的独特流动现象。因此,这项工作演示了如何使用机器学习来预测高大建筑物的风负载并捕获重要的流动特征。
摘要:背景/目标:中风是全球突出的健康问题,造成大量死亡和衰弱。当脑血流受损时,就会发生中风,导致不可逆的脑细胞损伤或死亡。利用机器学习的力量,本文提出了一种基于一系列综合因素预测中风患者生存率的系统方法。这些因素包括人口统计属性、病史、生活方式因素和生理指标。方法:提出了一种有效的随机抽样方法来处理高度偏差的中风数据。使用优化的增强机器学习算法进行中风预测,并利用 LIME 和 SHAP 的可解释 AI 提供支持。这使模型能够辨别复杂的数据模式并建立所选特征与患者生存之间的相关性。结果:研究了三种增强算法在中风预测中的性能,包括梯度增强 (GB)、AdaBoost (ADB) 和 XGBoost (XGB),其中 XGB 总体上取得了最佳结果,训练准确率为 96.97%,测试准确率为 92.13%。结论:通过这种方法,该研究旨在发现可行的见解,以指导医疗从业者为中风患者制定个性化的治疗策略。
社交媒体中的摘要网络欺凌会显着影响个人的心理健康,并为创建安全的在线环境,尤其是在非英语社区中构成值得注意的障碍。应对网络欺凌挑战需要社区,教育工作者和技术平台开发人员或设计师的合作努力。这项研究的主要关注点是利用各种机器学习(ML)方法来检测孟加拉语的网络欺凌。网络欺凌的孟加拉数据集涵盖了一系列文本,包括网络欺凌和非纤维欺凌内容。该数据集经历了预处理阶段,同时利用多种技术(包括令牌化,数据增强和转换为序列),以促进为各种ML方法创建适当的输入,例如XGBOOST(XGB)(XGB),例如梯度增强(GB),决策Tree Tree Tree Tree Tree Tree Tree Tree Tree Tree Tree Tree Tree Tree Trees(DT),Ann ne ne forter ne forter(dt),人为(Ann),人为(ANN),人为(RF),RF,RF,RF,RF,RF,RF,RF,RF,RF,RF,RF,RF,RF,RF,RF。 (CNN)和长期记忆(LSTM)。数据是使用来自不同社交媒体平台的Web刮擦收集的,其中包含五个不同的类别:中性,威胁,巨魔,政治和性类别。实验结果表明,所提出的网络欺凌检测模型的LSTM具有99.80%的特殊精度,超过了其他基于深度学习的算法。相反,XGB在相同的数据集中实现了超过74%的值得称赞的精度,表现优于其他传统的ML算法。这些发现对预防和减轻网络欺凌的积极措施产生了重大贡献,最终为在孟加拉国沟通的个人提供了更安全的在线环境。
抽象的森林和土地火(FLF)严重损害了森林生态系统并降低其功能。预测容易发生火灾的地区对于有效的管理和预防至关重要。机器学习(ML)在该领域显示出潜力。到2022年,东努萨·坦加拉(East Nusa Tenggara)(NTT)在印度尼西亚的火灾发生率最高,燃烧了70,637公顷。这项研究使用七种ML方法评估了NTT的FLF漏洞:高斯天真的贝叶斯,支撑矢量机,逻辑回归,人工神经网络,随机森林,渐变升压机和极端的毕业增强机(XGB)。使用ArcGI开发了NTT 2022火灾数据和14个与火灾相关因素的地理空间数据集。使用信息增益比进行特征选择,确定了十二个关键特征:高程,斜率角,坡度,平面曲率,土地覆盖,NDVI,通往道路的距离,建筑物的距离,每年降雨,平均温度,风速,风速和相对湿度。XGB模型表现最佳,训练的AUC值为0.959,测试为0.743。由此产生的脆弱性图显示了关键的火灾因素:高程,柔和的斜坡,弯曲的地形,森林覆盖,植被不良,人类活动,遥远的消防资源,低降雨,高温,高风速和湿度低。建议包括土地管理,防火植被,政策执法,社区教育和基础设施增强。关键字:东努萨·坦格拉(East Nusa Tenggara),森林和陆地火,特征选择,机器学习,映射
Model Threshold Acc FPR Kappa F1 Sens Spec AUC MCC RF 0.47 65.59 29.60 0.31 0.64 60.73 70.40 0.71 0.31 DT 0.48 60.36 33.60 0.21 0.58 54.25 66.40 0.63 0.21 KNN 0.36 65.19 30.40 0.30 0.63 60.73 69.60 0.70 0.31 SVC 0.41 67.61 28.00 0.35 0.66 63.16 72.00 0.75 0.75 0.35 xgb 0.43 62.78 34.00 0.26 0.26 0.61 59.51 66.00 0.69 0.69 0.26 FDA批准对目标NF-κB信号pathway进行批准的药物重复性:在这项研究中,我们