耐甲氧西林金黄色葡萄球菌(MRSA)在医院中造成了明显的病态和死亡率。MRSA的快速,准确的风险地层对于优化抗生素治疗至关重要。我们的研究介绍了一个深度学习模型Pytorch_EHR,该模型利用电子健康记录(EHR)时间序列数据,包括广泛的患者特定数据,以预测两周内MRSA的阳性。8,164 MRSA和22,393例来自德克萨斯州休斯敦市纪念馆Hermann医院系统的非MRSA患者事件用于模型开发。 Pytorch_EHR优于准确性(AUROC PYTORCH_EHR = 0.911,AUROC LR = 0.857,AUROC LROC LR = 0.892),均优于逻辑回归(LR)和光梯度增压机(LGBM)模型。 外部验证来自医学信息MART的393,713例患者事件(MIMIC)-IV数据集(IV)在波士顿的IV数据集证实其优异的准确性(Auroc Pytorch_ehr = 0.859,Auroc LR = 0.816,Auroc LRR = 0.816,AUROC LGBM = 0.838)。 我们的模型有效地将患者分为高,中和低风险类别,可能优化抗微生物疗法,并减少不必要的MRSA特异性抗菌药物。 这突出了深度学习模型在预测MRSA阳性文化,超越传统机器学习模型和支持临床医生的判断方面的优势。8,164 MRSA和22,393例来自德克萨斯州休斯敦市纪念馆Hermann医院系统的非MRSA患者事件用于模型开发。Pytorch_EHR优于准确性(AUROC PYTORCH_EHR = 0.911,AUROC LR = 0.857,AUROC LROC LR = 0.892),均优于逻辑回归(LR)和光梯度增压机(LGBM)模型。外部验证来自医学信息MART的393,713例患者事件(MIMIC)-IV数据集(IV)在波士顿的IV数据集证实其优异的准确性(Auroc Pytorch_ehr = 0.859,Auroc LR = 0.816,Auroc LRR = 0.816,AUROC LGBM = 0.838)。我们的模型有效地将患者分为高,中和低风险类别,可能优化抗微生物疗法,并减少不必要的MRSA特异性抗菌药物。这突出了深度学习模型在预测MRSA阳性文化,超越传统机器学习模型和支持临床医生的判断方面的优势。
在这项研究中,使用了极端梯度提升(XGBoost)和光梯度提升(LightGBM)al-gorithms用间接太阳能干燥机的香蕉切片的干燥特性进行模型。建立了自变量(温度,水分,产品类型,水流量和产品质量)与因变量(能源消耗和降低)之间的关系。用于耗能,XGBoost在训练过程中以0.9957的r 2为0.9957,在测试过程中表现出优异的表现,在训练期间的最小MSE为0.0034,在训练期间为0.0008,在测试阶段表明高预测性获得率和低错误率。相反,LGBM显示较低的R 2值(0.9061训练,0.8809测试)和较高的MSE在训练过程中的MSE为0.0747,在测试过程中0.0337显示了0.0337,反映了较差的表现。同样,对于收缩预测,XGBOOST优于LGBM,较高的R 2(0.9887训练,0.9975测试)和较低的MSE(0.2527培训,0.4878测试)证明了LGBM。统计数据表明,XGBoost定期胜过LightGBM。基于游戏理论的Shapley功能表明,温度和产品类型是能源消耗模型的最具影响力的特征。这些发现说明了XGBoost和LightGBM模型在食品干燥操作中的实际适用性,以优化干燥调节,提高产品质量并降低能耗。
摘要:本研究使用机器学习,利用 EEG 信号自主执行听力测试(听力测定)过程。在标准听力测试中,给受试者提供不同幅度和波长的声音,这些声音是通过 MATLAB GUI 设计的界面随机分配的。受试者表示,他听到了用耳机听到的随机大小的声音,但如果没有听到,他就不会采取行动。同时,跟踪 EEG(脑电图)信号,并记录受试者注意和未听到的声音在大脑中产生的波。对测试结束时生成的 EEG 数据进行预处理,然后进行特征提取。将从 MATLAB 接口接收到的听到和未听到的信息与 EEG 信号相结合,确定受试者听到了哪些声音,没有听到哪些声音。在通过界面给出的声音之间的等待期间,不会给受试者提供任何声音。因此,这些时间在 EEG 信号中标记为未听到。本研究使用 Brain Products Vamp 16 脑电图仪测量脑信号,然后使用 Brain Vision Recorder 程序和 MATLAB 创建脑电图原始数据。在从大脑中听到和未听到的声音产生的信号数据创建数据集之后,使用 PYTHON 编程语言进行机器学习过程。使用 Python 编程语言获取用 MATLAB 创建的原始数据,在完成预处理步骤之后,将机器学习方法应用于分类算法。每个原始脑电图数据都通过 Count Vectorizer 方法检测。使用 TF-IDF(词频-逆文档频率)方法计算所有脑电图数据中每个脑电图信号的重要性。根据人们是否能听到声音对获得的数据集进行分类。在分析中应用了朴素贝叶斯、光梯度强化机 (LGBM)、支持向量机 (SVM)、决策树、k-NN、逻辑回归和随机森林分类器算法。我们研究中选择的算法之所以受到青睐,是因为它们在 ML 中表现出色,并成功分析了 EEG 信号。所选分类算法还具有可在线使用的特点。使用了朴素贝叶斯、光梯度强化机 (LGBM)、支持向量机 (SVM)、决策树、k-NN、逻辑回归和随机森林分类器算法。在 EEG 信号的分析中,光梯度强化机 (LGBM) 被评为最佳方法。确定预测最成功的算法是 LGBM 分类算法的预测,成功率为 84%。这项研究表明,也可以使用 EEG 设备检测到的脑电波进行听力测试。虽然可以创建完全独立的听力测试,可能需要听力学家或医生来评估结果。
摘要:本研究深入研究了机器学习技术以分析蒸汽平台上的游戏受欢迎程度。Utilizing a diverse array of algorithms such as logistic regression, Support Vector Machine (SVM) , decision tree, Gradient Boosting (XGBoost) , Light Gradient Boosting Machine (LightGBM or LGBM), Deep Neural Networks (DNNs), and Convolutional Neural Networks (CNN), the research focuses on predicting game popularity through a thorough analysis of the Steam game dataset.该报告精心概述了数据准备的阶段,包括数据清洁和功能工程,然后构建各种预测模型及其后续的性能评估。值得注意的是,LGBM具有明显的优势,其精度为88.17%,AUC为80.36%。对Steam游戏的调查不仅在战略规划和减轻风险中艾滋病游戏开发人员和公司,而且还为玩家社区管理员增强社区管理提供了宝贵的见解。全面的方法强调了机器学习在解释游戏行业内的市场趋势和玩家偏好方面的重要潜力。
5自动化学校,Banasthali Vidyapith,拉贾斯坦邦,印度304022。 电子邮件:ppathak9999999999999999999999999999999. 重大的气候变化是一项非常困难的任务,会影响全世界的人们。 降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。 要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。 机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。 本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。 采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。 根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。 最终,XGB模型在统计参数方面优于其他模型。 关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。 1。 [6]。5自动化学校,Banasthali Vidyapith,拉贾斯坦邦,印度304022。电子邮件:ppathak9999999999999999999999999999999. 重大的气候变化是一项非常困难的任务,会影响全世界的人们。 降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。 要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。 机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。 本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。 采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。 根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。 最终,XGB模型在统计参数方面优于其他模型。 关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。 1。 [6]。电子邮件:ppathak9999999999999999999999999999999.重大的气候变化是一项非常困难的任务,会影响全世界的人们。降雨被认为是天气系统中最重要的现象之一,其速率是最关键的变量之一。要通过标准方法开发预测模型,气象专家试图检测大气属性,例如阳光,温度,湿度和浑浊等。机器学习(ML)技术最近进化得更具进化,它提供的结果比传统方法更令人满意,并且易于使用。本文介绍了ML分类器,例如Logistic回归(LR),决策树(DT),随机森林(RF),轻梯度增压机(LGBM),CAT Boost(CB)和Extreme Grantient Boost(XGB),以使用功能工程框架来预测降雨。采用接收器操作特征(AUROC)曲线和其他统计指标(例如回忆,准确性,精度和Cohen Kappa)的区域来预测和比较上述方法的成功率。根据AUROC值的验证结果为XGB(0.94)> CB(0.93)> LGBM(0.87)> RF(0.93)> dt(0.88)> lr(0.78)。最终,XGB模型在统计参数方面优于其他模型。关键字:二进制分类,超级参数调整,机器学习,XGB分类器,天气预报。1。[6]。引言大多数行业,例如生物学,建构,运输和农业都受到不利天气条件(例如洪水,降雨,干旱等)的影响,从而使天气预报是必要的要求。防止农业和财务损失的最具挑战性的解决方案之一是天气预报。天气预报始于19世纪后期,随后在[1,2]中划定了天气预报行动的进展。在过去,气象学家用来根据其专业知识来估算天气参数,但现在该过程涉及应用技术和数据[3]。常规数据管理方法尚未被证明有效或有效地处理大数据[4,5]。事实上,世界各地的不可预测的天气模式必须通过使用不同的大气属性(例如湿度,压力,温度和风速等)来开发一种新的预测技术。传统上,预测是通过人类努力来完成的,但是今天,它是由需要使用高质量设备的巨大计算方法来控制的[7,8]。尽管使用卫星知识和超级计算机使用先进的技术来适应数据,但预后剂仍然对季风的变化感到困惑,这使得对数据的智能解释和分析变得困难。在现实世界中的应用中,例如医学诊断,语音和模式识别,自然语言处理,以及在某些可再生能源应用中,例如太阳照射,生物能源和风速预测机器学习(ML)算法利用计算方法来从历史数据和提取相关特征中获得所需的信息来增强预测输出[9-10]。
摘要:入侵检测系统(IDS)对于识别网络攻击并为每种风险采取适当的措施至关重要。机器学习(ML)技术的效率在存在无关的特征和阶级失衡的情况下被妥协。在这项研究中,提出了有效的数据预处理策略,以增强模型的普遍性。使用K-均值Smote解决类别的差异。之后,我们提供了一种混合特征选择方法,该方法结合了过滤器和包装器。此外,通过改变最佳特征子集来分析超参数调整的光梯度增强机(LGBM)。实验使用了数据集 - UNSW-NB15和CICIDS-2017,其精度分别为90.71%和99.98%。由于模型的透明度和概括性很大程度上取决于理解预测的每个组成部分,因此我们采用了可解释的人工智能(XAI)方法,Shapley添加说明(SHAP)来提高对预测结果的理解。
这项纵向研究利用了FASA成人队列研究(FACS)的数据。该研究最初包括在伊朗FASA农村地区35-70岁的1018名参与者,并在5年后使用随机抽样进行了3,000名参与者的随访。在机器学习(ML)模型中总共包括160个变量,并使用特征缩放和单热编码进行数据处理。Ten supervised ML algorithms were utilized, namely logistic regression (LR), support vector machine (SVM), random forest (RF), Gaussian naive Bayes (GNB), linear discriminant analysis (LDA), k-nearest neighbors (KNN), gradient boosting machine (GBM), extreme gradient boosting (XGB), cat boost (CAT), and light Gra-streent Boosting Machine(LGBM)。超参数调整是使用超参数的各种组合来识别最佳模型的。合成少数民族过度抽样技术(SMOTE)用于平衡训练数据,并使用Shapley添加说明(SHAP)进行了特征选择。
在本文中,我们提出了一种方法,该方法结合了数据驱动和物理建模,以预测流域量表的径流发生和体积。以此目的,我们首先估计了绿色增强模型在有助于记录的风暴中的径流体积。然后,我们使用机器学习算法,即LightGBM(LGBM)和深神经网络(DNN)来预测在风暴开始或在风暴开始之前收集的一组大气变量(相对湿度,温度,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气,大气压和风速)的输出。在马德里举行的小城市集水区的结果DNN的结果在预测径流发生和体积方面表现更好。在具有辅助变量的Mospheric变量处的输入初级(例如,在第一个小时记录的风暴强度数据,或从辅助回归方法中获得的降雨量和强度估计值)很大程度上增加了每个形式的模型。我们在该手稿数据驱动的算法中显示的是由物理标准塑造的,可以通过允许数据驱动算法从物理模型的输出中学习来成功生成。它代表了一种新颖的方法,用于通过机器学习从水文建模中的常见实践转移的物理信息驱动算法。
摘要:农业是最重要的活动之一,它生产对人类生存至关重要的农作物和食物。如今,农产品和农作物不仅用于满足当地需求,而且全球化使我们能够将农产品出口到其他国家并从其他国家进口。印度是一个农业国家,很大程度上依赖其农业活动。预测作物产量和单产是一项必要的活动,它使农民能够估算储存量、优化资源、提高效率和降低成本。然而,农民通常根据经验和估计,根据地区、土壤、天气条件和作物本身来预测作物,这可能不太准确,尤其是在当今不断变化和不可预测的气候条件下。为了解决这个问题,我们的目标是使用机器学习 (ML) 模型来预测各种作物(如大米、高粱、棉花、甘蔗和拉比)的产量和单产。我们用天气、土壤和作物数据训练这些模型,以预测这些作物未来的产量和单产。我们汇编了影响印度特定邦农作物生产和产量的属性数据集,并对各种 ML 回归模型在预测农作物生产和产量方面的表现进行了全面研究。结果表明,在所考察的模型中,Extra Trees 回归器取得了最高的性能。它的 R 平方得分为 0.9615,平均绝对误差 (MAE) 和均方根误差 (RMSE) 最低,分别为 21.06 和 33.99。紧随其后的是随机森林回归器和 LGBM 回归器,它们的 R 平方得分分别为 0.9437 和 0.9398。此外,进一步的分析表明,基于树的模型的 R 平方得分为 0.9353,与线性和基于邻居的模型相比表现出更好的性能,后两者的 R 平方得分分别为 0.8568 和 0.9002。
血清电泳(SPEP)是一种用于分析血液中最重要蛋白质的分布的方法。主要的临床问题是存在抗体(M蛋白/副蛋白)的单克隆分数,这对于诊断和下血液学疾病(例如多发性骨髓瘤)至关重要。最近的研究表明,可以通过例如检查蛋白质聚糖模式来跟踪肿瘤手术,可以使用机器学习来评估蛋白质电泳。在这项研究中,我们比较了26种不同的决策树算法,通过使用来自血清蛋白质毛细血管电泳的数值数据,以鉴定人血清中M蛋白的存在。对于数据的自动检测和聚类,我们使用了一个由67,073个样本组成的匿名数据集。我们发现了五种具有较高能力检测M蛋白质的方法:额外的树(ET),随机拟合(RF),直方机分级增强回收期(HGBR),轻梯度增强方法(LGBM)和极端梯度增强(XGB)。此外,我们实施了一种游戏方法来披露数据集中的哪些功能,这些功能表明了由此产生的M蛋白诊断。结果验证了伽马球蛋白的馏分和β球蛋白分数的一部分是电泳分析的最重要特征,从而增强了我们方法的可靠性。最后,我们测试了分类的M蛋白质同种型的算法,其中ET和XGB在测试的五种算法中表现出最佳性能。我们的结果表明,血清毛细管电泳与决策树算法相结合,在应用M蛋白的快速,准确鉴定方面具有巨大的潜力。此外,这些方法将适用于各种血液分析,例如血红蛋白病,表明诊断范围广泛。但是,对于M蛋白质同种型分类,将机器学习解决方案与毛细血管电泳的数值数据与凝胶电泳图像数据相结合是最有利的。