摘要 - Cloud Computing是世界各地企业之间的新兴选择,因为它提供了灵感和全球的Web计算机功能作为可自定义的服务。由于云服务的分散性质,安全是一个主要问题。由于入侵者对任何形式的攻击,隐私和安全性都是极大的选择,这是对按需服务成功的重大障碍。网络交通量的大量增加为日益困难和广泛的安全脆弱性开辟了道路。使用传统的入侵检测系统(IDS)防止这些尝试无效。因此,本文提出了一种基于机器学习(ML)模型的新型网络入侵检测系统(NIDS),称为支持向量机(SVM)和极端梯度增强(XGBoost)技术。此外,基于乌鸦搜索算法的高参数优化技术正在利用来优化NID的性能。此外,基于XGBoost的特征选择技术用于提高NIDS方法的分类精度。最后,使用NSL-KDD和UNR-IDD数据集评估了提出的系统的性能,实验结果表明,它的性能优于基线,并且有可能在现代NID中使用。
在本研究中,我们探索了使用功能性近红外光谱 (fNIRS) 信号与现代机器学习技术结合对特定解剖运动进行分类的潜力,以增加基于 fNIRS 的脑机接口 (BCI) 应用的控制命令数量。这项研究的重点是新颖的个体手指敲击,这是 fNIRS 和 fMRI 研究中众所周知的任务,但仅限于左/右手指或几根手指。24 名右撇子参与者执行了个体手指敲击任务。根据 10-10 国际系统,使用放置在运动皮层上的 16 个源和探测器记录数据。该事件的平均氧合 1 HbO 和脱氧 1 HbR 血红蛋白数据被用作特征,以评估不同机器学习 (ML) 模型在具有挑战性的多类分类环境中的性能。这些方法包括 LDA、QDA、MNLR、XGBoost 和 RF。一种新的基于 DL 的模型“Hemo-Net”已被提出,它由多个并行卷积层组成,并使用不同的滤波器来提取特征。本文旨在探索在多类分类任务中使用 fNRIS 与 ML/DL 方法的有效性。与 LDA、MNLR 和 QDA 相比,RF、XGBoost 和 Hemo-Net 等复杂模型具有相对更高的测试集准确率。Hemo-Net 表现出色,达到了 76% 的最高测试集准确率,然而,在这项工作中,我们的目标不是提高模型的准确率,而是探索 fNIRS 是否具有神经特征来帮助现代 ML/DL 方法进行多类分类,这可以用于脑机接口等应用。使用 fNIRS 数据很难对精细解剖运动(例如单个手指运动)进行多类分类。与基于集成的 RF 和 XGBoost 方法相比,MNLR 和 LDA 等传统 ML 模型的性能较差。基于 DL 的方法 Hemo-Net 优于本研究中评估的所有方法,并展示了基于 fNIRS 的 BCI 应用的光明前景。
– 将总体业务目标转化为竞争性 KPI 的多目标优化。 – 支持三名初级数据科学家使用 XGBoost 和正则化线性回归对 KPI 进行建模,开发自定义性能指标。 – 设计并实施基于差分进化的优化算法,以找到在尊重业务约束的同时解决优化问题的模型特征值。 – 担任数据科学联系人,负责定义生产架构和数据工程要求。
物联网(物联网)在智能家居,自动驾驶汽车和环境监测等应用中变得越来越实用。但是,这种快速扩展导致了重大的网络安全威胁。检测这些威胁至关重要,尽管机器学习技术很有价值,但它们在高维数据方面挣扎。功能选择可以通过降低计算成本来帮助,同时保持模型概括。最有效的特征选择方法是至关重要的任务。本研究通过测试五种特征选择方法来解决此差距:随机森林(RF),递归特征消除(RFE),逻辑回归(LR),XGBoost回归(XGBoost)和信息增益(IG)使用CIC-IOT 2023数据集。与五个机器学习模型一起使用时,它会评估这些方法:Decision Tree(DT),Random Forest(RF),K-Nearest邻居(K-NN),梯度提升(GB)和多层式感知器(MLP),使用精度,精度,精确,回忆,fl1-Score,以及三个数据列表。结果表明,RFE尤其是RF模型,具有30个功能的最高精度(99.57%)。RF是最稳定的,准确性从83%至99.56%。此外,5-Feature方案最适合在资源有限的IoT设备上实现ID,RFE与K-NN模型配对是最佳组合。
表S2:从209个RDKIT描述符中选择功能选择,用于预测聚合物的光节间隙以及XGBoost模型的性能指标,该模型的性能指标训练了具有成对Pearson相关系数(P对)的不同组合的descriptors(P对)的组合,并且与光带差距有关(P GAP)(P GAP)。粗体表示P对和P间隙值的最佳组合。RMSE和MAE以EV测量。
摘要:对晶体材料的化学空间,尤其是金属 - 有机框架(MOF)的实验探索,需要对大量反应的多组分控制,这是不可避免地会在手动执行时耗时和劳动力。为了在保持高可重复性的同时加速物料发现速率,我们开发了一种与机器人合成平台集成的机器学习算法,用于闭环探索多氧盐损坏金属金属 - 有机框架(POMOFS)的化学空间。通过使用从不确定性反馈实验获得的更新数据和基于其化学构成的POMOF分类的多类分类扩展,通过使用更新数据来优化极端梯度提升(XGBoost)模型。POMOF的机器人合成的数字签名由通用化学描述语言(χDL)表示,以精确记录合成步骤并增强可重复性。九种新颖的Pomofs,其中包括具有良好的可重复性的POM胺衍生物与各种醛的硫胺衍生物的胰岛化反应,这些pomofs具有源自单个配体的混合配体。此外,根据XGBoost模型绘制了化学空间图,其F1得分高于0.8。此外,合成的Pomofs的电化学性质表明,与分子POMS相比,较高的电子转移和Zn比率的直接效应,所使用的配体的类型以及POMOFS中的拓扑结构用于调节电子传递能力。■简介
抽象的热带山地森林藏有异常高的生物多样性,但面临着人类活动的严重威胁。评估大区域的森林生物多样性至关重要,但极具挑战性。遥感提供了有效的监测解决方案,但是很少有研究集中在坦桑尼亚的多样化的蒙塔尼森林上。我们收集了坦桑尼亚西乌萨巴拉地区蒙塔尼森林159个地块中159个地块中树种成分的现场数据。我们将物种丰富度,均匀度和香农多样性指数计算为树木多样性的指标。使用Sentinel-2和Planetscope卫星图像,我们得出了光谱,纹理和植被指数预测因子,以通过广义添加剂模型和极端的梯度增强来对这些索引进行建模。基于Planetscope的XGBoost模型表现最佳,解释了香农多样性变化的19.7%。合并纹理预测器进一步提高了模型的准确性。尽管在建模复杂的热带森林方面面临固有的挑战,但我们的发现证明了Sentinel-2和Planetscope对区域生物多样性监测的有希望的潜力,而现场调查受到限制。进一步的研究可以通过利用更高的分辨率数据和增加现场采样来增强这些初始结果,以有效监测热带生物多样性。关键词:树种丰富度;山地森林;东弧山; GAM,XGBoost简介
图 2:模型概述。所研究蛋白质的 PDB 文件用于生成其图形表示。然后,将 POI 和 E3 连接酶的这些图形表示传递到预先训练的 GearNet 进行特征提取,同时从 PROTAC 组件的 SMILES 中收集指纹。然后将各个特征连接起来,并将连接的向量传递到机器学习模型(XGBoost、随机森林或 MLP)以预测 PROTAC 的 DC 50 值。单个示例的多格式标签允许在回归和分类任务中训练所研究的模型。
空气污染由空气中的化学物质或颗粒组成,这些化学物质或颗粒可能损害人类,动物和植物的健康。它也损坏了建筑物。空气中的污染物采取多种形式。它们可以是气体,固体颗粒或液滴。污染以许多不同的方式进入地球大气层。大多数空气污染是由人类产生的,采取了工厂,汽车或飞机的排放形式。二手香烟烟雾也被认为是空气污染。这些人为的污染来源称为人为来源。自然发生了某些类型的空气污染,例如野火或火山的灰烬。这些称为天然来源。空气污染最常见,在许多不同来源的排放量集中。有时,山脉或高建筑物阻止空气污染散布。这种空气污染通常看起来像是使空气模糊的云。它称为烟雾。“烟雾”一词来自结合“烟”和“雾”。为了预测空气质量,使用了机器学习算法。这些算法分析来自各种污染物的数据,并根据模式和趋势提供预测。常见的机器学习模型包括决策树,XGBoost等。XGBoost,它在预测空气质量方面的高度准确性受到青睐。这些模型使用输入数据,例如污染物水平(例如PM2.5,NO2,CO)来评估空气质量并将其分为不同的水平,从而帮助个人采取适当的措施。
摘要 - 已经开发了越来越多的机器学习(ML)工具和原型,以协助空中交通管制员(ATCO)的决策过程。这些ML工具可以促进更快,更一致的决策,以进行流量监控和管理。但是,其中许多工具都使用了模型,在这些模型中,机器做出的决策不容易被ATCO组成。因此,有必要为ATCO开发可解释的基于ML模型的工具,以管理使用基于ML模型的决策的固有风险。这项研究调查了视觉上解释的ML模型,用于跑道出口预测,以实现更好的跑道管理。具体来说,这项研究采用了XGBoost上的局部可解释的模型解释(LIME),在该解释中,可以看到机器做出的跑道退出预测的决策。XGBoost在这里研究的三种飞机分别达到了94.35%,94.17%和80.87%的分类精度。分析石灰参数时,石灰显示了与特定跑道出口相对应的每个飞机的特征的贡献。此外,视觉分析可以将跑道退出预测中不确定性的来源告知决策者。因此,这项工作为基于ML的跑道出口预测铺平了道路,视觉上可解释的机器决策可以为ATCO提供见解,以提供有效的跑道管理以及到达和出发的计划。交互式接口可视化跑道退出预测的机器决策的交互式界面也是本文的原型。