针对入侵检测系统(IDS)检测速度慢、自适应性差、检测准确率不高等问题,提出一种基于自适应并行量子遗传算法的正则化互信息特征选择与多算子协同进化的检测算法(NMIFS MOP-AQGA)。为了对高维特征数据进行有效约简,采用NMIFS方法选择最佳特征组合,将最佳特征送入MOP-AQGA分类器进行学习训练,得到入侵检测器,将数据输入检测算法,最终产生准确的检测结果。在真实异常数据上的实验结果表明,NMIFS MOP-AQGA方法比现有检测方法具有更高的检测准确率、更低的误报率和更强的自适应性能,尤其对于小样本集更为有效。
世界卫生组织表示,脑瘤是最严重的疾病之一,因为它影响着全世界大多数人,包括儿童。开发一种在早期阶段识别脑瘤的系统将有助于挽救许多人的生命。人们已经进行了大量探索来开发一种识别脑瘤的系统;然而,这个系统应该得到改进,提高其准确性。因此,特征选择方法有望改进该系统。机器学习 (ML) 中特征选择技术的主要目的是选择一组合适的特征。包装器方法用于过滤。这些方法分为四类:前向选择、后向消除、穷举特征选择和递归特征消除。近年来,脑瘤影响了越来越多的人。脑瘤影响大脑,有时会扩散到其他部位。此外,还有 55 个特征被集中关注,如图像粗糙度、一致性或能量,以及附近的同质性被移除,以显示方法之间的质量差异。目标是寻找使用特征选择技术构成大问题的特征的可能性,该问题使用 bruta 和遗传学来解决。基于随机森林的 Boruta 特征选择算法。在本文中,我们介绍了一种称为 GenBoruta 的混合特征选择技术。GenBoruta 是一种用于查找所有相关变量的混合特征选择算法。它迭代地消除可测量测试证明比随机探测不那么重要的特征。与前向选择、后向消除、Boruta 和遗传等现有技术相比,所提出的技术表现良好。
摘要背景。本研究的目的是开发和评估一种用于早期诊断 2 型糖尿病的机器学习模型,以便在疾病早期阶段应用治疗。材料和方法。开发了一种提出的混合机器学习模型,并将其应用于 UCI 数据库的早期糖尿病风险预测数据集。将所提模型的预测成功率与其他机器学习模型进行了比较。采用 Pearson 相关性和 SelectKBest 特征选择方法来检查数据集输入参数与结果之间的关系。结果。在数据集中包含的 520 名患者中,320 名被诊断患有糖尿病,其中 328 名(63.08%)为男性。最常见的糖尿病诊断标准是肥胖(n=482,83.08%)。虽然用 Pearson 相关性检测到的最强特征是多尿,但用 SelectKBest 检测到的最强特征是多饮。通过 Pearson 的特征提取,最成功的机器学习方法是提出的混合方法,准确率为 97.28%。使用 SelectKBest 特征选择,同一模型能够以 95.16% 的准确率预测 2 型糖尿病。结论。早期发现 2 型糖尿病将使患者得到更及时、更有效的治疗。因此,使用所提出的模型可能有助于提高患者护理质量并降低由该疾病造成的死亡人数。
放松复制起源和DNA解旋酶的负载是染色体复制的启动。在大肠杆菌中,最小起源oric包含一个双链放松元素(欠款)区域和结合起始蛋白DNAA的三个(左,中和右)区域。左/右区域带有一组DNAA结合序列,构成了左/右DNAA子复合物,而中间区域具有一个单个DNAA结合位点,该位点刺激了左/右DNAA亚复合物的锻炼。此外,群集元素(tattaaaaagaa)位于最小oric区域外。左DNAA子复合物促进了由于暴露TT [A/G] T(T)序列的放松,然后结合到左DNAA亚复合物,稳定DNAB Helicase载荷所需的未能状态。然而,右DNAA亚复合物的作用在很大程度上不清楚。在这里,我们表明,左/右DNAA子复合物的应有的放松,而不是仅由左DNAA子复合物,这是由应有的末端次区域刺激的。一致地,我们发现了右DNAA子复合物 - 绑定的单链应育成区域和群集区域。此外,左/右DNAA子复合物独立地结合了DNAB解旋酶。仅对于左DNAA子复合物,我们表明该群集对于DNAB加载至关重要。体内数据进一步支持了右DNAA子复合物的Unwound DNA结合的作用。综上所述,我们提出了一个模型,其中右DNAA子复杂与UNWOUND应变动态相互作用,有助于适当的放松和有效的DNAB解旋酶负载,而在没有Right-DNAA子复杂性的情况下,在这些过程中没有在这些过程中进行群集的辅助,以支持重复的鲁棒性。
本文根据信息标准研究了转移学习的效果。我们提出了一个程序,将转移学习与锤摩尔的CP(TLCP)结合在一起,并证明它在准确性和稳定性方面优于常规木棍的CP标准。Our theoretical results indicate that, for any sample size in the target domain, the proposed TLCp estimator performs better than the Cp estimator by the mean squared error (MSE) metric in the case of orthogonal predictors, provided that i) the dissimilarity between the tasks from source domain and target domain is small, and ii) the procedure parameters (complexity penalties) are tuned according to certain explicit rules.此外,我们表明我们的转移学习框架可以扩展到其他特征选择标准,例如贝叶斯信息标准。通过分析正交化CP的溶液,我们确定了一个在非正交预测因子的情况下,渐近地近似CP标准的解。对于非正交TLCP获得了相似的结果。最后,使用真实数据的模拟研究和应用证明了TLCP方案的有用性。关键字:转移学习,功能选择,槌狼的CP
图 1 痴呆症分类方法。痴呆症分类方法分为设计、实施和评估三个阶段。在获得神经病理学和其他数据后,我们对特征-特征相关性进行了预处理和评估。我们使用特征排序通过过滤方法对所有神经病理学特征进行排序。然后根据其排名选择不同的特征子集对分类器进行基准测试。然后,我们比较了一直被错误分类的病例,并评估了与这些病例相关的大脑属性,以改进机器学习。
脑机接口 (BCI) 系统解码脑电信号,建立人脑与外界直接交互的通道,无需肌肉或神经控制。P300 拼写器是最广泛使用的 BCI 应用之一,它向用户呈现字符选择,并通过从 EEG 中识别 P300 事件相关电位来执行字符识别。这种基于 P300 的 BCI 系统可以达到良好的准确度,但由于冗余和噪声信号,在日常生活中难以使用。应该考虑改进的空间。我们为基于 P300 的 BCI 系统提出了一种新的混合特征选择方法,以解决特征冗余问题,该方法结合了孟格曲率和线性判别分析。首先,将选定的策略分别应用于给定的数据集,以估计应用于每个特征的增益。然后,按降序对每个生成的值集进行排序,并根据预定义的标准判断其是否适合分类模型。然后评估两种方法的交集以确定最佳特征子集。使用三个公共数据集(即 BCI 竞赛 III 数据集 II、BNCI Horizon 数据集和 EPFL 数据集)对所提出的方法进行了评估。实验结果表明,与其他典型的特征选择和分类方法相比,我们提出的方法具有更好或相当的性能。此外,我们提出的方法可以在三个数据集上在所有 epoch 之后实现最佳分类准确率。总之,我们提出的方法为提高基于 P300 的 BCI 拼写器的性能提供了一种新方法。
摘要:基于功能性近红外光谱的脑机接口 (fNIRS-based BCI) 越来越受到关注。然而,由于固有的血流动力学延迟,我们实际上只能获得大量的 fNIRS 数据。因此,在使用机器学习技术时,可能会遇到由于高维特征向量而导致的问题,例如分类准确率下降。在本研究中,我们采用了一种基于弹性网络的特征选择,这是嵌入式方法之一,并通过分析结果证明了其实用性。使用从 18 名参与者获得的 fNIRS 数据集对心算和空闲状态引起的大脑激活进行分类,我们在改变参数 α(套索权重与岭正则化)的同时进行特征选择后计算了分类准确率。对于 α = 0.001、0.005、0.01、0.05、0.1、0.2 和 0.5 的各个值,分类准确率的平均值分别为 80.0 ± 9.4%、79.3 ± 9.6%、79.0 ± 9.2%、79.7 ± 10.1%、77.6 ± 10.3%、79.2 ± 8.9% 和 80.0 ± 7.8%,与使用所有特征估计的分类准确率的平均值(80.1 ± 9.5%)在统计上没有差异。因此,对于所有考虑的参数 α 值,分类准确率没有差异。特别是对于 α = 0.5,即使使用总特征的 16.4% 的特征,我们也能实现统计上相同的分类准确率水平。由于基于弹性网络的特征选择可以轻松应用于其他情况,而无需复杂的初始化和参数微调,我们可以期待看到基于弹性的特征选择可以积极应用于 fNIRS 数据。
摘要:已经进行了大量研究来从各个方面提高基于运动想象的脑机接口 (BCI) 分类性能。然而,在客观和主观数据集上比较他们提出的特征选择框架性能的研究有限。因此,本研究旨在提供一种新颖的框架,该框架将不同频带的空间滤波器与双层特征选择相结合,并在已发布和自获取的数据集上对其进行评估。对脑电图 (EEG) 数据进行预处理并将其分解为多个频率子带,然后根据 Fisher 比率和最小冗余最大相关性 (mRmR) 算法提取、计算和排序其特征。通过线性判别分析 (LDA) 选择信息滤波器组进行最佳分类。研究结果首先表明,所提出的方法在准确性和 F1 分数方面可与其他传统方法相媲美。研究还发现,手与脚的分类比左手与右手的分类更具可辨性(差异为 4-10%)。最后,在应用于小规模数据时,滤波器组通用空间模式(FBCSP,无特征选择)算法的性能明显低于所提出的方法(p = 0.0029、p = 0.0015 和 p = 0.0008)。
摘要。帕金森病 (PD) 是一种神经退行性疾病,其特征是大脑中多巴胺产生细胞的丧失。产生多巴胺的脑细胞的破坏会导致帕金森病,多巴胺是一种使脑细胞相互连接的化学物质。控制力、适应性和运动速度都由大脑中产生多巴胺的细胞控制。研究人员一直在研究尽快识别疾病早期出现的非运动症状的技术,以减缓疾病的进展。本研究提出了一种基于机器学习的帕金森病检测方法。所提出的检测技术采用了特征选择和分类技术。特征选择过程采用了 Boruta、递归特征消除 (RFE) 和随机森林 (RF) 分类器。检测帕金森病考虑了四种分类算法,即梯度提升、极端梯度提升、装袋和额外树分类器。我们发现,采用递归特征消除的 Bagging 比其他方法表现更好。帕金森症诊断中最低数量的语音特征的准确率达到 82.35%。
