1拉合尔大学电气工程系,拉合尔54000,巴基斯坦2 2号生物医学工程系,南德黑兰分公司,伊斯兰阿萨德大学,伊朗伊斯兰阿萨德大学,伊朗3号,伊朗3号电气工程系,政府大学大学,拉霍尔54000,巴基斯坦4000,北部4000,北部54000,上司,上司中国第710049号,北中国6号计算机工程系,工程学院,伊朗,克尔曼的沙希德·巴霍纳尔大学,伊朗,伊朗7号电气工程学院,马来西亚马来西亚马来西亚大学马来西亚大学,马来西亚马来西亚8号,马来西亚8个生物技术工程学系伊朗9号GOFA营地,GOFA工业学院附近和德国Adebabay,Nifas Silk-Lafto,Addis Ababa 26649,埃塞俄比亚10号贾巴利亚营地,联合国救济和工程局(UNRWA),巴勒斯坦难民营,加沙地带,加拿大的贾巴利亚,贾巴利亚,贾巴利亚,巴勒斯坦,科学,科学,科学,科学,科学,科学,科学,,科学。 Lumpur 50603,马来西亚
摘要:定量结构-活性关系 (QSAR) 旨在将分子结构特性与相应的生物活性关联起来。机会相关性和多重共线性是生成 QSAR 模型时经常遇到的两个主要问题。特征选择可以通过删除冗余或不相关的分子描述符来显著提高 QSAR 的准确性和可解释性。人工蜂群算法 (ABC) 模仿蜜蜂群的觅食行为,最初是为解决连续优化问题而提出的。它已应用于分类的特征选择,但很少用于回归分析和预测。本文使用二元 ABC 算法来选择 QSAR 中的特征(分子描述符)。此外,我们提出了一种改进的基于 ABC 的 QSAR 特征选择算法,即 ABC-PLS-1。交叉和变异算子被引入到已聘用蜜蜂和旁观蜜蜂阶段来修改每个解决方案的几个维度,这不仅节省了将连续值转换为离散值的过程,而且还减少了计算资源。此外,提出了一种新的贪婪选择策略,即选择准确率更高、特征更少的特征子集,有助于算法快速收敛。使用三个QSAR数据集对所提算法进行了评估。实验结果表明,ABC-PLS-1在准确率、均方根误差和所选特征数量方面优于PSO-PLS、WS-PSO-PLS和BFDE-PLS。此外,我们还研究了在跟踪回归问题时是否实施侦察蜂阶段,并得出了一个有趣的结论:在处理低维和中维回归问题的特征选择时,侦察蜂阶段是多余的。
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权持有人,该版本发布于2021年3月25日。 https://doi.org/10.1101/2021.03.24.436722 doi:biorxiv preprint
摘要 - 与阿尔茨海默氏病(AD)相关的社会和财务成本导致我们社会的显着负担。为了了解这种疾病的原因,公有私人伙伴关系,例如阿尔茨海默氏病神经诱因倡议(ADNI)将数据释放到科学界。这些数据被组织为各种方式(遗传,脑成像,认知评分,诊断等)进行分析。医学图像分析中使用的许多统计学习方法不能明确利用这种多模式数据结构。在这项工作中,我们提出了一种新颖的目标函数和优化算法,该算法旨在处理多模式信息以进行AD的预测和分析。我们的方法依赖于ℓ2,1-规范提供的稳健矩阵效果和行明稀疏性,以集成由ADNI提供的多模式数据。这些技术通过分类任务共同优化,以指导我们提出的任务平衡多模式特征选择方法中的特征选择。与某些广泛使用的机器学习算法进行比较时,我们的结果表现出改进的平衡精度,精度和Matthew的相关系数,以识别认知能力下降。在提高预测性能的方面,我们的方法能够识别临床研究界感兴趣的大脑和遗传生物标志物。我们预计我们的方法将引起更大的研究社区的兴趣,并在线发布了我们的方法代码。1我们的实验验证了现有的脑生物标志物和位于染色体11上的单核苷酸多态性,并在10号染色体上详细介绍了新型多态性,据作者所知,这些多态性尚未报道。
摘要:在模式识别和机器学习领域,特征在预测中起着关键作用。特征的著名应用包括医学成像、图像分类等。随着医疗数据存储库和医疗服务提供中信息投资的指数级增长,医疗机构正在收集大量数据。这些数据存储库包含支持医疗诊断决策和提高患者护理质量所必需的详细信息。另一方面,这种增长也使得理解和利用数据用于各种目的变得困难。由于较大数据集中存在无关特征,成像数据的结果可能会出现偏差。特征选择提供了减少如此大数据集中组件数量的机会。通过选择技术,排除不重要的特征并选择产生普遍表征精度的组件子集。找到好属性的正确决定会产生精确的分组模型,从而提高学习速度和预测控制。本文回顾了医学成像的特征选择技术和属性选择措施。本综述旨在描述医学领域的特征选择技术及其优缺点,并指出其在图像数据和数据挖掘算法中的应用。本综述揭示了现有特征和属性选择技术对多源数据的缺点。此外,本综述还提出了特征选择对于正确分类医学感染的重要性。最后,提供了批判性分析和未来方向。
摘要:近年来,研究的重点是生成机制来评估受试者在执行各种需要高度集中注意力的活动(例如驾驶车辆)时的认知工作量水平。这些机制已经实现了多种分析认知工作量的工具,而脑电图 (EEG) 信号由于其高精度而最常使用。然而,实现 EEG 信号的主要挑战之一是找到适合识别认知状态的信息。在这里,我们提出了一种基于机器学习技术的使用 EEG 信号信息进行模式识别的新特征选择模型,称为 GALoRIS。GALoRIS 结合遗传算法和逻辑回归来创建一个新的适应度函数,该函数识别和选择有助于识别高和低认知工作量的关键 EEG 特征,并构建一个能够优化模型预测过程的新数据集。我们发现,GALoRIS 使用从多个 EEG 信号中提取的信息来识别与受试者驾驶车辆时的高和低认知工作负荷相关的数据,将原始数据集减少了 50% 以上,并最大限度地提高了模型的预测能力,实现了 90% 以上的准确率。
摘要 - 常见的空间模式(CSP)算法是一种公认的空间过滤方法,用于运动成像(MI)基于脑部计算机的特征提取方法(BCIS)。然而,由于非统计学对电向形态学(EEG)的影响以及CSP目标函数的固有缺陷,空间滤波器以及它们相应的特征在CSP中使用的特征空间中不一定是最佳的。在这项工作中,我们设计了一种新功能选择方法来通过基于改进的目标函数选择功能来解决此问题。,改进是通过压制异常值和发现较大阶段距离的功能进行的。此外,提出了一种基于Dempster - Shafer理论的融合算法,该算法考虑了特征的分布。有了两个竞争数据集,我们首先根据分类精度,特征分布和嵌入性评估了改善目标函数的性能。然后,在精度和计算时间都进行了与其他特征选择方法的比较。实验结果表明,所提出的方法消耗的额外计算成本较少,并导致基于MI的BCI系统的性能显着提高。
在脑机接口 (BCI) 领域,选择高效且稳健的特征对于人工智能 (AI) 辅助临床诊断非常有吸引力。在本研究中,我们基于嵌入式特征选择模型,以逐层方式构建堆叠深度结构进行特征选择。其良好的性能由堆叠广义原理保证,即添加到原始特征中的随机投影可以帮助我们以堆叠方式连续打开原始特征空间中存在的流形结构。有了这样的好处,原始输入特征空间变得更加线性可分。我们使用波恩大学提供的癫痫脑电图数据来评估我们的模型。基于脑电图数据,我们构建了三个分类任务。在每个任务中,我们使用不同的特征选择模型来选择特征,然后使用两个分类器根据所选特征进行分类。我们的实验结果表明,我们的新结构选择的特征对分类器更有意义且更有帮助,因此比基准模型产生更好的性能。
脑机接口 (BCI) 是连接人脑和计算机或其他电子设备的通信和控制系统。然而,无关通道和与任务无关的误导性特征限制了分类性能。为了解决这些问题,我们提出了一种基于粒子群优化 (PSO) 的高效信号处理框架,用于通道和特征选择、通道选择和特征选择。改进的 Stockwell 变换用于特征提取,多级混合 PSO-贝叶斯线性判别分析用于优化和分类。这里使用 BCI 竞赛 III 数据集 I 来确认所提方案的优越性。与未优化方法(89%准确率)相比,基于PSO的方案在使用不到10.5%的原始特征时,最佳分类准确率达到99%,测试时间减少90%以上,Kappa值和F-score分别达到0.98和98.99%,信噪比更好,优于现有算法。结果表明,通道和特征选择方案可以加快收敛到全局最优的速度,减少训练时间。由于该框架可以显著提高分类性能,有效减少特征数量,大大缩短测试时间,可以为相关实时BCI应用系统研究提供参考。
摘要:情绪意识感知是一个正在迅速发展的领域,它可以实现人与机器之间更自然的互动。脑电图 (EEG) 已成为一种测量和跟踪用户情绪状态的便捷方式。EEG 信号的非线性特性会产生高维特征向量,从而导致高计算成本。本文使用深度特征聚类 (DFC) 结合多个神经网络的特征来选择高质量属性,而不是传统的特征选择方法。DFC 方法通过省略不可用的属性来缩短网络的训练时间。首先,将经验模态分解 (EMD) 作为一系列频率应用来分解原始 EEG 信号。在使用解析小波变换 (AWT) 进行特征提取过程之前,将分解后的 EEG 信号的时空分量表示为二维频谱图。使用四个预训练的深度神经网络 (DNN) 来提取深度特征。利用基于差分熵的 EEG 通道选择和 DFC 技术实现降维和特征选择,该技术使用 k 均值聚类计算一系列词汇。然后从一系列视觉词汇项目中确定直方图特征。SEED、DEAP 和 MAHNOB 数据集的分类性能与 DFC 的功能相结合表明,所提出的方法在短处理时间内提高了情绪识别的性能,并且比最新的情绪识别方法更具竞争力。