本文根据信息标准研究了转移学习的效果。我们提出了一个程序,将转移学习与锤摩尔的CP(TLCP)结合在一起,并证明它在准确性和稳定性方面优于常规木棍的CP标准。Our theoretical results indicate that, for any sample size in the target domain, the proposed TLCp estimator performs better than the Cp estimator by the mean squared error (MSE) metric in the case of orthogonal predictors, provided that i) the dissimilarity between the tasks from source domain and target domain is small, and ii) the procedure parameters (complexity penalties) are tuned according to certain explicit rules.此外,我们表明我们的转移学习框架可以扩展到其他特征选择标准,例如贝叶斯信息标准。通过分析正交化CP的溶液,我们确定了一个在非正交预测因子的情况下,渐近地近似CP标准的解。对于非正交TLCP获得了相似的结果。最后,使用真实数据的模拟研究和应用证明了TLCP方案的有用性。关键字:转移学习,功能选择,槌狼的CP
心脏病是一种常见疾病,可导致死亡,难以手动检测。更有效的分类模型依靠机器学习方法来实现更高的分类精度,吸引了研究人员的注意力设计有效的预测模型。此外,它在医学心脏病学的实际应用中起着重要作用,目的是早期发现心脏病。在本文中,根据提出的自适应特征选择技术,使用四种机器学习方法提出了有效而准确的心脏病检测系统:支持向量机(SVM),逻辑回归(LR),决策树(DT)和随机森林(RF)。使用两种特征选择方法来设计提出的技术,相互信息(MI)和递归功能消除(RFE),以确定提高分类模型性能并降低模型实现时间复杂性的最佳选定特征数量。所提出的技术是在UCI机器学习存储库的两个标准数据库上实施的:克利夫兰心脏病和心脏statlog cleveland。使用交叉验证方法选择并保存为预测模型。结果表明,每个数据都根据分类器模型选择了不同数量的功能。对于第一个心脏病数据集,与其他分类器模型相比,最佳心脏病检测系统支持矢量机器 - 毫无用量信息(SVM-MI)的最高分类精度约为96.755。虽然第二个数据集的随机森林 - 杂种信息(RF-MI)模型的准确度为97.4%。与该领域的最新研究相比,该技术在准确性,F1分数,准确性和度量检索方面产生了最高的预测性能。
糖尿病是一种威胁生命的疾病,应尽早诊断和治疗。在本文中,递归特征消除率(RFE)和遗传算法(GA)已被用于两种不同患者遗产的两个不同糖尿病数据集的特征选择(FS),并与K-Nearest邻居(KNN)和最佳的糖尿病预测相结合。在我们的论文中,与KNN相比,RF表现出更好的性能。准确度级别也很大程度上取决于所使用的数据集。伊拉克社会糖尿病(ISD)数据集的准确性明显高于使用相同的FS和分类方法的PIMA印度糖尿病(PID)数据集。通过将KNN与RFE或GA结合在FS中可以提高,而与RF结合使用时,RF与COMEN -COMEN -CONDING一起使用。GA在计算上的效率低于RFE,并且表现出较低的精度。
摘要 - 常见的空间模式(CSP)算法是一种公认的空间过滤方法,用于运动成像(MI)基于脑部计算机的特征提取方法(BCIS)。然而,由于非统计学对电向形态学(EEG)的影响以及CSP目标函数的固有缺陷,空间滤波器以及它们相应的特征在CSP中使用的特征空间中不一定是最佳的。在这项工作中,我们设计了一种新功能选择方法来通过基于改进的目标函数选择功能来解决此问题。,改进是通过压制异常值和发现较大阶段距离的功能进行的。此外,提出了一种基于Dempster - Shafer理论的融合算法,该算法考虑了特征的分布。有了两个竞争数据集,我们首先根据分类精度,特征分布和嵌入性评估了改善目标函数的性能。然后,在精度和计算时间都进行了与其他特征选择方法的比较。实验结果表明,所提出的方法消耗的额外计算成本较少,并导致基于MI的BCI系统的性能显着提高。
量子计算已成为一个新兴领域,可能彻底改变信息处理和计算能力的格局,尽管物理上构建量子硬件已被证明是困难的,而且当前嘈杂中型量子 (NISQ) 时代的量子计算机容易出错且其包含的量子比特数量有限。量子机器学习是量子算法研究中的一个子领域,它对 NISQ 时代具有潜力,近年来其活动日益增多,研究人员将传统机器学习的方法应用于量子计算算法,并探索两者之间的相互作用。这篇硕士论文研究了量子计算机的特征选择和自动编码算法。我们对现有技术的回顾使我们专注于解决三个子问题:A) 量子退火器上的嵌入式特征选择,B) 短深度量子自动编码器电路,以及 C) 量子分类器电路的嵌入式压缩特征表示。对于问题 A,我们通过将岭回归转换为量子退火器固有的二次无约束二元优化 (QUBO) 问题形式并在模拟后端对其进行求解来演示一个工作示例。对于问题 B,我们开发了一种新型量子卷积自动编码器架构,并成功运行模拟实验来研究其性能。对于问题 C,我们根据现有技术的理论考虑选择了一种分类器量子电路设计,并与相同分类任务的经典基准方法并行进行实验研究,然后展示一种将压缩特征表示嵌入到该量子电路中的方法。
特征选择是高维统计和机器学习的重要主题,用于预测和理解潜在现象。它在计算机视觉,自然语言处理,生物信息学等中都有许多应用。但是,文献中的大多数特征选择方法已提出用于离线学习,现有的在线功能选择方法在真正的支持恢复中具有理论和实际限制。本文提出了两种新型的在线特征选择方法,该方法由随机梯度下降和硬阈值操作员提出。提出的方法可以同时选择相关特征,并基于所选变量构建线性回归或分类模型。为提出方法的一致性提供了理论上的理由。对模拟和实际稀疏数据集的数值实验表明,所提出的方法与文献的最新在线方法相比有利。关键字:变量选择,流数据,随机算法,退火过程,大数据学习
sof umer洞穴是一个未开发的极端环境,可容纳新型微生物和潜在的遗传资源。来自洞穴的微生物组已被遗传适应以产生各种生物活性代谢产物,使它们能够生存并耐受苛刻的结合。然而,尚未探索Sof umer Cave微生物中与生物合成相关的基因簇标志。因此,使用高通量shot弹枪测序来探索sof umer Cave的微生物组中与生物合成相关的基因簇(BGC)。Geneall DNA土壤迷你试剂盒用于从均质样品中提取高分子量DNA,并使用Novaseq PE150对纯化的DNA进行测序。根据微-RN数据库,乌默洞穴中最常见的微生物属是原细菌,静脉细菌,verrucomicrobobiota和蓝细菌。对与生物合成相关的基因簇进行了注释并分类,并使用抗石和NAPDOS1预先对BGC进行预令。确定了编码广泛的二级代谢物的BGC的460个推定区域,包括RIPP(47.82%),萜烯(19.57%),NRPS(13.04%),杂种(2.18%)和其他新的注释(10.87%)com punds。此外,NAPDOS管道还从链霉菌素的链霉菌素(链霉菌素基因肌链霉菌素)中鉴定出钙依赖性的抗生素基因簇,来自链霉菌Chrysomallus的放线菌素基因簇和来自链霉菌链霉菌的博霉素基因簇。这些发现突出了Sof Umer Cave微生物组的未开发的生物合成潜力,以及其发现天然产物的潜力。
糖尿病预测是一个正在进行的研究主题,医学专家试图以更高的精度预测病情。糖尿病通常保持昏昏欲睡,并且有机会确定患者患有另一种疾病,例如对肾脏的伤害,眼睛的视网膜问题或心脏病问题,它会导致代谢问题和体内各种复杂性。在本评论中应用了各种全球学习程序,包括投票,支持和解雇。使用工程设计的少数族裔过采样程序(被摧毁)以及K跨层互批批准方法,用于实现夜晚的上课并批准发现。PIMA印度糖尿病(PID)数据集是从UCI机器学习(UCI ML)商店中积累的,并选择了此数据集。一种突出的工程技术用于计算生活方式因素的影响。已经开发了一种两相分类模型,以使用顺序最小优化(SMO)和SMOTE方法一起预测胰岛素抵抗。SMOTE技术用于在模型的第一阶段中预处理数据,而SMO类则在第二阶段使用。所有其他分类技术的表现都超过了决策树的错误率,准确性,特异性,精度,召回,F1措施和ROC曲线。使用组合的SMOTE和SMO策略进行了模型,该策略以0.1 ms的运行时获得了99.07%的校正。建议的系统的结果是提高分类器在早期发现疾病方面的表现。
摘要:近几十年来,脑机接口 (BCI) 已成为研究的前沿领域。特征选择对于降低数据集的维度、提高计算效率和增强 BCI 的性能至关重要。使用与活动相关的特征可以在所需任务中获得较高的分类率。本研究提出了一种基于包装器的元启发式特征选择框架,用于使用功能性近红外光谱 (fNIRS) 的 BCI 应用。在这里,从所有可用通道计算时间统计特征(即平均值、斜率、最大值、偏度和峰度)以形成训练向量。使用基于 k 最近邻的成本函数测试了七种元启发式优化算法的分类性能:粒子群优化、布谷鸟搜索优化、萤火虫算法、蝙蝠算法、花授粉优化、鲸鱼优化和灰狼优化 (GWO)。基于来自 29 名健康受试者的运动想象 (MI) 和心算 (MA) 任务的在线数据集,对所提出的方法进行了验证。结果表明,与从全套特征中获得的特征相比,利用从元启发式优化算法中选择的特征可以显著提高分类准确率。所有上述元启发式算法都提高了分类准确率并减小了特征向量大小。GWO 对 MA、MI 和四类(左手和右手 MI、MA 和基线)任务的平均分类率最高(p < 0.01),分别为 94.83 ± 5.5%、92.57 ± 6.9% 和 85.66 ± 7.3%。所提出的框架可能有助于在训练阶段为基于 fNIRS 的稳健 BCI 应用选择合适的特征。
MICHELE GROSSI 1、NOELLE IBRAHIM 2、VOICA RADESCU 3、ROBERT LOREDO 4、KIRSTEN VOIGT 5、CONSTANTIN VON ALTROCK 6 和 ANDREAS RUDNIK 7。1 欧洲核子研究组织 (CERN),瑞士日内瓦 1211(电子邮件:michele.grossi@cern.ch)2 IBM Quantum,IBM 3600 Steeles Ave East Markham,ON L3R 9Z7,CA(电子邮件:noel.ibrahim@ibm.com)3 IBM Quantum,IBM Deutschland Research & Development GmbH,Schönaicher Str. 220, 71032 Böblingen, 德国(电子邮件:voica.radescu@ibm.com) 4 IBM Quantum, IBM Corp, 1 Alhambra Plaza Suite #1415 Coral Gables, FL 33134(电子邮件:loredo@us.ibm.com) 5 IRIS Analytics GmbH, Klostergut Besselich, 56182 Urbar, 德国(电子邮件: kirsten.voigt@iris.de) 6 IRIS Analytics GmbH,Klostergut Besselich,56182 Urbar,德国(电子邮件:constantin.von.altrock@iris.de) 7 IRIS Analytics GmbH,Klostergut Besselich,56182 Urbar,德国(电子邮件:andreas.rudnik@iris.de)