摘要 — 在本文中,我们研究了从脑电图 (EEG) 数据中解码跨受试者运动想象 (MI) 的问题。由于各种个体间差异(例如大脑解剖结构、性格和认知特征),多受试者 EEG 数据集呈现出几种领域转变。这些领域转变使多受试者训练成为一项具有挑战性的任务,也阻碍了跨受试者的稳健泛化。受领域泛化技术对于解决此类问题的重要性的启发,我们提出了一种两阶段模型集成架构,该架构由多个特征提取器(第一阶段)和一个共享分类器(第二阶段)构建,我们使用两个新颖的损失项对其进行端到端训练。第一个损失应用课程学习,迫使每个特征提取器专门针对训练对象的子集并促进特征多样性。第二个损失是集成内蒸馏目标,允许集成模型之间协作交换知识。我们将我们的方法与几种最先进的技术进行了比较,在两个大型 MI 数据集(即 PhysioNet 和 OpenBMI)上进行了独立于受试者的实验。我们的算法在 5 倍交叉验证和留一受试者评估设置中均优于所有方法,并且使用的可训练参数数量要少得多。我们证明了我们的模型集成方法结合了课程学习和协作训练的力量,可实现高学习能力和稳健的性能。我们的工作解决了多受试者 EEG 数据集中的域转移问题,为无校准脑机接口铺平了道路。我们将代码公开发布在:https://github.com/gzoumpourlis/Ensemble-MI。索引术语——脑机接口、EEG、运动意象解码、模型集成、域泛化
摘要:降水对土地的预测对于社会经济风险评估至关重要,但是模型差异限制了其应用。在这里,我们使用一种模式过滤技术来识别多模型合奏的各个成员的低频变化,以评估投影模式和变化幅度的模型之间的差异。特别是,我们将低频组件分析(LFCA)应用于21 CMIP-6模型中每日降水极端的强度和频率。LFCA在预计变化的空间模式下,在模型之间的一致性中带来了适度但统计学上的显着改进,尤其是在温室强迫较弱的情况下。此外,我们表明LFCA促进了对降水极端量表随着单个合奏成员内的全球温度变化而增加降水量量表的强劲识别。尽管这些速率大致与Clausius-Clapeyron关系的期望平均匹配,但各个模型都会表现出很大且显着的差异。蒙特卡洛模拟表明,这些差异至少与气候敏感性的差异一样多,导致投影变化的不确定性。最后,我们将这些缩放率与观察产品鉴定的缩放率进行了比较,这表明几乎所有气候模型都显着低估了降水量增加的速度,而降水量增加的速度已随着历史上的全球温度而扩展。用观测值的约束投影扩大了降水极端的预测强度,并减少了其分布的相对误差。
hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
在亚季节时间尺度上产生关键气候变量(例如温度和沉淀)的高质量预测长期以来一直是操作预测的差距。本研究探讨了机器学习(ML)模型作为次生预测的后处理工具。滞后的数值集合预测(即成员具有不同初始化日期的合奏)和观察数据,包括相对湿度,海平面压力和地理位置高度,以预测每月平均降水量和两周的温度,以预测每月平均降水量和两周的温度。用于回归,分位数回归和二齿分类任务,我们考虑使用线性模型,随机森林,卷积神经网络和堆叠模型(基于单个ML模型的预测,一种多模型方法)。与以前单独使用集合的ML方法不同,我们利用嵌入整体预测中的信息来提高预测准确性。此外,我们研究了极端事件预测,这些预测对于计划和缓解工作至关重要。将合奏成员视为空间前铸件的集合,我们探讨了使用空间信息的不同方法。可以通过模型堆叠来减轻不同方法之间的权衡。我们提出的模型优于标准基准,例如气候预测和整体手段。此外,我们研究特征的重要性,使用完整的合奏或仅合奏均值之间的权衡以及对空间可变性的不同会计模式。
摘要 - 传统的推荐系统遭受概念漂移的困扰 - 一种假定用户偏好随着时间而言是静态的现象。为了解决此问题,需要使用推荐算法来考虑用户偏好的时间敏感变化并提供相关建议。这项研究工作提出了一个基于合奏的混合推荐系统,该系统结合了用户兴趣的时间变化。提出的系统结合了不同的算法,例如受欢迎程度,聚类,协作矩阵分解和奇异价值分解(SVD)。然后,使用人工神经网络(ANN)将从这些单个模型获得的电影建议合并并分类。用户对提出的建议的反馈,这有助于计算每批建议的相关因素。最后,向用户提供了相关的电影建议。在相关因素较低的情况下,建议将重新分类。提议的系统的目的是根据用户的时间敏感偏好为用户提供各种建议。提出的研究的新颖性是整合了普遍的建议策略以及用户反馈机制在提出的建议中的结合。所提出的系统是在标准电影数据集Movielens-25m上实现的,并使用RMSE和MAE等统计性能指标进行评估。这项工作说明了建议质量的提高以及对改变用户偏好的适应性。实验表明,将人工神经网络作为集合混合建议模型的分类器的整合在提供0.56和0.43作为RMSE和MAE值的相关建议方面表明了有希望的结果。
摘要 - 机器学习确定来自数据的模式,以加快决策过程。基于事实的决策和数据驱动的决策由行业专家指定。由于医疗保健中机器语言模型的持续增长,它们在ML模型中繁殖了连续的复杂性和黑匣子。为了使ML模型晶体清晰且可实现的解释,AI登录率很高。这项研究审查了印度医疗保健系统中可解释的AI和能力检测糖尿病。石灰和外形是两个用于实现可解释AI的库和软件包。密封的基础合并局部和全局可解释的方法,从而增强了复杂模型的结晶度,并从复杂模型中获得了对公平性的直觉。此外,所获得的直觉还可以促进临床数据科学家计划对计算机辅助诊断的更奇怪的组成。XAI对预测顽固疾病的重要性。 在这种情况下,顽固的糖尿病,血浆与胰岛素与胰岛素之间的相关性,年龄与妊娠,类(糖尿病和非糖尿病患者)与血浆葡萄糖的相关性持续存在着牢固的关系。 具有塑形值的PIMD(PIMA印度糖尿病数据集)用于简洁依赖性,而当同时需要特征的锚定和重要性时,石灰是适用的。 依赖图可帮助医生可视化与预测疾病的独立关系。 要识别不同属性的依赖性,使用相关热图。XAI对预测顽固疾病的重要性。在这种情况下,顽固的糖尿病,血浆与胰岛素与胰岛素之间的相关性,年龄与妊娠,类(糖尿病和非糖尿病患者)与血浆葡萄糖的相关性持续存在着牢固的关系。具有塑形值的PIMD(PIMA印度糖尿病数据集)用于简洁依赖性,而当同时需要特征的锚定和重要性时,石灰是适用的。依赖图可帮助医生可视化与预测疾病的独立关系。要识别不同属性的依赖性,使用相关热图。从学术的角度来看,Xai在不久的将来对成熟是必不可少的。估算了其他适用数据集对应研究的介绍,这是非常学徒的。
摘要:传统的飞机维修保障工作主要基于结构化数据。非结构化数据,如文本数据,尚未得到充分利用,这意味着资源的浪费。这些非结构化数据蕴含着巨大的故障知识库,可以为飞机维修保障工作提供决策支持。因此,本文提出了一种基于文本的故障诊断模型。所提方法利用Word2vec将文本单词映射到向量空间,然后将提取的文本特征向量输入基于堆叠集成学习方案的分类器。使用真实的飞机故障文本数据集验证了其性能。结果表明,所提方法的故障诊断准确率为97.35%,比次优方法提高了约2%。
由于目前尚无具有临床疗效的药物,因此寻找针对 COVID-19 的有效药物仍然迫在眉睫。近年来,寻找已获批准或正在研究的药物的新用途(即药物再利用)变得越来越流行。我们在此提出了一种基于知识图谱 (KG) 嵌入的 COVID-19 药物再利用新方法。我们的方法在以 COVID-19 为中心的 KG 中学习实体和关系的“集成嵌入”,以便获得图元素的更好的潜在表示。随后,集成 KG 嵌入用于训练深度神经网络以发现 COVID-19 的潜在药物。与相关研究相比,我们在排名靠前的预测中检索到了更多试验中药物,从而对试验外药物的预测更有信心。据我们所知,这是第一次使用分子对接来评估使用 KG 嵌入进行药物再利用获得的预测。我们表明福辛普利是 SARS-CoV-2 nsp13 靶标的潜在配体。我们还通过从 KG 中提取的规则以及 KG 衍生的解释路径来解释我们的预测。分子评估和解释路径为我们的结果带来了可靠性,并构成了评估基于 KG 的药物再利用的新的互补且可重复使用的方法。
摘要 — 在动态配电市场环境中,拥有太阳能发电和电池储能设备的住宅产消者可以通过电力交换灵活地与电网互动。提供这种双向电力调度的时间表可以方便电网运营商进行运营规划,并通过一些经济激励为产消者带来额外好处。然而,实现这种双赢局面的主要障碍是难以 1) 预测未知运行条件下电池退化的非线性行为和 2) 以计算可行的方式解决高度不确定的发电/负载模式。因此,本文为配备屋顶太阳能光伏板和家用电池的住宅产消者建立了一个强大的短期调度框架。目标是在具有规定调度规则的动态配电能源市场环境下实现最低成本运行。提出了一个一般的非线性优化问题,其中考虑了由于电力交易、电池退化和各种运行约束而导致的运营成本。使用所提出的基于集成非线性模型预测控制的经济调度策略实时解决优化问题,尽管本地数据有限,但预测中的不确定性已得到充分解决。所提出的算法的有效性已使用真实世界的产消者数据集得到验证。
摘要 - 在物理验证流中,layout热点检测非常重要。深度神经网络模型已应用于热点检测并取得了巨大的成功。布局可以视为二进制图像。因此,二进制的neu-lal网络(BNN)可以适合热点检测问题。在本文中,我们提出了一个基于BNN的新深度学习档案,以加快热点检测中的神经网络。一个新的二进制残留神经网络经过精心设计用于热点检测。ICCAD 2012和2019基准的实验结果表明,我们的体系结构在检测准确性方面优于先前的热点探测器,并且比最佳基于深度学习的解决方案具有8倍的速度。由于基于BNN的模型在计算上是相当有效的,因此可以通过采用集合学习方法来实现良好的权衡。实验结果表明,集成模型比原始速度损失具有更好的热点检测性能。