摘要:在不同投影场景下,气候模拟的时空分辨率的复杂性产生了多种气候模式。本文通过一种无监督的深度学习技术提出了一种新的数据驱动的气候分类工作,该技术可以在尺寸上降低大量时空数值气候投影数据中的大量紧凑表示。我们旨在确定捕获多个气候变量的不同区域以及在不同气候变化方案下的未来变化。我们的方法利用卷积自动编码器与K-均值聚类(标准自动编码器)和在线聚类相结合,基于sindhorn - Knopp算法(群集自动编码器),整个Conterminous美国(CONUS)(CONUS)(CONUS)捕获来自数据驱动的气候型号的独特气候式的goldement offeration Androm intery Demplyicals todlement todlement todlemant througation dynerical offer -Gromys toym intery dynerical demancortial dynerical ofderational dynerical officolt offer。 (GFDL-ESM2G)。开发的方法在多个变暖方案下以0.125 8的0.125 8将70年的GFDL-ESM2G仿真压缩为较低维空间的空间分辨率为660000倍,然后在150年的GFDL-ESM2G仿真数据中测试了150年。结果表明,五个气候群体捕获了与人类专家定义的已知气候类别相匹配的物理合理和空间稳定的气候效果。结果还表明,与使用标准自动编码器相比,使用群集自动编码器可以将聚类的计算时间限制为9.2倍。我们五个独特的气候模式是由深度学习引起的 - 基于较低维空间的聚类,从而使我们能够在整个综合美国立即提供有关水力气学及其空间异质性的见解,而无需下载大量的大气候数据集。
动机:抑制剂 - 激酶结合亲和力的准确预测对于药物发现和医疗应用至关重要,尤其是在治疗诸如癌症之类的疾病中。现有的预测抑制剂 - 激酶亲和力的方法仍然面临挑战,包括数据表达不足,功能提取有限和性能低。尽管通过人工智能(AI)方法(尤其是深度学习技术)取得了进展,但许多当前的方法未能捕获激酶与抑制剂之间的复杂相互作用。因此,有必要开发更先进的方法来解决抑制剂 - 激酶结合预测中的现有问题。结果:这项研究提出了Kinhibhib,这是抑制剂 - 激酶结合亲和力预测指标的新型框架。kinhibit会整合自我监督的预训练的预训练的分子编码器和蛋白质语言模型(ESM-S),以有效提取特征。kinhibit还采用特征融合方法来优化抑制剂和激酶特征的融合。实验结果证明了这种方法的优越性,在三种MAPK信号途径激酶的抑制剂预测任务中,精度达到了92.6%的精度:RAF蛋白激酶(RAF),有丝分裂原激活的蛋白激活蛋白激酶激酶激酶(MEK)和细胞外信号调节激酶(ERK)。此外,该框架在包含200多个激酶的数据集上达到了令人印象深刻的精度。这项研究为药物筛查和生物科学提供了有希望的有效的工具。
摘要 - 该纸张利用机器学习算法来预测和分析财务时间序列。该过程始于一个deno的自动编码器,以从主合同价格数据中滤除随机噪声波动。然后,一维卷积会降低过滤数据的维度并提取关键信息。被过滤和降低的价格数据被馈送到GAN网络中,其输出作为完全连接的网络的输入。通过交叉验证,训练了模型以捕获价格波动之前的功能。该模型预测了实时价格序列的重大价格变化的可能性和方向,将交易置于高预测准确性的时刻。经验结果表明,使用自动编码器和卷积来过滤和DENOSIS财务数据,结合gan,实现一定程度的预测性能,验证了机器学习算法的能力,以发现财务序列中的基本模式。
图 6 示例性注意力矩阵,可视化三位参与者在收敛时的注意力得分(来自随机选择的训练样本)(值越亮表示注意力得分越高)。解码器中的时间步长在 y 轴上表示,编码器的时间步长在 x 轴上表示。对角线结构表明注意力得分在时间域上是很好地对齐的,例如输出中的后续步骤关注输入中的后续步骤。该图还表明,填充输入 sEEG 序列(语音规划和理解)可能是不必要的,因为没有太多注意力放在第一个和最后一个输入步骤上。
摘要:基于模型的强化学习可以有效提高强化学习的样本效率,但是该方法中的环境模型有错误。模型错误可能会误导策略优化,从而导致次优政策。为了提高环境模型的概括能力,现有方法通常使用集合模型或贝叶斯模型来构建环境模型。但是,这些方法在计算密集型和复杂更新。由于生成的模型可以描述环境的随机性质,因此本文提出了一种基于有条件的自动编码器(CVAE)的基于模型的增强学习方法。在本文中,我们使用CVAE来学习与任务相关的表示形式,并应用生成模型来预测环境变化。考虑到多步误差积累的问题,模型适应用于最大程度地减少模拟和真实数据分布之间的差异。此外,该实验证实了所提出的方法可以学习与任务相关的表示并加速政策学习。
在生物信息学中,蛋白质二级结构预测在理解蛋白质功能和相互作用中起着重要作用。本研究介绍了TE_SS方法,该方法使用基于变压器编码的模型和ANKH蛋白质语言模型来预测蛋白质二级结构。根据蛋白质的二级结构(DSSP)版本4。使用各种数据集对模型的性能进行了严格评估。此外,本研究还将模型与八个结构类预测中的最新方法进行了比较。调查结果表明,TE_SS在九级和三类结构预测中表现出色,同时还表现出八类类别的熟练程度。这是由于其在QS和SOV评估指标中的性能而强调的,这证明了其识别复杂蛋白质序列模式的能力。此进步为蛋白质结构分析提供了重要的工具,从而丰富了生物信息学领域。
摘要 — 基于运动想象的脑机接口 (MI-BCI) 需要校准程序来为新用户调整系统。此过程非常耗时,并且会阻止新用户立即使用系统。由于 MI 信号的主体相关特性,开发独立于主体的 MI-BCI 系统以减少校准阶段仍然具有挑战性。已经开发了许多基于机器学习和深度学习的算法来从 MI 信号中提取高级特征,以提高 BCI 系统对主体的泛化能力。然而,这些方法基于监督学习并提取可用于区分各种 MI 信号的特征。因此,这些方法无法在 MI 信号中找到共同的潜在模式,并且其泛化水平有限。本文提出了一种基于监督自动编码器 (SAE) 的独立于主体的 MI-BCI 来绕过校准阶段。建议的框架在 BCI 竞赛 IV 中的数据集 2a 上得到了验证。模拟结果表明,在九个受试者中的八个中,我们的 SISAE 模型在平均 Kappa 值方面优于传统的和广泛使用的 BCI 算法、常见空间和滤波器组常见空间模式。
如图 1 所示,感知脑解码 (PBD) 是一种利用不同刺激引起的大脑反应来辨别原始感知刺激(例如视觉或听觉线索)或其某些特征的方法。通常,PBD 在认知和临床两个方面都具有优势。通过 PBD,可以仔细研究与外部刺激相对应的不同大脑活动模式。在临床环境中,大脑解码技术可以用于与患有闭锁综合症或瘫痪等疾病(这些疾病可能会损害运动和发声功能)的个体进行交流。在这种情况下,可以尝试在提供感知刺激的同时重建个体的反应或想象。此外,改进的感知脑解码方法可以用于记忆检索或可视化思维等应用,从而有助于认知研究和康复工作。
摘要 - 深度学习模型最近在许多分类任务上表现出色。深度神经网络的出色表现取决于大量的训练数据,同时必须具有相等的类别分布才能有效。但是,在大多数现实世界中,标记的数据可能受到类别之间高不平衡比率的限制,因此,大多数分类算法的学习过程受到不利影响,从而导致预测和性能较低。三种主要方法解决了不平衡学习的问题,即数据级,算法级别和混合方法,这些方法结合了上述两种方法。数据生成方法通常基于生成的对抗网络,这些网络需要大量的数据,而模型级别的方法需要广泛的领域专家知识来制定学习目标,从而在没有此类知识的情况下对用户访问较差。此外,这些方法中的绝大多数被设计和应用于成像应用,更少的时间序列,并且对它们都极为罕见。为了解决上述问题,我们介绍了Genda,Genda是一种基于生成邻域的Deep AutoCoder,它在设计方面既简单又有效,并且可以成功地应用于图像和时间序列数据。genda基于学习潜在
摘要:诸如ChatGpt和其他大型语言模型(LLM)等变压器网络的功能引起了世界的关注。其性能基础的至关重要的计算机制依赖于将完整的输入序列(例如,句子中的所有单词)转换为一个长的“编码向量”,该序列使变压器可以在自然序列中学习长距离的时间依赖性。具体来说,应用于此编码向量的“自我注意力”通过计算输入序列中的单词对之间的关联来增强变形金刚中的时间上下文。我们建议,跨单个皮质区域或以整个脑规模的多个区域传播的神经活动波可以实施类似的编码原理。通过将最新的输入历史记录到每个时间时刻,皮层波可以使时间上下文从感觉输入的序列中提取,这是变压器中使用的计算原理。