虽然消息传递图神经网络会导致信息丰富的节点嵌入,但它们可能无法描述图的拓扑特性。为此,节点滤波已被广泛用作使用持久图获得图的拓扑信息的一种尝试。然而,这些尝试面临着失去节点 - 床上用品信息的问题,这反过来又阻止了它们提供更具表现力的图表。为了解决这个问题,我们将重点转移到边缘效果上,并引入了一种新颖的基于边缘的持久性持续图,称为拓扑边缘图(TED),该图被数学证明可以保留节点嵌入信息以及包含其他拓扑信息。要实现TED,我们提出了一种基于神经网络的算法,名为“线图越vietoris-rips”(LGVR)持久图,该图通过将图形转换为其线图来提取边缘信息。通过LGVR,我们提供了两个模型框架,可以应用于任何传递GNN的消息,并证明它们比Weisfeiler-Lehman型着色更强大。最后,我们从经验上验证了模型在几种图形分类和回归基准上的出色性能。关键字:图形神经网络,持久图,拓扑数据分析,Weisfeiler-Lehman测试,越野透 - rips过滤
阿卜杜拉国王科技大学 (KAUST),计算生物科学研究中心 (CBRC),沙特阿拉伯图瓦尔 vladimir.bajic@kaust.edu.sa 摘要 识别药物和蛋白质的相互作用是药物发现早期阶段和寻找新药用途的重要步骤。传统的实验识别和验证这些相互作用仍然耗时、昂贵,并且成功率不高。为了改进这种识别过程,开发计算方法以最小错误率预测和排序可能的药物-靶标相互作用 (DTI) 将大有帮助。在这项工作中,我们提出了一种使用图嵌入和图挖掘进行药物-靶标相互作用预测的计算方法 DTiGEM。DTiGEM 模型将新型 DTI 识别为通过整合三个网络构建的异构图中的链接预测问题,即:药物-药物相似性、靶标-靶标相似性和已知 DTI。 DTiGEM 结合了不同的技术,包括图嵌入(例如 node2vec)、图挖掘(例如药物和目标之间的路径得分)和机器学习(例如不同的分类器)。与其他最先进的方法相比,DTiGEM 在四个基准数据集上对 DTI 进行计算预测时,在精确召回曲线下面积 (AUPR) 方面的预测性能有所提高。具体而言,我们证明,基于所有基准数据集的平均 AUPR 得分,DTiGEM 实现了最高平均 AUPR 值 (0.831),从而相对于比较中表现第二好的方法将预测误差降低了 22.4%。
为了更好地理解本课程,请参阅第三部分课程指南组合学部分和以下先决条件:组合介绍诸如Ramsey理论和极端图理论之类的主题。相关的本科课程包括:本课程没有严格的先决条件,尽管有一些基本的图理论术语会有所帮助。任何图理论课程都应为您提供此类知识,因此,即使您以前从未服用,这也不是问题。一些推荐书了解课程内容的是: - B.Bollobas(任何版本)的Combinatorics -R.Graham,B.Rothschild and B.Spencer(任何版本)的Ramsey Theory(Ramsey Theoy)的课程也是如此。对于极端图理论,从任何第一阶段对图理论具有基本理解就足够了。作为现实检查,请尝试在这些示例表中做一些问题:一些可能使您对这些主题有所了解的书是: - B.Bollobas(任何版本)的现代图理论 - N.Alon和J.Spencer(任何版本)的概率方法(任何版本)的组合用与离散的图形类似于图形。这是数学的一个分支,研究图形的特性和结构,由顶点和边缘组成。部门在组合矩阵理论,光谱图理论和拉姆西理论方面具有专业知识。在组合矩阵理论中,研究人员研究了在某些限制下的特殊矩阵。这些对象模拟现实世界现象,例如统计实验,误差校正等。他们还帮助设计方案,用于光掩模,过滤,电话会议,雷达,GPS和量子密码学。现代组合制剂中最著名的未解决问题之一是Hadamard Matrix猜想。该部门的研究专业知识还包括有关Hadamard矩阵,称重矩阵,正交设计,有限的投射飞机和入门非负矩阵的工作。Comminatorics探讨了在保证某个属性或最大结构看起来没有该属性之前必须是什么结构的密集。在图理论中,人们可能会询问避免特定类型的子图的最密集图。算术组合学检查了多少个数字满足给定范围内的算术特性。拉姆西理论重点是保存在分区或化着色小节下的结构。极端组合和拉姆西理论是密切相关的,通常在极端图理论中具有类似的公式。使用的工具包括图形,有限的几何形状,部分订单,拓扑,数字理论和概率方法。随机图是图形空间上的概率分布,研究以了解典型或预期属性。erdős-rényi随机图模型是通过以固定概率独立包含每个可能的边缘来定义的。许多属性表现出阈值行为:参数的小变化导致可能性发生巨大变化。研究兴趣包括过程如何随着时间的流逝而演变,例如信息和顶点激活的传播以及添加新边缘时的图形变化。频谱图理论研究了相关矩阵的特征值和特征向量的图形特性,并在图形上应用了食物网,蛋白质相互作用网络和量子步行。确定这两个不变性之间的关系动态需要分析经典图形参数并找到一种专门针对某些类型的图形计算它们的方法。这通常是通过使用图理论技术(例如着色和分解)以及基本的线性代数原理来完成的。
通过优化模型的最坏情况性能,基于分布的强大优化(DRO)图形网络方法改善了建议系统的脱离(OOD)概括。但是,这些研究未能考虑嘈杂样本在训练数据中的影响,这导致概括能力降低和准确性降低。通过实验和理论分析,本文表明,当前基于DRO的图形建议方法为噪声分布分配了更大的权重,从而导致模型参数学习由其主导。当模型过于关注训练数据中的噪声样本时,它可能会学习无关紧要或含义的较小功能,这些功能无法推广到OOD数据。为了应对这一挑战,我们为O OD推荐(DRGO)设计了D iStribution Rubust G Raph模型。具体来说,我们的方法首先采用简单有效的扩散范式来减轻潜在空间中的嘈杂效应。此外,在DRO目标函数中引入了熵常规项,以避免在最坏情况下分布中的极端样品权重。最后,我们提供了DRGO的概括误差结合的理论证明,以及对我们的方法如何对嘈杂的样本效应的理论分析,这有助于从理论角度更好地理解所提出的框架。我们在四个数据集上进行了广泛的实验,以评估我们的框架的有效性,以针对三个典型的分布变化进行评估,结果证明了其在独立和相同分布分布(IID)和OOD中的优势。我们的代码可在https://anonymon.4open.science/r/drgo-fed2上找到。
摘要 在药物发现中,生成具有所需生物活性的分子引起了越来越多的关注。先前的分子生成模型被设计为以化学为中心的方法,几乎不考虑药物-靶标相互作用,从而限制了它们的实际应用。在本文中,我们旨在以靶标感知的方式生成分子药物,以将生物活性和分子设计联系起来。为了解决这个问题,我们从几个公开可用的数据集中编制了一个基准数据集,并在统一的框架中构建基线。基于基于流的分子生成模型的最新优势,我们提出了 SiamFlow,它强制流适应潜在空间中目标序列嵌入的分布。具体而言,我们采用对齐损失和均匀损失来使目标序列嵌入和药物图嵌入达成一致,同时避免崩溃。此外,我们通过学习目标序列嵌入的空间将对齐形式化为一对多问题。实验定量表明,我们提出的方法可以在潜在空间中学习有意义的表示,从而生成目标感知的分子图,并为药物发现中连接生物学和化学提供了一种替代方法。
•我们可能有一个特殊的状态,可以承认减少的描述。如果我们知道自己的状态已经解压缩,我们可以通过指针状态的经典集合来描述它,而经典可观察物则独立于分支之间的相对相位,仅需要2 n -1个真实参数。或,如果我们知道我们的状态是某些指定的可观察到的特征状态,或者是一组可观察到的同时特征,我们可以获得一个紧凑的描述。例如,N量子位的Pauli Group包括2·4 N(签名)Pauli弦。所有n- qubit状态都稳定,即是身份操作员1的单位特征向量(并且无稳定-1)。,但只有一组离散的状态稳定了任何其他保利字符串:可以通过离散而不是连续信息指定的一组特殊状态。
在临床人工智能(AI)中,图表表示学习,主要是通过图神经网络和图形变压器体系结构,其能力很突出,其能力捕获临床数据集中的复杂关系和结构。使用不同的数据(从患者记录到成像),通过将其中的模式和实体视为与他们的关系相互联系的节点,将AI模型整体地处理数据。图AI促进了跨临床任务的模型转移,从而使模型能够在没有其他参数的情况下在患者群体之间发电,并且最少到没有重新进行了。但是,以人为中心的设计和模型解释性在临床决策中的重要性不能被夸大。由于图形AI模型通过在关系数据集上定义的局部神经转换捕获信息,因此它们在阐明模型基本原理方面提供了机会和挑战。知识图可以通过将模型驱动的见解与医学知识保持一致来增强可解释性。新兴图AI模型集成了各种数据