扩散生成模型(DMS)在图像和图生成方面取得了有希望的结果。然而,现实世界图,例如社交网络,分子图和交通图,通常共享非欧国人拓扑和隐藏的层次结构。例如,图的度分布主要是幂律分布。当前的潜在扩散模型将层次数据嵌入到欧几里得空间中,从而导致扭曲并干扰建模分布。取而代之的是,由于其指数生长特性,已发现双曲线空间更适合捕获复杂的层次结构。In order to simulta- neously utilize the data generation capabilities of diffusion models and the ability of hyperbolic embeddings to extract la- tent hierarchical distributions, we propose a novel graph gen- eration method called, Hyperbolic Graph Diffusion Model (HGDM), which consists of an auto-encoder to encode nodes into successive hyperbolic embeddings, and a DM that oper- ates in the双曲线潜在空间。HGDM通过构造包含边缘信息的双曲线潜在节点空间来捕获Crucial图结构分布。的实验实验表明,HGDM在通用图和分子生成基准测试中获得了更好的表现,并且具有高度层次结构的图生成质量提高了48%。
图对比学习 (GCL) 已出现,用于从对比视图中学习可泛化的表示。然而,它仍处于起步阶段,存在两个问题:1)通过数据增强改变图结构来生成对比视图可能会误导消息传递方案,因为这种图改变操作会剥夺内在的图结构信息,尤其是有向图中的方向结构;2)由于 GCL 通常使用带有手动挑选参数的预定义对比视图,因此它没有充分利用数据增强提供的对比信息,导致模型学习的结构信息不完整。在本文中,我们设计了一种称为拉普拉斯扰动的有向图数据增强方法,并从理论上分析了它如何在不改变有向图结构的情况下提供对比信息。此外,我们提出了一个有向图对比学习框架,该框架从拉普拉斯扰动生成的所有可能的对比视图中动态学习。然后我们使用多任务课程学习来训练它,以从多个易到难的对比视图中逐步学习。我们通过实证研究证明,我们的模型能够比其他 GCL 模型保留更多有向图的结构特征,因为它能够提供完整的对比信息。在各种基准测试中的实验表明,我们优于最先进的方法。
≻操作员将搜索的输出限制为特定的深度。因此,上面的表达式说,在顶点a开始,重量小于15的汉密尔顿路径(在图中)分别为a:[a,b,c,d]和[a,b,c,d]和[a,c,d,b],重量为11和10。计算汉密尔顿路径的算法通常很复杂。 但是,我们的实现很简单,是由小的代数组件建立的。 有关这些组件的更多详细信息,请参见第3节。 第一个组件是∗运算符,该操作员计算传递闭合。 图 1包含其用途的图:图形是一个图形,每个顶点都具有每个可触及顶点的边缘,重量等于该顶点的最短路径上的权重之和。 例如,有一个边缘(a↦→d)∈Gragr∗,重量5,由路径a↦→c↦→d构建(请注意,在我们的形式化中,∗不是直接在图上调用,而是在图5.4中所述的理想,而是在其理想上调用)。 大多数算法“工作”都是由∗函数完成的;其余的实施是保存和过滤。 路径函数,例如,标记每个顶点的列表,代表所需的路径到达该顶点。 > =>操作员连接图形:在这里我们将其用于组合计算汉密尔顿路径的算法通常很复杂。但是,我们的实现很简单,是由小的代数组件建立的。有关这些组件的更多详细信息,请参见第3节。第一个组件是∗运算符,该操作员计算传递闭合。图1包含其用途的图:图形是一个图形,每个顶点都具有每个可触及顶点的边缘,重量等于该顶点的最短路径上的权重之和。例如,有一个边缘(a↦→d)∈Gragr∗,重量5,由路径a↦→c↦→d构建(请注意,在我们的形式化中,∗不是直接在图上调用,而是在图5.4中所述的理想,而是在其理想上调用)。大多数算法“工作”都是由∗函数完成的;其余的实施是保存和过滤。路径函数,例如,标记每个顶点的列表,代表所需的路径到达该顶点。> =>操作员连接图形:在这里我们将其用于组合
确定由基于温度的复制品交换分子动力学(T-REMD)完成的最佳蛋白质构型用于使用蛋白质结合分析,这是准确描绘蛋白质在不同溶剂环境中的行为的重要过程,尤其是在确定蛋白质最佳结合位点以在蛋白质粘结剂和蛋白质蛋白质中使用的最佳结合位点。然而,该分析的完成(通过配置变化推出了顶部绑定位点)是一个多项式状态计算问题,即使在最快的超级计算机上,也可能需要多个小时来计算。在这项研究中,我们旨在确定图形切割是否提供近似溶液,最大问题可以用作一种方法,以在确定表面活性剂蛋白A(SP-A)顶部结合位点(SP-A)的顶部结合位点进行结合分析,以提供与T-REMD相似的结果。此外,我们使用实际量子处理器单元(QPU)在IFF技术的Polar+软件包中使用量子混合算法,使用模拟QPU或量子抽象的机器(QAM)在大型经典计算设备上实现Polar+的实现,并在经典的MaxCut Algorith上实施,以确定超级Commuthm ge grom computige of grow of SuperComputimant of SuperComputime,以确定超级计算机的范围。用于此问题的量子计算设备,甚至在经典设备上使用量子算法。这项研究发现,Polar+对MaxCut近似算法的经典实现或GROMACS T-REMD的使用提供了巨大的加速,并在其QPU和QAM实现中产生可行的结果。然而,使用图切割方法后,缺乏直接构型变化在SP-A的结构上产生的最终结合结果与GROMACS T-REMD产生的结合结果不同。因此,需要完成进一步的工作,以将基于量子的概率转换为基于各种噪声条件的配置更改,以更好地确定量子算法和量子设备在不久的将来可以提供的准确性优势。
摘要 - 在本文中,我们提出了T-FDP模型,T-FDP模型是一种基于学生t分布定义的新型有界短距力(T-Force)的定向位置方法。我们的表述具有灵活性,对附近的节点施加有限的排斥力,并且可以在其短期和长期效应中分别进行调整。在力指导的图形布局中使用此类力比当前方法可得出更好的邻域保存,同时保持低应力误差。使用快速傅立叶变换的有效实现是比最新方法快的速度快一个数量级,而在GPU上的两个订单则更快,使我们能够通过全球和本地调整复杂图的实时调整T-FORCE来执行参数调整。我们通过针对交互式探索的最新方法和扩展的数值评估来证明方法的质量。
近年来,图神经网络(GNN)凭借其邻域聚合的特性,在许多领域得到了成功应用,并取得了最佳性能。虽然大多数GNN处理图数据,但原始图数据往往带有噪声或不完整,导致GNN性能不佳。为了解决这个问题,最近出现了一种图结构学习(GSL)方法,通过学习符合基本事实的图结构来提高图神经网络的性能。然而,目前的GSL策略是迭代优化最优图结构和单个GNN,这会在训练中遇到几个问题,即脆弱性和过度拟合。本文引入了一种称为进化图神经网络(EGNN)的新型GSL方法,以提高对对抗性攻击的防御能力并增强GNN性能。与现有的GSL方法通过交替训练方法来优化图结构并增强单个GNN模型的参数不同,本文首次将进化理论应用于图结构学习。具体来说,通过变异操作生成的不同图结构用于进化一组模型参数,以适应环境(即提高未标记节点的分类性能)。然后使用评估机制来衡量生成样本的质量,以便仅保留具有良好性能的模型参数(后代)。最后,保留适应环境的后代并用于进一步优化。通过这个过程,EGNN 克服了图结构学习的不稳定性,并且始终进化出最好的后代,为 GSL 的进步和发展提供了新的解决方案。在各种基准数据集上进行的大量实验证明了 EGNN 的有效性以及基于进化计算的图结构学习的好处。© 2023 由 Elsevier BV 出版
知识图谱 [39](KG)是一种用于知识表示的抽象,通过表示诸如纽约市和美国之类的实体(即节点)以及连接这些实体的二元关系,对一个或多个领域的知识进行编码;例如,纽约市和美国通过关系国家连接起来,即纽约市有美国这个国家。大多数 KG 还包含将实体与文字连接起来的关系,即来自已知数据结构的值,如字符串、数字、日期等;例如,连接纽约市和整数 1624 的关系 solved 描述实体纽约市的属性。更一般地,我们可以从双重视角看待知识图谱:将其视为有向标记多图,其中节点表示实体或文字,标记边表示实体之间或实体与文字之间的特定关系;以及一组陈述,也称为事实,具有主语-谓语-宾语三元组的形式,例如(纽约市,国家,美国)和(纽约市,定居,1624)。在下文中,我们将使用符号 (h, r, t)(头,关系,尾)来标识知识图谱中的陈述,就像在有关知识图谱嵌入的文献中经常使用的那样。知识图谱中描述的实体通常使用一组类型来组织,例如城市和国家,也称为概念、类或数据类型(当称为
图神经网络 (GNN) 正在图结构数据的机器学习研究中兴起。GNN 在许多任务上都实现了最先进的性能,但在具有大量数据和严格延迟要求的实际应用中,它们面临着可扩展性的挑战。为了应对这些挑战,人们已经进行了许多关于如何加速 GNN 的研究。这些加速技术涉及 GNN 管道的各个方面,从智能训练和推理算法到高效的系统和定制硬件。随着 GNN 加速研究数量的快速增长,缺乏系统的处理来提供统一的观点并解决相关工作的复杂性。在这篇综述中,我们提供了 GNN 加速的分类法,回顾了现有的方法,并提出了未来的研究方向。我们对 GNN 加速的分类处理将现有的工作联系起来,并为该领域的进一步发展奠定了基础。
摘要。人类大脑是复杂神经生物系统的核心,其中的神经元、电路和子系统以神秘的方式相互作用。了解大脑的结构和功能机制一直是神经科学研究和临床疾病治疗的有趣追求。将人类大脑的连接映射为网络是神经科学中最普遍的范例之一。图神经网络 (GNN) 最近成为一种对复杂网络数据进行建模的潜在方法。另一方面,深度模型的可解释性较低,这阻碍了它们在医疗保健等决策关键环境中的使用。为了弥补这一差距,我们提出了一个可解释的框架来分析特定于疾病的兴趣区域 (ROI) 和突出的连接。所提出的框架由两个模块组成:一个面向大脑网络的疾病预测骨干模型和一个全局共享的解释生成器,该生成器突出显示特定于疾病的生物标志物,包括显着的 ROI 和重要连接。我们对三个真实的脑部疾病数据集进行了实验。结果验证了我们的框架可以获得出色的性能并识别有意义的生物标志物。该工作的所有代码均可在 https://github.com/HennyJie/IBGNN 上找到。