摘要 — 图神经网络 (GNN) 近年来因其处理图数据的能力而引起了广泛的研究关注,并已广泛应用于实际应用中。随着社会越来越关注数据隐私保护的需求,GNN 面临着适应这一新常态的需求。此外,由于联邦学习 (FL) 中的客户端可能存在关系,因此需要更强大的工具来利用这些隐含信息来提高性能。这导致了联邦 GNN (FedGNN) 这一新兴研究领域的快速发展。这个有前途的跨学科领域对于感兴趣的研究人员来说极具挑战性。缺乏对这个主题的深入调查进一步加剧了进入的难度。在本文中,我们通过对这一新兴领域进行全面调查来弥补这一空白。我们提出了 FedGNN 文献的二维分类法:1) 主要分类法通过分析 GNN 如何增强 FL 训练以及 FL 如何协助 GNN 训练,为 GNN 和 FL 的集成提供了清晰的视角;2) 辅助分类法提供了 FedGNN 如何处理 FL 客户端之间的异质性的观点。通过讨论现有作品的关键思想、挑战和局限性,我们展望了未来的研究方向,这些方向可以帮助构建更强大、更可解释、更高效、更公平、更具归纳性和更全面的 FedGNN。
抽象图神经网络(GNNS)是用于图形相关任务的强大工具,在进步的图形结构化数据中表现出色,同时保持置换不变性。然而,他们的挑战在于新节点表示的晦涩,阻碍了解释性。本文通过解释GNN预测来介绍一个框架,该框架解决了这一限制。所提出的方法采用任何GNN预测,为此,它将简洁的子图作为解释。利用显着性图,这是一种基于归因梯度的技术,我们通过通过反向传播将重要性得分分配给具有知识图的实体来增强可解释性。在药物重新利用知识图上进行了评估,图表网络的命中率为@5分为0.451,命中@10分数为0.672。图显示了明显的结果,最高召回率为0.992。我们的框架强调了GNN功效和可解释性,这在诸如药物重新利用之类的复杂情况下至关重要。通过阿尔茨海默氏病案例研究进行了说明,我们的方法为GNN预测提供了有意义且可理解的解释。这项工作有助于提高GNN在现实世界应用中的透明度和实用性。
基于图的模型已广泛应用于欺诈检测任务。由于图神经网络 (GNN) 的发展,最近的研究提出了许多基于同构或异构图的 GNN 欺诈检测器。这些工作利用现有的 GNN 并汇总邻域信息来学习节点嵌入,这依赖于邻居共享相似的上下文、特征和关系的假设。然而,欺诈者造成的不一致性问题很少被研究,即上下文不一致、特征不一致和关系不一致。在本文中,我们介绍了这些不一致性并设计了一个新的 GNN 框架 GraphConsis 来解决不一致问题:(1)对于上下文不一致,我们建议将上下文嵌入与节点特征相结合; (2) 针对特征不一致,我们设计了一个一致性评分来过滤不一致的邻居并生成相应的采样概率;(3) 针对关系不一致,我们学习与采样节点相关的关系注意权重。对四个数据集的实证分析表明,不一致问题在欺诈检测任务中至关重要。大量实验证明了 GraphConsis 的有效性。我们还发布了一个基于 GNN 的欺诈检测工具箱,其中包含 SOTA 模型的实现。代码可在 https://github.com/safe-graph/DGFraud 获得。
到2020年底,乳腺癌已成为世界上最常见的癌症,有780万妇女在过去的五年中诊断出来(1)。在全球范围内,乳腺癌需要比其他任何恶性肿瘤的妇女生活中的残疾调整年(达利人)。在2020年,乳腺癌在世界大多数国家的发病率和死亡率上排名第一(2)。在孟加拉国,情况是可比的。根据Globocan(全球癌症天文台)2020年的报告,在美国被诊断出13,028例新的乳腺癌病例(19%),其中6,783例屈服于该疾病,使其成为女性中最常见的癌症(3)。诊断时的临床阶段是乳腺癌中最重要的生存预测因子之一。延迟疾病检测的生存率较低(4)。 因此,如果发现该疾病足够早,我们可以最大程度地减少死亡率,因为早期乳腺癌治疗可能是相当有益的。 因此,筛选分子标记物是一种早期发现乳腺癌并治疗疾病的一种方法(5)。 当前,有几种乳腺癌临床诊断的方法。 有些是侵入性的,而另一些则是无创的。 乳房X线摄影是早期发现乳腺癌的最广泛使用的非侵入性技术之一。 然而,由于无法检测到小肿瘤,尤其是在乳房密集的妇女中,其效率和精度一直存在争议(6)。延迟疾病检测的生存率较低(4)。因此,如果发现该疾病足够早,我们可以最大程度地减少死亡率,因为早期乳腺癌治疗可能是相当有益的。因此,筛选分子标记物是一种早期发现乳腺癌并治疗疾病的一种方法(5)。当前,有几种乳腺癌临床诊断的方法。有些是侵入性的,而另一些则是无创的。乳房X线摄影是早期发现乳腺癌的最广泛使用的非侵入性技术之一。然而,由于无法检测到小肿瘤,尤其是在乳房密集的妇女中,其效率和精度一直存在争议(6)。CA 15-3用于评估对侵入性乳腺癌治疗的反应并鉴定疾病复发。因为CA 15-3不是很具体,因此不能用作女性的标准乳腺癌测试(7)。监测转移性阶段4乳腺癌,在极少数情况下,检测患有早期乳腺癌治疗的患者的复发是CA 27.29测试的两种最普遍用途(8)。转移性乳腺癌可以用高水平的CA125表示。由于CA125水平和癌症之间缺乏清晰度,该测试并不能用作筛查工具(9)。癌胚抗原(CEA)测试不是实用的乳腺癌筛查工具;相反,它用于确定癌症的预后,治疗结果和复发。由于其敏感性低和特异性,美国临床肿瘤学会目前建议不要将CEA用于常规的乳腺癌筛查(10)。这表明这些变量在很大程度上用于评估晚期乳腺癌的治疗成功
近年来,图神经网络(GNN)凭借其邻域聚合的特性,在许多领域得到了成功应用,并取得了最佳性能。虽然大多数GNN处理图数据,但原始图数据往往带有噪声或不完整,导致GNN性能不佳。为了解决这个问题,最近出现了一种图结构学习(GSL)方法,通过学习符合基本事实的图结构来提高图神经网络的性能。然而,目前的GSL策略是迭代优化最优图结构和单个GNN,这会在训练中遇到几个问题,即脆弱性和过度拟合。本文引入了一种称为进化图神经网络(EGNN)的新型GSL方法,以提高对对抗性攻击的防御能力并增强GNN性能。与现有的GSL方法通过交替训练方法来优化图结构并增强单个GNN模型的参数不同,本文首次将进化理论应用于图结构学习。具体来说,通过变异操作生成的不同图结构用于进化一组模型参数,以适应环境(即提高未标记节点的分类性能)。然后使用评估机制来衡量生成样本的质量,以便仅保留具有良好性能的模型参数(后代)。最后,保留适应环境的后代并用于进一步优化。通过这个过程,EGNN 克服了图结构学习的不稳定性,并且始终进化出最好的后代,为 GSL 的进步和发展提供了新的解决方案。在各种基准数据集上进行的大量实验证明了 EGNN 的有效性以及基于进化计算的图结构学习的好处。© 2023 由 Elsevier BV 出版
链接预测是图数据中的一个基本问题。在其最现实的环境中,问题包括预测一组断开对的节点对之间的丢失或将来的联系。图形神经网络(GNN)已成为链接预测的主要框架。基于GNN的方法将链接预测视为二进制分类问题,并处理极端类不平衡 - 真实图非常稀疏 - 通过对(随机均匀)进行抽样(随机均匀),不仅是用于培训,而且用于评估的脱节对。但是,我们表明,在平衡设置中链接预测的GNN的报告并不能转化为更现实的不平衡设置,并且在han-dling稀疏性方面,基于更简单的基于拓扑的方法通常会更好。这些发现激发了基于相似性的链接预测方法,该方法采用(1)基于节点属性的图形学习来增强拓扑启发式启发式,(2)解决类不平衡的排名损失,以及(3)负面采样方案,通过图分划分有效地选择硬训练对。实验表明,冰淇淋的表现优于现有的基于GNN的替代方案。
摘要 — 本研究探讨了图神经网络 (GNN) 和超图在使用氟脱氧葡萄糖正电子发射断层扫描 (FDG-PET) 图像改善抑郁症诊断的潜力。我们使用核密度估计和动态时间规整从单个静态 FDG-PET 图像构建图形和超图表示。在本地精神病数据集上使用各种 GNN 分类器(包括图卷积网络 (GCN) 和图同构网络 (GIN))评估这些表示。我们的实验表明,与成对图相比,GNN(尤其是 GCN)在超图上的性能更优越。我们强调了基于超图的表示在捕捉与抑郁症相关的复杂模式方面的整体功效。此外,我们对超图表示的探索为提高诊断准确性提供了有希望的途径,特别是在捕捉复杂的大脑连接模式方面。这项研究为 GNN 有助于使用 FDG-PET 图像更好地诊断精神疾病提供了证据,为个性化治疗策略和跨不同临床环境的诊断进步提供了见解。索引词 — 抑郁症、FDG-PET、KDE、DTW、图、超图、图神经网络、GIN、GCN。
摘要 - 流向基因型到表型模型,例如多基因风险评分,仅考虑基因型与表型之间的线性关系,而忽略了上皮相互作用,从而限制了可以正确表征的疾病的复杂性。蛋白质 - 蛋白质相互作用网络具有改善模型性能的潜力。此外,蛋白质水平的相互作用可以对理解疾病的遗传病因以及对药物发育产生深远的影响。在本文中,我们提出了一种基于图神经网络(GNN)的表型预测的新方法,该方法自然地将现有蛋白质相互作用网络纳入模型。因此,我们的方法自然可以发现相关的同义互动。我们使用模拟评估了这种方法的潜力,并将其与线性和其他非线性方法进行比较。我们还研究了拟议的基于GNN的方法在预测阿尔茨海默氏病(最复杂的神经退行性疾病之一)方面的性能,其中我们的GNN接近最先进的方法。此外,我们表明我们的建议能够发现阿尔茨海默氏病的关键相互作用。我们的发现突出了GNN在预测表型和发现复杂疾病的潜在机制方面的潜力。
基于图的数据的流行刺激了图神经网络(GNN)和相关的机器学习算法的快速发展。然而,尽管许多数据集自然而然地按照指示图进行建模,包括引文,网站和交通网络,但本研究的绝大多数都集中在无向图上。在本文中,我们提出了磁铁,这是一个基于复杂的Hermitian基质的有向图的GNN,称为磁性拉普拉斯式。此矩阵在其相位中的条目的大小和方向信息中编码了无方向的几何结构。“电荷”参数将光谱信息与定向周期之间的变化变化。我们将网络应用于各种有向的图节点分类,并链接预测任务,显示磁铁在所有任务上都表现良好,并且其性能超过了大多数此类任务的所有其他方法。磁铁的基本原理可以使其适应其他GNN架构。
摘要 — 功能性磁共振成像 (fMRI) 是一种常用的测量神经激活的技术。它在识别帕金森病、阿尔茨海默病和自闭症等潜在的神经退行性疾病方面尤为重要。最近对 fMRI 数据的分析将大脑建模为图形,并通过图神经网络 (GNN) 提取特征。然而,fMRI 数据的独特特性需要对 GNN 进行特殊的设计。定制 GNN 以生成有效且可领域解释的特征仍然具有挑战性。在本文中,我们提出了一种对比双注意块和一种可微分图池化方法(称为 ContrastPool),以更好地利用 GNN 进行大脑网络,满足 fMRI 特定的要求。我们将我们的方法应用于 3 种疾病的 5 个静息状态 fMRI 脑网络数据集,并证明了它优于最先进的基线。我们的案例研究证实,我们的方法提取的模式与神经科学文献中的领域知识相匹配,并揭示了直接而有趣的见解。我们的贡献凸显了 ContrastPool 在促进对大脑网络和神经退行性疾病的理解方面的潜力。源代码可在 https://github.com/AngusMonroe/ContrastPool 上找到。