经典算法通常对信息处理构成瓶颈[1]。它们通常旨在处理一致的,完全有序的,抽象的数量,而实际上,我们需要对嘈杂,高维数据进行推理。机器学习和神经网络(NNS)尤其使机器可以从此类输入中提取有用的功能,但是如果其输出需要与非差异性算法组成,则他们将无法通过反向传播从直接反馈中学习。以使算法适用的方式压缩信息会丢失许多潜在的相关细节。通过教导NNS如何执行算法来打破这种瓶颈是神经算法推理的目标[1-3]。对现实世界数据的首次应用是有希望的[4-6],但是即使在高度精心制作的架构上,推断仍然有改进的空间[7,8]。因此,显然需要更仔细地研究神经网络的信息处理功能。
在生物网络中,某些节点比其他节点更有影响力。最具影响力的节点是那些其消除会导致网络崩溃的节点,而检测这些节点在许多情况下至关重要。然而,当生物网络规模很大时,这是一项艰巨的任务。在本文中,我们设计并实现了一种高效的并行算法,利用图形处理单元 (GPU) 检测大型生物网络中的有影响力节点。所提出的并行算法背后的基本概念是重新设计几个计算量巨大的检测有影响力节点的程序,并将其转化为相当高效的 GPU 加速原语,如并行排序、扫描和缩减。四个局部指标,包括度中心性 (DC)、伴随行为 (CB)、聚类系数 (CC) 和 H 指数,用于衡量节点影响力。为了评估所提出的并行算法的效率,在实验中采用了五个大型真实生物网络。实验结果表明:(1) 与相应的串行算法相比,所提出的并行算法可以实现大约 48 ∼ 94 的加速比; (2) 与在多核 CPU 上开发的基线并行算法相比,所提出的并行算法对于 DC 和 H-Index 的加速比为 5 ∼ 9,而对于 CB 和 CC 的加速比由于度分布不均匀而略慢;(3) 当使用 DC 和 H-Index 时,所提出的并行算法能够在不到 3 秒的时间内检测出由 1.5 亿条边组成的大型生物网络中的影响节点。© 2019 Elsevier BV 保留所有权利。