摘要 — 基因组序列比对是许多生物应用的核心。测序技术的进步产生了大量的数据,使序列比对成为生物信息学分析的关键瓶颈。现有的比对硬件加速器存在片上内存有限、数据移动成本高、比对算法优化不佳等问题。它们无法同时处理测序机产生的大量数据。在本文中,我们提出了一种基于 ReRAM 的加速器 RAPIDx,使用内存处理 (PIM) 进行序列比对。RAPIDx 通过软硬件协同设计实现了卓越的效率和性能。首先,我们提出了一种适用于 PIM 架构的自适应带状并行比对算法。与原有的基于动态规划的比对相比,所提出的算法显著降低了所需的复杂度、数据位宽和内存占用,而准确性下降却微不足道。然后,我们提出了实现所提算法的高效 PIM 架构。 RAPIDx 中的数据流实现了四级并行,我们在 ReRAM 中设计了一个原位比对计算流,与我们之前的 PIM 设计 RAPID 相比,效率和吞吐量提高了 5.5-9.7 倍。所提出的 RAPIDx 可重新配置为集成到现有基因组分析流程中的协处理器,以增强序列比对或编辑距离计算。在短读比对中,RAPIDx 分别比最先进的 CPU 和 GPU 库提供了 131.1 倍和 46.8 倍的吞吐量改进。与用于长读比对的 ASIC 加速器相比,RAPIDx 的性能高出 1.8-2.9 倍。
医学研究中人工智能的报告指南 J. Peter Campbell, MD, MPH、Aaron Y Lee, MD, MSCI、Michael Abràmoff, MD、Pearse A. Keane, MD, FRCOphth、Daniel SW Ting, MD PhD 和 Michael F. Chiang, MD 资金支持:JPC 和 MFC 得到美国国立卫生研究院 (马里兰州贝塞斯达) 的 R01EY19474、R01EY031331、K12EY027720 和 P30EY10572 的支持;以及防盲研究 (JPC) 的无限制部门资金和职业发展奖的支持。AYL 得到 NIH/NEI K23EY029246、NIH P30EY10572 和防盲研究的无限制拨款的支持。赞助商/资助组织未参与本研究的设计或实施。财务披露:Michael D Abramoff,IDx(I、F、E、P、S)、Alimera(F)。J. Peter Campbell,Genentech(F)。Aaron Y Lee,美国 FDA(E)、Genentech(C)、Topcon(C)、Verana Health(C)、Santen(F)、Novartis(F)、Carl Zeiss Meditec(F)。Pearse A. Keane,DeepMind Technologies(C)、Roche(C)、Novartis(C)、Apellis(C)、Bayer(F)、Allergan(F)、Topcon(F)、Heidelberg Engineering(F)。Daniel Ting,EyRIS(IP)、Novartis(C)、Ocutrx(I、C)、Optomed(C)。通讯作者:Michael F Chiang 地址?联系方式?