Loading...
机构名称:
¥ 1.0

碱基调用是纳米孔测序分析中的一个重要步骤,其中纳米孔测序仪的原始信号被转换成核苷酸序列,即读取。最先进的碱基调用器使用复杂的深度学习模型来实现高碱基调用准确性。这使得碱基调用在计算上效率低下且耗费内存,成为整个基因组分析流程的瓶颈。然而,对于许多应用而言,大多数读取与感兴趣的参考基因组(即目标参考)不匹配,因此在基因组学流程的后续步骤中被丢弃,浪费了碱基调用计算。为了解决这个问题,我们提出了 TargetCall,这是第一个预碱基调用过滤器,以消除碱基调用中浪费的计算。TargetCall 的主要思想是在碱基调用之前丢弃与目标参考不匹配的读取(即脱靶读取)。 TargetCall 由两个主要组件组成:(1) LightCall,一种产生噪声读取的轻量级神经网络碱基调用器,以及 (2) 相似性检查,它通过将这些噪声读取与目标参考进行匹配,将每个噪声读取标记为在靶或脱靶。我们彻底的实验评估表明,TargetCall 1) 将最先进的碱基调用器的端到端碱基调用运行时性能提高了 3.31 倍,同时在保持目标读取方面的高 (98.88%) 召回率,2) 在下游分析中保持高准确率,以及 3) 与以前的工作相比,实现了更好的运行时性能、吞吐量、召回率、准确率和通用性。TargetCall 可在 https://github.com/CMU-SAFARI/TargetCall 获得。

通过预设消除碱基调用中浪费的计算...

通过预设消除碱基调用中浪费的计算...PDF文件第1页

通过预设消除碱基调用中浪费的计算...PDF文件第2页

通过预设消除碱基调用中浪费的计算...PDF文件第3页

通过预设消除碱基调用中浪费的计算...PDF文件第4页

通过预设消除碱基调用中浪费的计算...PDF文件第5页

相关文件推荐

2017 年
¥24.0
2011 年
¥43.0
2011 年
¥43.0