摘要:可以在生成时分析原始纳米孔信号,这是一种称为实时分析的过程。对原始信号的实时分析对于利用纳米孔测序提供的唯一特征至关重要,从而可以根据分析的分析提早停止读取或整个测序运行。最新的机制Rawhash,通过快速匹配其哈希值,提供了原始信号和参考基因组之间的首个基于哈希的有效和准确的相似性识别。在这项工作中,我们介绍了Rawhash2,该Rawhash2对Rawhash提供了重大改进,包括更敏感的量化和链接算法,加权映射决策,频率过滤器,以减少模棱两可的种子命中量,基于哈希的素描的最小化以及对R10.4流元电池版本和POD5和慢速5文件的支持。与Rawhash相比,Rawhash2提供了更好的F1精度(平均为10.57%且最高20.25%)和更好的吞吐量(平均比Rawhash(平均为4.0倍,最高9.9×))。可用性和实现:RAWHASH2可在https://github.com/cmu-safari/rawhash上找到。我们还提供脚本以在GitHub页面上充分复制我们的结果。
主要关键词