Loading...
机构名称:
¥ 1.0

动机:基因组数据的准确分类学分配在各种生物数据库中至关重要。近年来提交的基因组迅速增加,确保精确的分类对于维持数据库完整性很重要。标签错误的基因组可能会使研究人员混淆,阻碍分析并产生错误的结果。因此,对于计算有效的工具的迫切需要,可以确保将数据存储到基因组数据库中的准确分类分类。结果:在这里,我们介绍了基于NCBI和GTDB分类法的原核基因组的质量控制和分类分类工具。我们针对NCBI分类学分配了DFAST_QC的表现,显示出与它们的高度一致性。我们的结果表明,DFAST_QC与NCBI分类学分类达到了很高的一致性。可用性和实现:dfast_qc在Python中实现,并且可以作为Web服务(https://dfast.ddbj.nig.ac.ac.jp/dqc)和独立命令行工具提供。源代码可在GPLV3许可证下获得:https://github.com/nigyta/dfast_qc,并且Conda软件包也可从Bioconda获得。GitHub(https://github.com/mohamed-elmanzalawi/dfast_qc_benchmark)公开可用用于基准测试过程的数据和脚本。联系人:yt@nig.ac.jp补充信息:补充数据可在BioInformatics Online获得。

dfast_qc

dfast_qcPDF文件第1页

dfast_qcPDF文件第2页

dfast_qcPDF文件第3页

dfast_qcPDF文件第4页

dfast_qcPDF文件第5页