MGI Tech推出了一系列基于DNBSEQ技术的新NGS设备。对于不同类型的测序文库而言,这些序列据报道这些序列仪的准确性相似或精确度略低。但是,根据T7 Sequencer的情况,它们每天更具成本效益,并且每天达到约6 TB的数据。这些原因为MGI测序仪在基因组学领域中广泛使用铺平了道路,因此鼓励开发可以分析此类数据的软件。MGI序列器输出带有不同读取标题和文件命名的大型FastQ文件,而不是Illumina输出。单端的配对末端或正向读取(R1)的反向读取(R2)的末端是包含样本索引(i7和i5)和唯一分子标识符(UMI)的读取条形码。这些索引用于删除数据,即将读取分配给相应的样本。MGI Tech已将SplitBarcode工具1发布给Demultiplex MGI FastQ。但是,该工具无法识别数据中的UMIS,也没有解决不同标头和文件命名格式的问题,这些格式可以由Illumina基于Illumina的工具所需的问题。此外,它要求用户知道在读取条形码中找到索引的前期,并且不支持同一运行中的多个库。Mgikit用Rust编程语言写。可以在工具网页上获得综合文档和用户指南https:// sagc- bioinformatics.github.io/mgikit/。在此申请注释中,我们提供了一个软件套件的Mgikit,以消除MGI FASTQ数据,检测条形码模板并生成可以通过mgikikit-multiqc插件转换为html报告的反复材料和质量报告工具[1]。
主要关键词