我们提出ELPREP 5,该5更新ELPREP框架,用于处理使用变体调用的测序对齐/地图文件。ELPREP 5现在可以执行由GATK最佳呼叫的最佳实践所描述的完整管道,该实践由PCR和光学重复标记组成,按坐标顺序排序,基本质量得分重新校准以及使用单倍型呼叫者算法的变体调用。ELPREP 5产生与GATK4相同的BAM和VCF输出,同时通过并行化和合并管道步骤的执行来显着降低运行时。我们的基准测试表明,ELPREP 5在整个exome和全基因组数据上都将变量呼叫管道的运行时加快了,同时使用与GATK4相同的硬件资源。这使ELPREP 5在需要更快的执行时间时,可以合适地替换GATK4。
加速突变分析工作流程。This diagram illustrates the integration of NVIDIA Parabricks (a GPU-accelerated genomics toolkit) and GATK4 (Genome Analysis Toolkit version 4) with open-source workflow frameworks like Nextflow (a data-driven workflow management system), WDL (Workflow Description Language), and Toil (a scalable workflow engine) for high-performance, customizable genomic analysis pipeline.支持工具包括samtools(序列对齐/地图工具),bcftools(二进制对齐/地图和变体呼叫格式工具)和fastQC(用于高通量序列数据的质量控制工具)。利用GPU(图形处理单元)和容器化可增强可扩展性和可重复性。
