Loading...
机构名称:
¥ 1.0

基因预测长期以来一直是生物信息学研究的活跃领域。仍然,大核基因组中的基因预测提出了一个挑战,必须通过新算法来解决。转录组和蛋白质组可获得的词的数量和意义在基因组,基因甚至单个基因之间都不同。需要应对此类数据异质性的用户友好,准确的注释管道。先前的注释管道Braker1和Braker2分别使用RNA-Seq或蛋白质数据,但并非两者都使用。最近发布的Genemark-ETP进行了进一步的显着改进,整合了所有三种数据类型。我们在这里提出了基于Genemark-Etp和Augustus的Braker3管道,并使用Tsebra Combiner进一步提高了准确性。braker3使用短阅读RNA-Seq和大蛋白数据库的真核基因组中的蛋白质编码基因,以及针对靶标的迭代和专门学习的统计模型。,我们在目标物种蛋白质组与可用蛋白质组的相关性水平下基于11种基因组的新管道。Braker3优于Braker1和Braker2。平均成绩单级别的F1得分平均增加约20个百分点,而对于具有较大和复杂基因组的物种,差异最为明显。Braker3还胜过其他现有工具,Maker2,FunAntotate和Finder。Braker3的代码可在GitHub上获得,作为一个现成的Docker容器,可用于使用Docker或Singularity执行。总体而言,Braker3是真核基因组注释的准确,易于使用的工具。

braker3:使用RNA的完全自动基因组注释...

braker3:使用RNA的完全自动基因组注释...PDF文件第1页

braker3:使用RNA的完全自动基因组注释...PDF文件第2页

braker3:使用RNA的完全自动基因组注释...PDF文件第3页

braker3:使用RNA的完全自动基因组注释...PDF文件第4页

braker3:使用RNA的完全自动基因组注释...PDF文件第5页

相关文件推荐