真核基因组测序和从头组装曾经是资金丰富的国际财团的独家领域,已经变得越来越负担得起,因此适合各个研究小组的预算。第三代长阅读的DNA测序技术越来越多地使用,提供了曾经用于一些精选模型生物的广泛基因组工具包。生成许多水生物种的高质量基因组组件和注释,由于其大型基因组大小,复杂性和较高的染色体数量,仍然提出了重大挑战。的确,为新基因组项目选择最合适的测序和软件平台和注释管道可能会令人生畏,因为工具通常只能在有限的上下文中起作用。在基因组学上,产生高质量的基因组组装/注释已成为更好地理解任何物种生物学的必不可少的工具。在此,我们陈述了12个步骤,以帮助研究人员通过介绍广泛适用的指南(随着时间的推移),并涵盖基因组组装和注释从头到尾的各个方面的所有方面,从而帮助研究人员开始进行基因组项目。我们回顾了一些常用的方法,包括用于提取高质量DNA的实用方法以及最佳测序平台和库制剂的选择。此外,我们讨论了潜在的生物信息学管道的范围,包括结构和功能注释(例如,转座元素和重复序列)。本文还包括有关如何为基因组项目建立广泛社区的信息,数据管理的重要性以及如何通过将其提交给公共存储库并与研究社区共享数据和可重复使用的数据和结果。
主要关键词