© Crown 2023。开放存取 本文根据知识共享署名 4.0 国际许可证授权,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可证的链接,并指明是否做了更改。 本文中的图片或其他第三方资料包含在文章的知识共享许可证中,除非在资料的信用额度中另有说明。 如果资料未包含在文章的知识共享许可证中,并且您的预期用途不被法定规定允许或超出了允许的用途,您将需要直接从版权所有者处获得许可。 要查看此许可证的副本,请访问 http://creativecommons.org/licenses/by/4.0/ 。知识共享公共领域贡献豁免(http://creativecommons.org/ publicdomain/zero/1.0/)适用于本文中提供的数据,除非数据来源处另有说明。
长读测序技术通过生成足够长的读长来跨越和解析基因组的复杂或重复区域,提高了基因组组装的连续性,从而提高了质量。一些研究小组已经展示了长读长在检测数千个基因组和表观基因组特征方面的强大功能,而这些特征以前被短读长测序方法遗漏了。虽然这些研究表明了长读长如何帮助解析基因组的重复和复杂区域,但它们也强调了使用这些平台准确解析大量群体中的变异等位基因所需的通量和覆盖率要求。在撰写本文时,在最高通量短读长仪器上,全基因组长读长测序比短读长测序更昂贵;因此,实现足够的覆盖率以检测异质样本中的低频变异(如体细胞变异)仍然具有挑战性。另一方面,靶向测序提供了在异质群体中检测这些低频变异所需的深度。在这里,我们回顾了当前使用和最近开发的靶向测序策略,这些策略利用现有的长读技术来提高我们在各种生物背景下观察核酸的分辨率。
使用长读数据获得的高质量基因组不仅可以更好地了解杂合性水平、重复内容以及与使用短读技术获得的基因组相比更准确的基因注释和预测,而且还可以帮助了解单倍型分化。近年来,长读测序技术的进步使得为非模式生物生成此类高质量组装成为可能。这使我们能够重新审视基因组,而使用前几代数据和组装软件将其组装到染色体规模上一直存在问题。线虫是后生动物中种类最多、种类最多的动物门之一,但对其研究仍然很少,许多以前组装的基因组都是碎片化的。使用 Nanopore R10.4.1 和 PacBio HiFi 获得的长读长,我们生成了 Mermithidae 科二倍体线虫的高度连续组装体,目前尚未获得该科的密切相关基因组,以及 Panagrolaimidae 科三倍体线虫的折叠组装体和分阶段组装体。这两个基因组之前都已分析过,但碎片组装体的支架大小与组装前的长读长长度相当。我们的新组装体说明了长读长技术如何更好地表示物种基因组。我们现在能够根据更完整的基因和转座因子预测进行更准确的下游分析。