摘要 纤毛虫是经历广泛程序性基因组重排的微生物真核生物,这是一种自然的基因组编辑过程,可将较长的生殖系染色体转换为较小的富含基因的体细胞染色体。三种研究较为深入的纤毛虫包括 Oxytricha trifallax 、 Tetrahymena thermophila 和 Paramecium tetraurelia ,但只有 Oxytricha 谱系具有大量乱序基因组,其在发育过程中的组装需要数十万个精确编程的 DNA 连接事件,代表了已知生物中最复杂的基因组动态。在这里,我们通过检查 Oxytricha 谱系中不连续和乱序基因的起源和进化来研究这种复杂基因组的出现。本研究比较了来自三个物种的六个基因组,即 Euplotes woodruffi、Tetmemena sp. 和模型纤毛虫 O. trifallax 的生殖系和体细胞基因组。我们对 E. woodruffi 的生殖系和体细胞基因组(它是一个外群)以及 Tetmemena sp 的生殖系基因组进行了测序、组装和注释。我们发现 Tetmemena 的生殖系基因组与 Oxytricha 的一样具有严重的杂乱和中断:13.6%的基因位点需要程序性易位和/或倒位,一些基因在发育过程中需要数百个精确的基因编辑事件。这项研究表明,早期分化的螺旋藻 E. woodruffi 也有一个杂乱的基因组,但只有大约一半的基因位点(7.3%)是杂乱的。此外,它的杂乱基因不太复杂,共同支持了 Euplotes 作为此谱系中可能的进化中间体的地位,处于积累复杂的进化基因组重排的过程中,所有这些都需要大量修复来组装功能性编码区。比较分析还表明,混乱的基因座通常与局部重复有关,支持了通过许多小的 DNA 重复和衰减事件来产生复杂的、混乱的基因组的渐进模型。
主要关键词