着丝粒是真核染色体的重要区域,负责形成着丝粒复合体,在细胞分裂过程中与纺锤体微管连接。值得注意的是,尽管着丝粒在染色体分离中保持保守功能,但其底层 DNA 序列在物种内和物种间都存在差异,并且主要是重复性的。着丝粒的重复内容包括高拷贝串联重复序列(卫星)和/或特定的转座子家族。着丝粒的功能区域由特定组蛋白 3 变体 (CENH3) 的加载定义,该变体使着丝粒成核并显示动态调节。在许多植物中,着丝粒由卫星重复阵列组成,这些阵列的 DNA 甲基化程度高,并被嗜着丝粒的逆转录转座子侵入。在某些情况下,逆转录转座子成为 CENH3 加载的位点。我们回顾了植物着丝粒的结构,包括单着丝粒、全着丝粒和元多着丝粒结构,这些结构在染色体上着丝粒附着位点的数量和分布上有所不同。我们讨论了 CENH3 负荷的变化如何在植物胚胎发生早期细胞分裂过程中驱动基因组消除。我们回顾了表观遗传状态如何影响着丝粒身份,并讨论了试图解释跨物种观察到的着丝粒序列快速变化的进化模型,包括重组的潜在作用。我们概述了可能在着丝粒内起作用的假定选择模式,以及重复序列在驱动着丝粒进化周期中的作用。虽然我们的主要重点是植物基因组,但我们将其与动物和真菌着丝粒进行了比较,以得出着丝粒结构和功能的真核生物范围的视角。
着丝粒是真核染色体的重要区域,负责形成着丝粒复合体,在细胞分裂过程中与纺锤体微管连接。值得注意的是,尽管着丝粒在染色体分离中保持保守功能,但其底层 DNA 序列在物种内和物种间都存在差异,并且主要是重复性的。着丝粒的重复内容包括高拷贝串联重复序列(卫星)和/或特定的转座子家族。着丝粒的功能区域由特定组蛋白 3 变体 (CENH3) 的加载定义,该变体使着丝粒成核并显示动态调节。在许多植物中,着丝粒由卫星重复阵列组成,这些阵列的 DNA 甲基化程度高,并被嗜着丝粒的逆转录转座子侵入。在某些情况下,逆转录转座子成为 CENH3 加载的位点。我们回顾了植物着丝粒的结构,包括单着丝粒、全着丝粒和元多着丝粒结构,这些结构在染色体上着丝粒附着位点的数量和分布上有所不同。我们讨论了 CENH3 负荷的变化如何在植物胚胎发生早期细胞分裂过程中驱动基因组消除。我们回顾了表观遗传状态如何影响着丝粒身份,并讨论了试图解释跨物种观察到的着丝粒序列快速变化的进化模型,包括重组的潜在作用。我们概述了可能在着丝粒内起作用的假定选择模式,以及重复序列在驱动着丝粒进化周期中的作用。虽然我们的主要重点是植物基因组,但我们将其与动物和真菌着丝粒进行了比较,以得出着丝粒结构和功能的真核生物范围的视角。
中心粒是动力学的结合位点,对于整个细胞分裂的染色体的忠实隔离至关重要。酵母中的点丝粒由约115 bp的特异性DNA序列编码,而区域的丝粒范围从裂变酵母中的6 - 10 kbp到人类的5 - 10 Mbp。了解中心粒染色质的物理结构(酵母中的圆锥体),定义为姐妹动物学之间的染色质,将提供基本的见解,以了解如何将Centromere DNA编织成僵硬的弹簧,该弹簧能够在有点裂期间能够抵抗微管拉力。围粒粒粒的一个标志是染色体(SMC)蛋白凝聚蛋白和冷凝蛋白的结构维持的富集。基于种群方法的研究(CHIP-SEQ和HI-C)以及实验获得的荧光粒结构的荧光探针图像,以及模拟与实验结果之间的定量比较,我们提出了一种建立姐妹动物学菌之间张力的机制。我们提出,丝粒是一种染色质瓶洗,是通过环状侵入蛋白冷凝蛋白和粘着素而组织的。由于径向环之间的空间排斥力,瓶颈布置提供了一种生物物理手段,可以将周围质粒染色质转化为弹簧。我们认为,瓶刷是染色体组织的组织原则,该原理已从该领域的多种方法中出现。
Nicotiana Benthamiana是一种在植物生物学和生物技术中广泛采用的模型生物。自2012年最初发行以来,其基因组研究已落后。为了进一步提高其实用性,我们生成和相位的同种异体二磷酸n. benthamiana的完整的2.85 GB基因组组装,所有19个centromeres和38个端粒完全分析。我们发现,尽管甲酸溶剂粒粒子被TY3/GYPSY逆转录座子广泛主导,但基于卫星的centromeres在N. Benthamiana中令人惊讶的是,在N. Benthamiana中,有11个Cendromeres中有11个由超级范围层面卫星阵列展出。有趣的是,富含卫星的和无卫星的丝粒被独特的吉普赛逆转录子广泛入侵,其中CENH3蛋白更优选地占据了CENH3蛋白,这表明它们在中心仪功能中至关重要。我们证明rDNA是丝粒卫星的主要起源,线粒体DNA可以用作Centromere的核心成分。亚基因组分析表明,卫星阵列的出现可能会在多倍体化后基因组休克期间驱动着丝粒的形成和成熟。总的来说,我们提出了本氏菌Centromeres通过Neocentromere的形成,卫星扩张,逆转录转座子富集和mtDNA整合而发展。
着丝粒提出了一个进化悖论:功能高度保守,但序列和结构却迅速变化。然而,在没有损伤的情况下,着丝粒的位置通常在一个物种内是保守的。我们在此报告,致病酵母菌种近平滑假丝酵母的分离株在其八条染色体中的两条染色体上表现出着丝粒位置的种内多态性。它的旧着丝粒具有反向重复 (IR) 结构,而其新着丝粒没有明显的结构特征,但位于旧位置的 30 kb 以内。因此,着丝粒可以自然地从一个染色体位置移动到另一个染色体位置,似乎是自发的,并且在 DNA 序列没有任何显著变化的情况下。我们的观察结果与所有着丝粒都是由基因决定的模型相一致,例如由短或长 IR 的存在或形成十字形的能力决定。我们还发现着丝粒已成为 C. parapsilosis 进化枝中基因组重排的热点。
大型DNA组装方法是合成原核生物和发芽酵母染色体的里程碑成就的基础。通过〜125碱基对DNA序列定义的中心粒,哺乳动物和许多其他真核生物使用大型表观遗传性centromeres时,通过〜125碱基对dna序列定义的centromeres的染色体遗传。 利用中心粒表观遗传学允许人造染色体(HAC)形成,但不足以避免在引入细胞时初始DNA分子的多个多层次化。 我们描述了一种有效形成单拷贝HACS的方法。 它采用了一个〜750 kilobase的构建体,该构建体足够大,可以容纳存在于内部和外侧丝粒处的不同染色质类型,从而避免了对多聚体的需求。 通过使用酵母球体融合来简化向哺乳动物细胞的递送。 这些发展允许在后生细胞的背景下忠实的染色体工程。 y通过〜125碱基对dna序列定义的centromeres的染色体遗传。利用中心粒表观遗传学允许人造染色体(HAC)形成,但不足以避免在引入细胞时初始DNA分子的多个多层次化。我们描述了一种有效形成单拷贝HACS的方法。它采用了一个〜750 kilobase的构建体,该构建体足够大,可以容纳存在于内部和外侧丝粒处的不同染色质类型,从而避免了对多聚体的需求。通过使用酵母球体融合来简化向哺乳动物细胞的递送。这些发展允许在后生细胞的背景下忠实的染色体工程。y
通过组蛋白变体CENP-A的存在来定义并保持表观遗传学的定义和维持。尚不完全了解如何指定中心质体CENP-A位置并通过DNA复制确切地保持。 最近发布的端粒到核(T2T)基因组组件包含第一个完整的人类丝粒序列,为检查CENP-A位置提供了新的资源。 在多个细胞分裂之后,在同一细胞系列的克隆中映射CENP-A位置到T2T组装中高度相似的CENP-A位置。 相比之下,在不同人类细胞系的几个centromeres上表现出丝粒CENP-A上乳束,这证明了CENP-A富集的位置和人类细胞之间的KineTochore re裂位点不同。 在整个细胞周期中,通过DNA复制保持了其精确的位置,沉积在G1相中的CENP-A分子。 因此,尽管在DNA复制过程中CENP-A稀释,但CENP-A仍将CENP-A精确地重新加载到子丝粒内的相同序列上,从而在人类细胞中保持独特的丝粒身份。如何指定中心质体CENP-A位置并通过DNA复制确切地保持。最近发布的端粒到核(T2T)基因组组件包含第一个完整的人类丝粒序列,为检查CENP-A位置提供了新的资源。在多个细胞分裂之后,在同一细胞系列的克隆中映射CENP-A位置到T2T组装中高度相似的CENP-A位置。相比之下,在不同人类细胞系的几个centromeres上表现出丝粒CENP-A上乳束,这证明了CENP-A富集的位置和人类细胞之间的KineTochore re裂位点不同。在整个细胞周期中,通过DNA复制保持了其精确的位置,沉积在G1相中的CENP-A分子。因此,尽管在DNA复制过程中CENP-A稀释,但CENP-A仍将CENP-A精确地重新加载到子丝粒内的相同序列上,从而在人类细胞中保持独特的丝粒身份。
图1。SAM-SEQ同时探测植物组织上的染色质访问性和DNA甲基化。a。SAM-SEQ方案的工作流程和GDNA上M6A-MTase序列偏好的评估(EcoGII-WEALED GDNA)。 b。 链特异性的M6a水平的ECOGII处理的基因组DNA水平在标准化之前和之后,M6A-MTase偏好比五个A. thaliana染色体。 centromeres被描述为灰色盒子。 拟南芥12-mer序列的 c umap投影,由m6a/a含量的ecogii处理的gDNA,含量和含量。 MCG,MCHG和MCHH水平的GDNA和SAM-SEQ的ONT测序之间的密度图和相关分析。 e。 链特异性的SAM-SEQ M6A水平M6A-MTases偏好归一化和之后。 f。 拟南芥基因的元数据显示ATAC-SEQ可及性(Lu等人 2017)(右Y轴)和SAM-SEQ染色质可及性(M6A/A),使用独立的实验使用不同的M6A-MTases(ECOGII或HIA5)以及不同的ONT化学(R9.4.1或R10)(左Y轴)(左Y轴)。SAM-SEQ方案的工作流程和GDNA上M6A-MTase序列偏好的评估(EcoGII-WEALED GDNA)。b。链特异性的M6a水平的ECOGII处理的基因组DNA水平在标准化之前和之后,M6A-MTase偏好比五个A. thaliana染色体。centromeres被描述为灰色盒子。c umap投影,由m6a/a含量的ecogii处理的gDNA,含量和含量。MCG,MCHG和MCHH水平的GDNA和SAM-SEQ的ONT测序之间的密度图和相关分析。e。链特异性的SAM-SEQ M6A水平M6A-MTases偏好归一化和之后。f。拟南芥基因的元数据显示ATAC-SEQ可及性(Lu等人2017)(右Y轴)和SAM-SEQ染色质可及性(M6A/A),使用独立的实验使用不同的M6A-MTases(ECOGII或HIA5)以及不同的ONT化学(R9.4.1或R10)(左Y轴)(左Y轴)。
DNA测序在近几十年来彻底改变了医学。,对大型结构变化和重复DNA的分析是人类基因组的标志,受到短阅读技术的限制,读取长度为100-300 bp。长阅读测序(LRS)允许使用合成的实时测序和基于纳米孔的DI-ERCT电子测序进行实时测序,将人DNA片段的常规示例分别为数百个千倍酶对。lrs允许分析人类基因组中的大型结构变异和单倍型相分化,并能够发现和表征罕见的致病结构变异和重复探索。它最近还可以组装一个完整的,无处不在的人类基因组,该基因组包括以前棘手的区域,例如高度重复的centromeres和同源性杂技短臂。通过添加用于靶向富集,直接表观遗传DNA修饰检测和远程染色质分析方案,LRS有望在人类种群中引发对遗传多样性和致病突变的新时代。
哺乳动物细胞中的遗传筛选通常专注于功能丧失方法。评估额外基因拷贝的表型结合,我们使用了辐射杂种(RH)细胞的大量分离分析(BSA)。,我们构建了六个RH细胞池,每个池由约2500个独立克隆组成,并将池放置在带有或没有紫杉醇的培养基中。低通序测序鉴定出859个生长基因座,38个紫杉醇基因座,62个相互作用基因座和三个基因座,用于整个基因组显着性,用于线粒体的丰度。分辨率被测量为约30 kb,接近单基因。差异性能,反驳了平衡假设。此外,在RH池中人类centromeres的保留增强提出了一种对这些染色体元件的功能解剖方法的新方法。对RH细胞的合并分析显示出高功率和分辨率,应该是哺乳动物遗传工具包的有用补充。