转录增强子能够对后生动物的基因表达进行精确的时空控制。组蛋白 H3 赖氨酸 4 (H3K4me1) 的单甲基化富集是转录增强子的主要染色质特征。赖氨酸 (K) 特异性脱甲基酶 1A (KDM1A,也称为 LSD1) 是一种 H3K4me2/me1 脱甲基酶,可在小鼠胚胎干细胞 (mESC) 分化过程中使干细胞增强子失活。然而,其在未分化 mESC 中的作用仍不清楚。在这里,我们表明 KDM1A 在未分化和谱系定向细胞中都积极维持最佳增强子状态。KDM1A 占据了未分化 mESC 中的大部分增强子。增强子处的 KDM1A 水平与其底物 H3K4me2、H3K27ac 和增强子处的转录呈现明显的正相关性。在缺乏 Kdm1a 的 mESC 中,这些增强子中的大部分获得了额外的 H3K4 甲基化,同时伴有 H3K27 乙酰化增加以及增强子 RNA (eRNA) 和靶基因表达增加。在有丝分裂后的神经元中,KDM1A 的缺失会导致神经元活动依赖性增强子和基因的过早激活。总之,这些结果表明 KDM1A 是一种多功能的增强子调节器,并充当变阻器,通过平衡增强子处的 H3K4 甲基化来维持最佳增强子活性。
基因启动子处的 DNA-蛋白质相互作用在基因表达中起着至关重要的作用。人类细胞的启动子富含富含鸟嘌呤的序列,这些序列可以形成四链 G-四链体 (G4) 结构。G4 正在成为基因调控中一类独特的基于结构的调控元件,它们与蛋白质的相互作用对于 G4 的作用至关重要。目前,我们对 G4-蛋白质相互作用的理解主要是基于个案,没有系统信息。在这项工作中,我们使用来自 ENCODE 项目的数据检查了共识 G4 形成区 G4(+) 周围 1,183 种人类 DNA 结合蛋白(包括转录因子、组蛋白及其修饰酶)的空间占有率。我们发现 G4(+)、其近端侧和远端侧是三个主要的蛋白质结合位点。几乎所有蛋白质在这些位点上都富集或耗尽,这可能是由于竞争或位点之间的时空转换,导致不同程度的变化或持久性,在细胞/组织类型内或跨细胞/组织类型。值得注意的是,组蛋白被排除在 G4(+) 的近端之外,它们与 G4(+) 的结合分别通过乙酰化和甲基化打开和关闭。此外,远端优先富集 H3K23me2 和 H3K4me2。我们的实验还揭示了相应的 G4-蛋白质相互作用模式。总之,我们的结果表明 G4 在动态定义和协调基因启动子处的染色质结构和 DNA-蛋白质相互作用以进行转录调控方面发挥着普遍作用,而这项任务不太可能通过基于序列的 DNA 识别来完成。
基因启动子处的 DNA-蛋白质相互作用在基因表达中起着至关重要的作用。人类细胞的启动子富含富含鸟嘌呤的序列,这些序列可以形成四链 G-四链体 (G4) 结构。G4 正在成为基因调控中一类独特的基于结构的调控元件,它们与蛋白质的相互作用对于 G4 的作用至关重要。目前,我们对 G4-蛋白质相互作用的理解主要是基于个案,没有系统信息。在这项工作中,我们使用来自 ENCODE 项目的数据检查了共识 G4 形成区 G4(+) 周围 1,183 种人类 DNA 结合蛋白(包括转录因子、组蛋白及其修饰酶)的空间占有率。我们发现 G4(+)、其近端侧和远端侧是三个主要的蛋白质结合位点。几乎所有蛋白质在这些位点上都富集或耗尽,这可能是由于竞争或位点之间的时空转换,导致不同程度的变化或持久性,在细胞/组织类型内或跨细胞/组织类型。值得注意的是,组蛋白被排除在 G4(+) 的近端之外,它们与 G4(+) 的结合分别通过乙酰化和甲基化打开和关闭。此外,远端优先富集 H3K23me2 和 H3K4me2。我们的实验还揭示了相应的 G4-蛋白质相互作用模式。总之,我们的结果表明 G4 在动态定义和协调基因启动子处的染色质结构和 DNA-蛋白质相互作用以进行转录调控方面发挥着普遍作用,而这项任务不太可能通过基于序列的 DNA 识别来完成。
