癌症的出现和发展伴随着转录程序的失调。人类基因组的三维 (3D) 组织已成为基因转录和调控的重要多级介质。在癌细胞中,这种组织可以重组,为基因活性的失调提供框架。CTCF 蛋白最初被确定为肿瘤抑制基因的产物,是正常细胞中 3D 基因组组织形成的万能工具。在这里,我们总结了 CTCF 如何参与人类基因组的多级组织,并讨论了有关 CTCF 功能和 DNA 结合紊乱如何导致癌细胞中致癌基因激活的新见解,主要是通过增强子劫持的过程。此外,我们重点介绍了 CTCF 的非规范功能,这些功能也可能与癌症的出现有关。最后,我们为计算识别癌细胞中紊乱的 CTCF 结合和重组的 3D 基因组结构提供了指导。 2022 作者。由 Elsevier BV 代表计算和结构生物技术研究网络出版。这是一篇根据 CC BY-NC-ND 许可协议开放获取的文章(http://creative-commons.org/licenses/by-nc-nd/4.0/)。
增强子-基因通讯依赖于拓扑关联域 (TAD) 和由 CCCTC 结合因子 (CTCF) 绝缘子强制执行的边界,但其潜在的结构和机制仍然存在争议。在这里,我们研究了一种通常隔离成纤维细胞生长因子 (FGF) 致癌基因但在胃肠道间质瘤 (GIST) 中被 DNA 高甲基化破坏的边界。该边界包含一系列 CTCF 位点,可强制相邻的 TAD,一个包含 FGF 基因,另一个包含 ANO1 及其推定的增强子,它们在 GIST 及其可能的起源细胞中具有特异性活性。我们表明,边界中四个 CTCF 基序的协调破坏会融合相邻的 TAD,允许 ANO1 增强子接触 FGF3,并导致其强烈诱导。高分辨率微 C 图揭示了 ANO1 增强子和 FGF3 启动子中的转录起始位点之间的特定接触,这种接触与 FGF3 诱导呈定量关系,因此接触频率的适度变化会导致表达的强烈变化,与因果关系一致。
* 通讯作者。leonid@mit.edu,zechner@mpi-cbg.de,ashansen@mit.edu。作者贡献:ASH 构思并启动了该项目。HBB、MG、SGH、LM、CZ、ASH 设计了该项目。ASH 进行了基因组编辑并生成了细胞系。GMD 克隆了质粒。MG、AJ、CC 和 ASH 表征并验证了细胞系。THSH 进行了 Micro-C。CC 进行了 ChIP-Seq。MG、AJ 和 HBB 使用来自 ASH 的输入优化了成像实验。MG 和 AJ 收集了图像数据。MG 和 AJ 进行了对照实验并表征了 AID 细胞系。HBB 开发了图像处理管道 CNN,并使用来自 ASH、SGH、MG 和 AJ 的输入分析了图像数据。HBB 使用来自 SGH 和 LM 的输入进行了聚合物模拟。MG、AJ、HBB 和 ASH 注释了轨迹数据。 SGH 和 CZ 在 HBB、LM 和 ASH 的帮助下设计了 BILD。SGH 开发并测试了 BILD,将 BILD 应用于轨迹数据,并在 HBB、LM、ASH 和 CZ 的帮助下开发了 MSD 分析。HBB 和 SGH 分析了聚合物模拟。ASH、LM 和 CZ 负责监督该项目。HBB、MG、SGH、AJ 和 ASH 起草了手稿和图表。所有作者都编辑了手稿和图表。+ 现地址:Illumina Inc.;美国加利福尼亚州圣地亚哥 92122 † 这些作者对这项工作的贡献相同,可以先列出自己的名字。
1。巴黎大学,CNRS,Institut Jacques Monod,F-75013法国2。CEA,CEA,CNRS,CNRS综合生物学研究所(I2BC),法国F-91998 GIF-SUR-YVETTE,法国 *这些作者同样贡献了†对应:Maxim.greenberg@ijm.fr摘要,在哺乳动物的胚胎生成期间,两种甲基元素(5-Cyylimens)(5-Cyylimens)( (3D)在称为“表观遗传重编程”的过程中对染色质结构进行了深刻的重塑。表观遗传重编程的一个研究的方面是5mec通量本身如何影响3D基因组。 鉴于DNA结合对染色体折叠的关键调节剂的5mec-敏感性:CTCF。 我们使用小鼠胚胎干细胞(ESC)分化方案对CTCF结合景观进行了介绍,该方案模拟了幼稚多能的退出,其中全局DNA甲基化水平在四天内开始较低,并在四天内提高到躯体水平。 我们利用了这一事实,即缺乏DNA甲基化机制的小鼠ESC表现出全球相似的分化动力学,从而使CTCF不正调对基因表达的更微妙作用进行解剖。 我们通过在野生型和突变条件下进行CTCF HICHIP来评估异常的CTCF-CTCF接触,在没有5mec的情况下。 ,鉴于H3K27AC在主动启动子和增强子上富含H3K27AC,我们继续评估了错误调节的CTCF结合对顺式调节接触的影响。 使用DNA甲基化表观组编辑,我们能够直接证明DNA甲基马克能够影响CTCF结合。CEA,CEA,CNRS,CNRS综合生物学研究所(I2BC),法国F-91998 GIF-SUR-YVETTE,法国 *这些作者同样贡献了†对应:Maxim.greenberg@ijm.fr摘要,在哺乳动物的胚胎生成期间,两种甲基元素(5-Cyylimens)(5-Cyylimens)( (3D)在称为“表观遗传重编程”的过程中对染色质结构进行了深刻的重塑。表观遗传重编程的一个研究的方面是5mec通量本身如何影响3D基因组。鉴于DNA结合对染色体折叠的关键调节剂的5mec-敏感性:CTCF。我们使用小鼠胚胎干细胞(ESC)分化方案对CTCF结合景观进行了介绍,该方案模拟了幼稚多能的退出,其中全局DNA甲基化水平在四天内开始较低,并在四天内提高到躯体水平。我们利用了这一事实,即缺乏DNA甲基化机制的小鼠ESC表现出全球相似的分化动力学,从而使CTCF不正调对基因表达的更微妙作用进行解剖。我们通过在野生型和突变条件下进行CTCF HICHIP来评估异常的CTCF-CTCF接触,在没有5mec的情况下。,鉴于H3K27AC在主动启动子和增强子上富含H3K27AC,我们继续评估了错误调节的CTCF结合对顺式调节接触的影响。使用DNA甲基化表观组编辑,我们能够直接证明DNA甲基马克能够影响CTCF结合。最后,对印迹ZDBF2基因的详细解剖表明,CTCF的5mec-抗抗酸如何允许分化过程中适当的基因调节。这项工作提供了全面的概述,概述了DNA甲基化如何影响早期胚胎事件的相关模型中的3D基因组。
(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印版的版权持有人于2021年5月31日发布。 https://doi.org/10.1101/2021.05.31.446447 doi:Biorxiv Preprint
六种甲基转移酶分工建立组蛋白 H3 赖氨酸 9 甲基化 (H3K9me) 的基因组图谱,H3K9me 是一种控制组成性异染色质、基因抑制和逆转录元件沉默的表观基因组修饰。其中,SETDB1 被募集到活性染色质域以沉默内源性逆转录病毒的表达。在旨在确定 SETDB1 对巨噬细胞中刺激诱导基因表达的影响的实验中,我们发现 SETDB1 耗竭导致的 H3K9me3 丢失与 CTCF 募集增加有关,这些募集到 SINE B2 重复序列中包含的 >1600 个 DNA 结合基序,这是之前未确定的 SETDB1 介导的抑制靶点。CTCF 是染色质折叠的重要调节剂,可抑制黏连蛋白引起的 DNA 成环,从而在相邻拓扑域之间创建边界。 CTCF 与 SINE B2 重复序列的结合增加,增强了数百个位点的绝缘性,并增加了含有脂多糖诱导基因的拓扑域内的环形成,这与它们对刺激的调节受损有关。这些数据表明 H3K9me3 在抑制 CTCF 的基因组分布和活性方面发挥着作用,并对染色质组织和基因调控产生影响。
远端基因座之间的相互作用,包括涉及增强子和启动子的相互作用,是哺乳动物基因调节的核心机制,但这些相互作用的蛋白质调节剂仍未确定。锌指转录因子Znf143/ZFP143被强烈牵涉到染色质相互作用的调节剂,在有或没有CTCF的情况下起作用。然而,Znf143/ZFP143在此过程中的作用及其功能,无论有或没有CTCF,都尚不清楚。在这里,我们使用双用途Degron/Imaging标签标记了CTCF和ZNF143/ZFP143,以组合其循环功能和彼此的效果。我们发现ZNF143/ZFP143在小鼠和人类细胞中没有一般循环功能,并且它在很大程度上独立于CTCF起作用。相反,ZNF143/ZFP143是具有极为稳定的染色质停留时间(> 20分钟)的必不可少且高度保守的转录因子,可调节线粒体和核糖体基因的重要子集。
感染后,人乳头瘤病毒 (HPV) 会操纵宿主细胞基因表达,以创造一个有利于有效和持续感染的环境。病毒诱导的宿主细胞转录组变化被认为是导致致癌的原因。在这里,我们通过 RNA 测序表明,致癌 HPV18 附加体在原代人类包皮角质形成细胞 (HFK) 中的复制会驱动宿主转录变化,这些变化在多个 HFK 供体之间是一致的。我们之前已经表明,HPV18 将宿主蛋白 CTCF 募集到病毒附加体中,以控制分化依赖性病毒转录程序。由于 CTCF 是宿主细胞转录的重要调节器,它通过协调表观遗传边界和长距离染色体相互作用,我们假设 HPV18 也可能操纵 CTCF 来促进宿主转录重编程。通过 ChIP-Seq 分析宿主细胞基因组中的 CTCF 结合情况,结果显示,虽然病毒不会改变 CTCF 结合位点的总数,但是有一部分 CTCF 结合位点要么富集要么缺乏 CTCF。许多这些改变的位点聚集在差异表达基因的调控元件内,包括抑制上皮细胞生长和侵袭的肿瘤抑制基因细胞粘附分子 1 (CADM1)。我们发现 HPV18 的建立会导致 CADM1 启动子和上游增强子处的 CTCF 结合降低。在没有 CpG 高甲基化的情况下,CTCF 结合的丧失与 CADM1 的表观遗传抑制同时发生,而包括转录调节因子 ZBTB16 在内的相邻基因则被激活。这些数据表明,在 HPV18 建立后,CADM1 基因座会发生拓扑重排。我们利用 4C-Seq(环状染色体确认捕获测序)测试了这一假设,并表明 HPV18 的建立导致
CUT&RUN 方法 CUT&RUN 使用 CUTANA™ChIC/CUT&RUN 试剂盒进行,起始于 500k K562 细胞,含 0.5 µg IgG(EpiCypher 13-0042)、H3K4me3(EpiCypher 13-0060)、H3K27me3(EpiCypher 13-0055)或 0.125 µg CTCF(EpiCypher 13-2014)抗体,一式两份。使用 CUTANA™CUT&RUN 文库制备试剂盒(EpiCypher 14-1001/14-1002)以 5 ng DNA(或回收总量,如果少于 5 ng)进行文库制备。文库在 Illumina NextSeq2000 上运行,采用双端测序(2x50 bp)。样本测序深度为 5.5/18.8 百万个读数 (IgG Rep 1/Rep 2)、14.2/17.0 百万个读数 (H3K4me3 Rep 1/Rep 2)、24.7/18.1 百万个读数 (H3K27me3 Rep 1/Rep 2) 和 8.6/5.5 百万个读数 (CTCF Rep 1/Rep 2)。使用 Bowtie2 将数据与 T2T-CHM13v2.0 基因组比对。过滤数据以删除重复、多比对读数和 ENCODE DAC 排除列表区域。
先天性心脏缺陷 GATA6 0.174 3 2 0 0 0 2.5×10 -5 3.5×10 -6 KMT2A 0.065 5 0 1 0 0 3.2×10 -4 5.0×10 -5 ADNP 0.123 4 0 0 0 1 5.8×10 -4 3.1×10 -4 KDM5B a 0.572 4 0 0 2 4 0.012159 5.2×10 -4 NR2F2 0.217 2 1 0 0 0 0.014122 0.002103 FOXP1 a 0.175 2 1 0 0 0 0.029404 0.003100 TBX5 0.135 1 1 0 1 0 0.031389 0.053298 GATA4 0.527 2 0 0 2 1 0.040077 0.050796 TCF12 0.372 1 1 0 2 1 0.051542 0.068473 ZEB2 0.107 1 1 0 1 0 0.058741 0.131609 KLF2 a 0.710 1 1 0 0 0 0.204573 0.032261 SMAD4 0.222 0 2 0 0 0 0.209108 0.035057 MEIS2 a 0.184 2 0 0 0 0 0.271015 0.055872 CTCF a 0.148 0 2 0 0 0 0.278293 0.058374 颌面裂 SATB2 0.091 7 5 0 0 0 3.86×10 -14 5.77×10 -15 TFAP2A 0.261 2 3 0 1 0 2.84×10 -6 7.70×10 -6 CTCF b 0.148 0 3 0 0 0.011737 0.001484 IRF6 0.132 1 0 3 1 0 0.002951 0.007637 TP63 0.267 1 1 0 3 0 0.003631 0.072430 SOX5 b 0.188 1 1 0 1 0 0.018728 0.058691 ADNP b 0.123 2 0 0 0 1 0.092444 0.088307 GRHL2 b 0.270 2 0 0 0 0 0.328840 0.076571 213