HI-C测序和数据分析测序是在Illumina Novaseq平台上进行的。HI-C读数是使用三型读物处理的,并与HIC-PRO对齐HG38人类基因组参考。使用Juicebox进行可视化和接触归一化,并使用Juicer Tools GPU打ic来调用相互作用。根据打ic的相互作用调用手动策划映射到eCDNA的映射。使用纯染色体模式检测到染色体体相互作用。4
癌细胞基因组含有正常细胞中没有的环状染色体外 DNA (ecDNA) 元素。临床样本分析表明,它们在大多数癌症中很常见,它们的存在预示着不良预后。它们通常含有高表达的增强子和驱动致癌基因。环状 ecDNA 拓扑结构导致染色质开放构象并产生新的基因调控相互作用,包括与远端增强子的相互作用。着丝粒的缺失导致细胞分裂过程中 ecDNA 随机分布,并且编码在其上的基因以非孟德尔方式传播。ecDNA 可以整合到染色体 DNA 中和退出。特定 ecDNA 的数量会随着治疗而改变。这种重塑癌症基因组的动态能力挑战了长期存在的基本原理,为肿瘤异质性、癌症基因组重塑和耐药性提供了新的见解。
染色体外DNA(ecDNA)是一种来源于染色体的癌症特异性环状DNA分子。与线性染色体相比,ecDNA表现出独特的结构,可以代表高染色体可及性,导致原癌基因过度活化和恶性行为。同时,ecDNA的非染色体遗传和复发性突变加剧了肿瘤的异质性和进化。最近的研究表明,ecDNA驱动肿瘤的发生和进展,并与广泛存在的癌症的不良临床结果和耐药性有关。尽管ecDNA于1965年首次被发现,但随着技术的进步,它在肿瘤发生中的关键功能正在显现出来。在这篇综述中,我们总结了目前对ecDNA在癌症中的起源、生物发生过程、发现历史、分子机制和生理功能的理解。此外,我们重点介绍了研究ecDNA的有效方法,并为ecDNA导向治疗提供了新的见解。
外染色体DNA(ECDNA)是癌症局灶性致癌基因扩增的中心机制,发生在大约15%的早期癌症和30%的晚期癌症中。ECDNA通过动态调节基因拷贝数并重新启动基因调节网络,驱动肿瘤形成,进化和耐药性。阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。 配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。 断点图的遍历已用于成功预测癌症样品中的ECDNA。 然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。 长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。 在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。 珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。 可用性:https://github.com/ampliconsuite/coral阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。断点图的遍历已用于成功预测癌症样品中的ECDNA。然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。可用性:https://github.com/ampliconsuite/coral与以前的基于简读的工具相比,珊瑚在广泛的模拟和9个数据集中的重建基本上改善了重建。随着长阅读的用法变得广泛,我们预计珊瑚将成为培养肿瘤中局灶性扩增的景观和演变的宝贵工具。
图2。corex基因(a,b)验证验证核心基因预测值的验证。精度表示真正是eCDNA(+)的预测样品的比例。召回是指正确预测的eCDNA(+)样品的比例。对于具有相似精度的多个点,绘制了最大召回率。(a)核心基因和核心基因的曲线重叠,表明相似的预测能力。(b)Corex基因具有较高的预测率,并且基于对数折叠的折叠变化(TOP-| LFC |基因)的643个差异表达基因。(c)Corex基因在肿瘤类型的ECDNA(+)样品中始终在肿瘤样品中持续上调,但SARC除外。(d)的643 top- | lfc |基因,240个上调,而403个在ECDNA(+)样品中下调。325上调,而318个下调。top- | lfc |的绝对LFC值基因集明显大于核心基因的基因(p值1.83E -158)。(e)Corex基因的归一化基因表达值显着高于Top-| LFC |的基因表达值。基因集(p -Value <2E -308)。*** p -Value <0.001。
Xu 4,Kyle E. Orwig 5,Orhan Bukulmez 2和Haiqi Chen 1,2 * 1 Cecil H.和IDA Green for Dredroductive Biology Sciences,德克萨斯州西南部医学中心,美国德克萨斯州达克斯大学,美国德克萨斯州达克斯大学,美国2美国阿拉巴马大学伯明翰大学,美国阿拉巴马州伯明翰大学4个定量生物医学研究中心,彼得·奥唐纳尔(Peter O'Donnell Jr.作者同样为这项工作做出了贡献。*与haiqi.chen@utsouthwestern.edu的通信摘要摘要外染色体外圆形DNA(ECCDNA)起源于线性染色体DNA,可以在包括男性生殖线在内的各种人类细胞类型中找到。然而,尚不清楚eCCDNA在人类种系中的功能效应和生物发生机制。在这里,我们开发了一种测序方法来提取ECCDNA序列信息和来自同一单元的成对转录组信息。通过将这种方法应用于人类样本,我们发现了种系ECCDNA的转录活性的证据。我们还表明,患有高血压和糖尿病等慢性疾病的患者在精子中的ECCDNA数量明显高于健康疾病。至少部分是由于种系中的凋亡信号传导增加。分析糖尿病患者与健康个体的精子生成细胞的单细胞RNA测序数据表明,多种聚(ADP-核糖)聚合酶表达水平失调可能导致患病患者中种系ECCDNA的量增加。此外,我们确定了一种潜在的水平转移机制,健康的精子可以从周围的微环境中吸收ECCDNA。一起,我们的结果表明ECCDNA可能会对种系具有功能作用,并且可以作为人类健康的非侵入性临床生物标志物。引言癌细胞上的先前工作表明,已删除的基因组DNA可以自律化,并作为与线性基因组无关的遗传片段存在。这些经常称为eCDNA的这些外染色体DNA平均成对长,源自基因组的所有部分,可能包含促进肿瘤的基因,增加细胞异质性以促进耐药性以促进耐药性,以促进耐药性,甚至可以重新融合线性癌症基因组,以进一步破坏基因组的整合性[1-6]。有趣的是,在正常的体细胞和生殖细胞[7-10]中也发现了这种圆形DNA,并被称为ECCDNA(外染色体外圆形DNA),与癌细胞中的ECDNA不同。与ECDNA相反,eCCDNA的生物学功能和生物发生机制的研究较少,尤其是在人类种系的背景下。
已经认识到了基因组三维结构的变化的影响,但固体癌组织研究受到限制。Here, we performed integrated deep Hi-C sequencing with matched whole-genome sequencing, whole-genome bisulfite sequencing, 5-hydroxymethylcytosine (5hmC) sequencing and RNA sequencing across a cohort of 80 biopsy samples from patients with metastatic castration-resistant prostate cancer.在基因表达,5-甲基胞嘧啶/5HMC甲基化以及A和B(开放和闭合)染色质区室之间的结构变异与突变率中存在显着差异。肿瘤的一个子集在AR基因座表现出耗尽的区域染色质接触,与肉瘤外圆形DNA(ECDNA)有关,对AR信号抑制剂的反应较差。我们还确定了与甲基化结构,基因表达和预后差异差异相关的拓扑亚型。我们的数据表明,DNA相互作用可能易于结构变体形成,以复发性TMPRSS2 - ERG融合为例。这种全面的综合测序工作代表了独特的临床肿瘤资源。
确定新型的治疗方法,该方法利用了特定的肿瘤脆弱性。与成年癌症相比,通常表现出一生中积累的大量突变,小儿肿瘤通常在组织范围内的发育窗口中出现 - 特定方式 - 通常只有很少的突变驱动因素和低突变负担(4)。小儿实体瘤中的一个共同特征是融合癌蛋白的存在,由于染色体畸变而出现了(5)。此外,在某些儿科实体瘤中频繁进行肉体内和外肿瘤性癌基因的扩增,例如在神经母细胞瘤中,在神经母细胞瘤中,经常在ECDNA上发生myCN扩增,这是对不良预后的预测因子(6-10)。基因扩增和融合癌蛋白都难以直接治疗,尤其是在影响转录因子时,这阻碍了这些肿瘤实体中选择性疗法的发展。基因组不稳定性是癌细胞的标志(11),最近已证明它在治疗上可起作用(12)。癌细胞中的极端增殖率部分由融合型癌蛋白和癌基因扩增引起,可能会导致所谓的复制应力的DNA延迟或误差(13-15)。响应受损的DNA,细胞具有复杂的机制来识别和修复病变,同时确保细胞周期停止,称为DNA损伤响应(DDR)。DDR主要由三种激酶调节:共济失调突变(ATM),共济失调telangiectasia-和rad3相关(ATR)以及DNA依赖性蛋白激酶催化亚基(DNA-PKC; ref。16)。即使它们具有相似的蛋白质序列,并且它们的靶标重叠,但它们对它们对不同刺激的反应也被广泛接受(17)。尽管ATM和DNA-PKC在双链断裂后大部分被激活,但ATR主要响应复制应力与与DNA相关的DNA损伤,这通常涉及单链DNA中间体(18、19)。由于ATR响应于复制应力而被激活,因此有人提出,癌症比非转化的细胞更强烈地依赖于ATR来耐受高水平的复制应力(20,21)。这些发现激发了测试ATR抑制剂作为癌症治疗选择的兴趣,尤其是在具有较高复制应激的肿瘤中。一些预测的生物标志物