补充图1要使用现有方法获得遗传学,MC和HMC,有必要将来自标准的整个基因组测序实验的信息与来自单独的WGB和OXBS实验的数据相结合。这提出了许多实际挑战。sfig 1a)说明了给定CpG下HMC水平的估计值的差异是我们从WGB和OXBS的MC的MODC估计值的差异的总和。sfig1b)包含一个在两个模拟的测序实验的相同200nt区域的预期覆盖范围(从基因组中均匀读取的读取)的示例;左侧是WGBS实验,右侧是OXBS实验。每当两者中的任何一个中的覆盖范围下降到10倍以下时 - 都可以在MC或HMC上进行呼叫。sfig1c)提供了一种示意图,说明了低覆盖率的区域如何在多个实验中结合数据时如何结合不利的区域。集成的数据集将在任何区域中都有覆盖差距(用黑色阴影表示),而在任何一个实验中,覆盖范围不足。
通过谱系可塑性和发散的克隆进化(3,5-7)。CRPC-NE患者通常通过类似于小细胞肺癌(SCLC)的化学疗法方案进行积极治疗,并且还在进行几项CRPC-NE指导的临床试验。当前CRPC-NE的诊断仍然存在,因为需要转移活检以及室内肿瘤异质性。浆细胞-FRE-FREDNA(CFDNA)的DNA测序是一种无创的工具,可检测CER中的体细胞改变(8)。但是,与CRPC-Adeno相比,癌症特异性突变或拷贝数的变化仅在CRPC-NE中适度富集(3,9)。相反,我们和其他人观察到与CRPC-NE相关的广泛的DNA甲基化变化(3,10),并且可以在CFDNA中检测到这种变化(11,12)。DNA甲基化主要是在CpG二核苷酸上进行的,并且与广泛的生物学过程有关,包括调节基因的表达,细胞命运和基因组稳定性(13)。此外,DNA甲基化是高度组织特异性的,并提供了强大的信号来对原始组织进行反v,从而允许增强循环中低癌部分的检测(16、17),并已成功地应用于早期检测和监测(18,19)。如前所述,可以用甲硫酸盐测序来测量基础分辨率下的DNA甲基化,该测序为每种覆盖的CpG提供了一小部分甲基化的胞质的β值的形式,范围为0(无甲基化)至1(完全甲基化)。低通序测序遭受低粒度,并以粗分辨率捕获所有区域。原则上,诸如全基因组Bisulfite CFDNA测序(WGB)之类的方法可以很好地了解患者的疾病状况,并具有最佳的甲基化含量信息。实际上,鉴于高深度全基因组测序的成本,WGB的低通型变种适用于大规模的临床研究。鉴于此上下文中的大多数CPG站点可能是非信息或高度冗余的,我们旨在将测序空间减少到最小设置
通过谱系可塑性和发散的克隆进化(3,5-7)。CRPC-NE患者通常通过类似于小细胞肺癌(SCLC)的化学疗法方案进行积极治疗,并且还在进行几项CRPC-NE指导的临床试验。当前CRPC-NE的诊断仍然存在,因为需要转移活检以及室内肿瘤异质性。浆细胞-FRE-FREDNA(CFDNA)的DNA测序是一种无创的工具,可检测CER中的体细胞改变(8)。但是,与CRPC-Adeno相比,癌症特异性突变或拷贝数的变化仅在CRPC-NE中适度富集(3,9)。相反,我们和其他人观察到与CRPC-NE相关的广泛的DNA甲基化变化(3,10),并且可以在CFDNA中检测到这种变化(11,12)。DNA甲基化主要是在CpG二核苷酸上进行的,并且与广泛的生物学过程有关,包括调节基因的表达,细胞命运和基因组稳定性(13)。此外,DNA甲基化是高度组织特异性的,并提供了强大的信号来对原始组织进行反v,从而允许增强循环中低癌部分的检测(16、17),并已成功地应用于早期检测和监测(18,19)。如前所述,可以用甲硫酸盐测序来测量基础分辨率下的DNA甲基化,该测序为每种覆盖的CpG提供了一小部分甲基化的胞质的β值的形式,范围为0(无甲基化)至1(完全甲基化)。低通序测序遭受低粒度,并以粗分辨率捕获所有区域。原则上,诸如全基因组Bisulfite CFDNA测序(WGB)之类的方法可以很好地了解患者的疾病状况,并具有最佳的甲基化含量信息。实际上,鉴于高深度全基因组测序的成本,WGB的低通型变种适用于大规模的临床研究。鉴于此上下文中的大多数CPG站点可能是非信息或高度冗余的,我们旨在将测序空间减少到最小设置
通过谱系可塑性和发散的克隆进化(3,5-7)。CRPC-NE患者通常通过类似于小细胞肺癌(SCLC)的化学疗法方案进行积极治疗,并且还在进行几项CRPC-NE指导的临床试验。当前CRPC-NE的诊断仍然存在,因为需要转移活检以及室内肿瘤异质性。浆细胞-FRE-FREDNA(CFDNA)的DNA测序是一种无创的工具,可检测CER中的体细胞改变(8)。但是,与CRPC-Adeno相比,癌症特异性突变或拷贝数的变化仅在CRPC-NE中适度富集(3,9)。相反,我们和其他人观察到与CRPC-NE相关的广泛的DNA甲基化变化(3,10),并且可以在CFDNA中检测到这种变化(11,12)。DNA甲基化主要是在CpG二核苷酸上进行的,并且与广泛的生物学过程有关,包括调节基因的表达,细胞命运和基因组稳定性(13)。此外,DNA甲基化是高度组织特异性的,并提供了强大的信号来对原始组织进行反v,从而允许增强循环中低癌部分的检测(16、17),并已成功地应用于早期检测和监测(18,19)。如前所述,可以用甲硫酸盐测序来测量基础分辨率下的DNA甲基化,该测序为每种覆盖的CpG提供了一小部分甲基化的胞质的β值的形式,范围为0(无甲基化)至1(完全甲基化)。低通序测序遭受低粒度,并以粗分辨率捕获所有区域。原则上,诸如全基因组Bisulfite CFDNA测序(WGB)之类的方法可以很好地了解患者的疾病状况,并具有最佳的甲基化含量信息。实际上,鉴于高深度全基因组测序的成本,WGB的低通型变种适用于大规模的临床研究。鉴于此上下文中的大多数CPG站点可能是非信息或高度冗余的,我们旨在将测序空间减少到最小设置
通过谱系可塑性和发散的克隆进化(3,5-7)。CRPC-NE患者通常通过类似于小细胞肺癌(SCLC)的化学疗法方案进行积极治疗,并且还在进行几项CRPC-NE指导的临床试验。当前CRPC-NE的诊断仍然存在,因为需要转移活检以及室内肿瘤异质性。浆细胞-FRE-FREDNA(CFDNA)的DNA测序是一种无创的工具,可检测CER中的体细胞改变(8)。但是,与CRPC-Adeno相比,癌症特异性突变或拷贝数的变化仅在CRPC-NE中适度富集(3,9)。相反,我们和其他人观察到与CRPC-NE相关的广泛的DNA甲基化变化(3,10),并且可以在CFDNA中检测到这种变化(11,12)。DNA甲基化主要是在CpG二核苷酸上进行的,并且与广泛的生物学过程有关,包括调节基因的表达,细胞命运和基因组稳定性(13)。此外,DNA甲基化是高度组织特异性的,并提供了强大的信号来对原始组织进行反v,从而允许增强循环中低癌部分的检测(16、17),并已成功地应用于早期检测和监测(18,19)。如前所述,可以用甲硫酸盐测序来测量基础分辨率下的DNA甲基化,该测序为每种覆盖的CpG提供了一小部分甲基化的胞质的β值的形式,范围为0(无甲基化)至1(完全甲基化)。低通序测序遭受低粒度,并以粗分辨率捕获所有区域。原则上,诸如全基因组Bisulfite CFDNA测序(WGB)之类的方法可以很好地了解患者的疾病状况,并具有最佳的甲基化含量信息。实际上,鉴于高深度全基因组测序的成本,WGB的低通型变种适用于大规模的临床研究。鉴于此上下文中的大多数CPG站点可能是非信息或高度冗余的,我们旨在将测序空间减少到最小设置
图1:WGB中的参考序列空间爆炸。A:可视化WGBS协议的两个主要步骤,导致参考序列空间的2倍爆炸。首先,参考序列是变性的,并用硫化钠填充剂处理,导致C转化为未甲基化的胞嘧啶。在原点链中具有CS的位置(Bisulfi Te治疗之前)始终为红色。在PCR步骤中,将链片段放大,导致代表链片段(+)及其反向补体( - )的序列。由于A到T的反向互补性在原始链中没有甲基化的C(所有位置都带有以前的GS颜色为橙色),因此这将结果4不同的链。b:WGBS序列空间中的读取映射问题,通过映射到完整的参考空间(1),并使用读取本身或其反向补充必须映射到参考(2)的C/T转换版本的想法。后者在空间要求中规定了2倍爆炸以进行参考。
在发表的文章中,传说中有一个错误的补充图6M,n。使用“启动子活动”而不是“ WGB”进行样品相关聚类。正确的材料语句出现在下面。(M)热图显示了GSE70091中三对启动子活性的相关性。(n)热图显示了删除N3和T3对后,GSE70091中两对启动子活性的性能相关性更好。在已发表的文章中,存在印刷错误。基因名称“ rabgap1l”被错误地写成“ rabgapl1”。对结果进行了校正,甲基化调节的AP可以用作肿瘤诊断标记,第1段。这句话先前指出:“六个MRAP被聚集为四个上调的MRAPS(TNFRSF10的Prmtr.53735,RGS3的Prmtr.32651,CCDC150的Prmtr.36049,RASSF1的Prmtr.5237和RASSF1的Prmtr.5237和Prmtr.5237)和两个下降MRAPS(prmtr.14) prmtr.39585 rabgapl1的启动子活动(图4D,鞋面;表1;表S5)”
DNA甲基化是最丰富,最广泛研究的表观遗传修饰之一,在各种生物学过程中起着至关重要的作用,例如发育,癌症,衰老和复杂疾病。在癌症基因组图集(TCGA)等大型队列研究中,Illumina阵列已被广泛用作高通量筛查的经典平台。但是,这种类型的阵列覆盖了人类基因组中的CpG位点的3%。最新一代的DNA测序技术以PACBIO HIFI系统为例,具有产生长序列读数的独特能力,最高为25千碱基。太平洋生物科学(PACBIO)的最新进步致力于提高每碱基准确性和检测DNA修饰的能力。在这项研究中,我们使用DNA甲基化标准评估了PACBIO HIFI测序的性能。由人DNA在CpG部位酶甲基化的DNA标准和未甲基化的人DNA源自HCT116 DKO细胞系。1 ug。样品被测序为约8倍覆盖范围。DNA甲基化数据,并使用PB-CPG-Tools从BAM文件中提取甲基化值。然后,我们比较了从PACBIO HIFI测序获得的结果与由史诗阵列和整个基因组亚硫酸盐测序(WGB)产生的结果。我们发现WGB和PACBIO HIFI天然DNA甲基化调用表现出很高的一致性,表现优于史诗般的阵列,这两种史诗阵列都与甲基化标准和报道的CPG数量一致。使用甲基化的标准样品,HIFI数据报告约有85%的CpG位点的甲基化比大于90%,平均基因组宽93%。同样,WGBS数据显示了约85%的CpG位点的甲基化比大于90%,平均基因组宽95%。相比之下,Epic阵列仅报告40%的CpG位点的甲基化比大于90%,而整个基因组中平均为87%。这些结果表明,HIFI长读取测序可以准确检测到接近100%甲基化的区域的DNA甲基化信号。我们的研究提供了对检测DNA甲基化模式的PACBIO HIFI测序表现的见解及其作为史诗阵列的替代方案的潜力。这项研究的发现说明了如何将DNA甲基化标准用作评估DNA甲基化调用模型的基础真实参考。
胰腺导管腺癌(PDAC)中的摘要尚未发现复发转移特异性突变,这表明表观遗传机制(例如DNA甲基化)是晚期疾病进展的主要贡献者。在这里,我们在小鼠和人类PDAC类器官模型上进行了第一个全基因组纤维纤维测序(WGB),以鉴定特异性和分子亚型特异性DNA甲基化特征。使用这种方法,我们识别了数千种差异化甲基化的(DMR),它们可以区分PDAC的阶段和分子亚型。阶段特定的DMR与与神经系统发育和细胞粘附相关的基因相关,并富含启动子和二价增强子。亚型特异性DMR显示出鳞状亚型中的GATA6前胚层转录网络的过度甲基化和祖细胞亚型中EMT转录网络的过度甲基化。这些结果表明,异常的DNA甲基化构成有助于PDAC的进展和亚型分化,从而产生了具有诊断和预后潜力的显着和重复的DNA甲基化模式。
DNA甲基化是基因转录的重要调节剂。WGB是DNA甲基化定量碱基分辨率的金标准方法。它需要较高的测序深度。许多CPG位点在WGBS数据中覆盖不足,导致单个位点的DNA甲基化水平不足。提出了许多图案计算方法来预测缺失值。但是,许多方法都需要其他OMICS数据集或其他跨样本数据。,其中大多数仅预测DNA甲基化状态。在这项研究中,我们提出了RCWGB,可以将相邻侧面DNA甲基化水平的缺失(或低覆盖率)值算。深度学习技术被用于准确的预测。H1-HESC和GM12878的WGBS数据集被下采样。RCWGB预测的12×深度的DNA甲基化水平之间的平均差异分别在H1-HESC和GM2878细胞中> 50倍深度的平均差异分别小于0.03和0.01。rcwgb的表现都比Methimpute更好。我们的工作将有助于处理低测序深度的甲基化数据。对于研究人员来说,通过计算方法节省了测序成本并改善数据利用是有益的。