DNA 胞嘧啶甲基化是一种表观遗传机制,参与调节植物对生物和非生物胁迫的反应,其改变能力随胞嘧啶出现的序列环境(CpG、CHG、CHH,其中 H = 腺嘌呤、胸腺嘧啶、胞嘧啶)而变化。模型植物物种中的 DNA 甲基化定量通常通过全基因组亚硫酸盐测序(WGBS)进行,这需要高质量的参考基因组。精简代表性亚硫酸盐测序 (RRBS) 是一种经济有效的潜在替代方案,适用于基因组资源有限且实验设计规模大的生态研究。在本研究中,我们首次全面比较了 RRBS 和 WGBS 的输出,以表征 DNA 甲基化对给定环境因素的反应变化。具体而言,我们使用 epiGBS(最近优化的 RRBS)和 WGBS 来评估 Populus nigra cv. 无性系中昆虫和人工食草后的整体和序列特异性差异甲基化。 'italica'。我们发现,在两种食草处理中的任何一种之后,CHH 中的全局甲基化百分比都会增加,并且只有 epiGBS 检测到这种转变具有统计学意义。至于食草引起的位点特异性差异甲基化(epiGBS 中的胞嘧啶和 WGBS 中的区域),两种技术都表明昆虫和人工食草引起的反应具有特异性,并且 CpG 中的低甲基化和 CHH 中的高甲基化频率更高。当存在于 CpG 和 CHG 中时,甲基化变化主要发现在基因体和基因间区域,而在 CHH 环境中则发现在转座因子和基因间区域。因此,epiGBS 成功地表征了伦巴第杨对食草反应的全局全基因组甲基化变化。我们的研究结果支持 epiGBS 在旨在探索非模型植物物种对多种环境因素反应的表观遗传变化的大型实验设计中特别有用。
DNA甲基化是基因转录的重要调节剂。WGB是DNA甲基化定量碱基分辨率的金标准方法。它需要较高的测序深度。许多CPG位点在WGBS数据中覆盖不足,导致单个位点的DNA甲基化水平不足。提出了许多图案计算方法来预测缺失值。但是,许多方法都需要其他OMICS数据集或其他跨样本数据。,其中大多数仅预测DNA甲基化状态。在这项研究中,我们提出了RCWGB,可以将相邻侧面DNA甲基化水平的缺失(或低覆盖率)值算。深度学习技术被用于准确的预测。H1-HESC和GM12878的WGBS数据集被下采样。RCWGB预测的12×深度的DNA甲基化水平之间的平均差异分别在H1-HESC和GM2878细胞中> 50倍深度的平均差异分别小于0.03和0.01。rcwgb的表现都比Methimpute更好。我们的工作将有助于处理低测序深度的甲基化数据。对于研究人员来说,通过计算方法节省了测序成本并改善数据利用是有益的。
补充图1要使用现有方法获得遗传学,MC和HMC,有必要将来自标准的整个基因组测序实验的信息与来自单独的WGB和OXBS实验的数据相结合。这提出了许多实际挑战。sfig 1a)说明了给定CpG下HMC水平的估计值的差异是我们从WGB和OXBS的MC的MODC估计值的差异的总和。sfig1b)包含一个在两个模拟的测序实验的相同200nt区域的预期覆盖范围(从基因组中均匀读取的读取)的示例;左侧是WGBS实验,右侧是OXBS实验。每当两者中的任何一个中的覆盖范围下降到10倍以下时 - 都可以在MC或HMC上进行呼叫。sfig1c)提供了一种示意图,说明了低覆盖率的区域如何在多个实验中结合数据时如何结合不利的区域。集成的数据集将在任何区域中都有覆盖差距(用黑色阴影表示),而在任何一个实验中,覆盖范围不足。
图1:WGB中的参考序列空间爆炸。A:可视化WGBS协议的两个主要步骤,导致参考序列空间的2倍爆炸。首先,参考序列是变性的,并用硫化钠填充剂处理,导致C转化为未甲基化的胞嘧啶。在原点链中具有CS的位置(Bisulfi Te治疗之前)始终为红色。在PCR步骤中,将链片段放大,导致代表链片段(+)及其反向补体( - )的序列。由于A到T的反向互补性在原始链中没有甲基化的C(所有位置都带有以前的GS颜色为橙色),因此这将结果4不同的链。b:WGBS序列空间中的读取映射问题,通过映射到完整的参考空间(1),并使用读取本身或其反向补充必须映射到参考(2)的C/T转换版本的想法。后者在空间要求中规定了2倍爆炸以进行参考。
CORES ACTIVITY TECHNOLOGY / ACTIVITY Production Genomics Whole Genome Sequencing Illumina NovaSeq Exome / Targeted Capture Sequencing Illumina NovaSeq Whole Genome Bisulfite Sequencing (WGBS) Illumina NovaSeq RNA-Seq / miRNA-Seq Illumina NovaSeq ChIP-Seq, ChIPmentation, ATAC-Seq Illumina NovaSeq Expression Arrays / Genotyping Illumina iScan / Affymetrix Genetitan
摘要 印记是哺乳动物正常胚胎发育的关键部分,由确定的亲本来源 (PofO) 差异甲基化区域 (DMR)(称为印记控制区)控制。直接纳米孔测序 DNA 提供了一种检测等位基因甲基化的方法,并克服了甲基化阵列和短读技术的缺点。在这里,我们使用 12 个标准 B 淋巴细胞细胞系的公开纳米孔测序数据来获取人类印记间隔的全基因组图谱。利用测序数据,我们能够对 95% 的人类甲基化组进行分期,并检测出 94% 的先前已充分表征的印记 DMR。此外,我们发现了 42 个新的印记 DMR(16 个生殖系和 26 个体细胞),这些印记 DMR 已使用全基因组亚硫酸盐测序 (WGBS) 数据得到确认。对小鼠 ( Mus musculus )、恒河猴 ( Macaca mulatta ) 和黑猩猩 ( Pan troglo- dytes ) 的 WGBS 数据的分析表明,其中 17 个印记 DMR 是保守的。一些新的印记间隔位于没有已知 DMR 的印记基因内或附近。我们还检测到了细微的亲本甲基化偏差,跨越七个已知印记簇的几千个碱基。在这些区块,高甲基化发生在具有互斥的 H3K36me3 和 H3K27me3 等位基因组蛋白标记的表达等位基因的基因体上。这些结果扩展了我们目前对印记的了解和纳米孔测序的潜力,它仅使用亲本-后代三重奏来识别印记区域,而不是像以前那样需要大量的多代谱系。
DNA甲基化是最丰富,最广泛研究的表观遗传修饰之一,在各种生物学过程中起着至关重要的作用,例如发育,癌症,衰老和复杂疾病。在癌症基因组图集(TCGA)等大型队列研究中,Illumina阵列已被广泛用作高通量筛查的经典平台。但是,这种类型的阵列覆盖了人类基因组中的CpG位点的3%。最新一代的DNA测序技术以PACBIO HIFI系统为例,具有产生长序列读数的独特能力,最高为25千碱基。太平洋生物科学(PACBIO)的最新进步致力于提高每碱基准确性和检测DNA修饰的能力。在这项研究中,我们使用DNA甲基化标准评估了PACBIO HIFI测序的性能。由人DNA在CpG部位酶甲基化的DNA标准和未甲基化的人DNA源自HCT116 DKO细胞系。1 ug。样品被测序为约8倍覆盖范围。DNA甲基化数据,并使用PB-CPG-Tools从BAM文件中提取甲基化值。然后,我们比较了从PACBIO HIFI测序获得的结果与由史诗阵列和整个基因组亚硫酸盐测序(WGB)产生的结果。我们发现WGB和PACBIO HIFI天然DNA甲基化调用表现出很高的一致性,表现优于史诗般的阵列,这两种史诗阵列都与甲基化标准和报道的CPG数量一致。使用甲基化的标准样品,HIFI数据报告约有85%的CpG位点的甲基化比大于90%,平均基因组宽93%。同样,WGBS数据显示了约85%的CpG位点的甲基化比大于90%,平均基因组宽95%。相比之下,Epic阵列仅报告40%的CpG位点的甲基化比大于90%,而整个基因组中平均为87%。这些结果表明,HIFI长读取测序可以准确检测到接近100%甲基化的区域的DNA甲基化信号。我们的研究提供了对检测DNA甲基化模式的PACBIO HIFI测序表现的见解及其作为史诗阵列的替代方案的潜力。这项研究的发现说明了如何将DNA甲基化标准用作评估DNA甲基化调用模型的基础真实参考。
与基因组DNA(GDNA)不同,CFDNA不是随机碎片的,其碎片化模式与局部表观遗传背景高度相关。17,18。最近的几项研究已经确定了甲基化和未甲基化的CFDNA分子之间的DNA片段化模式显着不同,7,19,20。这些发现表明,从CFDNA片段化模式中推断DNA甲基化水平的可能性。最近的一项研究提供了一种概念验证解决方案,以通过深度学习模型19预测超高覆盖WGB中DNA甲基化的二元状态。但是,从CFDNA WGS预测甲基化状态的能力仍未得到探索。2020年美国妇产科医生学院(ACOG)指南建议所有怀孕的非侵入性产前测试(NIPT),无论风险如何,这最终将导致美国每年在美国每年都会导致数百万个浅层覆盖率(〜0.1x-1x)CFDNA WG。此外,已经将数十万个CFDNA WGS样品被学术社区和商业实体在全球范围内进行了癌症早期检测和其他目的。21。Given the potential to leverage cfDNA WGS datasets to advance understanding of gene regulation and human health 22 , we developed a computational method, named FinaleMe ( F ragmentat I o N A na L ysis of c E ll-free DNA Me thylation), to predict the DNA methylation status in each CpG at each cfDNA fragment and obtain the continuous DNA methylation level at CpG sites, mostly accurate in CPG富裕地区。我们直接从CFDNA WGS中的碎片模式直接预测了相关的原始组织状态。我们使用对不同生理条件的同一血管(〜16-39x)和浅(〜0.1x)WGS的同一血液中的血浆CFDNA的配对WGS和血浆CfDNA的甲基化水平和原生蛋白状态的预测。
胞嘧啶DNA甲基化参与了转座元件(TE)沉默,烙印和X染色体灭活。植物DNA甲基化由Met1(Mammalian DNMT1),DRM2(哺乳动物DNMT3)和两个植物特异性DNA甲基转移酶,CMT2和CMT3介导(Law and Jacobsen,2010年)。DRM2通过植物特异性RNA指导的DNA甲基化(RDDM)途径建立了植物中的从头DNA甲基化,依赖于两个DNA依赖性RNA聚合酶,POL IV和POL V(Gallego-Bartolome et al。木薯的DNA甲基团先前已根据其单倍体倒塌的基因组进行了记录(Wang等,2015)。由于木薯基因组是高度杂合的,因此单倍型折叠基因组的DNA甲基团错过了甲基体的许多特征。With the development of long-read sequencing and chromosomal conformation capture techniques, haplotype-resolved genomes are available for highly heterozygous genomes (Mansfeld et al., 2021 ; Qi et al., 2022 ; Sun et al., 2022 ; Zhou et al., 2020 ), which provides high-quality reference genomes facilitating studies of haplotype-resolved DNA甲基组。为了剖析木薯的单倍型分辨DNA甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基甲基(TME7和TME204)在两个单倍型基因组分辨率(TME7和TME204)中进行了研究。 Al。,2021;测序读数分别映射到不同的单倍型,允许零不匹配和一个最佳命中,这允许分离属于不同单倍型的读数。总体而言,我们发现尽管使用了WGB和EM-SEQ方法,但两种单倍型具有相似的整体
通过谱系可塑性和发散的克隆进化(3,5-7)。CRPC-NE患者通常通过类似于小细胞肺癌(SCLC)的化学疗法方案进行积极治疗,并且还在进行几项CRPC-NE指导的临床试验。当前CRPC-NE的诊断仍然存在,因为需要转移活检以及室内肿瘤异质性。浆细胞-FRE-FREDNA(CFDNA)的DNA测序是一种无创的工具,可检测CER中的体细胞改变(8)。但是,与CRPC-Adeno相比,癌症特异性突变或拷贝数的变化仅在CRPC-NE中适度富集(3,9)。相反,我们和其他人观察到与CRPC-NE相关的广泛的DNA甲基化变化(3,10),并且可以在CFDNA中检测到这种变化(11,12)。DNA甲基化主要是在CpG二核苷酸上进行的,并且与广泛的生物学过程有关,包括调节基因的表达,细胞命运和基因组稳定性(13)。此外,DNA甲基化是高度组织特异性的,并提供了强大的信号来对原始组织进行反v,从而允许增强循环中低癌部分的检测(16、17),并已成功地应用于早期检测和监测(18,19)。如前所述,可以用甲硫酸盐测序来测量基础分辨率下的DNA甲基化,该测序为每种覆盖的CpG提供了一小部分甲基化的胞质的β值的形式,范围为0(无甲基化)至1(完全甲基化)。低通序测序遭受低粒度,并以粗分辨率捕获所有区域。原则上,诸如全基因组Bisulfite CFDNA测序(WGB)之类的方法可以很好地了解患者的疾病状况,并具有最佳的甲基化含量信息。实际上,鉴于高深度全基因组测序的成本,WGB的低通型变种适用于大规模的临床研究。鉴于此上下文中的大多数CPG站点可能是非信息或高度冗余的,我们旨在将测序空间减少到最小设置