通过实现遍及表观基因组的性状关联的发现,无花果DNA甲基化beadchip显着促进了种群规模的表观遗传学研究。在这里,我们设计,描述和实验验证了该技术的新迭代,即甲基化筛选阵列(MSA),以关注人类性状筛查和发现。此阵列利用了先前基于Infinium平台的整个表观基因组协会研究(EWAS)的大量数据。它结合了最新的单细胞和细胞类型 - 整个基因组甲基谱的知识。MSA经过设计,以实现超高样品吞吐量中表观遗传学特征关联的可扩展筛选。我们的设计涵盖了各种人类性状关联,包括具有遗传,细胞,环境和人口统计学变量以及人类疾病(例如遗传,神经退行性,心血管,感染性和免疫疾病)的人类疾病。我们全面评估了该阵列的可重复性,准确性和能力,用于细胞型反卷积和支持5-羟基甲基化分析。我们使用此平台的第一个图集数据发现了与人类表型相关的DNA修饰变化和遗传变异的复杂染色质和组织环境。
DNA甲基化是一种关键表观遗传学修饰,在调节基因表达中起着至关重要的作用,并且已知会随着年龄的增长而发生动态变化。本研究研究了使用Illumina Epic850k阵列在两个时间点(相距15年)的64个个体的表观基因组宽的甲基化谱。混合效应模型确定了2821年龄相关的差异甲基化CPG位置(ADMP),中位变化率每年为0.18%,与人类寿命期间的变化10-15%一致。在所有ADMP中观察到了相似年龄的个体之间的基线DNA甲基化水平的显着变化以及在各个个体之间随着时间的变化方向不一致的变化。2821个ADMP的23个先前已纳入法医年龄预测模型。与所有ADMP相比,这些标记随着年龄的增长而显示出更大的DNA甲基化变化,并且个体之间的变化更少。然而,法医ADMP在DNA甲基化变化方向上也显示出个体间的变化。Elovl2中仅CG16867657在被研究的个体中表现出与年龄相关的变化的统一方向,这支持当前的Elovl2中的CpG站点是年龄预测的最佳标记。
DNA甲基化是最丰富,最广泛研究的表观遗传修饰之一,在各种生物学过程中起着至关重要的作用,例如发育,癌症,衰老和复杂疾病。在癌症基因组图集(TCGA)等大型队列研究中,Illumina阵列已被广泛用作高通量筛查的经典平台。但是,这种类型的阵列覆盖了人类基因组中的CpG位点的3%。最新一代的DNA测序技术以PACBIO HIFI系统为例,具有产生长序列读数的独特能力,最高为25千碱基。太平洋生物科学(PACBIO)的最新进步致力于提高每碱基准确性和检测DNA修饰的能力。在这项研究中,我们使用DNA甲基化标准评估了PACBIO HIFI测序的性能。由人DNA在CpG部位酶甲基化的DNA标准和未甲基化的人DNA源自HCT116 DKO细胞系。1 ug。样品被测序为约8倍覆盖范围。DNA甲基化数据,并使用PB-CPG-Tools从BAM文件中提取甲基化值。然后,我们比较了从PACBIO HIFI测序获得的结果与由史诗阵列和整个基因组亚硫酸盐测序(WGB)产生的结果。我们发现WGB和PACBIO HIFI天然DNA甲基化调用表现出很高的一致性,表现优于史诗般的阵列,这两种史诗阵列都与甲基化标准和报道的CPG数量一致。使用甲基化的标准样品,HIFI数据报告约有85%的CpG位点的甲基化比大于90%,平均基因组宽93%。同样,WGBS数据显示了约85%的CpG位点的甲基化比大于90%,平均基因组宽95%。相比之下,Epic阵列仅报告40%的CpG位点的甲基化比大于90%,而整个基因组中平均为87%。这些结果表明,HIFI长读取测序可以准确检测到接近100%甲基化的区域的DNA甲基化信号。我们的研究提供了对检测DNA甲基化模式的PACBIO HIFI测序表现的见解及其作为史诗阵列的替代方案的潜力。这项研究的发现说明了如何将DNA甲基化标准用作评估DNA甲基化调用模型的基础真实参考。
DNA,并将标本存储在-80°C下。DNAM分析是在杜克大学Yongmei Liu博士的实验室进行的。Bisulfite的转化。500ng的DNA。数据是在Illumina Infinium甲基化甲基甲基甲虫v1.0上产生的(CAT#WG317-1001,Illumina,Illumina,San Diego,CA,美国)。使用制造商方案将总共4 µL的硫酸硫酸硫酸含量转换为DNA与Illumina Beadchip杂交。样品被变性并放大过夜20-24小时。样品的碎片,沉淀和重悬于过夜孵化之后,然后与史诗般的珠奇普杂交16-24小时。然后洗涤珠奇普,以去除任何未脑的DNA,并用核苷酸标记以将引物扩展到DNA。按照Infinium HD甲基化协议,使用Illumina Iscan系统(Illumina,Illumina,San Diego,CA,USA)对珠奇普进行成像。
• 使用这样的机器人,移液的准确性更高,这意味着结果更一致。 • 技术人员需要进行的移液更少,因此重复性劳损 (RSI) 的风险更低。 • 机器人比人类更快。这一点尤其重要,因为一个 BeadChip 可以运行 24 名患者,每次运行将有四个 Beadchip(总共 96 名患者)。
通过对已发表的数据,科学文献和无甲基化阵列的分析来鉴定出无数甲基化筛选阵列上的50%的基因座,以查找CpG甲基化与各种性状或疾病的关联(图2和表2)。根据样本量,统计鲁棒性和科学影响,对超过1000个EWAS研究进行了策划和过滤。探针具有最高的统计显着性和效果大小的优先级,并且选择了选择,以最大程度地表示特征和疾病的表示。选定的含量与广泛的生物类别相关联,包括心血管,代谢,神经退行性/精神病学,自身免疫性,呼吸,生殖,肾脏,肾脏,衰老,遗传,环境暴露,环境暴露,以及感染相关的特征和疾病。还包括了来自以前和现有的Infinium Beadchip平台的表观遗传钟和细胞反卷积面板,以提供与EWAS研究中细胞类型估计值和表型预测的既定预测指标的向后兼容性(表3和图3)。
DNA甲基化的基因组研究经常使用Illumina Beadchip 450K/Epic阵列,该阵列在一组预定义的CpG位点上测量了平均DNA甲基化水平(β值),其中包括整个人类基因组的2800万CPG甲基化位点的2800万CPG甲基化位点的1.5-3%[9,9,10]。DNA测序技术的最新进展促进了一种以碎片为中心的观点,该观点以单分子分辨率捕获了多个相邻CpG位点的二进制DNA甲基化模式[4-8,11-14]。这些技术包括使用甲基化的DNA测序技术,例如牛津纳米孔技术(OXFORD NANANOPORE技术(Oxford)[17]或Pacbbio [18] [18] [18],这些技术包括甲基[15]或酶甲基处理,然后进行测序(EM-SEQ)[16],以及直接检测基础修饰。DNA甲基化信息可以在整个基因组中测量,也可以使用杂种捕获阵列,限制酶(RRB)或靶向PCR在目标区域富集[3-5,19-21]。尽管如此,用于处理,可视化和分析此类数据滞后的计算和算法工具。
摘要妊娠糖尿病(GDM)增加了孕妇及其后代的代谢疾病的风险。诸如营养或宫内环境之类的因素通过表观遗传机制在GDM的发展中起重要作用。这项工作的目的是确定与妊娠糖尿病有关的机制或途径涉及的表观遗传标记。总共选择了32名孕妇,其中16位患有GDM和16个非GDM。DNA甲基化模式是从光明甲基化史诗般的Beadchip获得的,在诊断性就诊时(26-28周)从外周血样本中获得。使用Champ和Limma套件在R 2.9.10中提取差异甲基化位置(DMP),其阈值为FDR <0.05,Deltabeta> | 5 |%|%和B> 0。总共发现了1.141 DMP,在基因中注释了714个。进行了功能分析,我们发现23个基因与碳水化合物代谢显着相关。最后,在口服葡萄糖耐受性测试的不同点,在怀孕期间和产后不同的访问时,总共与生化变量(例如不同点的葡萄糖耐受性测试,禁食葡萄糖,混蛋,homair和hba1c)相关。我们的结果表明,GDM和非GDM之间存在分化的甲基化模式。此外,注释到DMP的基因可能与GDM的发展以及相关代谢变量的变化有关。
大豆是全球种子蛋白和油的主要来源,在种子中平均成分为40%蛋白质和20%的油。这项研究的目的是确定使用种子蛋白和油含量的定量性状基因座(QTL),该蛋白质和油含量利用跨平均蛋白质含量线构建的种群,PI 399084,PI 399084到另一个具有低蛋白质含量值的线,PI 507429,均来自USDA Soybeanbeanbeanebean soybeanbean soybeanbean soybeanbeanbean collection。在四年内,对重复的近交系(RIL)人群,PI 507429 X PI 399084进行了评估(2018-2021);使用近红外反射光谱分析种子的种子蛋白质和油含量。使用测序使用基因分型重新列出了重组近交系和两个父母。总共12,761个分子标记物来自基因分型,通过测序,Soysnp6k Beadchip和来自已知蛋白质QTL染色体区域的选择的简单序列重复(SSR)标记来映射。在2号染色体上鉴定出一个QTL,该QTL解释了种子蛋白含量的56.8%的56.8%,种子油含量最高可达43%。15染色体上鉴定出的另一个QTL解释了种子蛋白质变异的27.2%和种子油含量变化的41%。这项研究的蛋白质和油QTL及其相关分子标记物将在繁殖中有用,以改善大豆的营养质量。
大豆是全球种子蛋白和油的主要来源,在种子中平均成分为40%蛋白质和20%的油。这项研究的目的是确定使用种子蛋白和油含量的定量性状基因座(QTL),该蛋白质和油含量利用跨平均蛋白质含量线构建的种群,PI 399084,PI 399084到另一个具有低蛋白质含量值的线,PI 507429,均来自USDA Soybeanbeanbeanebean soybeanbean soybeanbean soybeanbeanbean collection。在四年内,对重复的近交系(RIL)人群,PI 507429 X PI 399084进行了评估(2018-2021);使用近红外反射光谱分析种子的种子蛋白质和油含量。使用测序使用基因分型重新列出了重组近交系和两个父母。总共12,761个分子标记物来自基因分型,通过测序,Soysnp6k Beadchip和来自已知蛋白质QTL染色体区域的选择的简单序列重复(SSR)标记来映射。在2号染色体上鉴定出一个QTL,该QTL解释了种子蛋白含量的56.8%的56.8%,种子油含量最高可达43%。15染色体上鉴定出的另一个QTL解释了种子蛋白质变异的27.2%和种子油含量变化的41%。这项研究的蛋白质和油QTL及其相关分子标记物将在繁殖中有用,以改善大豆的营养质量。