摘要 印记是哺乳动物正常胚胎发育的关键部分,由确定的亲本来源 (PofO) 差异甲基化区域 (DMR)(称为印记控制区)控制。直接纳米孔测序 DNA 提供了一种检测等位基因甲基化的方法,并克服了甲基化阵列和短读技术的缺点。在这里,我们使用 12 个标准 B 淋巴细胞细胞系的公开纳米孔测序数据来获取人类印记间隔的全基因组图谱。利用测序数据,我们能够对 95% 的人类甲基化组进行分期,并检测出 94% 的先前已充分表征的印记 DMR。此外,我们发现了 42 个新的印记 DMR(16 个生殖系和 26 个体细胞),这些印记 DMR 已使用全基因组亚硫酸盐测序 (WGBS) 数据得到确认。对小鼠 ( Mus musculus )、恒河猴 ( Macaca mulatta ) 和黑猩猩 ( Pan troglo- dytes ) 的 WGBS 数据的分析表明,其中 17 个印记 DMR 是保守的。一些新的印记间隔位于没有已知 DMR 的印记基因内或附近。我们还检测到了细微的亲本甲基化偏差,跨越七个已知印记簇的几千个碱基。在这些区块,高甲基化发生在具有互斥的 H3K36me3 和 H3K27me3 等位基因组蛋白标记的表达等位基因的基因体上。这些结果扩展了我们目前对印记的了解和纳米孔测序的潜力,它仅使用亲本-后代三重奏来识别印记区域,而不是像以前那样需要大量的多代谱系。
影响中枢神经系统的血液系统肿瘤,最突出的是侵袭性 B 细胞淋巴瘤,需要快速诊断(通常通过立体定向活检)以启动治疗,从而促使采用非侵入性方式 [6]。在具有挑战性的病例中,脑脊液 (CSF) 的 DNA 甲基化 (DNAmeth) 和拷贝数变异 (CNV) 分析可能满足这一需求。健康和肿瘤细胞,包括中枢神经系统淋巴瘤 [11],可能会将 DNA 片段脱落到血液和脑脊液中作为无细胞 DNA (cfDNA)。此外,细胞碎片可以形成沉淀 DNA (seDNA)。在几例儿童高级别脑肿瘤中,CSF 含有足够量的肿瘤衍生 cfDNA (cf-tDNA),可通过基于连接的纳米孔测序进行基于甲基化和 CNV 的肿瘤分类 [ 1 ],并通过各种方法进行疾病监测 [ 15 ]。目前,这些方法需要费力的样品处理和昂贵的基础设施。在这里,我们已经将我们的快速无监督机器学习 (ML) 方法 [ 9 ] 改编为 CSF,用于对淋巴瘤和其他恶性脑肿瘤(包括转移瘤)进行鉴别诊断的病例。我们在两例 CNS 淋巴瘤病例中展示了它的临床应用。允许第二天将纳米孔测序衍生的甲基化模式与泛癌表观基因组和 CNV 数据进行比较
。cc-by 4.0国际许可(未经Peer Review尚未获得认证)是作者/资助者,他已授予Biorxiv的许可证,以永久显示预印本。这是该版本的版权持有人,该版本发布于2024年9月4日。 https://doi.org/10.1101/2024.09.09.03.610948 doi:Biorxiv Preprint
受污染的奶酪,但这种物种越来越多地据报道,该物种越来越多地显示出高丙核麦克风的奶酪,这是人类侵入性感染的原因[4-6]。在这里,我们提供了从头基因组组装和临床D. catenulata型CBS565的注释。D. catenulata型CBS565在1926年是从一个痴呆症患者的粪便中分离出来的,当时居住在波多黎各[1]。基因组DNA提取。使用连接测序试剂盒(SQK-LSK109; ONT,UK,UK)和本机条形码套件(EXP-NBD114; ONT)进行连接测序试剂盒(SQK-LSK109; ONT)进行纳米孔测序文库制备。根据制造商的协议,将两个库运行到奴才流中心(Flo-Min106; ont)上。使用Guppy v5.0.16对原始的纳米孔读数进行了基础?B9FCD7B5B(ONT)使用设置 - 浮雕flo-min106-Kit SQK-LSK109-Barcode_kits exp-nbd114-device cuda:0,由消除电源和条形码放在同一软件中。使用参数-nano- raw \ fastq [ - uot-dir \ directory \ div> flye v2.9(https://github.com/ fenderglass/flye; [8])进行 de Novo基因组组装。使用GenomeQC评估了组装的基因组质量[9]。总基因组大小为14,464,696 bp,n50为2,438,920 bp,在9个重叠群上分配(范围为3,918,888-888-370,337 bp;
我们的研究调查了牛津纳米孔技术的有效性,通过重新陈述33个长达3年的克雷伯氏菌肺炎爆发的33个分离株,并以Illumina的短阅读测序数据作为参考点。我们通过对牛津纳米孔技术测序的基因组进行CGMLST和系统发育分析检测到相当大的基本误差,从而导致从暴发群集中错误排除某些与暴发有关的菌株。附近的甲基化位点会导致这些误差,也可以在肺炎K. k. tneumoniae以外的其他物种中找到。基于这些数据,我们探讨了基于PCR的测序和掩盖策略,这些策略既成功解决这些不准确性,又可以确保准确的爆发追踪。我们将掩盖策略作为生物信息学工作流(MPOA),以无参考的方式识别和掩盖有问题的基因组位置。我们的研究强调了使用牛津纳米孔技术对原核生物进行测序的局限性,尤其是用于研究暴发。对于牛津纳米孔技术无法等待进一步的技术发展的时间关键项目,我们的研究建议我们基于PCR的测序或使用我们提供的生物信息学工作流。我们建议在发布结果时应提供基于质量的基因组质量基因组。
病毒载体、转座子、CRISPR/Cas 介导的 DNA 整合和其他 DNA 编辑器的基因组工程的全面表征对于其在人类基因治疗中的开发和安全使用仍然具有重要意义。目前,描述的用于测量编辑细胞中 DNA 整合的方法依赖于基于短读的技术。由于人类基因组的重复性,基于短读的方法可能会忽略重复区域中的插入事件。我们模拟了读长对解决插入位点的影响,这表明读长较短时插入位点检测率显著下降。基于此,我们开发了一种方法,该方法结合整合 DNA 的靶向扩增、基于 UMI 的 PCR 偏差校正和 Oxford Nanopore 长读测序,以对基因组中的 DNA 整合进行稳健分析。这种方法称为 INSERT-seq,能够检测发生频率高达 0.1% 的事件。INSERT-seq 可以独立于重复大小完整处理所有插入。实验流程将重复区域的可映射插入数量提高了 7.3%,并且对大于长读测序大小的重复进行计算处理,以在重复数据库中执行峰值调用。INSERT-seq 是一种简单、廉价且可靠的方法,可以定量表征各种体外和体内样本中的 DNA 整合。
基因组浏览定义为低通序的覆盖范围低于0.05倍,通常用于线粒体基因组恢复和物种鉴定。长阅读的纳米孔测序仪可以同时阅读DNA序列和甲基化,并且可以多重样品进行低成本基因组练习。在这里,我将纳米孔测序作为全球DNA甲基化和转座子评估的高度精确平台。仅覆盖0.001×或30 MB的读数,精度为1%。生物学和技术复制可验证高精度。浏览40种脊椎动物物种揭示了与全基因组亚硫酸盐测序一致的全球甲基化模式,平均地图率> 97%。基因组大小与全局DNA甲基化直接相关,解释了其39%的方差。只能以0.0001倍的覆盖范围或3 MB的读数来获得小鼠和灵长类动物中的精确正弦和线转座子甲基化。样品多路复用,现场可移植性和该仪器的低价合并,使基因组掠过DNA甲基化成为一种可访问的方法,用于从生态学到流行病学和低资源组的表观遗传评估。
EMBL澳大利亚合作伙伴实验室网络,约翰·科廷医学研究院,澳大利亚国立大学,澳大利亚堪培拉,澳大利亚b shine-dalgarno RNA创新中心,约翰·科廷医学研究院,澳大利亚国立大学,澳大利亚澳大利亚国立大学,澳大利亚堪培拉C计算机研究中心NHMRC研究卓越研究中心,澳大利亚E澳大利亚E澳大利亚州澳大利亚国立大学医学研究中心,澳大利亚澳大利亚国立大学,澳大利亚国立大学,澳大利亚法案第2601号法案,澳大利亚法案第2601号法案,堪培拉医院,堪培拉医院,堪培拉医院,堪培拉,堪培拉,第2605号法案,澳大利亚ACT 2605堪培拉,澳大利亚H堪培拉H基因组学和个性化健康中心,昆士兰昆士兰技术大学生物医学科学学院
。cc-by 4.0国际许可(未经Peer Review尚未获得认证)是作者/资助者,他已授予Biorxiv的许可证,以永久显示预印本。这是该版本的版权持有人,该版本发布于2025年1月12日。 https://doi.org/10.1101/2025.01.10.632410 doi:Biorxiv Preprint
图4。评估纳米旋转的性能。a-b比较了通过纳米重新启动估计的每个CpG基因座的甲基化水平与bisulfite测序和孔雀孔的6.3.8在GM24385数据上。PCC = Pearson相关系数。c-d比较了纳米恢复估计的CpG岛的平均甲基化水平与Bisulfite测序和GYPED 6.3.8在GM24385数据上的平均甲基化水平。