在不到四十年的时间里,纳米孔测序技术从笔记本页面上的一个令人难以置信的思想到了人类基因组完整顺序的决定性贡献者之一。它的快速发展,尤其是近年来,不仅是由于其对纳米孔的固有创新而驱动的,而且还取决于综合领域的协同进步,例如GPU加速和深层神经网络,以及深层的跨学科影响,例如诸如语音识别之类的领域。然而,在这种快速的进步中,纳米孔测序中的某些方法仍然相对尚未探索。这种疏忽有可能在技术进一步的发展中创造瓶颈。在本文工作中,我们深入研究了这些未知的领域,试图填补关键的空白并将技术分为新的边界。我们的目标是释放其潜力,从而在基因组研究及其他方面取得进一步的突破。通过我们的研究,我们开发了两种新型算法和两个量身定制的新颖模型,以解决纳米孔测序的这些不足的方面。属于MBS组的两种算法,GMB和LFB都为HHMMS固有的具有挑战性的解码问题提供了创新的解决方案。它们是针对不同场景量身定制的两个不同变体。虽然GMBS专门用于解码冗长的序列(例如在长阅读的基本词中遇到的序列),但LFBS已优化用于并行编程,并在处理短长度的sepciences方面表现出色。在这项研究中开发的两个创新模型,每种利用HHMM的变化并采用端到端方法,展示了分辨的结构。第一个模型是EDHMM和DNN的混合体,显示了整合知识驱动和数据驱动技术的有效性。相比之下,第二个模型是一种定制设计的解旋酶HMM,它从测序设备中发现的运动蛋白的开创性研究中汲取了灵感。凭借其精心制作的层次结构架构具有超过500万个排放状态,该模型提供了与其前身相当的全面功能空间。
分子载体代表了纳米孔传感领域中日益普遍的策略,用于使用二级分子选择溶液中靶分析物的存在,从而允许对其他难以检测的小分子(例如小,弱,带电的蛋白质)进行敏感测定。但是,现有的载体设计通常会引入纳米孔实验的缺点,包括更高水平的成本/复杂性和载波孔相互作用,从而导致信号和堵塞率升高。在这项工作中,我们基于粘性的DNA分子提出了一种简单的载体生产方法,该方法强调了易于合成和与纳米孔感应和分析的兼容性。尤其是我们的方法结合了能够灵活地控制生产的DNA载体长度的能力,从而通过可分离的纳米孔信号增强了该载体系统的多路复用电位,它们可以生成不同的目标。还提出了概念验证纳米孔实验,涉及我们的方法产生的载体,该载体具有多个长度,并附着于DNA纳米结构靶标,以验证系统的功能。随着纳米孔的应用的广度不断扩大,此处介绍的工具的可用性将非常重要。
图1。DNA纳米结构组件和纳米孔的表征。a)DNA螺旋束杂交的示意图:7249 NT M13MP13的热退火,带有190个短“主食”链。b)预期尺寸和3螺旋束组件的结构。c)1%琼脂糖凝胶电泳,显示了一个泳道中各种DNA长度的梯子,另一个车道完全组装了3HB结构。d)用于3HB结构的纳米孔感测的设置。黄色的色调描绘了电场强度。e)在13.2nm孔(顶部)中,在200 mV以下的12m licl中存在3HB引起的瞬时离子阻塞的串联电流痕迹(顶部)。单个封锁事件适合提取变量,例如最大电导阻塞和易位时间(底部)。f)在与(e)相同的实验条件下,最大电导阻塞与易位时间的散点图,n = 846。
基因组DNA经常受到氧化损伤,这被认为是癌症和年龄依赖性下降的主要驱动因素之一。最突出的后果2是将鸟嘌呤改成8-羟基鸟嘌呤(8-oxo-dg),它具有重要的3诱变潜力,并在甲基化介导的基因调节中起作用。在其基因组情境中同时检测和量化8-oxo-dg的方法一直缺乏。 5主要是因为这些方法依赖于间接检测或基于6 DNA的水解。纳米孔测序已被部署,用于直接检测基碱修饰7,例如测序期间的胞嘧啶甲基化。但是,由于缺乏训练数据,目前尚无纳米测序检测8 8-oxo-dg的模型。在这里,我们制定了一种基于合成寡寡寡做的9策略,以创建具有上下文可变性10的长DNA分子,以进行有效的深度学习和纳米孔测序。此外,我们展示了一种训练11方法,适合于与规范12 g相比,以应对8-oxo-DG的极端稀缺性,以实现特定的8-oxo-DG检测。应用于可诱导的组织培养系统,以实现13个氧化DNA损伤,我们的方法揭示了14个基因组的8-oxo-DG分布,这是C> A突变的不同背景模式,以及在周围8-oxo-dg位点的2千克酶窗口中同时发生的5-MC耗竭15。这些发现不仅强调了表观遗传学研究中纳米孔测序的潜力,而且还阐明了8-氧-17 DG在基因组调节中的作用。23通过以18个单分子分辨率同时测量5-MC和8-oxo-DG,我们的研究提供了对19个这些DNA修饰之间功能相互作用的见解。此外,我们使用合成寡核能通过机器学习修饰来产生20个地面真相的方法可以应用于其他21个DNA修饰。总的来说,我们的工作有助于推进表观遗传学领域,22种突出显示纳米孔测序是研究DNA修饰的强大工具。
使用不受长度限制的纳米孔读取(从短到超长),现在可以通过简单、简化的工作流程生成高质量的植物基因组组装。长纳米孔读取可以跨越大量重复或高度一致的序列和结构变体,而天然 DNA 测序可以捕获 PCR 无法访问的序列。在同一次测序运行中,还可以检测到表观遗传修饰以及规范碱基序列,从而从单个数据集提供多组学见解。多功能高输出 PromethION 设备使实验室能够扩展测序能力以适应不同规模、样本量和预算的项目,为不同的测序需求提供量身定制的解决方案。
7月24日,星期三,09:30-10:30只需连接运动蛋白| P. Stiblik,Z。Blahova(NGS Geeks)10:30-11:00牛津纳米孔技术 - 实验室简介| L. Villacorta,D。Welter,J。Provaznik11:00-12:30实践实验室培训 - 样本QC理论,DNA提取,DNA QC | L. Villacorta,D。Welter,J。Provaznik12:30-13:30午餐休息13:30-16:00实用的湿实验室培训 - 结束维修和清理| L. Villacorta,D。Welter,J。Provaznik18:30晚餐(网络)
是一种在基因组学领域中广泛使用的技术。但是,目前缺乏从纳米孔测序设备创建模拟数据的有效工具,这些工具以时间序列的当前信号数据的形式测量DNA或RNA分子。在这里,我们介绍了Squigulator,这是一个快速而简单的工具,用于模拟逼真的纳米孔信号数据。s弹器采用参考基因组,转录组或读取序列,并生成相应的原始纳米孔信号数据。这与牛津纳米孔技术(ONT)和其他第三方工具的基本软件兼容,从而为纳米孔分析工作流的每个阶段提供了有用的基板,用于开发,测试,调试,验证和优化。用户可以使用模拟特定ONT协议或无噪声“理想”数据的预设参数生成数据,或者他们可以确定性地修改一系列实验变量和/或噪声参数以满足其需求。我们提供了一个简短的用途示例,创建了模拟数据,以模拟不同参数影响ONT基本和下游变体检测准确性的程度。此分析揭示了对ONT数据和基本算法的性质的新见解。我们为纳米孔社区提供了旋转器作为开源工具。
摘要:可以在生成时分析原始纳米孔信号,这是一种称为实时分析的过程。对原始信号的实时分析对于利用纳米孔测序提供的唯一特征至关重要,从而可以根据分析的分析提早停止读取或整个测序运行。最新的机制Rawhash,通过快速匹配其哈希值,提供了原始信号和参考基因组之间的首个基于哈希的有效和准确的相似性识别。在这项工作中,我们介绍了Rawhash2,该Rawhash2对Rawhash提供了重大改进,包括更敏感的量化和链接算法,加权映射决策,频率过滤器,以减少模棱两可的种子命中量,基于哈希的素描的最小化以及对R10.4流元电池版本和POD5和慢速5文件的支持。与Rawhash相比,Rawhash2提供了更好的F1精度(平均为10.57%且最高20.25%)和更好的吞吐量(平均比Rawhash(平均为4.0倍,最高9.9×))。可用性和实现:RAWHASH2可在https://github.com/cmu-safari/rawhash上找到。我们还提供脚本以在GitHub页面上充分复制我们的结果。
资格设置和结果 为了在 NGS STARlet 上对 Oxford Nanopore SQK-LSK114-XL V14 V1.0 方法进行生物学验证,对 8 个(4 个阳性样本 + 4 个阴性对照)或 24 个样本(22 个阳性样本 + 2 个阴性对照)进行了生物学运行。作为输入材料,1 μg 全长(48 kB)噬菌体 Lambda DNA 用于 8 个样本的运行。对于 24 个样本的运行,1 μg 剪切(9kB)人类基因组 DNA 作为输入材料。使用 Thermo Fisher Scientific Qubit 4 荧光计和 Quant-iT™ 1X dsDNA 高灵敏度检测试剂盒(Thermo Fisher Scientific,#Q33232)测定从 8 个和 24 个样本的生物学验证运行中获得的文库的 DNA 浓度。平均样品产量为 344.3 ng(+/- 51.5 ng)