bitBiome Inc. 电子邮件:service@bitbiome.co.jp 网站:https://www.bitbiome.co.jp/ 日本东京新宿区早稻田鹤卷町 513 号 162-0041 早稻田大学第 121 栋 415 室
下面的直方图显示了测序数据的读取长度分布。直方图在 y 轴上显示测序碱基数 (bp),在 x 轴上显示读取长度。直方图中的每个条形代表读取长度的范围,条形的高度表示该范围内的碱基总数 (bp)。这会产生按每个箱体的核苷酸数加权的图,因为较长的读取在直方图中具有更大的权重。读取长度直方图可用于评估测序数据的质量,因为读取长度的分布可以指示测序过程中是否存在污染物或偏差。它们还可用于确定正在测序的扩增子的大小。
。CC-BY-NC-ND 4.0 国际许可证 它是永久可用的。 是作者/资助者,已授予 medRxiv 许可以显示预印本(未经同行评审认证)预印本 此版本的版权所有者于 2021 年 8 月 8 日发布。;https://doi.org/10.1101/2021.08.03.21261575 doi:medRxiv 预印本
• 对整个实验室进行消毒,包括移液器的内部和外部(对移液器进行消毒时应特别小心,例如确保所有清洁步骤后都进行多次蒸馏水冲洗步骤,以确保消除抑制剂残留物)、实验室设备和仪器,并按照其清洁程序进行擦拭测试。重复此操作,直到实验室所有区域均为阴性。
T 细胞急性淋巴细胞白血病 (T-ALL) 是一种侵袭性白血病,最常见于儿童,其特征是在诊断时存在少量染色体重排和蛋白质编码区 10 至 20 个体细胞突变。大多数 T-ALL 病例都含有 NOTCH1 中的激活突变以及与激酶信号传导、转录调控或蛋白质翻译有关的基因突变。为了更深入地了解诊断和治疗期间的克隆异质性水平,我们使用 Tapestri 平台进行单细胞靶向 DNA 测序。我们设计了一个定制的 ALL 面板,并获得了精确的单核苷酸变异和小插入-缺失突变,需要 305 个扩增子,覆盖每个样本和时间点约 4400 个细胞中的 110 个基因。对 8 名 T-ALL 患者的 25 个样本共分析了 108 188 个细胞。我们通常在诊断时观察到一个主要克隆(> 35% 的细胞),伴随几个次要克隆,其中一些克隆占细胞总数的不到 1%。四名患者有 > 2 个 NOTCH1 突变,其中一些存在于次要克隆中,表明在发育中的 T-ALL 细胞中获得 NOTCH1 突变的压力很大。通过分析纵向样本,我们检测到残留的白血病细胞和克隆的存在和克隆性质,这些细胞和克隆在诊断时存在较少,在疾病后期发展为临床相关的主要克隆。因此,单细胞 DNA 扩增子测序是一种灵敏的检测方法,可用于检测 T-ALL 中的克隆结构和进化。(Blood . 2021;137(6):801-811)
8 DeepBiome。Co. Ltd.,上海200031,中国 *通信:yongjunwei@zzu.edu.cn(y.w. ); liming@henau.edu.cn(M.L。 ); zhanglei@logictek.cn(L.Z.) 收到:2024年10月18日;接受:2025年2月21日;在线发布:2025年2月22日; https://doi.org/10.59717/j.xinn-life.2024.100120©2025作者。 这是CC下的开放访问文章(https://creativecommons.org/licenses/4.0/)。 引用:Dong P.,Chen Y.,Wei Y.等。 (2025)。 dix-seq:用于快速扩增子数据分析的集成管道。 创新生活3:100120。 在过去十年中,测序技术的快速进步推动了Amplicon Metagenome的广泛采用。 但是,当前的Amplicon数据分析软件/管道通常需要手动干预跨越多个步骤,因此需要清楚了解参数,并阻碍缺乏经验的用户自动化其工作流程。 在这里,我们介绍了Dix-Seq,这是一种完全容器化的工具,用于快速,自动化和可扩展的扩增子数据分析。 使用一个单个命令,DIX-Seq可以将原始扩增子序列处理为各种统计和可视化结果,生成基于HTML的报告和恢复的日志文件。 dix-seq利用单个参数表可以大大简化其命令行接口,从而使其不受欢迎的用户更容易实现,同时改善了研究可重复性。 DIX-SEQ的模块化设计使得将新方法和数据库的快速采用到其软件框架中。Co. Ltd.,上海200031,中国 *通信:yongjunwei@zzu.edu.cn(y.w.); liming@henau.edu.cn(M.L。); zhanglei@logictek.cn(L.Z.)收到:2024年10月18日;接受:2025年2月21日;在线发布:2025年2月22日; https://doi.org/10.59717/j.xinn-life.2024.100120©2025作者。这是CC下的开放访问文章(https://creativecommons.org/licenses/4.0/)。引用:Dong P.,Chen Y.,Wei Y.等。(2025)。dix-seq:用于快速扩增子数据分析的集成管道。创新生活3:100120。在过去十年中,测序技术的快速进步推动了Amplicon Metagenome的广泛采用。但是,当前的Amplicon数据分析软件/管道通常需要手动干预跨越多个步骤,因此需要清楚了解参数,并阻碍缺乏经验的用户自动化其工作流程。在这里,我们介绍了Dix-Seq,这是一种完全容器化的工具,用于快速,自动化和可扩展的扩增子数据分析。使用一个单个命令,DIX-Seq可以将原始扩增子序列处理为各种统计和可视化结果,生成基于HTML的报告和恢复的日志文件。dix-seq利用单个参数表可以大大简化其命令行接口,从而使其不受欢迎的用户更容易实现,同时改善了研究可重复性。DIX-SEQ的模块化设计使得将新方法和数据库的快速采用到其软件框架中。当前,已将21个以上的算法,软件和第三方程序集成到DIX-Seq中的八个模块中,而越来越多。这种方法还允许经验丰富的用户微调工作流程,从而促进定制分析。在实际案例研究的数据集上执行的基准测试了DIX-Seq的能力,该功能在生成统计信息和提取生物学上有意义的模式的完整数字中生成了发布的数字。此外,它在检测模拟测序深度下降的方差方面仍然非常有效,结果在所有和某些方面(例如植物网络多样性和Pearson的相关性),结果保持稳健至11000和1000的深度。总而言之,Dix-Seq是用于扩增数据分析的方便但高度可自定义的工具,使其成为入门级和经验丰富的用户的理想选择。
1 肯尼亚基利菲 KEMRI-Wellcome Trust 研究计划生物科学系 2 北卡罗来纳大学教堂山分校医学院医学系传染病科,北卡罗来纳州教堂山 27599,美国 3 牛津大学纳菲尔德医学系热带医学与全球健康中心,英国牛津 4 玛希隆大学热带医学院玛希隆-牛津热带医学研究组,泰国曼谷 5 布朗大学沃伦·阿尔珀特医学院病理学与实验室医学系,罗德岛州普罗维登斯 02903,美国 6 北卡罗来纳大学教堂山分校吉林斯全球公共卫生学院流行病学系,北卡罗来纳州教堂山 27516,美国 7 北卡罗来纳大学教堂山分校医学院遗传学与分子生物学课程,北卡罗来纳州教堂山,美国
与简短的读数相比,覆盖范围仅限于ITS1或ITS2区域,HIFI读取的读数涵盖了全真菌其区域的全长。这包含800 bp,如果包括18s和/或28S基因以跨越操纵子,则可以提供约5 kb的扩增子。以及更保守的rRNA基因,这些区域允许在物种水平上降低序列相似性和更高分辨率的分类信息(Tedersoo等,2018; Tedersoo等人,2021年,图2)。除了产生更高的分类价值外,HIFI全长扩增子测序的成本与短阅读的部分扩增子测序相当。在本申请注释中,我们提供了从复杂社区DNA样品中扩增全长真核ITS和rRNA区域的一般指导。
摘要。海洋氮 (N 2 ) 固定是一种具有全球意义的生物地球化学过程,由一群特殊的原核生物 (固氮菌) 进行,但我们对其生态学的理解在不断发展。尽管海洋 N 2 固定通常归因于蓝藻固氮菌,但间接证据表明非蓝藻固氮菌 (NCD) 也可能很重要。一种广泛用于了解固氮菌多样性和生物地理学的方法是对 nifH 基因的一部分进行聚合酶链式反应 (PCR) 扩增,该基因编码 N 2 固定酶复合物固氮酶的结构成分。存在一系列生物信息学工具来处理 nifH 扩增子数据;然而,缺乏标准化实践阻碍了交叉研究比较。这导致错失了更彻底评估固氮菌多样性和生物地理学以及它们对海洋氮循环的潜在贡献的机会。为了解决这些知识空白,我们设计了一个生物信息学工作流程,以标准化高通量测序 (HTS) 产生的 nifH 扩增子数据集的处理。使用专门的 DADA2 流程高效一致地处理多个数据集,以识别扩增子序列变体 (ASV)。然后,一系列可定制的后流程阶段检测并丢弃虚假的 nifH 序列,并使用多个参考数据库和分类方法注释后续质量过滤的 nifH ASV。这个新开发的工作流程用于重新处理几乎所有来自海洋研究的公开可用的 nifH 扩增子 HTS 数据集,并生成一个全面的 nifH ASV 数据库,其中包含从 21 项研究中汇总的 9383 个 ASV,这些研究代表了全球海洋中的固氮菌种群。对于每个样本,数据库都包含从 Simons 合作海洋图集项目 (CMAP) 获得的物理和化学元数据。在这里,我们展示了该数据库在揭示主要固氮菌群的全球生物地理模式方面的实用性,并强调了海面温度的影响。工作流程和 nifH ASV 数据库为研究 nifH 扩增子 HTS 捕获的海洋 N 2 固定和固氮菌多样性提供了一个强大的框架。可以轻松添加针对研究不足的海洋区域的未来数据集,用户可以根据其特定重点调整所包含的参数和研究。工作流程和数据库分别在 GitHub(https://github.com/jdmagasin/nifH-ASV-workflow,最后访问时间:2025 年 1 月 21 日;Morando 等人,2024c)和 Figshare(https://doi.org/10.6084/m9.gshare.23795943.v2;Morando 等人,2024b)上可用。
摘要 靶向扩增子测序广泛应用于微生物生态学研究。然而,测序伪影和扩增偏差令人担忧。为了确定这些伪影的来源,我们使用由来自 33 种细菌菌株的 16S rRNA 基因组成的模拟群落进行了系统分析。我们的结果表明,虽然测序错误通常只发生在低丰度操作分类单元中,但嵌合序列是伪影的主要来源。单序列和双序列主要是嵌合体。嵌合序列的形成与目标序列的 GC 含量显着相关。低 GC 含量的模拟群落成员表现出较低的嵌合序列形成率。GC 含量对序列恢复也有很大影响。定量能力明显有限,恢复率差异很大,预期和观察到的菌株丰度之间的相关性较弱。GC 含量较高的模拟群落菌株的恢复率高于 GC 含量较低的菌株。由于引物亲和力的差异,还观察到了扩增偏差。两步 PCR 策略将嵌合序列的数量减少了一半。此外,基于模拟群落的比较分析表明,几种广泛使用的序列处理流程/方法,包括DADA2、Deblur、UCLUST、UNOISE和UPARSE,在伪影去除和稀有物种检测方面各有优缺点。这些结果对于提高测序质量和可靠性以及开发新的算法来处理目标扩增子序列具有重要意义。