要将以环境得出的元编码数据转换为社区矩阵进行生态分析,必须首先将序列聚集到操作分类单元(OTU)中。此任务对于包括大量带有不完整参考库的数据,包括大量的分类单元。OptimoTU提供了一种具有分类学意识的OTU聚类方法。它使用一组分类学识别的参考序列来选择最佳的遗传距离阈值,以将每个祖先分类群分组为最与后代分类单元最匹配的集群。然后,查询序列根据初步分类学标识和其祖先分类群的优化阈值聚类。该过程遵循分类学层次结构,从而将所有查询序列的所有查询序列完全分类为命名的分类学组以及占位符“ Pseudotaxa”,这些序列适合无法分类为相应等级的命名分类单元的序列。Optimutu聚类算法是作为R软件包实现的,在C ++中实现了速度的计算密集步骤,并合并了成对序列对齐的开源库库。距离也可以在外部计算,并且可以从UNIX管道中读取,从而允许大型数据集聚类,在该数据集中,整个距离矩阵将不方便地存储在内存中。Optimutu生物信息学管道包括一个完整的工作流程,用于配对端的Illumina测序数据,其中包含了质量过滤,DeNoising,Wratifact删除,分类学分类以及与Optimotu的OTU集群。开发了用于高性能计算簇的OptimoTU管道,并将其缩放到每个样品和数万个样本的数据集中。
图S3。 三元地块描述了细菌和真菌DNA的基于真菌和真菌DNA或基于RNA的OTU在植物土壤实验结束时土壤处理之间的分布(灰色圆圈),表明基于DNA的或基于RNA的基于DNA或基于RNA的富集或激活的OTU,或者是由T.绿色圆圈或通过T. eestivum(blue cirdie)(或蓝色圆形),或在blue coundere(blue cirdiean),或者在blue counder coundere coundere coundere counce,或者在blue councered counder counder counder(blue cirdie),或depleta。或通过T. aestivum(浅蓝色),两种植物(橙色)富集或激活的Otus以及两种植物(黄色)耗尽或抑制的OTU。 对总细菌和真菌的丰度(基因拷贝数)进行了此分析。 每个圆圈描绘了一个单独的OTU,其位置取决于指示的方式对丰度的贡献。 圆的大小反映了OTU的相对丰度。图S3。三元地块描述了细菌和真菌DNA的基于真菌和真菌DNA或基于RNA的OTU在植物土壤实验结束时土壤处理之间的分布(灰色圆圈),表明基于DNA的或基于RNA的基于DNA或基于RNA的富集或激活的OTU,或者是由T.绿色圆圈或通过T. eestivum(blue cirdie)(或蓝色圆形),或在blue coundere(blue cirdiean),或者在blue counder coundere coundere coundere counce,或者在blue councered counder counder counder(blue cirdie),或depleta。或通过T. aestivum(浅蓝色),两种植物(橙色)富集或激活的Otus以及两种植物(黄色)耗尽或抑制的OTU。对总细菌和真菌的丰度(基因拷贝数)进行了此分析。每个圆圈描绘了一个单独的OTU,其位置取决于指示的方式对丰度的贡献。圆的大小反映了OTU的相对丰度。
表1在LaRéunion的香草植物的根中检测到的主要菌根作战分类单元(OTU)的GenBank上的最佳爆炸量。指定了检测到每个OTU的培养实践。我们,林下; Openfield; SHB,带渣酱的阴影屋; SHDL,带有枯叶的阴影房屋。BOLD中的培养实践表明,在> 10%的样品中检测到OTU,而括号中的OTU表示<10%。具有> 95%身份的三个最佳命中(由电子价值排名)与作者提供的相应隔离或放大源和位置给出了> 95%的身份。身份> 97%被粗体。
根据最近的一项研究,土壤是已知物种的59%(±15%)的遗体(Anthony等人2023,PNAS 120:E2304663120),它的估计值是上一倍的两倍(Decaens等人的25%2006),尤其是来自微生物物种池的更多内容仍然未知。土壤生物参与了广泛的土壤和生态系统过程,例如垃圾分解,养分循环,水过滤和害虫控制,因此对于生态系统功能至关重要。对土壤生物将如何受到人类干预和全球变化的影响以及社区组成的变化将如何影响生态系统过程的知之甚少,主要是因为在很大程度上缺乏有关土壤生物多样性的长期数据。此外,在高通量测序(HTS)的出现之前,由于构成土壤社区的各种分类单元,物种识别一直很困难,并且主要仅在订单,家庭(对于无脊椎动物)或操作分类单位(OTU(OTU)(OTU,OTU)(对于微生物)水平上,大多数情况下才能识别。遵循协调协议的长期跨国监测计划将有助于提供必要的数据,以分析全球变化对土壤生物多样性的影响。选择适当的方法将有助于在寻找土壤社区组成的模式和变化所需的水平上识别分类单元。此外,尽管HTS技术的快速发展使得很难预测
在微生物群落测序中,涉及细菌核糖体16S rDNA或真菌ITS,靶向基因是分类学分配的基础。传统的生物信息程序已有数十年的历史使用了一个聚类协议,该协议通过该协议将序列汇总到共享百分比身份的包装中,通常为97%,以产生运营技术单位(OTU)。数据处理方法中的进展导致了最小化技术测序符错误的可能性,这是OTU选择的主要原因,而是分析确切的Amplicon序列变体(ASV),这是一种选择,这会产生较少的聚集读数。我们已经在相同16S的元编码细菌扩增子数据集上测试了这两个程序,这些数据集包含来自17个相邻栖息地的一系列样品,这些样品跨越了700米长的不同生态条件的700米长的样本,这些样本在从农田,通过山地,森林,森林过渡到同一海岸的梯度,从农田跨度跨越了梯度。这种设计允许扫描高生物多样性盆地,并测量该地区的α,β和伽玛多样性,以验证生物信息学对十个不同生态索引和其他参数的值的效果。将两个级别的进行性OTU聚类(99%和97%)与ASV数据进行了比较。结果表明,OTU群集成比例地导致了物种多样性的生态指标值的明显低估,以及有关直接使用ASV数据的主导性和均匀性指数的扭曲行为。多元定序分析在树拓扑和连贯性方面也引起了敏感。总体而言,数据支持这样的观点:基于参考的OTU聚类带来了几种误导性的劣势,包括缺少新颖的分类单元的风险,这些偏见尚未在数据库中引用。由于其替代品作为从头聚类的替代方案,另一方面,由于计算需求较重和结果可比性,尤其是对于包含几种但未表征的物种的环境研究,至少对于原核生物而言,与OTU Clus-Clus-Clus-tering titer titer catiftitions catiftitions cotoff cotoff cotoff cotoff conforp的含义,至少是基于ASV的直接分析。
fi g u r e 4通过大量浮游物样品的DNA分析检测到的浮游组合中的空间模式。从16S通用(a)和软体动物(b)测定的非金属多维缩放图显示了采样位点和摩ri座北部和南部的OTU组合(分别为k = 0.11&0.10)之间的OTU组合,均分别为k = 3&p≤.001)。样品与抽样时的平均海面温度的关系由温度梯度指示。簇表示每个位置的样品,彩色线的连接表示每个位置的质心。
fi g u r e 1微生物生态进化动力学对生态系统功能的影响。跨站点的社区由不同的操作分类单元(OTU)组成,这是微生物物种的替代物(此处为四个OTU为简单起见)。然而,OTUS掩盖了数百万年的进化差异,排除了对微生物种群或其他适应性反应的进化动力学的见解。当一个社区对环境变化做出反应时,生态(即种间变化)和进化反应(即种子内变化)转移分类(物种)和遗传(等位基因(等位基因)频率)。可以通过系统发育保护程度来评估功能性状(例如,碳降解和温度反应)的变化(例如碳降解和温度反应),以预测社区的整体功能响应。
fi g u r e 1微生物生态进化动力学对生态系统功能的影响。跨站点的社区由不同的操作分类单元(OTU)组成,这是微生物物种的替代物(此处为四个OTU为简单起见)。然而,OTUS掩盖了数百万年的进化差异,排除了对微生物种群或其他适应性反应的进化动力学的见解。当一个社区对环境变化做出反应时,生态(即种间变化)和进化反应(即种子内变化)转移分类(物种)和遗传(等位基因(等位基因)频率)。可以通过系统发育保护程度来评估功能性状(例如,碳降解和温度反应)的变化(例如碳降解和温度反应),以预测社区的整体功能响应。