图1。使用变压器模型生成样品嵌入/分类和上下文敏感分类单元嵌入的工作流程。输入(a)是表示为相对丰度向量的样本,首先要经过预处理步骤(b),以生成变压器模型(d)的文本样输入(c)。变压器模型生成样品嵌入(H Cls),该样本嵌入(H Cls)通过样本分类层(E)产生特定任务样本级别预测(F)。变压器模型还为样本中每个分类单元生成上下文敏感嵌入(G)。出现在不同样本中的相同分类单元可能会因上下文差异而具有不同的嵌入。
不同16S rRNA可变区检测不同细菌群落的敏感性可能会改变微生物组研究中的比较。某些地区比其他地区提供了更好的识别(Bukin等,2019); for example, V1-V3 regions can discriminate between staphylococcal populations ( Conlan et al., 2012 ), whereas V3-V4 were shown to be better at discriminating a greater number of taxa in the vaginal microbiota such as Gardnerella vaginalis, Bifidobacterium bifidum , and Chlamydia trachomatis Graspeuntner et al.(2018)。16S基于RRNA的技术在处理过程中的高风险,测序误差以及解释不同操作分类单元的存在(OTUS)(OTUS)时也可能受到限制(Quince等,2009,2011; Youssef等,2009)。
环境档案,例如湖泊沉积物,过去和现在生态系统的港口DNA。然而,我们对湖泊系统中沉积DNA的出处,沉积和分布的理解在很大程度上是未知的,这限制了派生时空推断的广度。通过使用元编码在大湖中绘制水生和陆地分类单元的分布,我们表征了沉积DNA的空间异质性,并指出了其潜在的驱动因素。分类群的组成在湖中的地理梯度之间有所不同,DNA的空间分布与生物的范围和生命模式有关。外源分类单元,例如高山植物,在流动河口附近的检测最可靠。我们的数据表明,沉积性DNA正在反映环境中生物体和有机残留物的镶嵌分布,并且来自不同海拔,生物群或其他多样性边界的湖泊的单个位置并不能捕获周围地区的全部动力学。
梭状芽胞杆菌艰难梭菌感染(CDI)每年在美国约30万住院,相关的货币成本为数十亿美元。肠道微生物组营养不良对CDI很重要。据我们所知,元文字组合(MT)仅用于表征肠道微生物组组成和功能,在一项涉及CDI患者的先前研究中。因此,我们利用MT研究了CDI+(n = 20)和CDI-(n = 19)样品在微生物类群和表达基因方面的活性群落多样性和组成的差异。根据CDI状态,未检测到有关丰富性或偶数的显着(Kruskal-Wallis,p> 0.05)的显着差异。但是,基于CDI状态的聚类对于活性微生物分类群和表达的基因数据集都很重要(Permanova,P≤0.05)。此外,与CDI-样品相比,CDI+中的差异特征分析表明,机会性病原体的肠球菌病原体和Ruminococcus gnavus的表达更大。仅考虑真菌序列时,糖霉菌科在CDI-中表达了更多的基因,而其他31种真菌分类群则被确定为显着(Kruskal-Wallisp≤0.05,log(LDA)≥2)与CDI+相关。我们还检测到基于CDI状态的各种基因和途径(Kruskal-Wallisp≤0.05,log(LDA)≥2)显着差异。值得注意的是,与生物膜形成相关的差异基因通过艰难梭菌表达。这为艰难梭菌对抗生素的抵抗和体内频繁复发提供了另一个可能的贡献。此外,更多的CDI+相关真菌分类群构成了额外的证据,表明该分枝杆菌对CDI发病机理很重要。未来的工作将集中于确定艰难梭菌在感染过程中是否积极产生生物膜,以及任何特定的真菌分类群在CDI中是否特别有影响力。
识别小组之间丰度不同的微生物分类单元(对照/治疗,健康/患病等)对于基础科学和应用科学都很重要。与所有科学研究一样,微生物组研究必须具有良好的统计能力,才能检测出治疗之间的丰度大大不同的分类单元。低功率通过“获胜者的诅咒”导致精确度和偏见估计。几项研究引起了对微生物组研究中低功率的担忧。在这项研究中,我们研究了差异丰度分析中的统计能力。特别是,我们提出了一种新的方法,用于估算在单个分类单元的水平上检测效果的效果大小(折叠变化)和平均丰度的效果的新方法。我们分析了七个实际病例对照微生物组数据集,并开发了一种模拟微生物组数据的新方法。我们说明了力量如何随效应大小和平均丰度而变化;我们的结果表明,典型的差异丰度研究无法检测单个分类单元的变化。
图1:二甲双胍与(a)T2D中的肠道真菌的关联,(a)总数据集,(b)随机临床试验(RCTS)和(3)横断面研究。黑色三角形和Pointrange显示了骨料数据集的后均值和后部95%可靠的间隔。有色钻石点显示了单个研究的后验。箭头显示基线(左)或二甲双胍(Met)处理(右)时的丰度增加。虚线垂直线表示零关联。(d)来自同一个体的配对样品显示为基线和二甲双胍处理期间比例相对丰度的相邻水平条。分类单元为阶级:家庭,相对较少的分类单元被合并为“其他”类别。
与植物相关的微生物已显示可帮助植物应对干旱。但是,基本机制知之甚少,并且关于哪种微生物分类单元和功能主要涉及的不确定性。我们在新热带雨林和识别的叶面微生物中探讨了这些问题,这些生物可能在树木的干旱耐受性中发挥作用。我们的目标是(i)测试新热带树中的干旱耐受性特征与其叶面真菌和细菌群落的多样性和组成之间的关系,以及(ii)与干旱耐受性特征相关的叶片微生物分类或负相关。我们的结果表明,叶真菌群落而不是细菌群落的组成与干旱耐受性有关。我们识别27
1. 存在水生大型无脊椎动物 2. 存在 6 种或更多蜉蝣目(蜉蝣) 3. 存在多年生(大型无脊椎动物)指示类群 4. 河床内或附近的湿地植物