来自同一物种的微生物菌株由于其不同的基因含量而具有不同的功能特征。作为最高分辨率,菌株主要是特定于宿主的,因此掩盖了公正的关联,并阻碍了演绎研究。在这里,我们以公正的,独立的方式全面地以一致宣布的亚种分辨率定义了人类肠道微生物群,并证明我们可以在全球范围内概括到全球范围内的不同种群,同时保持特异性并提高培养基可重复性。我们开发了Panhashome,这是一种基于草图的方法,用于快速亚种量化和鉴定驱动种子内变化的基因,并表明亚种在物种水平上携带不可检测的信息。通过大肠癌荟萃分析(CRC)数据集,我们确定了与疾病相关的亚种,其兄弟姐妹亚种没有。基于亚种的机器学习CRC诊断算法通过利用唯一的亚种级信息来优于物种水平的方法。该亚种目录允许鉴定基因,这些基因将亚种之间的功能差异作为机械理解微生物组 - 表型相互作用的基本步骤。
主要关键词