抽象的微生物群落通常具有细菌,古细菌,质粒,病毒和微核生素的混合物。在相对的含量丰度中,Y等人与细菌进行了复杂的相互作用。Moreo Ver,病毒和质粒作为移动遗传元素,在水平基因转移和微生物种群中抗生素耐药性中起着重要作用。由于难以识别微生物群落中的病毒,质粒和微核生素,因此我们对这些次要类别落后于细菌和古细菌的差异。resse,将分类器被用来分开,将一个或多个次要类别与元基因组组件中的细菌和古细菌分开。ho w e v er,这些分类器通常是阶级不平衡问题,从而导致识别次要类别的精确度较低。在这里,我们开发了一个称为4CAC的分类器,能够从元素组组件中同时识别病毒,质粒,微核细胞和原核生物。4CAC使用se v er序列长度调整后的XGB OOST模型生成了初始的F我们的分类,并使用汇编图进一步对分类进行了分类。对所采用和真实的元基因组数据集进行的表明,在简短读取中,4CAC显然优于现有的分类器及其组合。 长期读取,除非少数类的丰度为very lo w,否则它也会显示出优势。 4CAC的运行速度比其他分类器快1-2个数量级。表明,在简短读取中,4CAC显然优于现有的分类器及其组合。长期读取,除非少数类的丰度为very lo w,否则它也会显示出优势。4CAC的运行速度比其他分类器快1-2个数量级。4CAC软件可从https://github.com/ shamir-lab/ 4cac获得。
我们承诺考虑对生物多样性的潜在负面影响。在可能的情况下,我们与被认为是生物多样性异常值的公司互动。我们参与了几项保护生物多样性的举措。有关这些计划的更多信息,请访问我们的白皮书中有关生物多样性和自然的白皮书,可在我们的网站上找到。我们使用内部开发的监测系统考虑对投资决策的生物多样性的影响。发行人在生物多样性指标上被确定为离群值,或者在几个指标中表现出很大的不利影响可能会受到进一步的分析和潜在行动,如下所述。
染色体是生物体的遗传信息的载体,可以分为两种主要类型:同种异体体和常染色体。同种体,也称为性染色体,在性别决定和调节与性别相关的特征中起着至关重要的作用。尽管多样性相当多,但它们具有标准特征和基因含量和配对系统的差异。了解性染色体对于农业和疾病控制工作至关重要,在这种工作中,利用性别特异性特征的遗传方法表现出希望。但是,识别同种异体,尤其是在非模型生物中,带来了挑战。在这里,我们探索了监督的机器学习模型的使用,包括逻辑回归,随机森林,支持向量机和K-Nearest邻居,将基于全基因组测序数据基于全基因组测序数据的常染色体或同体分类。评估了覆盖,杂合性和GC含量等特征的预测能力。结果强调了特征组合和模型选择以进行准确分类的重要性。
(未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者此版本于 2023 年 4 月 20 日发布。;https://doi.org/10.1101/2023.04.19.537311 doi:bioRxiv preprint