用于对狗微生物组进行宏基因组分析的数据库的开发:一种采用 KRAKEN2 和 BOWTIE2 的方法 PAULO SALLAROLA TAKAO;帕梅拉·苏萨·科里亚;胡利奥·弗朗茨·莫拉大卫·阿西奥莱·巴博萨; FABIANO BEZERRA MENEGIDIO 摘要 宏基因组分析在了解微生物群落及其环境影响方面发挥着至关重要的作用,在兽医学中对于宠物疾病的诊断、治疗和预防具有特殊意义。这项研究旨在为 Bowtie2 和 Kraken2 工具创建集成数据库,将狗和人类基因组整合成最新且易于访问的资源。随着技术的进步,微生物组的宏基因组分析已成为兽医日常工作中一种很有前途的工具,特别是考虑到兽医诊所中狗的普及率很高,仅在巴西就有大约 5810 万只狗,是家庭中第二大宠物,仅次于鸟类。然而,必要的生物信息学步骤(例如去除宿主基因组和人类污染物)需要大量时间和计算资源。为了克服这一挑战,我们为每种工具开发了特定的数据库,大大减少了分析时间并确保基因组的持续更新。虽然 Bowtie2 执行精确序列比对,但 Kraken2 使用较小的序列(k-mers)进行更快、更有效的分类学分类。数据库构建后,对犬类宏基因组文库进行了测试,结果显示比对率较高,且能有效去除与狗或人类相关的读段。尽管由于缺乏详细的文献而面临挑战,但创建的数据库被证明是可行且可重复的,为未来兽医宏基因组分析研究做出了重大贡献。关键词:家狼,宏基因组,Kraken2-build,Bowtie2-build,污染物。 1 引言 宏基因组分析是对宏基因组进行分类的过程(MARCHESI;RAVEL,2015),宏基因组是基因组学的衍生词,是研究生物体基因的学科。从字面上翻译,宏基因组学是“超越基因组的”,也就是说,在宏基因组学中我们不仅分析一个基因组,还分析样本中包含的所有基因组(GILBERT;DUPONT,2011)。这些基因组可以来自微生物,甚至可以是环境(样本)中的游离 DNA 片段、微生物结构元素的基因、病毒、噬菌体、毒素和其他所有具有遗传物质的东西(BERG 等人,2020 年;HANDELSMAN 等人,1998 年;MERRIAM-WEBSTER,2023 年;WHIPPS;LEWIS;COOKE,1988 年)。那么我们可以将宏基因组分析描述为对给定条件下的微生物基因组集合及其环境条件的分析
主要关键词