用于对狗微生物组进行宏基因组分析的数据库的开发:一种采用 KRAKEN2 和 BOWTIE2 的方法 PAULO SALLAROLA TAKAO;帕梅拉·苏萨·科里亚;胡利奥·弗朗茨·莫拉大卫·阿西奥莱·巴博萨; FABIANO BEZERRA MENEGIDIO 摘要 宏基因组分析在了解微生物群落及其环境影响方面发挥着至关重要的作用,在兽医学中对于宠物疾病的诊断、治疗和预防具有特殊意义。这项研究旨在为 Bowtie2 和 Kraken2 工具创建集成数据库,将狗和人类基因组整合成最新且易于访问的资源。随着技术的进步,微生物组的宏基因组分析已成为兽医日常工作中一种很有前途的工具,特别是考虑到兽医诊所中狗的普及率很高,仅在巴西就有大约 5810 万只狗,是家庭中第二大宠物,仅次于鸟类。然而,必要的生物信息学步骤(例如去除宿主基因组和人类污染物)需要大量时间和计算资源。为了克服这一挑战,我们为每种工具开发了特定的数据库,大大减少了分析时间并确保基因组的持续更新。虽然 Bowtie2 执行精确序列比对,但 Kraken2 使用较小的序列(k-mers)进行更快、更有效的分类学分类。数据库构建后,对犬类宏基因组文库进行了测试,结果显示比对率较高,且能有效去除与狗或人类相关的读段。尽管由于缺乏详细的文献而面临挑战,但创建的数据库被证明是可行且可重复的,为未来兽医宏基因组分析研究做出了重大贡献。关键词:家狼,宏基因组,Kraken2-build,Bowtie2-build,污染物。 1 引言 宏基因组分析是对宏基因组进行分类的过程(MARCHESI;RAVEL,2015),宏基因组是基因组学的衍生词,是研究生物体基因的学科。从字面上翻译,宏基因组学是“超越基因组的”,也就是说,在宏基因组学中我们不仅分析一个基因组,还分析样本中包含的所有基因组(GILBERT;DUPONT,2011)。这些基因组可以来自微生物,甚至可以是环境(样本)中的游离 DNA 片段、微生物结构元素的基因、病毒、噬菌体、毒素和其他所有具有遗传物质的东西(BERG 等人,2020 年;HANDELSMAN 等人,1998 年;MERRIAM-WEBSTER,2023 年;WHIPPS;LEWIS;COOKE,1988 年)。那么我们可以将宏基因组分析描述为对给定条件下的微生物基因组集合及其环境条件的分析
[19] Kunin,V.,Copeland,A.,Lapidus,A.,Mavromatis,K。,&Hugenholtz,P。(2008)。宏基因组学的生物信息学指南。微生物学和分子生物学评论,72(4),557-578。[20] Jolley,K。A.,Chan,M。S.,&Maiden,M.C。(2004)。MLSTDBNET分布的多洛克斯序列键入(MLST)数据库。BMC生物信息学,5(1),86。[21] Enright,M。C.和Spratt,B。G.(1999)。多焦点序列键入。微生物学的趋势,7(12),482-487。[22] Healy,M.,Huong,J.,Bittner,T.,Lising,M.,Frye,S.,Raza,S。,&Woods,C。(2005)。通过自动重复序列的PCR键入微生物DNA。临床微生物学杂志,第43(1)期,199-207。[23] Vergnaud,G。和Pourcel,C。(2006)。多个基因座VNTR(串联重复的可变数量)分析。分子鉴定,系统学和原核生物的种群结构,83-104。[24] Van Belkum,A。(2007)。通过多焦点数量的串联重复分析(MLVA)来追踪细菌物种的分离株。病原体和疾病,49(1),22-27。[25] Vergnaud,G。和Pourcel,C。(2009)。多个基因座变量串联重复分析数。微生物的分子流行病学:方法和方案,141-158。[26] Fricke,W。F.,Rasko,D。A.和Ravel,J。(2009)。基因组学在鉴定,预测和预防生物学威胁中的作用。PLOS Biology,7(10),E1000217。[27] Wu,M。和Eisen,J。A.(2008)。95-100)。一种简单,快速且准确的系统基因推断方法。基因组生物学,9(10),R151。[28] Liu,B.,Gibbons,T.,Ghodsi,M。和Pop,M。(2010年12月)。隐式:元基因组序列的分类分析。生物信息学和生物医学(BIBM),2010年IEEE国际会议(pp。IEEE。 [29] Wang,Z。,&Wu,M。(2013)。 门水平细菌系统发育标记数据库。 分子生物学与进化,30(6),1258-1262。 [30] Darling,A。E.,Jospin,G.,Lowe,E.,Matsen IV,F。A.,Bik,H。M.,&Eisen,J. A. (2014)。 系统缩影:基因组和宏基因组的系统发育分析。 peerj,2,e243。 [31] Taberlet,P.,Prud'Homme,S.M.,Campione,E.,Roy,J.,Miquel,C.,Shehzad,W。,&Melodelima,C。(2012)。 土壤采样和细胞外DNA的分离,适用于大量的起始材料。 分子生态学,21(8),1816-1820。IEEE。[29] Wang,Z。,&Wu,M。(2013)。门水平细菌系统发育标记数据库。分子生物学与进化,30(6),1258-1262。[30] Darling,A。E.,Jospin,G.,Lowe,E.,Matsen IV,F。A.,Bik,H。M.,&Eisen,J.A.(2014)。系统缩影:基因组和宏基因组的系统发育分析。peerj,2,e243。[31] Taberlet,P.,Prud'Homme,S.M.,Campione,E.,Roy,J.,Miquel,C.,Shehzad,W。,&Melodelima,C。(2012)。土壤采样和细胞外DNA的分离,适用于大量的起始材料。分子生态学,21(8),1816-1820。
