1 Cold Spring Harbour Laboratory,Long Island,NY 11724,美国; habowsk@cshl.edu(A.N.H.); poornim@cshl.edu(D.P.B.); caligiu@cshl.edu(G.C。)2美国盐湖城汉斯曼癌症研究所肿瘤科学系,美国盐湖城,美国犹他州84112; sandra.scherer@hci.utah.edu 3儿童研究所和德克萨斯大学西南部达拉斯大学的儿科,美国德克萨斯州75235,美国; Arin.aurora@utsouthwestern.edu 4 Jackson Laboratory,Farmington,CT 06032,美国; Bill.Flynn@jax.org 5美国俄勒冈州健康与科学大学肿瘤学科学系,美国97239; langere@ohsu.edu 6美国俄勒冈州俄勒冈州健康与科学大学外科系,美国97239; Brodyj@ohsu.edu 7分子与医学遗传学系,俄勒冈州健康与科学大学,波特兰,美国97239,美国; searsr@ohsu.edu 8 Ospedale San Raffaele,20054年意大利米兰; foggetti.giorgia@hsr.it 9 New Haven,纽黑文市CT 06520,内科。 anna.arnal@yale.edu 10病理学系,耶鲁大学,纽黑文,CT 06520,美国; don.nguyen@yale.edu(d.x.n. ); katerina.politi@yale.edu(K.A.P。) 11 Terasaki生物医学创新研究所,美国加利福尼亚州90024,美国; xiling.shen@terasaki.org 12美国杜克大学杜克大学医学系,美国北卡罗来纳州27710; shiaowen.hsu@duke.edu 13美国加利福尼亚州旧金山分校的放射学和生物医学成像系,美国加利福尼亚州94158; donna.peehl@ucsf.edu(D.M.P. ); john.kurhanewicz@ucsf.edu(J.K。); renuka.sriram@ucsf.edu(R.S.) 14美国芝加哥西北大学Lurie儿童医院儿科,美国伊利诺伊州60611; msuarezpalacios@luriechildrens.org(M.S.2美国盐湖城汉斯曼癌症研究所肿瘤科学系,美国盐湖城,美国犹他州84112; sandra.scherer@hci.utah.edu 3儿童研究所和德克萨斯大学西南部达拉斯大学的儿科,美国德克萨斯州75235,美国; Arin.aurora@utsouthwestern.edu 4 Jackson Laboratory,Farmington,CT 06032,美国; Bill.Flynn@jax.org 5美国俄勒冈州健康与科学大学肿瘤学科学系,美国97239; langere@ohsu.edu 6美国俄勒冈州俄勒冈州健康与科学大学外科系,美国97239; Brodyj@ohsu.edu 7分子与医学遗传学系,俄勒冈州健康与科学大学,波特兰,美国97239,美国; searsr@ohsu.edu 8 Ospedale San Raffaele,20054年意大利米兰; foggetti.giorgia@hsr.it 9 New Haven,纽黑文市CT 06520,内科。 anna.arnal@yale.edu 10病理学系,耶鲁大学,纽黑文,CT 06520,美国; don.nguyen@yale.edu(d.x.n.); katerina.politi@yale.edu(K.A.P。)11 Terasaki生物医学创新研究所,美国加利福尼亚州90024,美国; xiling.shen@terasaki.org 12美国杜克大学杜克大学医学系,美国北卡罗来纳州27710; shiaowen.hsu@duke.edu 13美国加利福尼亚州旧金山分校的放射学和生物医学成像系,美国加利福尼亚州94158; donna.peehl@ucsf.edu(D.M.P.); john.kurhanewicz@ucsf.edu(J.K。); renuka.sriram@ucsf.edu(R.S.)14美国芝加哥西北大学Lurie儿童医院儿科,美国伊利诺伊州60611; msuarezpalacios@luriechildrens.org(M.S.14美国芝加哥西北大学Lurie儿童医院儿科,美国伊利诺伊州60611; msuarezpalacios@luriechildrens.org(M.S.); sophia.xiao@northwestern.edu(s.x.); yuchdu@luriechildrens.org(y.d。); xli@luriechildrens.org(X.-N.L.)15杰维尔医学肿瘤学系,戴维·科赫·科赫(David H. nnavone@mdanderson.org(n.m.n。 ); elabanca@mdanderson.org(E.L。)16阿拉巴马大学伯明翰伯明翰伯明翰市阿拉巴马州阿拉巴马州35233的辐射肿瘤学系 *通信:cwilley@uabmc.edu;电话。 : +1-205-934-567015杰维尔医学肿瘤学系,戴维·科赫·科赫(David H. nnavone@mdanderson.org(n.m.n。); elabanca@mdanderson.org(E.L。)16阿拉巴马大学伯明翰伯明翰伯明翰市阿拉巴马州阿拉巴马州35233的辐射肿瘤学系 *通信:cwilley@uabmc.edu;电话。: +1-205-934-5670
言语交流在将我们的思想传达给他人,保持社会联系和支持教育成就方面起着至关重要的作用。因此,影响语音感知,例如自闭症,阅读障碍和听力损失的沟通障碍对个人和社会都可能是昂贵的。了解语音处理的神经生物学基础是在神经外科背景下侵入性颅内电生理学加剧的重要目标。然而,大量的行为证据表明,语音输入到音素中尚未考虑到神经生物学模型中尚未考虑的动态,灵活的方面。这个探索性/发展性R21项目追求了一个中心假设,即听力背景系统地影响了对语音的皮质反应,因此影响了信号传导音素中声学维度的诊断性。一个新成立的跨学科研究团队将通过在神经外科背景下获得的立体电脑摄影(SEEG)使用脑内记录,以追求这一假设。像电皮质学(ECOG)一样,Seeg具有高时空分辨率,可以针对皮质表面,包括上颞回(STG)。由于皮质内电极的放置,Seeg电极通过颞上平面记录,特别针对深沟和陀螺灰质,包括上颞沟(STS)和Heschl的Gyrus(Hg)。同时将获得头皮脑电图(EEG),以将这些物质内措施与健康听众研究中的无创方法联系起来。aim 1将建立对两个声 - 声音维度的神经反应,这是它们信号音素同一性的感知权重的函数。这将为每个参与者提供一个基线响应,以作为与听力背景的实验操作相比,在AIM 2中转移感知权重,并将确定感知加权策略中个体差异如何预测皮质电生理响应。aim 2将引入两个完善的操纵,从行为上讲,相对于基线而转移感知权重:引入噪声和引入“口音”的“噪声”,短期语音输入偏离了母语的分布规律性。对参与者内部实验操作的检查将提供一种敏感手段,通过该方法来测定神经反应的变化,这是在听力环境中产生的知觉权重变化的函数。参与者将在青春期(15-25岁)中进行采样,在此期间,感知权重提供了信息性的异质性。该项目将通过填补对语音处理的重要空白,从患者的侵入性电生理研究中建造一座桥梁,到通过结合eeg+EEG,婚礼经典和最先进的计算方法到为机制提供信息的机制,并理解具有实质性处理的动态性质,从而使人类听众的头皮衡量人类听众的衡量。
单分子实时 (SMRT) DNA 测序技术 (Pacific Biosciences) 生成的长读段是高质量叶绿体 (1, 2) 和线粒体基因组序列组装的起点之一。栽培的葡萄树 Vitis vinifera 极易受到病原体的感染。抗性品种如种间杂交品种‘Börner’ (V. riparia GM183 [母株] V. cinerea Arnold [花粉供体]) 被用作培育优良葡萄品种的砧木。我们从 SMRT 读段中组装并注释了‘Börner’的叶绿体 (cp_Boe) 和线粒体 (mt_Boe) 基因组序列。除非另有说明,所有生物信息学工具均采用默认参数。从品种“Börner”的幼叶中提取基因组 DNA(3),并在 Sequel I 测序仪(1Mv3 SMRT 细胞、结合试剂盒 v3.0、测序化学 v3.0,均来自 PacBio)上进行测序。通过 BLASTN(BLAST 2.7.1)搜索(4)筛选质体或线粒体序列(RefSeq 版本 91),筛选出潜在的质体或线粒体读段。使用的标准如下:读段长度,500 个核苷酸(nt)以上;同一性,70% 以上;查询覆盖率,30% 以上。 292,574 个潜在质体读段(共 2,715,983,671 nt;N50,12,829 nt)和 426,918 个潜在线粒体读段(3,928,350,102 nt;N50,12,624 nt)分别用 Canu v1.7(5)进行组装。每个最长的重叠群都与 V. vinifera 的叶绿体(6)或线粒体(7)基因组序列具有高度相似性。随后,使用 Bandage(8)确认组装正确。手动修剪环状基因组中重叠的末端序列,并将起始序列与葡萄参考序列比对。用 Arrow(SMRT Link 版本 5.1.0.26412)对组装体进行三次完善。最后一轮精炼将起始点移至序列的相反位置。为了帮助注释,根据制造商的说明,使用 peqGOLD 植物 RNA 试剂盒 (Peqlab) 从“Börner”组织中提取 RNA。根据 TruSeq RNA 样品制备 v2 指南,从 1,000 ng 总 RNA 制备索引 Illumina 测序文库。将得到的转录组测序 (RNA-Seq) 文库以等摩尔量汇集,并在 HiSeq 1500 仪器上以 2 100-nt 双端格式进行测序。cp_Boe (161,008 bp;GC 含量,37.4%) 和 mt_Boe (755,068 bp;GC 含量,44.3%) 使用 Web 服务 GeSeq v1.66 进行注释(cp_Boe 的具体设置:
arrowia lipolytica 属于子囊菌门、酿酒菌亚门和双足菌科 (1)。除了工业用途 (2) 之外,Y. lipolytica 还广泛存在于食品、环境和动物中 (1)。由于其能够在 32°C 以上不稳定地生长,因此通常认为该菌种可安全用于工业用途 (1)。Yarrowia lipolytica 是一种机会性病原体,可引起侵袭性念珠菌病 (3)。在体外,该菌种被认为对氟康唑敏感 (4)。第一个 Y. lipolytica 基因组 (CLIB122) 于 2004 年发布 (5)。我们报告了对氟康唑有抗性的 Y. lipolytica 临床分离株的基因组草图,该分离株是从溃疡性结肠炎手术后的血培养中采集的。有趣的是,尽管之前曾接触过唑类药物,但使用梯度浓度试纸法(Etest;bioMérieux),该菌株的氟康唑 MIC 为 0.256 mg/mL。患者成功地用卡泊芬净治疗。该菌株在 35°C 的显色琼脂平板(CAN2;bioMérieux)上生长,并使用 Vitek 基质辅助激光解吸电离 - 飞行时间质谱 (MALDI-TOF MS) 仪器(bioMérieux)进行鉴定。在溶菌酶细胞壁消化后,使用 QIAmp DNA minikit(Qiagen)提取基因组 DNA。使用 Illumina DNA 制备标记试剂盒(Illumina)构建文库。简而言之,使用珠状转座子技术和集成 DNA 技术 (IDT) 的 Illumina DNA/RNA 独特双重 (UD) 索引集将 30 ng 总 DNA 片段化并进行索引。使用 Qubit 高灵敏度试剂盒 (Thermo Fisher Scienti ) 对文库进行扩增、纯化和定量。最后,将 9 pM 汇集和变性文库放入 2 250-bp v2 试剂盒 (Illumina) 中,并使用 MiSeq 仪器 (Illumina) 进行测序。使用 CLC Genomics Workbench v22.0 (Qiagen) 中的 Trim Reads v2.5 和 De Novo Assembly v1.5 工具对原始读取进行修剪、组装成重叠群并进行搭建。使用覆盖率与长度图丢弃覆盖率为 , 10 且长度为 , 500 bp 的重叠群 (6)。使用 QUAST v5.0.2 对最终的 scaffold 集进行质量分析 (7)。总基因组大小为 20,255,408 bp,分布在 521 个 scaffold 上(覆盖率为 100 ),N 50 值为 105 kbp(最长 scaffold,397 kbp),GC 含量为 49.03%。AUGUSTUS v3.4.0 (8) 使用白色念珠菌训练数据集预测了 6,151 个蛋白质编码基因,使用 tRNAscan-SE 2.0 检测到了 484 个 tRNA 基因 (9)。使用 BUSCO v5.3.2 和 saccharomycetes_odb10 谱系数据集 (10) 估计基因组完整性为 95.3%。平均核苷酸同一性 (ANI) 计算
宏基因组学是对直接从土壤,水和肠道含量等环境样品中提取的遗传物质的研究,而无需隔离单个生物。该领域使用宏基因组学框来根据相似性将DNA序列分为组。目标是将这些序列分配给其相应的微生物或分类群,从而更深入地了解样本中的微生物多样性和功能。计算方法(例如序列相似性,组成和其他特征)用于分组。宏基因组学的方法包括:基于序列组成的binning,它分析了不同基因组中的不同模式;基于覆盖范围的binning,它使用测序深度将分组读取为垃圾箱;混合式分子,结合了两种方法以提高准确性;基于聚类的封装,可用于高基因组多样性数据集;和基于机器学习的封装,需要带注释的参考基因组进行培训。每种方法都有其优势和局限性,其选择取决于特定的元基因组数据集和研究问题。宏基因组学箱很复杂。2017年,本教程将涵盖元基因组式融合工具,以及咖啡发酵生态系统和metabat 2算法metabat的数据生成MAGS,可以轻松地与下游分析和工具集成,例如分类学注释和功能预测。已经对六个样本进行了测序,生成了6个用于咖啡发酵系统的原始数据集。2。宏基因组套件是分析复杂的微生物群落的关键步骤,但面临着几个挑战,包括水平基因转移污染危险嵌合序列和Maxbin Metabat mycc mycc mycc groopm groopm metawrap anvi'o semibin of de nove bin bin bin bin bin bin bin bin bin bin bin的物种计算工具中的物种计算工具中的应变变化,例如已显示出高度准确的有效扩展和用户友好的基准研究发现,Metabat 2在准确性和计算效率方面都优于其他替代方案,以提供有关宏基因组学软件的更多信息,请参见Sczyrba等。使用Illumina MiSeq全基因组测序进行了六次颞枪i弹枪元基因组研究,以全面分析咖啡微生物组的结构和功能。我们基于这些现实世界数据为本教程创建了模拟数据集。我们将介绍本教程中的以下主题:准备分析历史记录和数据,将metabat 2运行到bin元基因组测序数据。要运行binning,我们首先需要将数据纳入Galaxy,任何分析都应具有自己独特的历史记录。让我们通过单击历史记录面板的顶部创建一个新的历史记录并重命名它。要将序列读取数据上传到星系中,您可以直接从计算机导入它,也可以使用这些链接从Zenodo或数据库中获取它:等等。首先,创建一个名为GTN的文件夹 - 带有主题名称和教程名称的子文件夹的材料。选择所需的文件要从顶部附近的下拉菜单中导入。3。通过在弹出窗口中选择“选择历史记录”,选择要导入数据(或创建新数据)的历史记录。通过重命名示例名称的读取对创建配对集合,然后按照以下步骤:检查所有要包含的数据集,并通过单击“数据集对构建列表”来构建数据集对列表。将未配对的前进和反向读取文本更改为每对的常见选择器。单击“配对这些数据集”以进行有效的前进和反向对。输入一个集合名称,然后单击“创建列表”以构建集合。binning有几个挑战,包括高复杂性,碎片序列,不均匀的覆盖率,不完整或部分基因组,水平基因转移,嵌合序列,应变变异和开放图像1:binning。在本教程中,我们将通过Galaxy使用Metabat 2(Kang等,2019)来学习如何键入元基因组。metabat是“基于丰度和四核苷酸频率的元基因组binning的工具”,该工具将shot弹枪元基因组序列组装到微生物群落中。它使用基因组丰度和四核苷酸频率的经验概率距离来达到98%的精度,并在应变水平下以281个接近完全独特的基因组为准。我们将使用上传的汇编FastA文件作为Metabat的输入,为简单起见保留默认参数。设置为“否”。在输出选项中,“垃圾箱的最小尺寸作为输出”设置为200000。对于ERR2231567样品,有6个箱子,将167个序列分类为第二箱。手:1。4。该工具将在Galaxy版本1.2.9+Galaxy0中使用这些参数:“包含重叠群的Fasta文件”汇编FASTA文件; “考虑融合的良好重叠群的百分比”设置为95; “ binning边缘的最低分数”为60; “每个节点的最大边数”为200; “构建TNF图的TNF概率截止”为0;和“关闭丢失还是小重叠的额外的押金?”The output files generated by MetaBAT 2 include (some are optional and not produced unless required): - Final set of genome bins in FASTA format (.fa) - Summary file with info on each genome bin, including length, completeness, contamination, and taxonomy classification (.txt) - File with mapping results showing contig assignment to a genome bin (.bam) - File containing abundance estimation of each genome bin (.txt) - 每个基因组bin(.txt)的覆盖曲线的文件 - 每个基因组bin的核苷酸组成(.txt) - 文件具有每个基因组bin(.faa)的预测基因序列(.faa)的基因序列,可以进一步分析和用于下游应用,例如功能性注释,相比的植物组合和化学分析,并可以用于下游应用。去复制是识别基因组列表中“相同”的基因组集的过程,并从每个冗余集中删除除“最佳”基因组之外的所有基因组。在重要概念中讨论了相似性阈值以及如何确定最佳基因组。基因组去复制的常见用途是元基因组数据的单个组装,尤其是当从多个样本中组装简短读数时(“共同组装”)。这可能会导致由于组合类似菌株而导致碎片组件。执行共同组装以捕获低丰度微生物。另一种选择是分别组装每个样品,然后去重新复制箱以创建最终的基因组集。metabat 2不会明确执行放松,而是通过利用读取覆盖范围,样品差异覆盖范围和序列组成来提高构架准确性。DREP等工具的设计用于宏基因组学中的复制,旨在保留一组代表性的基因组,以改善下游分析。评估:DREP评估集群中每个基因组的质量,考虑到完整性,污染和应变异质性等因素。基因组选择:在每个群集中,DREP根据用户定义的标准选择代表性基因组。该代表性基因组被认为是群集的“翻译”版本。放松输出:输出包括有关消除基因组的信息,包括身份,完整性和污染。用户可以选择基因组相似性的阈值,以控制删除水平。使用您喜欢的汇编程序分别组装每个样本。bin每个组件分别使用您喜欢的Binner。bin使用您喜欢的Binner共同组装。5。将所有组件中的垃圾箱拉在一起,然后在它们上运行DREP。6。在解复的基因组列表上执行下游分析。检查质量:1。一旦完成,必须检查其质量。2。可以使用CheckM(Parks等,2015)评估binning结果,这是一种用于元基因组学框的软件工具。3。2。检查通过将基因组仓与通用单拷贝标记基因进行比较,评估了基因组仓的完整性和污染。宏基因组学:1。宏基因组学将DNA碎片从混合群落分离为单个垃圾箱,每个垃圾箱代表一个独特的基因组。checkm估计每个基因组箱的完整性(存在的通用单拷贝标记基因集的总数)和污染(在一个以上bin中发现的标记基因的百分比)。关键功能:1。基因组完整性的估计:CheckM使用通用单拷贝标记基因来估计回收基因组的比例。2。基因组污染的估计:CHECKM估计多个箱中存在的标记基因的百分比,表明来自多种生物的潜在DNA。3。识别潜在的杂料:CheckM基于基因组的标记基因分布来识别杂种。4。结果的可视化:CheckM生成图和表,以可视化基因组垃圾箱的完整性,污染和质量指标,从而使解释更加容易。checkm也可以根据与不同分类学组相关的特定标记基因(例如sineage_wf:评估使用谱系特异性标记集对基因组垃圾箱的完整性和污染)进行分类分类的基因组分类。checkm lineage_wf工作流使用标记基因和分类信息的参考数据库来对不同分类学水平的基因组垃圾箱进行分类。来源:-Turaev,D。,&Rattei,T。(2016)。(2014)。使用metabat 2的元基因组重叠群构造教程强调了选择最合适的binning工具的重要性。不同的方法具有不同的优势和局限性,具体取决于所分析的数据类型。通过比较多种封装技术,研究人员可以提高基因组融合的精度和准确性。可用于元基因组数据,包括基于参考的,基于聚类的混合方法和机器学习。每种方法都有其优点和缺点,从而根据研究问题和数据特征使选择过程至关重要。比较多种封装方法的结果有助于确定特定研究的最准确和最可靠的方法。在完整性,污染和应变异质性方面评估所得垃圾箱的质量至关重要。另外,比较已识别基因组的组成和功能谱可以提供有价值的见解。通过仔细选择和比较binning方法,研究人员可以提高基因组箱的质量和可靠性。这最终导致对微生物群落在各种环境中的功能和生态作用有了更好的了解。微生物群落系统生物学的高清晰度:宏基因组学以基因组为中心和应变分辨。- Quince,C.,Walker,A。W.,Simpson,J。T.,Loman,N。J.,&Segata,N。(2017)。shot弹枪宏基因组学,从采样到分析。-Wang,J。和Jia,H。(2016)。元基因组范围的关联研究:微生物组细化。-Kingma,D。P.和Welling,M。(2014年)。自动编码变分贝叶斯。-Nielsen,H。B.等。鉴定和组装基因组和复杂元基因组样品中的遗传因素,而无需使用参考基因组。-Teeling,H.,Meyerdierks,A.,Bauer,M.,Amann,R。,&Glöckner,F。O.(2004)。将四核苷酸频率应用于基因组片段的分配。-Alneberg,J。等。(2014)。通过覆盖范围和组成的结合元基因组重叠群。-Albertsen,M。等。(2013)。通过多个元基因组的差异覆盖层获得的稀有,未培养细菌的基因组序列。-Kang,D.D.,Froula,J.,Egan,R。,&Wang,Z。(2015)。metabat,一种有效的工具,用于准确地重建来自复杂微生物群落的单个基因组。simmons b a和singer s w提出了一种新算法,称为Maxbin 2.0,用于2016年生物信息学期刊中多个元基因组数据集的binning基因组。此外,Kang等人开发了Metabat 2,一种自适应binning算法,该算法于2019年在Peerj发表。PlazaOñate等人引入了MSPMiner,这是一种从shot弹枪元基因组数据重建微生物泛元组的工具,如2019年的生物信息学报道。Other studies like those of Lin and Liao, Chatterji et al, Parks et al, Pasolli et al, Almeida et al, Brooks et al, Sczyrba et al, Qin et al, Bowers et al, Sieber et al, Cleary et al, Huttenhower et al, Saeed et al, and Pride et al have also contributed to the development of metagenomics tools and approaches for genome recovery.这些发现表明,宏基因组分析和计算方法的最新进展使研究人员能够从环境样本中恢复几乎完整的基因组。本文讨论了有关宏基因组学的各种研究,这是对特定环境中多种生物的遗传物质的研究。研究集中于人类肠道微生物组及其在不同人群和年龄之间的组成。引用了几篇论文,其中包括Chen等人的论文。(2020),他开发了一种从宏基因组获得准确而完整的基因组的方法。Daubin等人的另一篇论文。(2003)探讨了细菌基因组中侧向转移基因的来源。本文还提到了有关人肠道微生物组的研究,包括Schloissnig等人的工作。(2013),他绘制了人类肠道微生物组的基因组变异景观。Yatsunenko等。 (2012)研究了在不同年龄和地理位置的人类肠道微生物组。 此外,本文参考了有关微生物从母亲传播到婴儿的研究,包括Asnicar等人的工作。 (2017)和Ferretti等。 (2018)。 本文还涉及宏基因组学分析中使用的机器学习和深度学习技术,例如变化自动编码器和无监督的聚类方法。 最后,本文提到了用于分析元基因组数据的软件工具,包括Li(2013)的BWA-MEM和Paszke等人的Pytorch。 (2019)。 以下是生物信息学和基因组学领域的各种研究文章的摘要。Yatsunenko等。(2012)研究了在不同年龄和地理位置的人类肠道微生物组。此外,本文参考了有关微生物从母亲传播到婴儿的研究,包括Asnicar等人的工作。(2017)和Ferretti等。(2018)。本文还涉及宏基因组学分析中使用的机器学习和深度学习技术,例如变化自动编码器和无监督的聚类方法。最后,本文提到了用于分析元基因组数据的软件工具,包括Li(2013)的BWA-MEM和Paszke等人的Pytorch。(2019)。以下是生物信息学和基因组学领域的各种研究文章的摘要。释义旨在保留原始文章的主要思想和发现,同时以更简洁和易于访问的方式介绍它们。1。**聚类**:一种用于将相似数据点分组在一起的算法,应用于基于Web的数据。2。** art **:用于下一代测序的模拟器可以模仿现实世界数据。3。** metaspades **:一种可以从混合微生物群落中重建基因组的宏基因组组装子。4。** minimap2 **:一种以高精度和速度对齐核苷酸序列的工具。5。** blat **:用于比较基因组序列的爆炸样比对工具。6。** Circos **:用于比较基因组学的可视化工具,用于显示多个基因组之间的关系。7。**高通量ANI分析**:使用平均核苷酸同一性(ANI)指标估算原核基因组之间距离的方法。8。** checkm **:一种评估微生物基因组完整性和污染的工具。9。** BLAST+**:具有改进功能和用户界面的BLAST算法的更新版本。10。** mash **:使用Minhash估算基因组或元基因组距离的工具。11。**浪子**:原核基因组的基因识别和翻译起始位点识别工具。12。** InterPro 2019 **:蛋白质序列注释的InterPro数据库的更新,具有改进的覆盖范围和访问功能。13。14。15。16。**控制虚假发现率**:一种用于管理生物信息学研究中多种假设检验的统计方法。** checkv **:一种用于评估元基因组组装的病毒基因组质量的工具。**使用深度学习从宏基因组数据中识别病毒**:使用机器学习从混合微生物群落中检测病毒的研究。**标准化的细菌分类法**:基于基因组系统发育的细菌进行分类的新框架,该细菌修改了生命之树。17。** gtdb-tk **:一种用于与基因组分类学数据库(GTDB)分类的工具包。18。** iq-Tree **:使用快速有效算法估算最大可能的系统发育的工具。这些摘要概述了生物信息学和基因组学领域的各种研究文章,突出显示了与序列比对,组装,注释和系统发育有关的工具,方法和研究。最新的多个序列对齐软件的进步显着提高了D. M. Mafft版本7,Modelfinder,Astral-III,UFBOOT2,Life V4和APE 5.0等工具的性能和可用性。这些工具通过引入新颖特征,例如快速模型选择,多项式时间种树重建,超快的自举近似和交互式可视化来提高系统发育估计值的准确性。这些软件包的整合已简化了构建进化树的过程,使研究人员可以更轻松地探索复杂的系统发育关系。