Chytrid真菌胚层艾美艾尔(Emersonii)产生带有游泳尾巴的孢子(Zoospores);这些细胞可以感知并朝光线游动。对该物种的兴趣源于持续开发艾默生芽孢杆菌的努力,作为理解相关光遗传电路的光持续演变和分子细胞生物学的模型。在这里,我们报告了B. emersonii美国型培养物收藏品22665菌株的高度结合基因组组装和基因注释。我们在一个带有Illumina配对的基因组序列调查的PACBIO长阅读库中,导致组装21个重叠群,总计34.27 MB。使用这些数据,我们评估了编码基因的感觉系统的多样性。这些分析确定了G蛋白偶联受体,离子转运蛋白和核苷酸循环酶的丰富补体,所有这些都通过域重组和串联重复而多样化。在许多情况下,这些结构域的组合导致蛋白质结构域与跨膜结构域融合,将推定的信号传导与细胞膜绑定在一起。这种模式与B. emersonii感觉信号系统的多元化一致,后者可能在这种真菌的复杂生命周期中起着各种作用。
摘要:亚马逊雨林是物种数量和众多的近卫生关系中的超多样性生态系统。为了表征占主导地位和经济重要的亚马逊物种,巴西坚果树(Bertholletia Excelsa Bonpl。),在基因组水平上,从单个个体的叶子中引发了高覆盖的长阅读测序数据。基因组组装揭示了一个意外的发现:两个可以分配给染色体的圆形重叠群和pantoea stewartii菌株的质粒。比较基因组学表明,该菌株属于独立元素亚种,并与从新热带棕榈bactris gasipaes kunth的患病叶片中分离出的其他菌株高度同步。对致病性相关基因的研究揭示了质粒中没有整个III型分泌系统基因簇,质粒否则与已知在Dracaena Sanderiana Mast中引起疾病的分离物的质粒高度相似。相反,检测到与植物生长有关的几种基因,包括参与吲哚-3-乙酸(IAA)产生的基因,磷酸盐溶解和辅助载体的生物合成。总而言之,我们报告了未经培养的Stewartii亚种的基因组。与巴西坚果树相关的植物菌株,并可能是植物生长的细菌。
亚麻 ( Linum usitatissimum ) 也称为普通亚麻或亚麻籽,在温带地区作为油料和纤维作物种植,可能已被人类使用长达 30,000 年 ( Kvavadze et al., 2009 )。纤维亚麻是栽培亚麻的主要形态类型之一,也是驯化作物中最古老的形态,为人类提供了纤维来源 ( Hickey, 1988 )。据报道,对纤维亚麻 ( 纤维用途 ) 和亚麻籽亚麻 ( 油料用途 ) 的破坏性选择导致植物类型在形态、解剖学、生理学和农艺性能上存在很大差异 ( Diederichsen and Ulrich, 2009 )。纤维亚麻比油料用途亚麻相对较高、分枝较少、种子较少 ( Zhang et al., 2020 )。在过去十年中,纤维工业开发出高价值产品,应用于汽车、建筑工业、生物燃料工业和纸浆(Diederichsen 和 Ulrich,2009 年)。亚麻制成的纺织品在西方国家被称为亚麻布,传统上用于床单、内衣和桌布。亚麻仍然是一种小作物,主要原因是过去十年来其产量过低(Soto-Cerda 等人,2014 年)。准确的参考基因组已成为遗传学研究不可或缺的资源,尤其是对于功能基因图谱和标记辅助选择(MAS)。亚麻基因组的组装可以显著加速亚麻育种的进程。受益于亚麻参考基因组的发布,人们获得了不少与重要农艺性状相关的候选基因 ( Soto-Cerda et al., 2018; Xie et al., 2018a,b; You et al., 2018b; Guo et al., 2020 )。第一个亚麻基因组组装于 2012 年使用 Illumina 短双端和配对读段 (CDC Bethune v1) 发布 ( Wang et al., 2012 )。随后,You 等人使用光学、物理和遗传图谱 (CDC Bethune v2) 将这些碎片化的重叠群锚定到 15 个假分子中 ( You et al., 2018a )。最近还使用短双端读段和 Hi-C 测序发布了三个不同品种的基因组组装 ( Zhang et al., 2020 )。几个月前首次发表了使用错误长读长的亚麻组装体(Dmitriev et al., 2021)。然而,即使使用 Oxford Nanopore 长读技术,所有这些组装体的连续性都非常差。这些组装体最大的重叠群 N50 为 365 Kb。亚麻基因组最近经历了全基因组复制 (WGD) 事件,充满了重复元素(You et al., 2018a)。在使用短读长或错误长读长的组装过程中,同源序列或重复序列之间很容易发生崩溃。使用不同的软件和 Oxford Nanopore 长读长组装体,组装体大小差异很大,证明了这一点(Dmitriev et al., 2021)。
摘要 — 生物信息学和人工智能 (AI) 是快速发展的工具,它们促进了移动遗传元素 (MGE) 的注释,从而能够预测污染环境中的健康风险因素,例如抗生素抗性基因 (ARG)。本研究旨在评估四种基于 AI 的质粒注释工具 (Plasflow、Platon、RFPlasmid 和 PlasForest) 的性能,通过使用定义的性能参数来识别从哥斯达黎加维里拉河获得的一个沉积物样本的宏基因组中的 ARG。我们从样本中提取并测序完整的 DNA,组装宏基因组,然后使用每种生物信息学工具进行质粒预测,并使用抗性基因标识符网络门户进行 ARG 注释。计算了评估质粒的每个 ARG 预测结果的灵敏度、特异性、精确度、阴性预测值、准确度和 F1 分数。值得注意的是,Platon 在评估的工具中表现最高,获得了优异的分数。相反,Plasflow 似乎难以区分染色体和质粒序列,而 PlasForest 在处理小重叠群时遇到了限制。RF- Plasmid 表现出较低的特异性,并且其分类单元依赖的工作流程表现不佳。我们建议采用 Platon 作为抗性基因组研究的首选生物信息学工具
Lamiaceae家族的成员Baicalaria Baicalensis Georgi是一家广泛使用的药用植物。从黄葡萄球菌中提取的黄酮促成了许多健康益处,包括抗炎,抗病毒和抗肿瘤活性。但是,不完全的基因组组装阻碍了对黄链树的生物学研究。这项研究通过PACBIO HIFI,纳米孔超长和HI-C技术的整合,提出了第一台端粒到核(T2T)间隙 - 无链球菌的基因组组装。获得了384.59 MB的基因组大小,其重叠群N50为42.44 MB,所有序列均固定在没有任何间隙或不匹配的9个假色体中。此外,我们使用广泛靶向的代谢组方法分析了与蓝紫花花的测定有关的主要氰化素和delphinidin的花青素。基于整个基因组的鉴定(CYP450)基因家族,三个基因(SBFBH1、2和5)编码类黄酮3'-羟基酶(F3'HS)(F3'HS)和一个基因(SBFBH7)(SBFBH7)(SBFBH7)(SBFBH7)编码F3'''''''''''''''''''''''''''''''''''''''''''''' - 羟基化类黄酮的B环。我们的研究丰富了可用于Lamiaceae家族的基因组信息,并提供了一种用于发现类黄酮装饰涉及的CYP450基因的工具包。
绣球花属属于绣球花科,属于开花植物山茱萸目,该目早期在菊科中分化,包括几种常用的观赏植物。其中,大叶绣球是苗圃贸易中最有价值的物种之一,但这种作物或密切相关的菊科物种的基因组资源很少。绣球花品种“Veitchii”和“Endless Summer”的两个高质量单倍型解析参考基因组[最高品质为 2.22 千兆碱基对 (Gb)、396 个重叠群、N50 22.8 兆碱基对 (Mb)]被组装并支架到预期的 18 条假染色体中。利用新开发的高质量参考基因组以及其他相关开花植物的高质量基因组,发现核数据支持菊科植物演化支中的单个分歧点,其中山茱萸目和杜鹃花目均与真菊科植物分化。使用 F 1 杂交种群进行基因作图证明了连锁作图与新基因组资源相结合的强大功能,可以识别位于 4 号染色体上的花序形状基因 CYP78A5 和位于 17 号染色体上的导致重花的新基因 BAM3。本研究开发的资源不仅有助于加速绣球花的遗传改良,还有助于了解最大的开花植物群——菊科植物。
长阅读测序已彻底改变了基因组组装,产生了高度连续的染色体水平重叠群。但是,来自某些第三代长读技术的组件,例如太平洋生物科学(PACBIO)连续长读(CLR)具有很高的错误率。可以通过称为抛光的过程来纠正此类错误。尽管脊椎动物基因组项目(VGP)组装社区最近描述了抛光非模型的新型基因组组件的最佳实践,但需要在常规的高性能计算环境下轻松实施并运行公开可再现的工作流程。在这里,我们描述了polishclr(https://github.com/isugifnf/polishclr),这是一种可复制的NextFlow工作流程,可实现CLR数据制成的抛光组件的最佳实践。可以从将最佳实践扩展到次优案例的几种输入选项中启动。它还在几个关键过程中提供了重新输入点,包括识别Purge_Dups中的重复单倍型,如果有数据可用,请降低脚手架的休息,以及在多个回合的抛光和评估中,用箭头和freebayes进行评估。polishclr已被集装箱和公开可用于更大的集会社区,作为从现有的,易错的长阅读数据中填写组件的工具。
摘要 软骨鱼类是理解脊椎动物进化的基础,但其基因组研究不足。我们报告了鲸鲨基因组的长读测序,以生成迄今为止最佳的无缝软骨鱼类基因组组装,其重叠群连续性高于所有其他软骨鱼类基因组,并研究了祖先基因家族、免疫和巨人症的脊椎动物基因组进化。我们发现,在有颌脊椎动物的起源处,基因家族数量大幅增加,而与基因组复制无关。我们研究了脊椎动物病原体识别受体 (PRR),它们是启动先天免疫防御的关键,并发现了基因家族进化的多种模式,表明有颌动物的适应性免疫并没有完全取代种系编码的 PRR 创新。我们还在鲸鲨中发现了一种新的 Toll 样受体 (TLR29) 和三个 NOD1 拷贝。我们发现,与其他脊椎动物相比,软骨鱼类和巨型脊椎动物的基因组替换率有所降低,但巨型脊椎动物的基因家族扩张率各不相同,这表明脊椎动物基因组中基因家族的替换率和扩张率是脱钩的。最后,我们发现,在巨型脊椎动物中扩张率发生变化的基因家族富含人类癌症相关基因,这与巨人症需要适应来抑制癌症相一致。
受污染的奶酪,但这种物种越来越多地据报道,该物种越来越多地显示出高丙核麦克风的奶酪,这是人类侵入性感染的原因[4-6]。在这里,我们提供了从头基因组组装和临床D. catenulata型CBS565的注释。D. catenulata型CBS565在1926年是从一个痴呆症患者的粪便中分离出来的,当时居住在波多黎各[1]。基因组DNA提取。使用连接测序试剂盒(SQK-LSK109; ONT,UK,UK)和本机条形码套件(EXP-NBD114; ONT)进行连接测序试剂盒(SQK-LSK109; ONT)进行纳米孔测序文库制备。根据制造商的协议,将两个库运行到奴才流中心(Flo-Min106; ont)上。使用Guppy v5.0.16对原始的纳米孔读数进行了基础?B9FCD7B5B(ONT)使用设置 - 浮雕flo-min106-Kit SQK-LSK109-Barcode_kits exp-nbd114-device cuda:0,由消除电源和条形码放在同一软件中。使用参数-nano- raw \ fastq [ - uot-dir \ directory \ div> flye v2.9(https://github.com/ fenderglass/flye; [8])进行 de Novo基因组组装。使用GenomeQC评估了组装的基因组质量[9]。总基因组大小为14,464,696 bp,n50为2,438,920 bp,在9个重叠群上分配(范围为3,918,888-888-370,337 bp;
摘要:微生物技术在改进工业过程方面发挥着至关重要的作用,特别是在生产具有多种应用的化合物方面。在本研究中,我们使用生物信息学方法分析了链霉菌 MGMM6 的基因组结构,并确定了参与各种代谢途径的具有重大生物技术潜力的基因。基因组挖掘显示,MGMM6 由 6,932,303 bp 的线性染色体组成,G+C 含量高达 73.5%,缺乏任何质粒重叠群。在注释的基因中,预测有几个基因编码酶,例如染料过氧化物酶、芳香环开双加氧酶、多铜氧化酶、细胞色素 P450 单加氧酶和芳香环羟基化双加氧酶,这些酶负责生物降解多种内源性和外来污染物。此外,我们还鉴定了与重金属抗性相关的基因,例如砷、镉、汞、铬、碲、锑和铋,这表明 MGMM6 具有用于环境修复目的的潜力。对次生代谢物的分析表明,存在多个生物合成基因簇,这些基因簇负责产生具有强效抗菌和金属螯合活性的化合物。此外,在受控条件下进行的实验室测试表明,MGMM6 可有效抑制植物病原微生物,使废水中的芳香族三苯甲烷染料(尤其是 Blue Brilliant G250)脱色和降解,效果高达 98 ± 0.15%。总体而言,我们的研究结果凸显了 S. albidoflavus MGMM6 的生物技术潜力。