3。ji,Y.,Zhou,Z.,Liu,H。&Davuluri,R。V. Dnabert:预先训练的双向编码器119来自Transformers模型的DNA语言中DNA语言的表示。生物信息学37,120 2112–2120(2021)。121
许多生物学实体在内,包括细菌,古细菌,质粒,噬菌体和其他病毒都可以具有圆形基因组。一旦组装,圆形基因组序列表示为线性字符串,并以某种方式标记,以表明其应为圆形。线性序列开始的点是随机的,这是由于从测序读取中组装基因组时使用的算法的性质。这种任意的起点会影响下游基因组注释和分析。它们可能发生在编码序列(CD)中,可能会破坏移动遗传因素(如预言)的预测潜力,并难以基于基因顺序进行pangenome分析。因此,通常需要将微生物序列重新定向,以从某些基因开始:细菌染色体的DNAA染色体复制引发剂基因,质粒的RepA质粒复制起始基因和TERL大型末端末端基因酶基因的细菌亚nunit基因的细菌属基因。在这里,我们提出了DNAAPLER,这是一种柔性微生物序列的重新定向工具,可快速,一致地取向圆形微生物基因组,例如细菌,质粒和噬菌体。Dnaapler在github上托管在github.com/gbouras13/dnaapler上。
这项研究的目的是开发纯化样品中AAV病毒基因组的DDPCR方案。未包装的污染物DNA,以及其他来自生产质粒和/或细胞系中的DNA,需要在准确量化病毒基因组之前被消除。我们测试了几个方案,以便它们去除未包装的DNA的能力,同时保持准确的包装病毒基因组滴度。为此,我们将质粒DNA刺激到纯化的AAV2载体中,并评估了以下样品处理条件:(a)仅与DNasei孵育; (b)DNAsei孵育,然后再灭活,72°C热灭活,蛋白酶K处理,最后95°C热灭活; (c)与条件B相同,但在72°C而不是95°C(d)无样品预处理时进行最终热灭活。质粒和AAV基因组拷贝通过双链DDPCR(QX200液滴数字PCR系统,Bio-Rad)量化。与条件D相反,在未进行样品处理的情况下,与条件A和C条件A和C相比,在条件B和条件B中观察到较低的AAV2 VG滴度的趋势在条件A,B和C中未检测到质粒DNA(图1)。有趣的是,在条件A和C中都会发现可比较的VG滴度。在重复使用纯化的AAV9实验时,进行了类似的观察结果。
绣球花属属于绣球花科,属于开花植物山茱萸目,该目早期在菊科中分化,包括几种常用的观赏植物。其中,大叶绣球是苗圃贸易中最有价值的物种之一,但这种作物或密切相关的菊科物种的基因组资源很少。绣球花品种“Veitchii”和“Endless Summer”的两个高质量单倍型解析参考基因组[最高品质为 2.22 千兆碱基对 (Gb)、396 个重叠群、N50 22.8 兆碱基对 (Mb)]被组装并支架到预期的 18 条假染色体中。利用新开发的高质量参考基因组以及其他相关开花植物的高质量基因组,发现核数据支持菊科植物演化支中的单个分歧点,其中山茱萸目和杜鹃花目均与真菊科植物分化。使用 F 1 杂交种群进行基因作图证明了连锁作图与新基因组资源相结合的强大功能,可以识别位于 4 号染色体上的花序形状基因 CYP78A5 和位于 17 号染色体上的导致重花的新基因 BAM3。本研究开发的资源不仅有助于加速绣球花的遗传改良,还有助于了解最大的开花植物群——菊科植物。
创作者的创作者(S)Ana S. A. Cohen,Emily G. Farrow,Ahmed Abdelmoity,Joseph Alaimo,Shivarajan Manickavasavasagam Amudhavalli,John Anderson,Lalit R. Bansal,Lauren E. ,Shreyasee Chakraborty,Warren A. Cheung,Keith A. Coffman,Ashley M. Cooper,Laura A. Cross,Tom Curran,Thuy Tien T. Dang,Mary M. Elfrink,Kendra Engleman,Erin Day Fecske,Erin Day Fecske,Cynthia Fieser,Cynthia Fieser,Keely M. Fitzgerald,Emily Flemgar,Randi N. jenn n. jenn Et Gibson,Jeffrey Goldstein,Elin Grundberg,Kelsee Halpin,Brian S. Harvey,Bryce Heese,Wendy Hein,Suzanne M. Herd,Susan Starling Hughes,Mohammed Ilyas,Jill Jacobson,Janda L. Jenkins,Shao Jiang,Jeffrey J. Johnston,Kathryn Keeler,Jonas Korlach,Jonas Korlach,Jonnifer ,Michael Lypka,Brittany D. McDonald,Neil Miller,Ann Modrcin,Annapoorna Nair,Shelby H. Neal,Christopher M. Oermann,Donna M. Pacicca,Kailash Pawar,Nyshele L. Ol J. Saunders,Caitlin Schwager,Richard M. Schwend,Elizabeth Shaffer,Craig Smail,Sarah E. Soden,Meghan Strenk,Bonnie Sullivan,Brooke Sweeney、Jade B. Tam-Williams、Adam Walter、Holly Welsh、Aaron M. Wenger、Laurel K. Willig、Yun Yan、Scott T. Younger、Dihong Zhou、Tricia N. Zion、Isabelle Thiffault 和 Tomi Pastinen
角菜属(Cerastium alpinum)约有 200 个物种,主要分布在北半球的温带气候中。我们在此报告了角菜(Cerastium alpinum)、北极角菜(C. arcticum)和黑色角菜(C. nigrescens)的完整叶绿体基因组。cp 基因组长度范围为 147,940 至 148,722 bp。它们的四部分环状结构具有相同的基因组织和内容,包含 79 个蛋白质编码基因、30 个 tRNA 基因和 4 个 rRNA 基因。每个物种的重复序列从 16 到 23 个不等,回文重复最为常见。每个物种已鉴定的 SSR 数量范围为 20 到 23 个,它们主要由含有 A/T 单元的单核苷酸重复组成。根据 Ka/Ks 比率值,大多数基因受到纯化选择。新测序的叶绿体基因组具有高频率的 RNA 编辑特征,包括 C 到 U 和 U 到 C 的转换。基于 71 个蛋白质编码基因的序列,重建了 Cerastium 属和石竹科内的系统发育关系。系统发育树的拓扑结构与所研究物种的系统位置一致。Cerastium 属的所有代表都聚集在一个分支中,而 C. glomeratum 与其他分支的相似性最小。
四个子属(Monogynella,Pachystigma,Cuscuta和Grammica)。C.上皮和欧洲梭菌是库斯库塔亚属的成员。他们缺乏一个红外区域,有两个反转。此外,23种库斯库塔物种的叶绿体基因组及其基因组成的长度有很大的变化。大多数还原的叶绿体基因组失去了几种光合基因(NDH,RPO,PSA,PSB,PSB,PET和RBCL),因此逐渐降低了其光合作用的能力。这项研究不仅会发现可应用的潜在分子标记物,以识别属于四个亚属的物种,还可以指导
AU:请确认所有标题级别均正确表示:随着全球人口增长和气候变化,作物生产正变得越来越具有挑战性。现代栽培作物品种是根据最佳生长环境下的生产力进行选择的,并且经常会丢失可能使它们适应多样化且现在迅速变化的环境的遗传变异。这些遗传变异通常存在于其最接近的野生亲属中,但不太理想的性状也是如此。如何保存和有效利用作物野生亲属提供的丰富遗传资源,同时避免有害变异和适应不良的遗传贡献,是持续改良作物的核心挑战。本文探讨了这一挑战以及可能找到解决方案的潜在途径。
图1 五种机器学习算法在训练集上的预测结果注:SVM:支持向量机算法,CTree:条件推理树算法,Decision_tree:决策树算法,Naive_Bayes:朴素贝叶斯算法,Random_Forest:
© 作者 2023。开放存取 本文根据知识共享署名 4.0 国际许可进行授权,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可的链接,并指明是否做了更改。 本文中的图片或其他第三方资料包含在文章的知识共享许可中,除非资料的致谢中另有说明。 如果资料未包含在文章的知识共享许可中,且您的预期用途不被法定规定允许或超出允许用途,则需要直接从版权所有者处获得许可。 要查看此许可证的副本,请访问 http://creativecommons.org/licenses/by/4.0/。知识共享公共领域贡献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非数据来源中另有说明。