© 作者 2023。开放存取 本文根据知识共享署名 4.0 国际许可进行授权,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可的链接,并指明是否做了更改。 本文中的图片或其他第三方资料包含在文章的知识共享许可中,除非资料的致谢中另有说明。 如果资料未包含在文章的知识共享许可中,且您的预期用途不被法定规定允许或超出允许用途,则需要直接从版权所有者处获得许可。 要查看此许可证的副本,请访问 http://creativecommons.org/licenses/by/4.0/ 。知识共享公共领域贡献豁免(http://creativeco mmons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非数据来源中另有说明。
。CC-BY 4.0国际许可证。是根据作者/资助者提供的预印本(未经同行评审认证)提供的,他已授予Biorxiv的许可证,以在2024年2月19日发布的此版本中在版权所有者中显示预印本。 https://doi.org/10.1101/2022.11.15.516472 doi:Biorxiv Preprint
摘要 - 计算pangenomics是一种新兴领域,使用图形结构封闭多个基因组研究遗传变异。可视化Pangenome图对于理解基因组多样性至关重要。然而,由于图布局过程的高计算需求,处理大图可能具有挑战性。在这项工作中,我们对最先进的pangenome图布局算法进行了彻底的性能特征 - 揭示了显着的数据级并行性,这使GPU成为计算加速度的有前途的选项。但是,不规则的数据访问和算法的内存性质具有重大障碍。为了克服这些挑战,我们开发了一种实施三个关键优化的解决方案:对缓存友好的数据布局,合并的随机状态和经纱合并。另外,我们提出了一个定量度量标准,用于可扩展对Pangenome布局质量的评估。对24个人类全染色体pangenomes进行了评估,我们的基于GPU的解决方案在没有布局的质量损失的情况下,在the-Art MultineReaded CPU基线上实现了57.3倍的速度,从而将执行时间从数小时减少到数分钟。索引术语 - Pangenomics,生物信息学,图形布局,GPU加速度
摘要:在过去十年中,由于基因组测序技术、组装算法和计算基因组学的进步,豆科植物基因组学研究发生了范式转变,这些进步使得构建主要豆科作物的高质量参考基因组组装成为可能。这些进步无疑促进了对许多豆科作物农艺重要性状背后的新遗传变异的鉴定。此外,这些强大的测序技术使我们能够使用“泛基因组分析”研究多个个体和物种水平的整个基因组的结构变异。本综述更新了构建各种豆科作物泛基因组组装的进展,并讨论了这些泛基因组的前景以及如何利用这些信息通过分子育种来改善各种具有经济重要性的性状,以增加豆科植物的遗传增益并应对日益严重的全球粮食危机。
Murukarthck Jayakodi 1,31,34 , Qiongxian Luke 2,3,34 , M. Timothy Rabanus-Wallace 1,34 , Micha Bayer 4 , Thomas Lux 5 , Benjamin Jaegle 6 , Wubishet Bekele 9,32 , Brett Chavang 10 , Boyke jørgensen 2 , Jia-wu Febig 1 , Anne Fiebig 1 , Hedrun Gundlach 5 , Georg Ha Berer 5 , Mats Hansson 13 , Axel HimMelbach 1 , iris Hoffe 1 , Robert 1 , Haifei Hu 12,14 , Sachiko Isobe 15 , Sandic M. Kale 2,33 6 , Manuela KNAAFT 1 , Simon G. Krattinger 17 , Jochen Kumlehn 1 , Chengdao Li 12,18,19 , Marone 1 , Andreas Maurer 20 , Klaus F. X. Mayer 1 , 22 , Emiko Murozuka 20 , Pierre A. Pierre A. 24 ro sato 15,27 , danta schüler 1 , Thomas Schmutzer , Uwe Scholz 1 , Miriam Schreiber 4 n 2 , Josquin F. TIBBTS 16 , Martin Toft Simmelsgard Nielsen 2 , Cynthia Voss 2 , Penghao Wang 12 , Robbie Waught 12 n 2 , Runxuan Zhang 4 , Xiao-Qi Zhang 12 , Thomas Wicker 6 ✉ , Christophy Dockter 2 ✉ , Martin Mascher 1,30 ✉ & Nils Stein 1,20 ✉
Pangenome参考文献通过存储一组代表性的单倍型及其对齐方式来解决参考基因组的偏见,通常是作为图形。由变体呼叫者确定的备用等位基因可用于构造pangenome图,但是长阅读测序的进步导致广泛可用的高质量的分阶段组件。直接从组件中构造pangenome图,而不是变体调用,它利用该图在不同尺度上表示变化的能力。在这里,我们介绍了直接从全基因组比对创建pangenomes的Mimigraph-Cactus pangenome管道,并证明了其从人类Pangenome参考联盟中扩展到90个人类单倍型的能力。该方法构建包含所有形式的遗传变异的图形,同时允许使用当前的映射和基因分型工具。我们衡量用于分析的参考基因组的质量和完整性的效果,并表明,使用端粒到三聚体联盟的CHM13参考可以提高我们方法的准确性。我们还展示了果蝇的构造Melanogaster Pangenome。
基因组序列的可用性的增加,突显了我们单个参考基因组以表示物种内部多样性的局限性。pangenomes,涵盖了来自多个基因组的基因组信息,因此对二种情况的多样性进行了更稳定的代表。然而,图形形式的pangenomes通常缺乏注释信息,这限制了其对正向分析的效用。我们在这里介绍Grannot,该工具是通过将现有注释从源基因组投射到图表,然后随后转移到其他嵌入式基因组的工具,该工具专为使用此类图的效率和可靠的注释传输。Grannot针对的是大米,Human和E. coli的Pangenome图和线性基因组的最新工具进行了基准测试。结果表明,Grannot在准确性或速度方面是共识,保守和快速,超过基于对准的方法,或两者兼而有之。它提供了提供信息的输出,例如基因的存在 - 缺乏矩阵,以及源和靶基因组之间传递特征的比对,有助于研究杂物变化和进化。grannot的鲁棒性和不同物种的可复制性使其成为增强pangenome分析的宝贵工具。Grannot可在https://forge.fr/diade/dynadiv/grannot的GNU GPLV3许可下获得。
。cc-by-nc-nd 4.0国际许可证(未获得同行评审证书)获得的是作者/资助者,他已授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本于2024年4月2日发布。 https://doi.org/10.1101/2024.03.14.585029 doi:Biorxiv Preprint
。cc-by-nc-nd 4.0国际许可证未通过同行评审获得证明)是作者/资助者,他已授予Biorxiv授予Biorxiv的许可,以永久显示预印本。它是此预印本的版权持有人(该版本发布于2024年4月1日。; https://doi.org/10.1101/2024.03.27.583983 doi:biorxiv Preprint
我们研究了1C进化枝中植物疫霉及其近亲的进化史。我们使用了来自1C进化枝中69个植物菌属分离株的整个基因组序列数据,并进行了一系列基因组分析,包括核苷酸介入性评估,最大似然树,网络评估,最新共同祖先和迁移分析的时间。我们始终确定了两种墨西哥植物疫霉菌的明显且后来的分歧,第1页。mirabilis和p。ipomoeae,来自p。Infestans和其他1C进化枝种。phytophthora Infestans与来自南美的其他1C进化枝种类表现出较新的分歧。Andina和p。 betacei。 在1C进化枝中的形成和p的演变。 Infestans发生在安第斯山脉中。 p。 Andina – p。 betacei – p。 Infestans形成了一个物种复合物,具有模糊的物种边界,物种之间的杂交以及与共同血统的短时间。 更重要的是,现代墨西哥和南美p之间的区别。 Infestans证明较少离散,表明随着时间的推移,人群之间的基因流动。 混合分析表明,这些人群之间存在复杂的关系,暗示了这些区域之间的潜在基因流动。 历史p。 从1845 - 1889年收集的 Infestans是第一个与所有其他p分歧的人。 Infestans人群。 现代南美人口下一步,墨西哥人口以后的血统。 Infestans。Andina和p。betacei。在1C进化枝中的形成和p的演变。Infestans发生在安第斯山脉中。p。Andina – p。 betacei – p。 Infestans形成了一个物种复合物,具有模糊的物种边界,物种之间的杂交以及与共同血统的短时间。 更重要的是,现代墨西哥和南美p之间的区别。 Infestans证明较少离散,表明随着时间的推移,人群之间的基因流动。 混合分析表明,这些人群之间存在复杂的关系,暗示了这些区域之间的潜在基因流动。 历史p。 从1845 - 1889年收集的 Infestans是第一个与所有其他p分歧的人。 Infestans人群。 现代南美人口下一步,墨西哥人口以后的血统。 Infestans。Andina – p。betacei – p。Infestans形成了一个物种复合物,具有模糊的物种边界,物种之间的杂交以及与共同血统的短时间。更重要的是,现代墨西哥和南美p之间的区别。Infestans证明较少离散,表明随着时间的推移,人群之间的基因流动。混合分析表明,这些人群之间存在复杂的关系,暗示了这些区域之间的潜在基因流动。历史p。Infestans是第一个与所有其他p分歧的人。Infestans人群。现代南美人口下一步,墨西哥人口以后的血统。Infestans。两个人群均来自历史p。基于p的发散时间。来自其最亲密的亲戚的Infestans,p。Andina和p。 Betacei在安第斯山脉地区,我们认为安第斯山脉是p的原产地。 Infestans,现代全球化有助于p之间的混合。 今天来自墨西哥,安第斯山脉和欧洲的人口。Andina和p。Betacei在安第斯山脉地区,我们认为安第斯山脉是p的原产地。 Infestans,现代全球化有助于p之间的混合。 今天来自墨西哥,安第斯山脉和欧洲的人口。Betacei在安第斯山脉地区,我们认为安第斯山脉是p的原产地。Infestans,现代全球化有助于p之间的混合。今天来自墨西哥,安第斯山脉和欧洲的人口。今天来自墨西哥,安第斯山脉和欧洲的人口。