1 美国农业部植物科学研究中心,美国明尼苏达州圣保罗 55108 2 明尼苏达大学植物精准基因组学中心,美国明尼苏达州圣保罗 55108 3 明尼苏达大学基因组工程中心,美国明尼苏达州圣保罗 55108 4 明尼苏达大学农学与植物遗传学系,美国明尼苏达州圣保罗 55108 5 马里兰大学植物科学与景观建筑系,美国马里兰州帕克分校 6 马里兰大学生物科学与生物技术研究所,美国马里兰州罗克维尔 7 植物发育激素控制实验室。生物科学系,高级农业学校“Luiz de Queiroz”,圣保罗大学,CP 09, 13418-900,皮拉西卡巴,圣保罗,巴西 8 马克斯普朗克分子植物生理学研究所,Am Muëhlenberg 1, 14476波茨坦戈尔姆,德国 9 Departamento de Biologia Vegetal,Universidade Federal de Vic¸osa,Vic¸osa,米纳斯吉拉斯州,CEP 36570-900,巴西
人们经常提到的一个事实是,到本世纪中叶,全球人口增长率可能会超过全球农业生产增长率。此外,全球各地的生产力差异很大,但农业的大部分负担却落在少数物种的栽培上,这些物种大多位于不同于其驯化起源地的地方,而且往往受到截然不同的环境条件的影响( Fernie 和 Yan,2019 年)。最近的技术发展——主要是下一代测序技术的可及性和可负担性的增强——已经使我们能够鉴定出 100 多个驯化基因( Fernie 和 Yan,2019 年)。其中许多基因,例如与碎裂性、种子大小和休眠丧失相关的基因,在我们的作物物种中都得到了保留( Gross 和 Olsen,2010 年; Lenser 和 Theissen,2013 年)。然而,其他基因似乎只针对某些作物或作物类型,例如果实形状的改变(Xiao 等人,2008 年)或块茎的进化(Cheng 等人,2016 年;Hardigan 等人,2017 年)。确定基因后,它们可用于从头驯化,即对很少栽培或尚未驯化的物种进行遗传改良。关键是要确定表现出特定期望特性的物种,例如更高的产量和肥料利用率
我们介绍 SPARC:用于从头算实空间计算的模拟包。SPARC 可以在静态和动态设置中对孤立系统(例如分子)以及扩展系统(例如晶体和表面)执行 Kohn-Sham 密度泛函理论计算。它安装/使用简单,与最先进的平面波代码具有很强的竞争力,在少数处理器上表现出可比的性能,并且随着处理器数量的增加而具有越来越大的优势。值得注意的是,SPARC 将大型并行计算机上具有 O(100-500)个原子的系统的求解时间缩短到几秒钟,比平面波同类产品高出一个数量级甚至更多。© 2021 作者。由 Elsevier BV 出版 这是一篇根据 CC BY-NC-ND 许可开放获取的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。
经过预先训练/微调,(1)根据生成器计算的概率,通过逐步采样 token 生成一批 SMILES;(2)这些有效的 223
1柔性电子学研究所(SIFE,FUTURE TECHNOGIES),FUJIAN柔性电子的主要实验室,福建师范大学和柔性电子海峡实验室(Slofe),富州,福建350117,中国。2福建师范大学物理与能源学院,富州,福建350117,中国。3功能纳米结构设计和组装的关键实验室,以及福建省纳米材料的省级主要实验室福吉安物质研究所,中国科学院,中国科学院,富士,富士,富士,中国350002。4 Xiamen稀土光电功能材料的主要实验室,Xiamen稀土材料研究所,海克西研究所,中国科学院,Xiamen 361021,中国。5物理,化学和生物学系(IFM),瑞典LinköpingLinköpingUniversity,瑞典。
由于长期阅读的DNA测序技术,可以进行复杂基因组的从头基因组组件。但是,基于长阅读的组件质量最大化是一项具有挑战性的任务,需要开发专门的数据分析技术。我们提出了用于组装单倍体和二倍体生物的长DNA测序读数的新算法。组件算法构建了一个无方向的图,每个读取两个顶点是根据由k-mer分布得出的哈希函数所指出的最小化器所读取的。在图形构造过程中收集的统计信息被用作通过选择边缘来构建布局路径的功能,该边缘通过似然函数排名。对于二倍体样品,我们整合了对RefHAP算法进行分子相分化的重新配置。我们在PACBIO HIFI和纳米孔测序数据上运行了从不同物种的单倍体和二倍体样品中采集的纳米孔测序数据。与当前使用的其他软件相比,我们的算法表现出竞争精度和计算效率。我们希望这种新的发展对于为不同物种建立基因组组件的研究人员将很有用。
(2)Zhavoronkov,A.;伊万年科夫,Y.A.; Aliper,A.;维谢洛夫,M.S.;弗吉尼亚州阿拉丁斯基;阿拉丁斯卡娅,A.V.;弗吉尼亚州 Terentiev;波利科夫斯基,D.A.;库兹涅佐夫医学博士;阿萨杜拉耶夫,A.;沃尔科夫,Y.; Zholus,A.;沙亚赫梅托夫,R.R.;热布拉克,A.;米娜耶娃,L. I.;扎格里别尔尼,文学士;李,L. H.;索尔,R.;玛奇,D.;幸,L.;郭,T.; Aspuru-Guzik,A.深度学习能够快速识别有效的 DDR1 激酶抑制剂。纳特。生物技术。 2019,37(9),1038–1040。 https://doi.org/10.1038/s41587-019-0224-x。
图 S1 。一般工作流程。左侧:使用小型数据集进行 TL 以聚焦 Prior(生成模型)的状态,随后将其用于具有自定义 MPO 目标的 RL。右侧:对生成模型的不同状态进行采样时化合物分布的示意图。A ) 一般 Prior 是在 ChEMBL 上训练的初始生成模型的状态。与其他状态相比,它生成给定 SMILES 字符串的概率分布更均匀。B ) 聚焦先验是生成模型的一种状态,在该状态下,它可以以比其他区域更高的概率生成某些化学空间区域。C ) 生成模型作为聚焦先验进入 RL,并在整个过程中导航化学空间以寻找高 MPO 分数区域。导航过程中获取的数据属于 MPO 得分较高的区域,可作为新颖想法的来源。
摘要在人类基因组中具有超过270个独特的发生,肽识别的PDZ结构域在调节极化,信号传导和传统途径中起着核心作用。PDZ结构域中的突变导致癌症和囊性纤维化等疾病,从而使PDZ结构域成为治疗干预的有吸引力的靶标。 D肽抑制剂作为治疗剂具有独特的优势,包括代谢稳定性提高和免疫原性。 在这里,我们介绍了DexDesign,这是一种基于鱼鹰的新型算法,用于计算设计从头D肽抑制剂。 dexDesign利用了三种新型技术,这些新技术广泛适用于计算蛋白设计:最小柔性集,基于K ∗的突变扫描和逆丙氨酸扫描。 我们应用这些技术和脱氧设计来生成两个生物医学上重要的PDZ域靶标的新型D肽抑制剂:CAL和MAST2。 我们引入了一个用于分析从头肽的框架 - 沿复制/恢复轴的评估 - 并将其应用于右启动生成的D肽。 值得注意的是,我们生成的肽被预测将其靶标比其靶标的内源配体结合,从而验证了肽的潜力作为铅抑制剂。 我们还提供了免费和开源计算蛋白设计软件Osprey中dexdesign的实现。PDZ结构域中的突变导致癌症和囊性纤维化等疾病,从而使PDZ结构域成为治疗干预的有吸引力的靶标。D肽抑制剂作为治疗剂具有独特的优势,包括代谢稳定性提高和免疫原性。在这里,我们介绍了DexDesign,这是一种基于鱼鹰的新型算法,用于计算设计从头D肽抑制剂。dexDesign利用了三种新型技术,这些新技术广泛适用于计算蛋白设计:最小柔性集,基于K ∗的突变扫描和逆丙氨酸扫描。我们应用这些技术和脱氧设计来生成两个生物医学上重要的PDZ域靶标的新型D肽抑制剂:CAL和MAST2。我们引入了一个用于分析从头肽的框架 - 沿复制/恢复轴的评估 - 并将其应用于右启动生成的D肽。值得注意的是,我们生成的肽被预测将其靶标比其靶标的内源配体结合,从而验证了肽的潜力作为铅抑制剂。我们还提供了免费和开源计算蛋白设计软件Osprey中dexdesign的实现。