摘要 - CB2受体配体活性的准确预测是针对该受体的药物发现的关键,这与炎症,疼痛管理和神经退行性疾病有关。尽管传统的机器学习和深度学习技术已经显示出希望,但其有限的解释性仍然是理性药物设计的重要障碍。在这项工作中,我们介绍了CB2Former,该框架将图形卷积网络(GCN)与变压器体系结构相结合以预测CB2受体配体活动。通过利用变压器的自我发项机制以及GCN的结构学习能力,CB2Former不仅增强了预测性能,而且还提供了对受体活性基础分子特征的见解。我们针对各种基线模型进行基准测试,包括随机森林,支持矢量机,最近的邻居,梯度增强,极端梯度增强,多层感知器,卷积神经网络和重复的神经网络,并以0.685的0.685和0.685和0.67的0.67和0.67 and and and and and and and and and and and and and and and and 0.675,并表现出优势。此外,注意力重量分析揭示了影响CB2受体活动的关键分子子结构,强调了该模型作为可解释的AI的潜力。这种指出关键分子基序的能力可以简化虚拟筛选,指导铅优化和加快治疗性发育。总的来说,我们的结果展示了先进的AI方法(例如CB2Former)在提供准确的预测和可操作的分子见解方面的变革潜力,从而促进了药物发现中的跨学科合作和创新。
最近已经提出了动机的强大生成模型,但这些方法中很少有支持柔性蛋白质配体对接和亲和力估计。没有人可以直接对多种结合配体进行同时建模,也可以根据药理学相关的药物靶标进行严格的标准,从而阻碍了它们在药物发现工作中的广泛采用。 导致这项工作,我们提出了FlowDock,这是一种基于条件流量匹配的深几何生成模型,该模型学会了将其直接映射到其绑定的(Holo)对应物中,以将其映射到任意数量的结合配体中。 此外,Flowdock与其每种生成的蛋白质配体复杂结构中提供了预测的结构置信度评分和结合亲和力值,从而实现了新(多配体)药物目标的快速虚拟筛选。 对于常用的PoseBusters基准数据集,Flotdock使用Unbound(APO)蛋白质输入结构实现了51%的盲区对接成功率,而没有任何来自多个序列比对的信息,并且对于具有挑战性的新Dockgen-E数据集,FlotDock与单次序列Chai-1的性能相匹配。 此外,在第16个社区范围内的结构预测技术批判性评估(CASP16)的配体类别中,Flowdock在140种蛋白质配体复合物中的药理学结合亲和力估计的前5位方法中排名,证明了其在虚拟筛选中的学位表达的功效。没有人可以直接对多种结合配体进行同时建模,也可以根据药理学相关的药物靶标进行严格的标准,从而阻碍了它们在药物发现工作中的广泛采用。导致这项工作,我们提出了FlowDock,这是一种基于条件流量匹配的深几何生成模型,该模型学会了将其直接映射到其绑定的(Holo)对应物中,以将其映射到任意数量的结合配体中。此外,Flowdock与其每种生成的蛋白质配体复杂结构中提供了预测的结构置信度评分和结合亲和力值,从而实现了新(多配体)药物目标的快速虚拟筛选。对于常用的PoseBusters基准数据集,Flotdock使用Unbound(APO)蛋白质输入结构实现了51%的盲区对接成功率,而没有任何来自多个序列比对的信息,并且对于具有挑战性的新Dockgen-E数据集,FlotDock与单次序列Chai-1的性能相匹配。此外,在第16个社区范围内的结构预测技术批判性评估(CASP16)的配体类别中,Flowdock在140种蛋白质配体复合物中的药理学结合亲和力估计的前5位方法中排名,证明了其在虚拟筛选中的学位表达的功效。可用性和实现源代码,数据和预训练的模型可在https://github.com/ bioinfaramefaraminelearning/flowdock上找到。
Ashwin Dhakal 是密苏里大学哥伦比亚分校的计算机科学研究生。他的研究重点是分析和设计用于预测蛋白质-配体相互作用的机器学习模型。Cole McKay 是密苏里大学哥伦比亚分校的生物化学研究生。他的研究重点是未表征蛋白质结构域的结构和生物学功能。John J. Tanner 是密苏里大学哥伦比亚分校生物化学和化学系的教授。他的研究兴趣包括结构生物学、X 射线晶体学和酶。Jianlin Cheng 是密苏里大学哥伦比亚分校电气工程和计算机科学系的教授。他的研究重点是生物信息学和机器学习。收到日期:2021 年 8 月 5 日。修订日期:2021 年 9 月 28 日。接受日期:2021 年 10 月 15 日 © 作者 2021。由牛津大学出版社出版。这是一篇根据知识共享署名许可条款分发的开放获取文章(http://creativecommons.org/licenses/by/4.0/),允许在任何媒体中不受限制地重复使用、分发和复制,前提是正确引用原始作品。
摘要:金黄色葡萄球菌是一种常见的人类共生病原体,可引起多种传染病。由于抗生素耐药性的产生,病原体对越来越多的抗生素产生耐药性,从而产生了耐甲氧西林金黄色葡萄球菌 (MRSA) 甚至耐多药金黄色葡萄球菌 (MDRSA),即“超级细菌”。这种情况凸显了对新型抗菌药物的迫切需求。细菌转录负责细菌 RNA 的合成,是开发抗菌药物的有效但未充分利用的靶点。之前,我们报道了一类新型抗菌药物,称为 nusbiarylins,它通过中断两种转录因子 NusB 和 NusE 之间的蛋白质-蛋白质相互作用 (PPI) 来抑制细菌转录。在这项工作中,我们根据 nusbiarylins 的化学结构及其对金黄色葡萄球菌的活性开发了一种基于配体的工作流程。整合了基于配体的模型(包括药效团模型、3D QSAR、AutoQSAR 和 ADME/T 计算),并用于以下 ChemDiv PPI 数据库的虚拟筛选。结果,四种化合物(包括 J098-0498、1067-0401、M013-0558 和 F186-026)被鉴定为针对金黄色葡萄球菌的潜在抗菌剂,预测的 pMIC 值范围为 3.8 至 4.2。对接研究表明这些分子与 NusB 紧密结合,结合自由能范围为 -58 至 -66 kcal/mol。
简介 癌症的发展和转移很大程度上取决于癌细胞与环境的相互作用,包括巨噬细胞,巨噬细胞大量渗入肿瘤,通常预后不良 (1, 2)。巨噬细胞是一种特殊细胞,它不断巡逻和监控身体,以解决感染和清除垂死细胞。当检测到异常时,例如在伤口愈合期间,巨噬细胞会消灭入侵的微生物,协调免疫系统,促进和解决炎症,并支持细胞增殖和组织重塑 (3)。微环境中的因素驱使巨噬细胞向特殊细胞状态发展,其中两种极端状态被描述为促炎、经典激活的 M1 状态和抗炎、替代激活的 M2 状态 (4)。然而,多项研究表明,巨噬细胞存在于一系列细胞状态和功能中,它们在不同的激活状态之间振荡 (5)。同样在肿瘤中,巨噬细胞的表型也多种多样,它们支持或抑制肿瘤进展。肿瘤相关巨噬细胞 (TAM) 最初试图恢复肿瘤的正常结构,类似于经典的 M1 激活巨噬细胞 (6)。然而,肿瘤细胞分泌和蛋白水解释放某些细胞因子和生长因子,如集落刺激因子-1 (CSF-1) (7) 和白细胞介素-4 (IL-4) (8),会将 TAM 诱导为促肿瘤表型,具有许多与替代激活的 M2 巨噬细胞相同的特征。因此,TAM 可以支持肿瘤生长、转移和免疫逃避,并保护肿瘤细胞免受化疗 (9–11)。TAM 表型是促肿瘤还是抗肿瘤,取决于肿瘤的起源以及肿瘤微环境 (TME) 内的确切信号传导。
微生物产生天然产物作为对抗土壤微环境中竞争性微生物和捕食者的手段。现代医学利用这些天然化合物作为药物开发的生物活性剂。FK506 结合蛋白 (FKBP) 是一种催化顺反肽基脯氨酰异构化的酶,这是蛋白质折叠和功能过程中的关键步骤。FKBP 在真核生物中是保守的,可以结合天然产物形成复合物,抑制细胞内靶标,包括钙调磷酸酶、TOR 和着丝粒相关蛋白 CEP250。这些天然产物特异性地与普遍存在的 FKBP 结合,形成对其靶标具有高度特异性的蛋白质-药物复合物,这为开发 FK506(他克莫司)和雷帕霉素(西罗莫司)及其类似物(吡美莫司、依维莫司、替西罗莫司)铺平了道路,使其成为 FDA 批准的用于移植接受者、癌症化疗、皮肤病学和介入心脏病学的药物。此外,由于产生 FKBP12 配体的生物体居住在土壤中,天然产物可以在土壤中生存,这进一步说明了为什么这些配体具有开发为抗菌剂的潜力。本综述的目的是突出天然产物 FKBP12 配体的已知和未知靶标,以评估进展并进一步促进该领域的研究。
Luebbert* 1,3 , Annet EM Blom 5 , Bruce N. Cohen 1 , Jonathan S. Marvin 4 , Philip M. Borden 4 , Charlene H. Kim 1 , Anand K. Muthusamy 5 , Amol V. Shivange 1 , Hailey J. Knox 5 , Hugo Rego Campello 6 , Jonathan H. Wang 1 , Dennis A. Dougherty 5 , Loren L. Looger 4 , Timothy Gallagher 6 , Douglas C. Rees 5,7 , Henry A. Lester 1ª * 共同第一作者 1 加州理工学院生物与生物工程系
基于碎片的量子化学方法提供了一种避免电子结构计算的非线性缩放的方法,因此可以使用高级方法研究大型分子系统。在这里,我们使用碎片来计算具有数千个原子的系统中的蛋白质-配体相互作用能,使用一种用于管理基于碎片的计算的新软件平台,该平台实现了屏蔽多体展开。使用最小基半经验方法 (HF-3c) 进行的收敛测试表明,使用单残基碎片和简单氢帽的二体计算足以重现使用传统超分子电子结构计算获得的相互作用能,误差在 1 kcal/mol 以内,计算成本约为 1%。我们还表明,HF-3c 结果说明了密度泛函理论在增强四倍 ζ 质量的基组中获得的趋势。碎片化的战略部署有利于融合生物分子模型系统与高质量电子结构方法和基组一起使用,将从头算量子化学引入迄今为止难以想象的规模的系统。这将有助于为机器学习应用生成高质量的训练数据。
图1:提议的框架概述。该过程始于利用蛋白质氨基酸序列和配体微笑弦作为输入。构象采样过程包括迭代应用输入特征,更新残留特征并脱落等效,最终在其辅导的Cα蛋白质主链和配体配合物以及其辅导中产生了新型蛋白质序列。
图 2. 脉冲 EPR 回波检测场扫描 (EDFS) 的模拟取向依赖性。(A) 四方 Cu(II) 复合物的平行和垂直取向定义。(B) 模拟 Cu(II) EDFS 和组成超精细 m I 流形的取向依赖性,自旋哈密顿参数 g ∥ = 2.0912、g " = 2.0218、A ∥ = −500.1 MHz ( − 166.8 × 10 -4 cm -1 )、A " = −116.9 MHz ( − 39.0 × 10 -4 cm -1 )、ν = 9.7 GHz,取自实验 [Cu(mnt) 2 ] 2- CW EPR 光谱的拟合结果。 (C)模拟的 V(IV) EDFS 和自旋哈密顿参数 g ∥ = 1.9650、g " = 1.9863、A ∥ = −478.0 MHz ( − 159.4 × 10 -4 cm -1 )、A " = −167.8 MHz ( − 55.9 × 10 -4 cm -1 )、ν = 9.7 GHz 的方向依赖性,取自实验 VOPc CW EPR 光谱的拟合结果。黑色实线箭头表示 EDFS 中的纯平行方向,而红色实线箭头表示纯垂直方向。