2. Ikemura N、Taminishi S、Inaba T、Arimori T、Motooka D、Katoh K、Kirita Y、Higuchi Y、Li S、Suzuki T、Itoh Y、Ozaki Y、
管道。在这方面,评估药物靶标结合能力 (DTA) 的计算方法非常有趣 4,因为 DTA 通常被认为是预测药物效果的最佳指标之一。准确预测 DTA 对于筛选出低效分子并防止其进入临床试验至关重要,因此近年来开发了大量计算 DTA 技术。最准确的 DTA 计算估计可以通过原子分子动力学模拟(经典、量子或混合)与计算配体结合自由能的现代技术之一相结合获得。5 然而,准确性是以非常高的计算需求为代价的,这使得这些方法通常不适用于大规模虚拟筛选。这就是为什么在现代药物发现中估计 DTA 的常用方法是分子对接,它在准确性和计算效率之间提供了合理的折衷。 6 然而,人们普遍认为,分子对接中使用的经验评分函数已经接近实际的准确度极限,如果不引入额外的计算负担,这一极限不太可能得到改善。为了解决这些缺点,开发了用于确定 DTA 的经典机器学习 (ML) 方法。这些方法不依赖于计算目标蛋白质和配体之间的物理相互作用。它们纯粹基于知识,依赖于类似配体倾向于
摘要:准确预测药物-靶标结合亲和力 (DTA) 是药物发现中的一项关键任务。大多数传统的 DTA 预测方法都是基于模拟的,这严重依赖于领域知识或具有靶标的 3D 结构的假设,而这些知识通常很难获得。同时,传统的基于机器学习的方法应用各种特征和描述符,并且仅仅依赖于药物-靶标对之间的相似性。最近,随着可用的亲和力数据的增加和深度表示学习模型在各个领域的成功,深度学习技术已应用于 DTA 预测。然而,这些方法考虑了标签/独热编码或分子的拓扑结构,而没有考虑氨基酸和 SMILES 序列的局部化学背景。基于此,我们提出了一种新颖的端到端学习框架 DeepGS,该框架使用深度神经网络从氨基酸和 SMILES 序列中提取局部化学背景,以及从药物中提取分子结构。为了协助对符号数据的操作,我们建议使用先进的嵌入技术(即 Smi2Vec 和 Prot2Vec)将氨基酸和 SMILES 序列编码为分布式表示。同时,我们提出了一种在我们的框架下运行良好的新分子结构建模方法。我们进行了大量的实验,将我们提出的方法与最先进的模型(包括 KronRLS、SimBoost、DeepDTA 和 DeepCPI)进行了比较。大量的实验结果证明了 DeepGS 的优越性和竞争力。
ErbB 受体家族(包括 EGFR 和 HER2)在细胞生长和存活中起着至关重要的作用,并与乳腺癌和肺癌等各种癌症的进展有关。在本研究中,我们开发了一个深度学习模型,使用基于 SMILES 表示的分子指纹来预测 ErbB 抑制剂的结合亲和力。每种 ErbB 抑制剂的 SMILES 表示均来自 ChEMBL 数据库。我们首先从 SMILES 字符串生成 Morgan 指纹,并应用 AutoDock Vina 对接来计算结合亲和力值。根据结合亲和力过滤数据集后,我们训练了一个深度神经网络 (DNN) 模型来根据分子指纹预测结合亲和力值。该模型取得了显著的性能,训练集上的均方误差 (MSE) 为 0.2591,平均绝对误差 (MAE) 为 0.3658,R 平方 (R²) 值为 0.9389。尽管在测试集上性能略有下降(R² = 0.7731),但该模型仍然表现出强大的泛化能力。这些结果表明深度学习方法对于预测 ErbB 抑制剂的结合亲和力非常有效,为虚拟筛选和药物发现提供了宝贵的工具。
准确预测硅中的药物目标亲和力(DTA)对于现代药物发现至关重要。在药物开发的早期阶段应用的DTA预测的计算方法,能够大大降低其成本。最近提出了基于机器学习的广泛方法进行DTA评估。它们最有前途的是基于深度学习技术和图形神经网络来编码分子结构。Alphafold做出的蛋白质结构预测的最新突破使得无前前数量的蛋白质,而没有实验定义的结构可用于计算DTA预测。在这项工作中,我们提出了一种新的深度学习DTA模型3DPROTDTA,该模型与蛋白质的图表结合使用了Alphafold结构预测。该模型优于其在通用基准数据集上的竞争对手,并且具有进一步改进的潜力。
免疫球蛋白 G (IgG) 的亲和力被定义为其与靶抗原的结合强度。由于 IgG 反应的亲和力成熟,亲和力也在成熟。因此,急性感染的特征是低亲和力 IgG,而过去的感染通常与高亲和力 IgG 有关。亲和力成熟也是最佳疫苗接种的结果。亲和力已被证明在许多微生物系统中的保护性体液免疫中发挥着重要作用。严重急性呼吸综合征冠状病毒 2 (SARS-CoV-2) 感染后,情况与其他病毒感染不同,因为大多数感染病例达到的中等亲和力与仅接种一次疫苗后达到的亲和力相似。相比之下,两次接种疫苗会导致大多数接种疫苗的个体对病毒刺突蛋白 S1 (S1) 的 IgG 亲和力高得多。因此,似乎两次接种疫苗比自然感染允许更长的亲和力/亲和力成熟。两次接种疫苗后亲和力成熟的程度各不相同。第三次接种疫苗可以进一步增强亲和力成熟程度。完整的亲和力成熟似乎取决于成熟过程中抗原的持续可用性。令人担忧的变异似乎增加了其受体结合域 (RBD) 对血管紧张素转换酶 2 (ACE2) 的亲和力和/或降低了对中和抗体的敏感性。经典的中和试验不一定反映中和 IgG 的亲和力,因为它们在操作上将 S1 和 IgG 之间的结合反应与 S1 与 ACE2 的结合区分开来。这种方法淡化了 IgG 和 ACE 之间对 S1 的 RBD 的关键竞争反应。定量亲和力测定可能是定义接种疫苗后仅具有次优保护性免疫力的个体的重要工具,因此可能受益于额外的加强免疫。
药物-靶标结合亲和力预测在药物发现的早期阶段起着重要作用,可以推断新药与新靶标之间相互作用的强度。然而,以前的计算模型的性能受到以下缺点的限制。药物表示的学习仅依赖于监督数据,而没有考虑分子图本身所包含的信息。此外,大多数以前的研究倾向于设计复杂的表示学习模块,而忽略了用于衡量表示质量的均匀性。在本研究中,我们提出了GraphCL-DTA,一种用于药物-靶标结合亲和力预测的具有分子语义的图对比学习。在GraphCL-DTA中,我们设计了一个针对分子图的图对比学习框架来学习药物表示,从而保留了分子图的语义。通过该图对比框架,可以在不需要额外监督数据的情况下学习更本质、更有效的药物表示。接下来,我们设计了一个新的损失函数,可直接用于平滑地调整药物和靶标表示的均匀性。通过直接优化表示的均匀性,可以提高药物和靶标的表示质量。在KIBA和Davis两个真实数据集上验证了上述创新元素的有效性。GraphCL-DTA在上述数据集上的优异表现表明了其优于当前最佳模型。
*通讯作者:tk.kozai@pitt.edu 1 Department of Bio Granginesering,匹兹堡大学,美国宾夕法尼亚州匹兹堡大学,美国宾夕法尼亚州匹兹堡认知神经基础,美国宾夕法尼亚州匹兹堡,美国宾夕法尼亚州匹兹堡,宾夕法尼亚州宾夕法尼亚州匹兹堡3号合作模型和仿真PHD计划美国宾夕法尼亚州宾夕法尼亚州公园,美国宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州6华盛顿大学的美国宾夕法尼亚州匹兹堡市匹兹堡市匹兹堡市匹兹堡大学再生医学研究所10MCGOWAN 11NEUROTECH CENTER,匹兹堡脑研究所,美国宾夕法尼亚州匹兹堡大学,
摘要:严重急性呼吸综合症冠状病毒2(SARS-COV-2)引起的冠状病毒疾病2019年(COVID-19)是全球健康紧急情况。主要蛋白酶(M Pro)对于冠状病毒的生命周期至关重要。boceprevir是SARS-COV-2 M Pro的潜在抑制剂和药物候选者。在这项研究中,研究了M PRO的蛋白质结构的变化,这是由于SARS-COV-2突变以及这些变化对Boceprevir亲和力的影响(重要的潜在治疗剂)。用RDP4和Megax分析了突变。通过Promod3产生了突变M Pro的三维模型。定性模型能量分析,下原和或而者是用于野生型和突变体M蛋白的结构验证和建模。使用I-Tasser TM得分计算野生型和突变体M Pro的拓扑差异。使用Autodock 4.2进行分子对接。使用Dynomics创建了功能动态结构模型。在SARS-COV-2的M Pro中检测到了七个突变(L89F,K90R,P108,A191V,T224A,A234V和S254F)。突变导致潜在的蛋白酶抑制剂Boceprevir的亲和力降低。Boceprevir停靠到M Pro的活性位点,对于野生型和突变体而言,结合能分别为-10.34和-9.41 kcal.mol -1。通过弹性网络模型分析计算的Debye – Waller因子分别为0.58和0.64Å2,野生型M Pro和Mutant M Pro分别为0.58。是SARS-COV-2的重要药物靶标的结构中的突变可能会使现有的治疗疗法无效。