冠状病毒会引发严重的上呼吸道感染,并可能扩散到肺部。核衣壳蛋白 (N 蛋白) 在 SARS-CoV-2(引起 COVID-19 的病毒)和其他冠状病毒的基因组复制、转录和病毒体组装中起着重要作用。糖原合酶激酶 3 (GSK3) 活化会使病毒 N 蛋白磷酸化。为了对抗 COVID-19 和未来的冠状病毒疫情,干扰 N 蛋白对 GSK3 的依赖性可能是一种可行的策略。为此,本研究旨在构建强大的机器学习模型,使用定量结构-活性关系方法从食品和药物管理局批准和研究药物库中识别 GSK3 抑制剂。从 ChEMBL 数据库获取了一个非冗余数据集,其中包含 495 种和 3070 种 GSK3 a 和 GSK3 b 化合物。使用 12 组分子描述符来定义这些抑制剂,并使用 LazyPredict 包选择机器学习算法。采用直方图梯度提升算法和轻梯度提升机算法建立预测模型,并根据均方根误差和 R 平方值进行评估。最后,根据最高预测活性(半最大抑制浓度的负对数,pIC 50 值)选择前两种药物(selinexor 和 ruboxistaurin)进行分子动力学模拟,以进一步研究蛋白质-配体复合物的结构稳定性。这种基于人工智能的虚拟高通量筛选方法是加速药物发现和寻找新药理靶点的有效策略,同时可降低成本和时间。
摘要简介:这项研究的主要目的是确定开发有效KEAP1抑制剂的潜在潜在客户。方法:在当前的研究文章中,已采用了硅内方法来发现潜在的KEAP1抑制剂。3D-QSAR是使用具有IC 50的KEAP1抑制剂的Chembl数据库生成的。选择了最好的药理,以筛选三个不同的文库,即Asinex,Minimaybridge和锌。从数据库中筛选的分子通过可药物性规则和分子对接研究过滤。对接研究后获得的最佳结合分子通过二利方法对测定物理化学性质进行毒性进行。通过分子动态模拟,研究了最佳的命中以在KEAP1腔中进行稳定。结果:分别对不同数据库进行虚拟筛选,并获得了三个导线。这些铅分子asinex 508,minimaybridgehts_01719和锌0000952883在KEAP1腔中显示出最好的结合。铅的结合复合物的分子动态模拟支持对接分析。铅(Asinex 508,minimaybridgehts_01719和锌0000952883)在100 NS模拟的KEAP1结合腔中稳定,平均RMSD值分别为0.100、0.114和0.106 Nm。结论:这项研究提出了三个铅分子作为基于高吞吐量筛查,对接和MD模拟研究的潜在KEAP1抑制剂。这些HIT分子可用于进一步设计和开发KEAP1抑制剂。这项研究提供了用于发现新型KEAP1抑制剂的初步数据。它为药物化学家打开了新的途径,以探索针对KEAP1-NRF2途径的抗氧化剂刺激分子。
摘要 多重耐药性鲍曼不动杆菌感染带来的全球挑战刺激了新治疗策略的发展。我们报道外膜蛋白 W(OmpW)是鲍曼不动杆菌的潜在治疗靶点。本文使用从 ChEMBL 数据集生成的定量结构-活性关系 (QSAR) 模型对 11,648 种天然化合物库进行初步筛选,该数据集包含 >7,000 种化合物,并报告了它们对鲍曼不动杆菌的最低抑菌浓度 (MIC) 值,然后对 OmpW 进行基于结构的虚拟筛选。进行了计算机药代动力学评估以评估这些化合物的药物相似性。发现排名最高的十种化合物的结合能量得分范围为 -7.8 至 -7.0 kcal/mol,其中大多数属于姜黄素类化合物。为了验证这些发现,我们使用微量稀释和时间-杀灭曲线测定法,对一种表现出良好结合稳定性和药代动力学特性的先导化合物——脱甲氧基姜黄素——进行了针对一组鲍曼不动杆菌菌株的测试,以确定其抗菌活性。为了验证该化合物是否与选定的靶标结合,研究了一种 OmpW 缺陷型突变体并将其与野生型进行了比较。我们的结果表明,脱甲氧基姜黄素单一疗法和与粘菌素联合使用对所有鲍曼不动杆菌菌株均有效。最后,发现该化合物可显著降低鲍曼不动杆菌与宿主细胞的相互作用,表明其具有抗毒力特性。总之,这项研究证明了机器学习是一种有前途的策略,可用于发现姜黄素类化合物作为对抗鲍曼不动杆菌感染的抗菌剂。
摘要:铁 (Fe) 螯合药物和组蛋白去乙酰化酶 (HDAC) 抑制剂是治疗遗传性弗里德赖希共济失调的两种选择,已被证明可以改善临床结果 (FA)。Fe 螯合分子可以最大限度地减少储存的 Fe 量,而 HDAC 抑制剂可以促进 Frataxin (FXN) 基因的表达,从而增强 FA。本文报告了从 ChEMBL 数据库中对抑制剂进行完整的定量构效关系 (QSAR) 搜索,其中包括 437 种 Fe 螯合化合物和 1,354 种 HDAC 抑制剂化合物。为了进一步研究,选择 IC50 作为生物活性单位,经过数据细化,最终生成了 436 种 Fe 螯合化合物和 1,163 种 HDAC 抑制化合物的数据集。使用随机森林 (RF) 技术生成模型(训练 R 2 得分分别为 0.701 和 0.892;测试 R 2 得分分别为 0.572 和 0.460,分别针对 Fe 和 HDAC)。使用 PubChem 指纹创建的模型是 12 种指纹类型中最强的;因此选择该特征进行解释。结果显示了与含氮官能团(PubchemFP656 的 SHAP 值为 -0.29)和芳香环(PubchemFP12 的 SHAP 值为 -0.16)相关的特性的重要性。因此,我们解释了分子指纹对模型的影响以及对可用于人工智能 FA (XAI) 的潜在药物的影响,这可以通过 SHAP(Shapley 加法解释)值来解释。模型脚本和指纹识别方法也可在 https://github.com/tissueandcells/XAI 获得。关键词:可解释人工智能、弗里德赖希共济失调、预测准确性、定量构效关系、QSAR、Shapley 值。
摘要背景:药物-靶标相互作用 (DTI) 对于药物重新利用和阐明药物机制至关重要,它们收集在大型数据库中,例如 ChEMBL、BindingDB、DrugBank 和 DrugTargetCommons。然而,提供这些数据的研究数量(约 0.1 百万)可能仅占 PubMed 上包含实验性 DTI 数据的所有研究的一小部分。查找此类研究并提取实验信息是一项艰巨的任务,迫切需要机器学习来提取和管理 DTI。为此,我们开发了基于 Transformers 的双向编码器表示 (BERT) 算法的新型文本挖掘文档分类器。由于 DTI 数据与用于生成它的检测类型密切相关,因此我们还旨在合并函数来预测检测格式。结果:我们的新方法从以前未包含在公共 DTI 数据库中的 210 万项研究中识别和提取了 DTI。使用 10 倍交叉验证,我们获得了约 99% 的识别包含药物-靶标对的研究的准确率。检测格式预测的准确率约为 90%,这为未来的研究留下了改进的空间。结论:本研究中的 BERT 模型是稳健的,所提出的流程可用于识别包含 DTI 的新研究和以前被忽视的研究,并自动提取 DTI 数据点。表格输出有助于验证提取的数据和检测格式信息。总体而言,我们的方法在机器辅助 DTI 提取和管理方面取得了重大进步。我们希望它成为药物机制发现和再利用的有用补充。关键词:BERT、来自 Transformer 的双向编码器表示、用于生物医学数据的 BERT、药物靶标相互作用预测、挖掘药物靶标相互作用、生物医学文本挖掘、生物活性数据、药物再利用
疟疾主要由恶性疟原虫引起,仍然是一个严重的公共卫生问题,因此需要开发新的抗疟药物。恶性疟原虫热休克蛋白 90 (Hsp90) 对寄生虫的生存不可或缺,也是一种很有前途的药物靶点。针对 N 端结构域的 ATP 结合口袋的抑制剂具有抗疟原虫作用。我们提出了一种从头主动学习 (AL) 驱动的方法,结合对接来预测具有独特支架和对 PfHsp90 优先选择性的抑制剂。预测在 ATP 结合口袋处与 PfHsp90 结合并具有抗疟原虫活性的参考化合物被用于生成 10,000 种独特衍生物并建立自动定量结构活性关系 (QSAR) 模型。进行滑动对接以预测衍生物和从 ChEMBL 数据库获得的 15,000 多种化合物的对接得分。对模型进行反复训练和测试,直到最佳的基于 Kennel 的偏最小二乘 (KPLS) 回归模型达到收敛,该模型的训练集回归系数 R2 = 0.75,测试集的平方相关预测 Q2 = 0.62。使用诱导拟合对接和分子动力学模拟重新评分使我们能够优先考虑 15 种 ATP/ADP 类设计理念以供购买。这些化合物对恶性疟原虫 NF54 菌株表现出中等活性,IC 50 值为 ÿ 6 μ M,对 PfHsp90 表现出中等至弱亲和力(KD 范围:13.5–19.9 μ M),与报道的 ADP 亲和力相当。最有效的化合物是 FTN-T5(PfN54 IC 50:1.44 μ M;HepG2/CHO 细胞 SI ÿ 29),它以中等亲和力(KD:7.7 μ M)与 PfHsp90 结合,为优化工作提供了起点。我们的工作证明了 AL 在快速识别用于药物发现的新分子(即命中识别)方面具有巨大实用性。FTN-T5 的效力对于设计物种选择性抑制剂以开发更有效的抗疟药物至关重要。
乙型肝炎病毒(HCV)感染引起病毒肝炎,导致肝细胞癌。尽管临床使用直接作用抗病毒药(DAAS),但仍有5-10%的病例的治疗失败。因此,针对HCV开发新的抗病毒药至关重要。在这项工作中,我们使用机器学习和定量结构 - 活性关系(QSAR)方法开发了“抗HCV”平台,以预测针对HCV非结构性(NS)蛋白的重新定义药物。,我们从化学验证的小分子中从化学验证数据库中检索了具有生物活性(IC 50 /EC 50)的实验验证的小分子,该分子针对HCV NS3(454),NS3 /4A(495),NS5A(494)和NS5B(494)和NS5B(1671)蛋白质。这些独特的化合物分为训练/测试和独立验证数据集。使用递归特征消除算法选择相关的分子描述符和细纹。不同的机器学习技术,即。支持向量机,k-nearest邻居,人工神经网络和随机森林用于开发预分类模型。,我们使用最佳开发模型在10倍的横截面中实现了Pearson的相关系数从0.80至0.92,并且在独立数据集上的性能相似。也由适用性域,化学多样性和诱饵数据集分析支持了开发的预测模型的鲁棒性和可靠性。使用“抗HCV”预测模型来识别潜在的重新利用药物。代表性候选者通过分子对接进一步验证,该分子对象表现出高结合功能。靶向HCV NS蛋白。因此,这项研究确定了有望重新利用的药物。naf- tifin,丁亚比塔尔(NS3),乙烯苯甲胺,上rip丁(NS3/4A),pipecuronium,trimephaphan(ns5a),olodaterol和vemurafenib(NS5B)等(NS5B)等这些潜在的重新利用药物可能被证明可用于针对HCV的抗病毒药物开发。2022作者。由Elsevier B.V.代表计算和结构生物技术的研究网络发布。这是CC BY-NC-ND许可证(http://creative-commons.org/licenses/by-nc-nd/4.0/)下的开放式访问文章。
摘要:药物发现的一个核心问题是确定类药物化合物与蛋白质靶标之间的相互作用。在过去的几十年中,已经开发了各种定量结构-活性关系 (QSAR) 和蛋白质化学计量 (PCM) 方法来建模和预测这些相互作用。虽然 QSAR 方法仅利用药物化合物的表示,但 PCM 方法结合了蛋白质靶标和药物化合物的表示,使它们能够对以前未见过的蛋白质靶标实现高于偶然性的预测准确度。QSAR 和 PCM 方法最近都通过机器学习和深度神经网络得到了改进,从而允许从测量数据开发药物-靶标相互作用预测模型。然而,深度神经网络通常需要大量的训练数据,并且无法稳健地适应新任务,例如在推理时预测未见过的蛋白质靶标的相互作用。在这项工作中,我们建议使用超网络在推理过程中有效地在任务之间传输信息,从而准确预测药物-靶标对未见过的蛋白质靶标的相互作用。与之前的方法相比,我们的 HyperPCM 方法在多个知名基准(包括 Davis、DUD-E 和 ChEMBL 衍生的数据集)上达到了最先进的性能,并且在涉及看不见的蛋白质靶标的零样本推理方面尤其出色。 我们的方法以及可重复的数据准备可在 https://github.com/ml-jku/hyper-dti 上获得。■ 简介药物 - 靶标相互作用 1 的建模是药物发现的一个基本步骤,意味着学习小的类药物化合物(在此称为药物化合物(术语药物化合物在本文中表示配体,即分子化合物,被视为潜在药物但最终可能不适合作为最终候选药物))与已确定的疾病蛋白质靶标之间相互作用的结合特性。2 随着新疾病的出现,迫切需要快速准确地预测大量药物 - 靶标相互作用。 3 药物-靶标相互作用的计算机建模受益于更强大的计算能力 4 ,而使用其他领域的最先进深度学习方法则有助于进一步发展。 5、6 到目前为止,该领域的研究主要集中在药物化合物和蛋白质靶标的表示上。 传统的定量结构-活性关系 (QSAR) 模型 7 仅基于药物化合物结构的表示来学习药物-靶标相互作用的特性。 通常,首先将结构编码为数值向量,即嵌入。 手工嵌入可以从化学和生物数据 8-10 或通过位向量(例如摩根指纹)构建。 11
目前,DTI 预测的计算方法可以分为三类:基于配体的方法、对接方法和特征学习方法。基于配体的方法通常用于通过计算给定药物或化合物与已知靶标的活性化合物的化学结构相似性来估计潜在的作用靶标。Keiser 等人 [3] 提出了一种根据配体的化学相似性推断蛋白质靶标的方法。Yamanishi 等人 [7-9] 通过将化合物的化学结构相似性和蛋白质的氨基酸序列相似性整合到均匀空间来预测未知的药物-靶标相互作用。Campillos 等人 [9] 将化合物的化学结构相似性和蛋白质的氨基酸序列相似性整合到均匀空间中。 [6]通过表型副作用的相似性来预测潜在的靶标蛋白。这种基于配体的方法在化学结构相似性较高的情况下简单有效,但也在很大程度上限制了其应用的范围和准确性。对接方法是计算药物与潜在靶标在三维结构中的形状和电性匹配程度,从而推断药物可能的作用靶点。其中,反向对接方法是最常用的预测方法,该方法通过预测给定化合物与靶标之间的相互作用模式和亲和力对药物靶标进行排序,从而确定该药物的可能靶点。程等[10]开发了基于结构的最大亲和力模型。李等[11]开发了利用对接方法识别药物靶点的网络服务器Tar-FisDock。此类方法充分考虑了目标蛋白质的三维结构信息,但分子对接方法本身仍存在一些尚未得到有效解决的问题,如蛋白质的灵活性、打分函数的准确性以及溶剂水分子等,导致逆对接,该方法的预测准确率较低。对接的另一个严重问题是它不能应用于三维结构未知的蛋白质,到目前为止,已知三维结构的蛋白质仍只占所有蛋白质的一小部分,这严重限制了该方法的推广和普及。特征学习方法将药物靶标关系视为相互作用和非相互作用的二类问题,此类方法利用机器学习算法学习已知化合物-靶标对的潜在模式,通过迭代优化生成预测模型,进而推断潜在的DTI。Yu等[12]提出了一种基于化学、基因组和药理学信息的系统方法。Faulon等[13]提出了一种基于化学、基因组和药理学信息的系统方法。[ 13 ] 预测药物