作者的完整列表:萨斯加,1月;加州大学戴维斯分校,尼古拉的化学Shevchenko;加州大学戴维斯(UC Davis),化学Gonel,Goktug;加州大学戴维斯分校,Zaira化学工程贝德拉·瓦尔迪斯(Bedolla Valdez);加州大学戴维斯分校,雷切尔化学工程系;加州大学戴维斯分校,化学工程与材料科学Moule,亚当;加州大学戴维斯分校,化学工程和材料科学马斯卡,马克; UC Davis,化学
最近已经提出了动机的强大生成模型,但这些方法中很少有支持柔性蛋白质配体对接和亲和力估计。没有人可以直接对多种结合配体进行同时建模,也可以根据药理学相关的药物靶标进行严格的标准,从而阻碍了它们在药物发现工作中的广泛采用。 导致这项工作,我们提出了FlowDock,这是一种基于条件流量匹配的深几何生成模型,该模型学会了将其直接映射到其绑定的(Holo)对应物中,以将其映射到任意数量的结合配体中。 此外,Flowdock与其每种生成的蛋白质配体复杂结构中提供了预测的结构置信度评分和结合亲和力值,从而实现了新(多配体)药物目标的快速虚拟筛选。 对于常用的PoseBusters基准数据集,Flotdock使用Unbound(APO)蛋白质输入结构实现了51%的盲区对接成功率,而没有任何来自多个序列比对的信息,并且对于具有挑战性的新Dockgen-E数据集,FlotDock与单次序列Chai-1的性能相匹配。 此外,在第16个社区范围内的结构预测技术批判性评估(CASP16)的配体类别中,Flowdock在140种蛋白质配体复合物中的药理学结合亲和力估计的前5位方法中排名,证明了其在虚拟筛选中的学位表达的功效。没有人可以直接对多种结合配体进行同时建模,也可以根据药理学相关的药物靶标进行严格的标准,从而阻碍了它们在药物发现工作中的广泛采用。导致这项工作,我们提出了FlowDock,这是一种基于条件流量匹配的深几何生成模型,该模型学会了将其直接映射到其绑定的(Holo)对应物中,以将其映射到任意数量的结合配体中。此外,Flowdock与其每种生成的蛋白质配体复杂结构中提供了预测的结构置信度评分和结合亲和力值,从而实现了新(多配体)药物目标的快速虚拟筛选。对于常用的PoseBusters基准数据集,Flotdock使用Unbound(APO)蛋白质输入结构实现了51%的盲区对接成功率,而没有任何来自多个序列比对的信息,并且对于具有挑战性的新Dockgen-E数据集,FlotDock与单次序列Chai-1的性能相匹配。此外,在第16个社区范围内的结构预测技术批判性评估(CASP16)的配体类别中,Flowdock在140种蛋白质配体复合物中的药理学结合亲和力估计的前5位方法中排名,证明了其在虚拟筛选中的学位表达的功效。可用性和实现源代码,数据和预训练的模型可在https://github.com/ bioinfaramefaraminelearning/flowdock上找到。
动机:抑制剂 - 激酶结合亲和力的准确预测对于药物发现和医疗应用至关重要,尤其是在治疗诸如癌症之类的疾病中。现有的预测抑制剂 - 激酶亲和力的方法仍然面临挑战,包括数据表达不足,功能提取有限和性能低。尽管通过人工智能(AI)方法(尤其是深度学习技术)取得了进展,但许多当前的方法未能捕获激酶与抑制剂之间的复杂相互作用。因此,有必要开发更先进的方法来解决抑制剂 - 激酶结合预测中的现有问题。结果:这项研究提出了Kinhibhib,这是抑制剂 - 激酶结合亲和力预测指标的新型框架。kinhibit会整合自我监督的预训练的预训练的分子编码器和蛋白质语言模型(ESM-S),以有效提取特征。kinhibit还采用特征融合方法来优化抑制剂和激酶特征的融合。实验结果证明了这种方法的优越性,在三种MAPK信号途径激酶的抑制剂预测任务中,精度达到了92.6%的精度:RAF蛋白激酶(RAF),有丝分裂原激活的蛋白激活蛋白激酶激酶激酶(MEK)和细胞外信号调节激酶(ERK)。此外,该框架在包含200多个激酶的数据集上达到了令人印象深刻的精度。这项研究为药物筛查和生物科学提供了有希望的有效的工具。
药物-靶标结合亲和力预测在药物发现的早期阶段起着重要作用,可以推断新药与新靶标之间相互作用的强度。然而,以前的计算模型的性能受到以下缺点的限制。药物表示的学习仅依赖于监督数据,而没有考虑分子图本身所包含的信息。此外,大多数以前的研究倾向于设计复杂的表示学习模块,而忽略了用于衡量表示质量的均匀性。在本研究中,我们提出了GraphCL-DTA,一种用于药物-靶标结合亲和力预测的具有分子语义的图对比学习。在GraphCL-DTA中,我们设计了一个针对分子图的图对比学习框架来学习药物表示,从而保留了分子图的语义。通过该图对比框架,可以在不需要额外监督数据的情况下学习更本质、更有效的药物表示。接下来,我们设计了一个新的损失函数,可直接用于平滑地调整药物和靶标表示的均匀性。通过直接优化表示的均匀性,可以提高药物和靶标的表示质量。在KIBA和Davis两个真实数据集上验证了上述创新元素的有效性。GraphCL-DTA在上述数据集上的优异表现表明了其优于当前最佳模型。
此预印本版的版权持有人于2023年1月24日发布。 https://doi.org/10.1101/2023.01.17.523999 doi:Biorxiv Preprint
法律挑战:大麻部门面临的最重要的障碍之一是复杂且通常不一致的法律格局。在国家和国际层面存在监管障碍,为企业驾驶的挑战性迷宫。跨国立法的差异可能会使事情进一步复杂化。例如,尽管加拿大这样的国家已经完全合法化了大麻,但它仍然严格控制着许多国家。这种差异为希望跨境扩展的企业造成了不确定性,要求他们理解并遵守不同的法规,这通常是令人生畏的和资源密集的。
a 印度阿姆劳蒂 Mardi 路 Rajendra Gode 药学院药物化学系;b 沙特阿拉伯利雅得伊玛目穆罕默德伊本沙特伊斯兰大学理学院化学系;c 沙特阿拉伯莫哈伊尔阿西尔哈立德国王大学科学与艺术学院化学系;d 马来西亚双威城双威大学医学与生命科学学院;e 伊拉克埃尔比勒 Tishk 国际大学药学院药物化学系;f 沙特阿拉伯阿尔哈吉 Prince Sattam Bin Abdulaziz 大学药学院药理学与毒理学系;g 印度兰契 Birla 理工学院药物科学与技术系;h 沙特阿拉伯利雅得 AlMaarefa 大学医学院基础医学系
结果:在这项研究中,为了获得具有高精度和强大可解释性的模型,我们利用了各种传统和尖端的特征选择和降低维度降低技术来处理自我相关特征和相邻的相关特征。然后将这些优化的特征送入学习排名以实现有效的DTA预测。在两个常用数据集上进行的广泛实验结果表明,在各种特征优化方法中,基于回归树的特征选择方法对于构建具有良好性能和稳健性的模型是最有益的。然后,通过利用Shapley添加说明值和增量功能选择AP-PRACH,我们可以获得高质量的功能子集由前150D特征组成,而Top 20D功能对DTA预测产生了突破性的影响。总而言之,我们的研究彻底验证了DTA预测中特征优化的重要性,并作为构建高性能和高解释模型的灵感。
计算机的高性能使得它们可以为药物设计中的实验室实验提供帮助。1因此计算机辅助药物设计在过去的几十年里得到了发展,充分利用高性能计算机,可以快速模拟药物设计中的诸多步骤,各种应用也逐渐发展起来。例如,NAMD (NAnoscale Molecular Dynamics)2、GROMACS3和Amber4提供了相对精确的分子动力学模拟手段,可以模拟分子体系在特定条件下的自然运动。分子对接可以探索不同分子之间的结合构象空间,帮助研究人员找到最佳的对接构象。许多专注于分子对接的方法包括DOCK、5AutoDock、6GOLD7等。随着深度学习在各个领域的卓越成就,基于深度学习的药物设计应用和模型不断涌现。Preuer等人。构建了一个前馈神经网络,并提出了一个名为 DeepSynergy 8 的模型来预测抗癌药物的协同作用。DeepTox 9 由一个深度神经网络组成,被提出用于毒性预测,并在 Tox21 挑战数据集中表现良好。10 BSite-pro 11 使用随机森林分类器仅基于序列来预测蛋白质结合位点。Lenselink 等人证明深度神经网络的表现优于生物活性基准集。12 Ciriano 等人总结了最近基于机器翻译的蛋白质化学计量建模
结果:在这项研究中,为了获得具有高精度和强大可解释性的模型,我们利用了各种传统和尖端的特征选择和降低维度降低技术来处理自我相关特征和相邻的相关特征。然后将这些优化的特征送入学习排名以实现有效的DTA预测。在两个常用数据集上进行的广泛实验结果表明,在各种特征优化方法中,基于回归树的特征选择方法对于构建具有良好性能和稳健性的模型是最有益的。然后,通过利用Shapley添加说明值和增量功能选择AP-PRACH,我们可以获得高质量的功能子集由前150D特征组成,而Top 20D功能对DTA预测产生了突破性的影响。总而言之,我们的研究彻底验证了DTA预测中特征优化的重要性,并作为构建高性能和高解释模型的灵感。