蛋白激酶(PK)酶是巨大的超家族的一部分,在各种细胞活化事件中起着重要作用。1 PK酶会催化磷酸基团在酶(苏氨酸,丝氨酸,酪氨酸和组氨酸)中存在于酶的催化位点(也称为ATP结合位点)中,这代表了调节酶活性的关键过程。PK酶的三维结构是由两个域(也称为Lobes)形成的,它们通过固定铰链区域相互关联。这两个结构域之间的界面形成了疏水性CLE构造ATP结合位点(图1)。较小的N端子结构域由B-表格(B 1 - B 5)和一个螺旋(称为C)构成,而第二个C末端域则由多个A螺栓(A D - A I)富集。2 - 4 PK酶共享一些2 - 4 PK酶共享一些
(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印本版的版权持有人于2023年8月22日发布。 https://doi.org/10.1101/2023.08.21.554147 doi:Biorxiv Preprint
1斯坦福大学神经生物学系;美国加利福尼亚州斯坦福大学。 2 Aarhus University化学系;丹麦的奥尔胡斯。 3斯坦福大学生物工程系;美国加利福尼亚州斯坦福大学。 4得克萨斯大学医学分公司微生物和免疫学系;美国德克萨斯州加尔维斯顿。 5斯坦福大学医学系;美国加利福尼亚州斯坦福大学。 6斯坦福大学的体外生物安全3级服务中心,斯坦福大学;美国加利福尼亚州斯坦福大学。 7在斯坦福大学化学,工程和医学(Chem-H)的化学,工程和医学计划;美国加利福尼亚州斯坦福大学。 8斯坦福大学,斯坦福大学大分子结构知识中心;美国加利福尼亚州斯坦福大学。 9病理学系,德克萨斯大学医学分公司;美国德克萨斯州加尔维斯顿。 10神经科学,细胞生物学和解剖学系,德克萨斯大学医学分支机构;美国德克萨斯州加尔维斯顿。 11斯坦福大学微生物与免疫学系;美国加利福尼亚州斯坦福大学12 Chan Zuckerberg Biohub;美国加利福尼亚州旧金山。 13斯坦福大学化学与系统生物学系;美国加利福尼亚州斯坦福大学。 *相应的作者。 电子邮件:westberg@chem.au.dk,mzlin@stanford.edu摘要:SARS-COV-2主要蛋白酶(M Pro)的抑制剂,例如Nirmatrelvir(NTV)(NTV)和Entitrelvir(ETV),证明了在降低了与CRUTISS的相关性中的相关性,但有效地降低了与CRUTISS的相关性,并且存在于共同性的情况下,并且存在着众多的未来。 反抗。 第二代口服药物在这些突变体上保留功能。1斯坦福大学神经生物学系;美国加利福尼亚州斯坦福大学。2 Aarhus University化学系;丹麦的奥尔胡斯。 3斯坦福大学生物工程系;美国加利福尼亚州斯坦福大学。 4得克萨斯大学医学分公司微生物和免疫学系;美国德克萨斯州加尔维斯顿。 5斯坦福大学医学系;美国加利福尼亚州斯坦福大学。 6斯坦福大学的体外生物安全3级服务中心,斯坦福大学;美国加利福尼亚州斯坦福大学。 7在斯坦福大学化学,工程和医学(Chem-H)的化学,工程和医学计划;美国加利福尼亚州斯坦福大学。 8斯坦福大学,斯坦福大学大分子结构知识中心;美国加利福尼亚州斯坦福大学。 9病理学系,德克萨斯大学医学分公司;美国德克萨斯州加尔维斯顿。 10神经科学,细胞生物学和解剖学系,德克萨斯大学医学分支机构;美国德克萨斯州加尔维斯顿。 11斯坦福大学微生物与免疫学系;美国加利福尼亚州斯坦福大学12 Chan Zuckerberg Biohub;美国加利福尼亚州旧金山。 13斯坦福大学化学与系统生物学系;美国加利福尼亚州斯坦福大学。 *相应的作者。 电子邮件:westberg@chem.au.dk,mzlin@stanford.edu摘要:SARS-COV-2主要蛋白酶(M Pro)的抑制剂,例如Nirmatrelvir(NTV)(NTV)和Entitrelvir(ETV),证明了在降低了与CRUTISS的相关性中的相关性,但有效地降低了与CRUTISS的相关性,并且存在于共同性的情况下,并且存在着众多的未来。 反抗。 第二代口服药物在这些突变体上保留功能。2 Aarhus University化学系;丹麦的奥尔胡斯。3斯坦福大学生物工程系;美国加利福尼亚州斯坦福大学。4得克萨斯大学医学分公司微生物和免疫学系;美国德克萨斯州加尔维斯顿。5斯坦福大学医学系;美国加利福尼亚州斯坦福大学。 6斯坦福大学的体外生物安全3级服务中心,斯坦福大学;美国加利福尼亚州斯坦福大学。 7在斯坦福大学化学,工程和医学(Chem-H)的化学,工程和医学计划;美国加利福尼亚州斯坦福大学。 8斯坦福大学,斯坦福大学大分子结构知识中心;美国加利福尼亚州斯坦福大学。 9病理学系,德克萨斯大学医学分公司;美国德克萨斯州加尔维斯顿。 10神经科学,细胞生物学和解剖学系,德克萨斯大学医学分支机构;美国德克萨斯州加尔维斯顿。 11斯坦福大学微生物与免疫学系;美国加利福尼亚州斯坦福大学12 Chan Zuckerberg Biohub;美国加利福尼亚州旧金山。 13斯坦福大学化学与系统生物学系;美国加利福尼亚州斯坦福大学。 *相应的作者。 电子邮件:westberg@chem.au.dk,mzlin@stanford.edu摘要:SARS-COV-2主要蛋白酶(M Pro)的抑制剂,例如Nirmatrelvir(NTV)(NTV)和Entitrelvir(ETV),证明了在降低了与CRUTISS的相关性中的相关性,但有效地降低了与CRUTISS的相关性,并且存在于共同性的情况下,并且存在着众多的未来。 反抗。 第二代口服药物在这些突变体上保留功能。5斯坦福大学医学系;美国加利福尼亚州斯坦福大学。6斯坦福大学的体外生物安全3级服务中心,斯坦福大学;美国加利福尼亚州斯坦福大学。7在斯坦福大学化学,工程和医学(Chem-H)的化学,工程和医学计划;美国加利福尼亚州斯坦福大学。 8斯坦福大学,斯坦福大学大分子结构知识中心;美国加利福尼亚州斯坦福大学。 9病理学系,德克萨斯大学医学分公司;美国德克萨斯州加尔维斯顿。 10神经科学,细胞生物学和解剖学系,德克萨斯大学医学分支机构;美国德克萨斯州加尔维斯顿。 11斯坦福大学微生物与免疫学系;美国加利福尼亚州斯坦福大学12 Chan Zuckerberg Biohub;美国加利福尼亚州旧金山。 13斯坦福大学化学与系统生物学系;美国加利福尼亚州斯坦福大学。 *相应的作者。 电子邮件:westberg@chem.au.dk,mzlin@stanford.edu摘要:SARS-COV-2主要蛋白酶(M Pro)的抑制剂,例如Nirmatrelvir(NTV)(NTV)和Entitrelvir(ETV),证明了在降低了与CRUTISS的相关性中的相关性,但有效地降低了与CRUTISS的相关性,并且存在于共同性的情况下,并且存在着众多的未来。 反抗。 第二代口服药物在这些突变体上保留功能。7在斯坦福大学化学,工程和医学(Chem-H)的化学,工程和医学计划;美国加利福尼亚州斯坦福大学。8斯坦福大学,斯坦福大学大分子结构知识中心;美国加利福尼亚州斯坦福大学。9病理学系,德克萨斯大学医学分公司;美国德克萨斯州加尔维斯顿。10神经科学,细胞生物学和解剖学系,德克萨斯大学医学分支机构;美国德克萨斯州加尔维斯顿。11斯坦福大学微生物与免疫学系;美国加利福尼亚州斯坦福大学12 Chan Zuckerberg Biohub;美国加利福尼亚州旧金山。13斯坦福大学化学与系统生物学系;美国加利福尼亚州斯坦福大学。*相应的作者。电子邮件:westberg@chem.au.dk,mzlin@stanford.edu摘要:SARS-COV-2主要蛋白酶(M Pro)的抑制剂,例如Nirmatrelvir(NTV)(NTV)和Entitrelvir(ETV),证明了在降低了与CRUTISS的相关性中的相关性,但有效地降低了与CRUTISS的相关性,并且存在于共同性的情况下,并且存在着众多的未来。 反抗。第二代口服药物在这些突变体上保留功能。我们假设共价HCV蛋白酶抑制剂BOCEPREVIR(BPV)可以作为与现有药物更加紧密抑制SARS-COV-2 M Pro的口服生物可用药物的基础。执行BPV的结构引导的修饰,我们开发了一种皮摩尔亲和抑制剂ML2006A4,具有抗病毒活性,口服药代动力学和治疗效力,类似于NTV或优于NTV。ML2006A4的关键特征是酮酰胺反应性基团的新衍生化,可改善细胞的渗透性和口服生物利用度。最后,ML2006A4对几种对NTV或ETV的抗性的突变不太敏感,并且发生在天然SARS-COV-2种群中。因此,预期的药物设计可以预先解决潜在的抗药性机制。
药物-靶标结合亲和力预测在药物发现的早期阶段起着重要作用,可以推断新药与新靶标之间相互作用的强度。然而,以前的计算模型的性能受到以下缺点的限制。药物表示的学习仅依赖于监督数据,而没有考虑分子图本身所包含的信息。此外,大多数以前的研究倾向于设计复杂的表示学习模块,而忽略了用于衡量表示质量的均匀性。在本研究中,我们提出了GraphCL-DTA,一种用于药物-靶标结合亲和力预测的具有分子语义的图对比学习。在GraphCL-DTA中,我们设计了一个针对分子图的图对比学习框架来学习药物表示,从而保留了分子图的语义。通过该图对比框架,可以在不需要额外监督数据的情况下学习更本质、更有效的药物表示。接下来,我们设计了一个新的损失函数,可直接用于平滑地调整药物和靶标表示的均匀性。通过直接优化表示的均匀性,可以提高药物和靶标的表示质量。在KIBA和Davis两个真实数据集上验证了上述创新元素的有效性。GraphCL-DTA在上述数据集上的优异表现表明了其优于当前最佳模型。
人工智能辅助药物发现 (AIDD) 因其能够使新药搜索更快、更便宜、更有效而越来越受欢迎。尽管它广泛应用于众多领域(例如 ADMET 预测、虚拟筛选),但对带噪声的分布外 (OOD) 学习问题的研究却很少。我们提出了 DrugOOD,一个系统的 OOD 数据集管理和 AIDD 基准。具体来说,我们专注于药物-靶标结合亲和力预测问题,其中涉及大分子(蛋白质靶标)和小分子(药物化合物)。DrugOOD 提供了一个自动化的数据集管理者,具有用户友好的自定义脚本、与生物化学知识一致的丰富领域注释、逼真的噪声水平注释以及 SOTA OOD 算法的严格基准测试,而不是仅提供固定数据集。由于分子数据通常使用图神经网络 (GNN) 主干建模为不规则图,因此 DrugOOD 还可作为图 OOD 学习问题的宝贵试验台。大量的实证研究表明,分布内和分布外实验之间存在显著的性能差距,这强调了需要开发更有效的方案,以允许 AIDD 在噪声下进行 OOD 泛化。
管道。在这方面,评估药物靶标结合能力 (DTA) 的计算方法非常有趣 4,因为 DTA 通常被认为是预测药物效果的最佳指标之一。准确预测 DTA 对于筛选出低效分子并防止其进入临床试验至关重要,因此近年来开发了大量计算 DTA 技术。最准确的 DTA 计算估计可以通过原子分子动力学模拟(经典、量子或混合)与计算配体结合自由能的现代技术之一相结合获得。5 然而,准确性是以非常高的计算需求为代价的,这使得这些方法通常不适用于大规模虚拟筛选。这就是为什么在现代药物发现中估计 DTA 的常用方法是分子对接,它在准确性和计算效率之间提供了合理的折衷。 6 然而,人们普遍认为,分子对接中使用的经验评分函数已经接近实际的准确度极限,如果不引入额外的计算负担,这一极限不太可能得到改善。为了解决这些缺点,开发了用于确定 DTA 的经典机器学习 (ML) 方法。这些方法不依赖于计算目标蛋白质和配体之间的物理相互作用。它们纯粹基于知识,依赖于类似配体倾向于
2. Ikemura N、Taminishi S、Inaba T、Arimori T、Motooka D、Katoh K、Kirita Y、Higuchi Y、Li S、Suzuki T、Itoh Y、Ozaki Y、
用于估计嘈杂的中间量子量子(NISQ)ERA设备上的分子基态性能,基于变异的量子本特征(VQE)算法的算法已获得流行,因为它们相对较低的电路深度和对噪声的弹性。9,10这导致了一系列成功的演示,涉及当今量子设备和模拟器上小分子的分子基态能量的计算。4,6,11 - 22然而,仅对分子基态能量的估计不足以描述许多有趣的化学过程,这些化学过程涉及某种形式的电子激发。23,例如,化学现象的准确建模,例如光化学反应,涉及过渡金属复合物,光合作用,太阳能电池操作等的催化过程等。需要对分子地面和激发态进行精确模拟。这种系统的电子激发态通常密切相关,因此需要使用复杂的量子化学理论来准确描述。在过去的几十年中,在这方面已经开发了许多方法。24 - 32最初由Stanton和Bartlett开发的运动方程耦合群集(EOM-CC)26方法是一个流行的示例,通常用于计算分子激发剂,例如激发能量
用于估计嘈杂的中间量子量子(NISQ)ERA设备上的分子基态性能,基于变异的量子本特征(VQE)算法的算法已获得流行,因为它们相对较低的电路深度和对噪声的弹性。9,10这导致了一系列成功的演示,涉及当今量子设备和模拟器上小分子的分子基态能量的计算。4,6,11 - 22然而,仅对分子基态能量的估计不足以描述许多有趣的化学过程,这些化学过程涉及某种形式的电子激发。23,例如,化学现象的准确建模,例如光化学反应,涉及过渡金属复合物,光合作用,太阳能电池操作等的催化过程等。需要对分子地面和激发态进行精确模拟。这种系统的电子激发态通常密切相关,因此需要使用复杂的量子化学理论来准确描述。在过去的几十年中,在这方面已经开发了许多方法。24 - 32最初由Stanton和Bartlett开发的运动方程耦合群集(EOM-CC)26方法是一个流行的示例,通常用于计算分子激发剂,例如激发能量
为了估计嘈杂的中尺度量子 (NISQ) 时代设备上的分子基态特性,基于变分量子特征求解器 (VQE) 的算法因其相对较低的电路深度和对噪声的抵抗力而广受欢迎。9,10 这导致了一系列成功的演示,涉及在当今的量子设备和模拟器上计算小分子的分子基态能量。4,6,11 – 22 然而,仅仅估计分子基态能量不足以描述许多涉及某种形式的电子激发的有趣化学过程。23 例如,准确模拟化学现象,如光化学反应、涉及过渡金属配合物的催化过程、光合作用、太阳能电池操作等,需要准确模拟分子基态和激发态。此类系统的电子激发态通常具有很强的相关性,因此需要使用复杂的量子化学理论来准确描述它们。在过去的几十年里,在这方面已经开发了许多方法。 24 – 32 运动方程耦合团簇 (EOM-CC) 26 方法最初由 Stanton 和 Bartlett 开发,是一种常用的例子,通常用于计算分子激发态特性,例如激发能