药物发现过程始于确定靶点和明确药物作用机制,以期赢得疾病治疗之战(Vamathevan 等人,2019 年)。药物发现中靶点识别的方法包括虚拟筛选和实验筛选。作为最广泛使用的基于结构的虚拟筛选方法之一,分子对接可以识别查询配体的最可能靶点。有许多流行的对接程序,例如 AutoDock、LeDock、Glide、GOLD 和 DOCK(Lapillo 等人,2019 年;Shahid 等人,2021 年)。为了减少评分偏差,Lee 和 Kim(2020 年)通过对 GOLD、AutoDock Vina 和 LeDock 的评分算法进行排名,构建了一个用于靶点预测的 Web 服务器。为了协助识别草药成分的假定靶点,Zhang 等人利用分子对接程序对草药成分进行分类,以确定可能的靶点。 (2019 ) 使用反向对接方法来预测配体-靶标相互作用。Ma 和 Zou (2021 ) 使用 DOCK 算法开发了一种反向对接程序,以支持将配体与多个蛋白质结构集合对接。然而,对接的优势被严重的缺陷所抵消:对接会产生许多假阳性事件 ( Lyu et al., 2019 )。这是由相对粗糙的搜索算法造成的,例如,蒙特卡洛算法在活性位点生成一个随机的配体初始构型,包括随机构象、平移和旋转;禁忌搜索算法对配体的当前构型进行了一些小的随机更改并对其进行排序 ( Sulimov et al., 2019 )。为了避免假阳性事件,我们之前开发了一种基于贝叶斯-高斯混合模型 (BGMM) 的靶标过滤算法 (Wei et al., 2022)。我们对从 PDB 中的配体结合蛋白晶体结构中提取的配体原子与蛋白质片段之间的相互作用对进行了聚类(发布时间:1995 年 1 月至 2021 年 4 月),发现潜在靶标应满足 ≥ 600 个显著相互作用对,同时它们与所有相互作用对的比例≥ 0.8 (Wei et al., 2022)。我们方法的优势在于,我们不仅考虑了配体和蛋白质之间的主要键,例如氢键、盐桥、疏水接触、卤素键和 π 堆积 (Shaikh et al., 2021),还总结了配体和蛋白质之间的所有原子接触
主要关键词