摘要背景:通过实验确定药物-靶标相互作用(DTI)成本高昂且耗时,因此计算预测药物与蛋白质靶标之间的相互作用对于新药研发至关重要。然而,不同的蛋白质靶标之间相互作用的数量差异很大。具体而言,大多数相互作用仅集中在少数靶标上。因此,相互作用数量较多的靶标可能拥有足够的正样本来预测其相互作用,而相互作用数量较少的靶标的正样本可能不足。仅使用一种分类策略可能无法同时处理上述两种情况。为了解决上述问题,本文提出了一种基于多种分类策略的药物-靶标相互作用预测方法(MCSDTI)。在MCSDTI中,首先根据靶标的相互作用数量将靶标分为两部分,一部分包含相互作用数量较少的靶标(TWSNI),另一部分包含相互作用数量较多的靶标(TWLNI)。然后分别为TWSNI和TWLNI设计不同的分类策略来预测相互作用。此外,对TWSNI和TWLNI进行独立评估,可以克服同时评估所有靶标时结果可能主要由具有大量相互作用的靶标决定的问题。结果:提出了一种新的药物-靶标相互作用(MCSDTI)预测方法,该方法采用多种分类策略。MCSDTI在五个DTI数据集上进行了测试,例如核受体(NR),离子通道(IC),G蛋白偶联受体(GPCR),酶(E)和药物库(DB)。实验表明,对于TWLNI,我们的方法在NR,IC,GPCR和E上的AUC分别比第二好的方法高3.31%,1.27%,2.02%,2.02%和1.04%;对于TWSNI,我们的方法在NR,IC和E上的AUC分别比第二好的方法高1.00%,3.20%和2.70%。结论:MCSDTI 在大多数数据集上对于所有目标部位都是一种比以前的方法更有竞争力的方法,针对不同目标部位采用不同的分类策略是提高 DTI 预测效果的有效方法。
主要关键词