通讯作者:安吉勇 摘要:背景:预测新的药物-靶标相互作用(DTI)在发现新的候选药物和寻找新的靶标蛋白质中起着重要作用。考虑到实验方法耗时且昂贵。因此,如何开发有效的计算方法来准确预测药物和靶标之间的潜在关联是一项具有挑战性的任务。结果:在本文中,我们提出了一种基于药物指纹和蛋白质进化信息的新型计算方法WELM-SURF来识别DTI。更具体地说,为了利用蛋白质序列特征,应用位置特异性评分矩阵(PSSM)来捕获蛋白质进化信息,并使用加速机器人特征(SURF)从PSSM中提取序列关键特征。对于药物指纹,使用分子子结构指纹的化学结构来表示药物作为特征向量。考虑到加权极限学习机(WELM)具有训练时间短、泛化能力强以及最重要的是能够通过优化权重矩阵的损失函数有效地执行分类的优势。因此,采用WELM分类器对提取的特征进行分类以预测DTIs。通过五重交叉验证检验在酶、离子通道、GPCRs和核受体数据集上进行实验验证,评估了WELM-SURF模型的性能。WELM-SURF在酶、离子通道、GPCRs和核受体数据集上的平均准确率分别为93.54%、90.58%、85.43%和77.45%。我们还将其性能与极限学习机(ELM)、在酶和离子通道数据集上最先进的支持向量机(SVM)以及在四个数据集上的其他现有方法进行了比较。与实验结果相比,WELM-SURF的性能明显优于ELM、SVM和该领域的其他先前方法。结论:结果表明,所提出的WELM-SURF模型能够高精度、稳健地预测DTIs。预计 WELM - SURF 方法是一种有用的计算工具,可广泛促进与 DTI 预测相关的生物信息学研究。
主要关键词