蛋白质功能预测是生物信息学的一个热门话题。由于测序数据的增加,越来越多的蛋白质需要功能注释。本专题中的四篇作品开发了基于机器学习的方法来预测蛋白质功能。Liang 和 Zhang [1] 专注于预测凋亡蛋白的亚细胞定位,因为凋亡蛋白参与了许多生物过程。他们设计了一个计算模型来预测凋亡蛋白的亚细胞定位。在他们的模型中,进化信息和非负矩阵分解被用于制定蛋白质样本。支持向量机 (SVM) 是分类算法。他们在三个已发布的数据集上展示了他们的模型的性能。他们的模型将为凋亡蛋白分析提供指导。Yang 等人[2] 设计了一个人工智能模型来识别癌症凝集素。癌症凝集素是一类凝集素蛋白,在癌症的发生、生长和扩散中起着重要作用。正确识别癌症凝集素可以为癌症治疗提供重要线索。在这项工作中,他们利用序列信息描述癌症凝集素,并使用方差分析 (ANOVA) 来降低特征维度。在交叉验证测试中获得了良好的预测精度。第三项工作 [3] 描述了一种改进革兰氏阴性细菌分泌蛋白预测的计算策略。本文报道的模型使用位置特异性评分矩阵作为特征。使用 SVM 进行分类。他们的模型可以产生非常高的准确性。Ning 等人[4] 通过计算策略发现一些肽具有与 PbHRH 和 Romiplostim 中的 MHC-I 和 MHC-II 分子结合的潜在能力,可作为潜在表位。
主要关键词