过去,已经开发了几种方法来预测信使RNA(mRNA)的单标签亚细胞定位。但是,仅设计有限的方法来预测mRNA的多标签亚细胞定位。此外,现有方法很慢,不能以转录组量表实现。在这项研究中,已经开发了一种快速可靠的方法来预测可以在基因组量表中实现的mRNA的多标签亚细胞定位。基于机器学习的方法是使用mRNA序列组成开发的,其中基于XGBoost的分类器在接收器操作员特征(AUROC)下达到了0.709(0.668 - 0.732)的平均面积。除了无对齐的方法外,我们还使用基准搜索技术开发了基于对齐的方法。最后,已经开发了一种结合XGBoost模型和基于基序的方法的混合技术,其平均AUROC为0.742(0.708 - 0.816)。我们的方法(MRSLPred)在性能和计算效率方面优于现有状态分类。已经开发了一种公开访问的Web服务器和独立工具,以促进研究人员(WebServer:https://webs.iiitd.edu.in/raghava/raghava/mrslpred/)。
主要关键词