对于鉴定生物化学过程和活细胞中生物学规范至关重要的主要营养素是蛋白质。蛋白质通常围绕由其家庭类型定义的一个或几个功能。因此,需要识别和分类来根据其结构和家庭分离蛋白质。在这项工作中,我们建立了一个模型来对蛋白质序列的家庭进行分类。我们使用的蛋白质序列数据集由各种生物学意义的大分子组成。分类器是使用BI-LSTM深入学习的。我们通过从结构生物信息学研究合作社的蛋白质数据库中收集数据集,使用令牌化对数据进行预处理,并基于BI-LSTM的深度学习网络对分类器进行建模。由于我们获得了受过训练的模型的最佳准确率,因此我们使用学习曲线,准确率和损失的评估指标来找出模型性能。结果表明,Deep Bi-LSTM具有拟合学习曲线,99%的精度率和0.042损失的出色性能。
主要关键词