摘要:认识到蛋白质的潜在过敏性对于确保其安全性至关重要。过敏原是确定蛋白质安全性的主要问题,尤其是随着重组蛋白在新医疗产品中的使用越来越多。这些蛋白质需要仔细的过敏性评估以确保其安全性。但是,传统的实验室测试过敏既昂贵且耗时。为了应对这一挑战,生物信息学为预测蛋白质过敏性提供了有效且具有成本效益的替代方法。在这项研究中,我们开发了一种增强的深度学习模型,以基于其主要结构为蛋白质序列的主要结构来预测蛋白质的潜在过敏性。我们的方法利用了两个蛋白质语言模型,为每个序列提取不同的特征向量,然后将其输入到深层神经网络模型中进行分类。每个特征向量代表蛋白质序列的特定方面,并将它们组合起来可以增强最终结果,并平衡模型的灵敏度和特异性。该模型将蛋白质分类为过敏反应或非过敏性类别。我们提出的模型表明,与ALGPRED 2.0模型相比,所有评估指标的可接受改进,其敏感性为97.91%,特异性为97.69%,精度为97.80%,使用Algpred 2.0 2.0 Dataaset的ROC曲线在99%下的敏感性为97.80%,使用标准的五fordation fortal-forcectation。
主要关键词