Loading...
机构名称:
¥ 1.0

蛋白质语言模型是通过对庞大蛋白质序列数据集进行预训练来学习蛋白质表示的强大工具。然而,尽管传统的蛋白质语言模型与蛋白质功能相关,但仍缺乏明确的结构监督。为了解决此问题,我们将远程同源性检测的集成到不需要明确的蛋白质结构作为输入而将结构信息整合到蛋白质语言模型中。我们评估了这种结构信息训练对下游蛋白质功能预测任务的影响。实验结果揭示了EC数量和GO期限预测的功能注释精度的一致提高。在突变数据集上的性能根据目标性质和蛋白质结构之间的关系而变化。这强调了在将结构感知训练应用于蛋白质功能预测任务时考虑这种关系的重要性。代码和模型权重可在https://github.com/ deepgraphlearning/esm-s上找到。

结构信息蛋白质语言模型

结构信息蛋白质语言模型PDF文件第1页

结构信息蛋白质语言模型PDF文件第2页

结构信息蛋白质语言模型PDF文件第3页

结构信息蛋白质语言模型PDF文件第4页

结构信息蛋白质语言模型PDF文件第5页

相关文件推荐

2024 年
¥1.0
2025 年
¥1.0
2024 年
¥10.0
2024 年
¥1.0
2023 年
¥2.0
2025 年
¥2.0
1900 年
¥4.0