Loading...
机构名称:
¥ 1.0

蛋白质功能推论依赖于通过序列模拟性的注释蛋白质域,通常通过剖面隐藏的Markov模型(配置文件HMM)建模,该模型捕获了相关域内的进化多样性。但是,在以序列进行建模残基时,file-file hmms可以使强大的简化独立性假设。在这里,我们介绍了诗篇(使用语言模型的蛋白质序列注释),一种分层方法,可放松这些假设,并使用蛋白质语言模型学到的蛋白质序列的表示,以启用高敏,高特异性残基级蛋白质序列。我们还为蛋白质序列结构域注释开发了一个基准,在该序列身份的给定阈值下,训练和测试序列进行了严格的分裂,以在其任何域之间没有相似性。一次分配一个域家族的基准测试分析不支持注释多域蛋白的方法,其中训练和测试序列需要来自不同家族的多个域。我们在此基准测试中验证了诗篇的表现,并突出显示诗篇作为HMMER的有希望的替代方法,即一种基于最新的基于HMM的方法,用于蛋白质序列注释。

使用语言模型的蛋白质序列域注释

使用语言模型的蛋白质序列域注释PDF文件第1页

使用语言模型的蛋白质序列域注释PDF文件第2页

使用语言模型的蛋白质序列域注释PDF文件第3页

使用语言模型的蛋白质序列域注释PDF文件第4页

使用语言模型的蛋白质序列域注释PDF文件第5页

相关文件推荐

2024 年
¥1.0
2025 年
¥1.0
2024 年
¥5.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥23.0