学习套索肽的语言以改进肽工程

在寻找癌症和传染病的新疗法的过程中,套索肽被证明是一种捕获物。它们的结状结构为这些分子提供了高稳定性和多样化的生物活性,使它们成为新疗法的有前途的途径。为了更好地释放其临床潜力,Carl R. Woese 基因组生物学研究所的一个团队开发了 LassoESM,这是一种用于预测 lasso 肽特性的新型大型语言模型。

来源:英国物理学家网首页
开发套索肽特定语言模型 LassoESM。套索肽生物合成需要前导肽酶、RiPP 识别元件 (RRE) 和套索环化酶,将线性核心肽连接到套索样结中。 B LassoESM 基于 ESM-2 架构构建,并使用带有掩码语言建模的域自适应方法对 lasso 肽进行进一步预训练。由此产生的 La​​ssoESM 嵌入用于三个下游任务:预测套索环化酶底物耐受性、识别套索环化酶和底物肽的非同源对之间的底物兼容性以及预测 RNAP 抑制活性(数字表示富集值,估计 RNAP 抑制活性)。图片来源:《自然通讯》(2025)。 DOI:10.1038/s41467-025-63412-3
一个 B 自然通讯

在寻找癌症和传染病的新疗法的过程中,套索肽被证明是一种捕获物。它们的结状结构为这些分子提供了高稳定性和多样化的生物活性,使它们成为新疗法的有前途的途径。为了更好地释放其临床潜力,Carl R. Woese 基因组生物学研究所的一个团队开发了 LassoESM,这是一种用于预测 lasso 肽特性的新型大型语言模型。

这项合作研究最近发表在《自然通讯》上。

已发布

Lasso 肽是细菌产生的天然产物。为了生产这些肽,细菌使用核糖体构建氨基酸链,然后通过生物合成酶将其折叠成独特的滑结状结构。通过这个过程,产生了数千种不同的套索肽,其中许多已被证明具有抗菌、抗病毒和抗癌特性。

天然产品 药物发现 大语言模型 氨基酸序列 更多信息: DOI: 10.1038/s41467-025-63412-3

期刊信息:Nature Communications

期刊信息: