用于训练图像和语言的专用大规模架构的最新进展对计算机视觉和自然语言处理 (NLP) 领域产生了深远影响。语言模型(例如最近的 ChatGPT 和 GPT4)在处理、翻译和生成人类语言方面表现出了卓越的能力。这些突破也反映在蛋白质研究中,导致在短时间内迅速开发出许多新方法,并具有前所未有的性能。语言模型在蛋白质研究中得到了广泛的应用,因为它们已被用于嵌入蛋白质、生成新蛋白质和预测三级结构。在本章中,我们概述了蛋白质生成模型的使用,回顾了 1) 用于设计新型人工蛋白质的语言模型、2) 使用非 Transformer 架构的作品和 3) 在定向进化方法中的应用。
主要关键词