AI 刚刚模拟了 5 亿年的进化——并创造了一种新蛋白质!

数十亿年来,进化一直在分子水平上微调生命。蛋白质是生命的基本组成部分,通过这一过程进化,发挥各种生物功能,从抵抗感染到消化食物。这些复杂的分子由长链氨基酸组成,这些氨基酸以精确的序列排列,决定了它们的结构和功能。 […]文章 AI 刚刚模拟了 5 亿年的进化——并创造了一种新蛋白质!首次出现在 Unite.AI 上。

来源:Unite.AI

数十亿年来,进化一直在分子水平上对生命进行微调。蛋白质是生命的基本组成部分,通过这一过程进化,发挥各种生物功能,从抵抗感染到消化食物。这些复杂的分子由长链氨基酸组成,这些氨基酸以精确的序列排列,决定了它们的结构和功能。虽然大自然产生了极其多样的蛋白质,但了解它们的结构和设计全新的蛋白质长期以来一直是科学家面临的复杂挑战。

人工智能的最新进展正在改变我们应对一些生物学最重大挑战的能力。以前,人工智能被用来预测给定的蛋白质序列将如何折叠和行为——由于配置数量众多,这是一个复杂的挑战。最近,人工智能已经发展到以前所未有的规模生成全新的蛋白质。这一里程碑是通过由 EvolutionaryScale 设计的多模态生成语言模型 ESM3 实现的。与为文本处理而设计的传统人工智能系统不同,ESM3 经过训练可以理解蛋白质序列、结构和功能。真正令人称奇的是,它能够模拟 5 亿年的进化过程——这一壮举促成了一种全新的荧光蛋白的诞生,这是自然界中从未见过的。

EvolutionaryScale

这一突破是朝着使生物学更加可编程迈出的重要一步,为设计可应用于医学、材料科学和其他领域的定制蛋白质开辟了新的可能性。在本文中,我们将探讨 ESM3 的工作原理、它取得了哪些成就,以及为什么这一进步正在重塑我们对生物学和进化的理解。

认识 ESM3:模拟进化的人工智能

AlphaFold esmGFP 思路推理

人工智能驱动的蛋白质设计过程

以下是研究人员使用 ESM3 开发 esmGFP 的方法:

提示人工智能 生成新型蛋白质 更快的药物发现: