新的蛋白质折叠人工智能极大地扩展了 Alphafold 的工作

由名为 ESMFold2 的人工智能工具生成的新开源图谱极大地扩展了已知的蛋白质宇宙

来源:科学美国人

新的蛋白质折叠人工智能可预测 10 亿种蛋白质的结构

由名为 ESMFold2 的人工智能工具生成的新开源图谱极大地扩展了已知的蛋白质宇宙

作者:Ewen Callaway、Miryam Naddaf 和《自然》杂志

AI 工具设计了针对细胞毒性 T 淋巴细胞相关蛋白 4 (CTLA-4) 的结合剂。

科学图片库/Alamy

已知的蛋白质宇宙变得更大了。一种新发布的人工智能工具生成了超过十亿个预测蛋白质结构和数十亿个蛋白质序列的图谱。

这个名为 ESM Atlas 的数据库今天由陈·扎克伯格倡议 Biohub 的研究人员揭晓,该中心是 Facebook 创始人马克·扎克伯格 (Mark Zuckerberg) 和他的妻子、医生兼教育家普里西拉·陈 (Priscilla Chan) 在加利福尼亚州旧金山创建的一家生物医学研究所。

该图集比预测蛋白质结构的 AlphaFold 数据库多了 8 亿多个条目,比之前的 ESM 图集多了约 3 亿条。

关于支持科学新闻

如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻事业。通过购买订阅,您将有助于确保有关塑造当今世界的发现和想法的影响力故事的未来。

这些预测是使用 ESMFold2 进行的,Biohub 表示,ESMFold2 是一种人工智能模型,其性能超越了 AlphaFold3、Google DeepMind 系统的最新版本和其他蛋白质结构预测人工智能的性能。今天发布的预印本中描述了该地图集。

“这本图谱的作用是展示蛋白质生物学的整体,尤其是最未知的部分,”领导这项工作的 Biohub 科学负责人 Alex Rives 说。 “我们认为这将成为发现新生物学的真正强大的基础。”

抗体预测

补充数据库

Ovchinnikov 表示,ESMFold2 的完全开源性质,对商业用途没有限制,这意味着它可以得到广泛的使用。 “我预计很多人会对尝试 ESMFold2 感到兴奋。”