重新利用潜在扩散的产生蛋白质折叠模型

格子是一种多模式生成模型,通过学习蛋白质折叠模型的潜在空间,同时生成蛋白质1D序列和3D结构。授予2024年诺贝尔奖对Alphafold2的奖励标志着重要的...

来源:ΑΙhub

格子是一种多模式生成模型,通过学习蛋白质折叠模型的潜在空间,同时生成蛋白质1D序列和3D结构。

格子

Amy X Lu

Amy X Lu

2024年诺贝尔奖授予Alphafold2是对生物学中AI角色的重要时刻。蛋白质折叠后接下来会发生什么?

诺贝尔奖

在格子中,我们开发了一种方法,该方法学会了从蛋白质折叠模型的潜在空间中采样以生成新​​蛋白质。它可以接受组成功能和有机体提示,并且可以在序列数据库上进行训练,该数据库比结构数据库大2-4个数量级。与许多以前的蛋白质结构生成模型不同,格子解决了多模式的共同生成问题设置:同时生成离散序列和连续的全原子结构坐标。

生成 组成功能和有机体提示 在序列数据库中训练

从结构预测到现实世界药物设计

尽管最近的作品证明了扩散模型生成蛋白质的能力的希望,但仍然存在以前模型的局限性,这些模型使其对于现实世界应用不切实际,例如:

    全原子生成:许多现有的生成模型仅产生骨干原子。为了产生全原子结构并放置侧链原子,我们需要知道序列。这会产生一个多模式生成问题,需要同时产生离散和连续的模态。有生物特异性:旨在人性化的蛋白质生物制剂,以避免被人体免疫系统破坏。控制范围:药物发现并将其放入患者手中是一个复杂的过程。我们如何指定这些复杂的约束?例如,即使解决了生物学,您也可能会认为平板电脑比小瓶更容易运输,从而增加了对可溶性的新约束。
全原子发电 生物特异性 人性化