Loading...
机构名称:
¥ 1.0

我们提出了格子(p Rotein la tent i doffusion),这是一种通过在预先训练的序列序列序列序列的序列序列的压缩潜在空间上学习扩散,用于蛋白质结构域的发电范围和蛋白质结构域的序列。由于在生成模型训练期间仅需要序列训练数据,因此与其他序列结构生成模型相比,我们将可用的训练数据集增加了10 2×至10 4×。此外,这扩大了可控制生成的注释,我们证明了功能和生物体的组成条件,包括2219个基因本体论功能的丰富词汇。样品表现出跨模式的一致性,同时具有条件弗雷切特(Fréchet)的距离(FID)测量的所需特性。格子范式避免了结构数据库的强烈先验和大规模失衡,可以轻松地使用数据和计算来缩放,并可以控制全原子蛋白质结构和序列。

可控制的全原子生成蛋白质序列和结构仅限序列输入

可控制的全原子生成蛋白质序列和结构仅限序列输入PDF文件第1页

可控制的全原子生成蛋白质序列和结构仅限序列输入PDF文件第2页

可控制的全原子生成蛋白质序列和结构仅限序列输入PDF文件第3页

可控制的全原子生成蛋白质序列和结构仅限序列输入PDF文件第4页

可控制的全原子生成蛋白质序列和结构仅限序列输入PDF文件第5页

相关文件推荐