详细内容或原文请订阅后点击阅览
简单折:折叠蛋白比您想象的要简单
蛋白质折叠模型已经取得了开创性的结果,自Alphafold2引入以来,通常是通过将域膨胀到其建筑设计和训练管道的结合构建的。尽管如此,考虑到在不同但相关的问题上的生成模型的特征,很自然地质疑这些架构设计是否需要建立性能模型。在本文中,我们介绍了SimpleFold,这是仅使用通用变压器层的第一个基于流量匹配的蛋白折叠模型。而不是依靠昂贵的……
来源:Apple机器学习研究蛋白质折叠模型已经取得了开创性的结果,自Alphafold2引入以来,通常是通过将域膨胀到其建筑设计和训练管道的结合构建的。尽管如此,考虑到在不同但相关的问题上的生成模型的特征,很自然地质疑这些架构设计是否需要建立性能模型。在本文中,我们介绍了SimpleFold,这是仅使用通用变压器层的第一个基于流量匹配的蛋白折叠模型。 SimpleFold不依靠昂贵的模块化三角关注或配对表示偏见或精心制作的培训目标,而是采用具有自适应层的标准Transformer块,并通过生成的流动匹配目标进行了培训。我们将SimpleFold缩放为3B参数,并在超过860万的蒸馏蛋白结构以及实验性PDB数据上进行训练。据我们所知,SimpleFold是有史以来最大的规模折叠模型。在标准折叠基准测试中,与最先进的基线相比,SimpleFold-3B模型可实现竞争性能。由于其发电量的目标,简单折叠还表明了整体预测的强劲性能。简单的挑战对复杂领域特异性体系结构的设计挑战在折叠中设计,突出了蛋白质结构预测中的替代性而重要的途径。
- **在Apple