遵循序列和结构旋转,预测实施生物学功能的蛋白质的动力学机制仍然是一个杰出的科学挑战。几种实验技术和分子动力学(MD)模拟原则上可以确定构象状态,结合构型及其概率,但吞吐量较低。在这里,我们开发了一种生物分子模拟器(BioEmu),这是一种生成深度学习系统,可以在单个图形处理单元上每小时从蛋白质结构集合中生成数千个独立的独立样品。通过利用新颖的培训方法和蛋白质结构的大量数据,超过200毫秒的MD模拟以及实验蛋白质稳定性,BioeMu的蛋白质集合代表了一系列具有挑战性且实际相关的指标的平衡。在定性上,生物EMU采样了许多与功能相关的构象变化,范围从隐性口袋的形成,到特定蛋白质区域的展开,到大型域的后方范围。定量地,生物EMU对蛋白质构象与1 kcal/mol左右的相对自由能误差进行了构象构象,以验证了毫秒timesscale MD模拟和实验测量的蛋白稳定性。通过同时模拟结构集合和热力学特性,生物EMU揭示了机械洞察力,例如突变体折叠不稳定的原因,并可以有效地提供实验性检验的假设。
主要关键词