Loading...
机构名称:
¥ 6.0

蛋白质是通过各种功能,从结构支持到催化生化反应的不同功能来维持生命的重要生物分子。它们的催化效率使它们对于工业应用来说是无价的,在这些应用中,它们通常需要优化才能在特定条件下运行。虽然实验和计算方法在蛋白质工程方面取得了进展,但由于蛋白质结构和功能的复杂性,不存在通用方法。机器学习的最新进展通过利用大量蛋白质序列数据提供了新的可能性。然而,仍然存在关键挑战,包括描述酶活性和热稳定性等基本特性的高质量标签的有限可用性和不均匀分布。解决这些问题对于开发能够精确特征选择的模型至关重要。我的工作重点介绍了蛋白质工程的两个关键步骤:多样化和选择。为了改善选择,使用转移学习,数据增强和蛋白质语言模型(PLM)开发了深度学习模型,以预测物理和功能特性,例如熔化温度,酶温,蛋白质丰度和体外活性。这些模型不仅可以实现精确的性状选择,而且还提供了有关序列,热适应性和构象稳定性之间关系的见解。为了多样化,创建了一个深层生成模型,以捕获自然序列多样性并扩展其以生成跨蛋白质家族的新型变体库。这种方法优先考虑功能序列,并允许具有增强特性的蛋白质的靶向工程。超越了一般序列的生成,开发了一个框架来创建针对特定性状优化的变体池,例如增加的热稳定性。通过整合这些进步,我们从各种野生型序列中设计了功能性蛋白质变体,达到熔化温度的36°C升高。这项工作突出了生成机器学习的潜力,以完善和加速蛋白质工程周期,为更高效,更可扩展的生物技术应用铺平了道路。

深层生成模型用于功能蛋白的分析和工程

深层生成模型用于功能蛋白的分析和工程PDF文件第1页

深层生成模型用于功能蛋白的分析和工程PDF文件第2页

深层生成模型用于功能蛋白的分析和工程PDF文件第3页

深层生成模型用于功能蛋白的分析和工程PDF文件第4页

深层生成模型用于功能蛋白的分析和工程PDF文件第5页

相关文件推荐

2025 年
¥6.0