摘要:定向进化通过迭代诱变促进酶工程。尽管高通量筛选应用广泛,但构建“智能库”以有效识别有益变体仍然是该社区面临的主要挑战。在这里,我们基于 EnzyHTP 开发了一种新的计算定向进化协议,EnzyHTP 是我们之前报道过的用于自动化酶建模的软件。为了提高吞吐效率,我们实施了一种自适应资源分配策略,该策略根据工作流中酶建模子任务的特定需求动态分配不同类型的计算资源(例如 GPU/CPU)。我们将该策略实现为 Python 库,并使用氟乙酸脱卤酶作为模型酶测试了该库。结果表明,与在整个工作流中 CPU 和 GPU 都随时可用的固定资源分配相比,应用自适应资源分配可以节省 87% 的 CPU 小时数和 14% 的 GPU 小时数。此外,我们在自适应资源分配框架下构建了一个计算定向进化协议。该工作流程在 Kemp 消除酶定向进化实验中针对两轮突变筛选进行了测试,总共有 184 个突变体。使用折叠稳定性和静电稳定能作为计算读数,我们重现了四个实验观察到的目标变体中的三个。借助该工作流程,整个计算任务(即 18.4 μs MD 和 18,400 QM 单点计算)在三天内使用约 30 个 GPU 和约 1000 个 CPU 完成。
摘要:定向进化 (DE) 是一种强大的工具,可用于优化蛋白质适应特定应用。然而,当突变表现出非加性或上位性行为时,DE 可能效率低下。在这里,我们介绍了主动学习辅助定向进化 (ALDE),这是一种迭代机器学习辅助 DE 工作流程,它利用不确定性量化来比当前的 DE 方法更有效地探索蛋白质的搜索空间。我们将 ALDE 应用于对 DE 具有挑战性的工程领域:优化酶活性位点中的五个上位性残基。在三轮湿实验室实验中,我们将非天然环丙烷化反应所需产物的产量从 12% 提高到 93%。我们还对现有的蛋白质序列适应度数据集进行了计算模拟,以支持我们的论点,即 ALDE 比 DE 更有效。总体而言,ALDE 是一种实用且广泛适用的策略,可以解锁改进的蛋白质工程成果。关键词:蛋白质工程、定向进化、酶工程、原珠蛋白、卡宾、立体选择性、机器学习、贝叶斯优化、主动学习、不确定性量化
图片标题 图 S1 C9 和 C12 变体的 EP-PCR 文库。 图 S2 对 mCherry 家族进行诱变努力以实现寿命进化的总结。 图 S3 空间远距离替换对光物理特性的作用。 图 S4 寿命和酵母细胞共同进化轨迹。 图 S5 哺乳动物细胞的细胞亮度。 图 S6 大肠杆菌的光漂白趋势。 图 S7 比较大肠杆菌在激发速率标准化条件下的光稳定性。 图 S8 归一化的吸收和发射光谱。 图 S9 变体的荧光各向异性衰减和旋转时间常数(τ r)。 图 S10 变体的荧光衰减和平均寿命(τ)。 图 S11 变体的荧光量子产率()。 图 S12 mCherry 变体的辐射速率常数分析。图 S13 总非辐射速率常数与能隙的拟合。图 S14 相关可观测量的示意图。图 S15 波数尺度上的吸光度和荧光光谱。图 S16 方程 S2 中的分子和分母函数。补充数据表列表
其中 x 是序列,f(x) 是未知的序列到适应度图。DE 是一种黑盒优化问题,它按顺序查询序列进行实验筛选。贪婪搜索能够有效地用最少的实验找到改进的序列,但由于适应度景观中普遍存在的上位性,它通常仅限于探索局部最优 2 – 4 。另一方面,通过多位点饱和诱变进行随机探索不可避免地会产生庞大的组合文库,这往往会超出筛选能力 5 。一种以最小的实验负担搜索上位性景观的有效策略是十分可取的。过去十年,生物数据的机器学习 (ML)(包括深度学习,DL)算法得到了快速发展 6 – 10 。监督模型可以学习蛋白质与适应度之间的关系,并提供酶活性和选择性3、蛋白质热稳定性11、蛋白质折叠能12、13、蛋白质溶解度14、蛋白质-配体结合亲和力15和蛋白质-蛋白质结合亲和力16的定量预测。由于获取监督标签的成本高昂,自监督蛋白质嵌入已成为蛋白质建模的重要范例。通过对自然进化产生的大量未标记序列数据进行训练,自监督蛋白质嵌入可以捕获序列中大量潜在的生物信息,并将信息传递给下游的监督任务17、18。许多模型架构(如变分
摘要:定向进化 (DE) 是一种强大的工具,可用于优化蛋白质适应特定应用。然而,当突变表现出非加性或上位性行为时,DE 可能效率低下。在这里,我们介绍了主动学习辅助定向进化 (ALDE),这是一种迭代机器学习辅助 DE 工作流程,它利用不确定性量化来比当前的 DE 方法更有效地探索蛋白质的搜索空间。我们将 ALDE 应用于对 DE 具有挑战性的工程领域:优化酶活性位点中的五个上位性残基。在三轮湿实验室实验中,我们将非天然环丙烷化反应所需产物的产量从 12% 提高到 93%。我们还对现有的蛋白质序列适应度数据集进行了计算模拟,以支持我们的论点,即 ALDE 比 DE 更有效。总体而言,ALDE 是一种实用且广泛适用的策略,可以解锁改进的蛋白质工程成果。关键词:蛋白质工程、定向进化、酶工程、原珠蛋白、卡宾、立体选择性、机器学习、贝叶斯优化、主动学习、不确定性量化
成熟的自噬体随后与溶酶体融合,将其内容物降解为单体,以供下游的合成代谢和分解代谢。基础自噬通过清除多余或受损的蛋白质和细胞器来维持细胞稳态,而自噬通量上调是细胞对营养缺乏和细胞毒性药物暴露的一种适应性反应。近年来,越来越明显的是,自噬上调在癌症的发展及其对治疗的反应中起着重要作用。6,7 许多类型的肿瘤——包括卵巢癌、8 胰腺癌、9 乳腺癌 10 和结肠癌 11——依赖于自噬的持续激活来维持在肿瘤微环境血管稀少、缺氧和营养缺乏的条件下的生长。化疗 12 和放疗 13 后自噬的激活已被确定为获得治疗耐药性的主要促成因素。 14
细胞膜含有多种脂质,由于缺乏原位控制调节膜组成的方法,人们对于单个脂质生物学功能的了解一直受到阻碍。在这里,我们提出了一种编辑磷脂的策略,磷脂是生物膜中最丰富的脂质。我们的膜编辑器基于细菌磷脂酶 D (PLD),它通过水或外源醇对磷脂酰胆碱进行水解或转磷脂酰化来交换磷脂头部基团。利用哺乳动物细胞中活性依赖性的定向酶进化,我们开发并从结构上表征了一个“超级PLD”家族,其活性比野生型 PLD 高 100 倍。我们证明了超级PLD 在活细胞中特定细胞器膜内光遗传学编辑磷脂以及体外生物催化合成天然和非天然设计磷脂的实用性。除了超级PLD之外,哺乳动物细胞中基于活动的定向酶进化是一种可推广的方法,可以设计出额外的化学酶生物分子编辑器。
选择性酶的进化。[1b] 最新的评论包含大量有关方法学开发的信息,发表于 2020 年。[1c] 我们对这项激动人心的事业的兴趣可以追溯到 20 世纪 90 年代中期,当时我的团队提出了一种全新的不对称催化方法,即定向进化立体选择性酶作为合成有机化学和生物技术中的催化剂。[1,2] 考虑到手性药物、天然产物、植物保护剂和香料的社会价值,我们认为“试管中的进化”可以与开发用于不对称转化的手性人造合成催化剂相辅相成。如果成功,这将为在温和且环保的条件下进行多种不同的不对称转化提供丰富且取之不尽的新型催化剂来源。
定向进化已成为一种设计蛋白质各种特性的有力策略。传统的构建文库的方法,如易错的 PCR 和 DNA 改组,通常会产生庞大且效率相对较低的文库。在缺乏高通量筛选方法的情况下,搜索此类文库既费时又费力,而且成本高昂。另一方面,由结构或序列信息引导的定向诱变已成为一种产生所谓智能文库的流行方法。随着有利突变与有害突变比例的增加,智能文库可提高定向进化的效率,前提是靶位预测可靠。突变靶位或热点预测对文库的质量和定向进化的性能至关重要。适当选择热点可以高效合理地生成具有所需特性的蛋白质。本文概述了七种热点,分为两类:基于序列的热点,包括 CbD(保守但不同)位点和共同进化的残基;基于 3D 结构的热点,包括活性位点残基、通道位点、柔性位点、与活性中心偶联的远端位点和界面位点。本综述还介绍了用于识别这些热点的计算工具的最新进展,以及将它们用于酶工程的许多成功案例。