摘要:酶以极高的选择性催化化学转化。通过定向进化,我们可以重新编程酶以应用于生物催化和医学。在第一部分中,我将讨论我的工作,即发现、表征和设计卤化未活化 Csp3—H 键的 FeII/α-酮戊二酸依赖性酶。我解决了一种新型赖氨酸卤化酶 (BesD) 的厌氧晶体结构,发现了能够形成九种新氯化氨基酸的同源物,并开发了酶级联以产生氯化杂环、二胺、酮酸和肽。通过结构研究和高通量筛选,我研究了该酶家族中区域选择性和催化选择性的机制基础,并利用由此获得的见解来设计羟化酶以进行卤化,其活性和选择性与天然卤化酶相当。在第二个故事中,我通过定向进化开发了新型胞嘧啶碱基编辑器 (CBE)。碱基编辑器由可编程的 DNA 结合蛋白(如催化受损的 Cas9)组成,与脱氨酶融合,可实现基因组中靶位点的精确核苷酸变化。将 C•G 碱基对转化为 T•A 的 CBE 通常比其腺嘌呤碱基编辑器 (ABE) 更大,并且具有更多不良的脱靶编辑。为了开发一类保留 ABE 有利特性的新型 CBE,我使用连续蛋白质进化来进化 ABE,以便在治疗相关位点和细胞类型内进行高效的胞嘧啶碱基编辑。这些新进化的碱基编辑器克服了现有 CBE 的几个局限性,并展示了蛋白质进化在应对生物技术挑战方面的力量。
构建进化的细菌底盘通常依赖于功能蛋白的定向进化。1 进化的蛋白质替代宿主中的天然对应物,从而形成具有特定表型的进化细菌底盘,2 例如大肠杆菌中进化的RpsE和酵母中的PfDHFR分别赋予壮观霉素抗性 3 和乙胺嘧啶抗性 4。然而,外源DNA的替代会影响宿主的安全性,这限制了宿主在某些领域的应用,特别是在食品工业中。因此,期望宿主自身的蛋白质得到进化。蛋白质定向进化的技术框架已经从体外发展到体内。5 – 7 定向进化的典型策略是随机诱变、半理性设计和理性设计。它们都严重依赖于从基因克隆、体外诱变、异源或整合的几个迭代步骤的过程
用于训练图像和语言的专用大规模架构的最新进展对计算机视觉和自然语言处理 (NLP) 领域产生了深远影响。语言模型(例如最近的 ChatGPT 和 GPT4)在处理、翻译和生成人类语言方面表现出了卓越的能力。这些突破也反映在蛋白质研究中,导致在短时间内迅速开发出许多新方法,并具有前所未有的性能。语言模型在蛋白质研究中得到了广泛的应用,因为它们已被用于嵌入蛋白质、生成新蛋白质和预测三级结构。在本章中,我们概述了蛋白质生成模型的使用,回顾了 1) 用于设计新型人工蛋白质的语言模型、2) 使用非 Transformer 架构的作品和 3) 在定向进化方法中的应用。
利用我们高通量的定向进化工程平台,Capsida确定了一个系统地给药的(IV)Capsid,该capsID可实现NHP脑范围的生物分布,除了提供治疗相关的心脏转移水平外,还可以在关键FA相关的大脑区域中转导大量的神经元。在NHP研究中,同时给予一小片capsID(n = 3 NHP),工程化的衣壳驱动的RNA表达水平比CNS中的AAV9高约100倍,同时在心脏组织中保持相似的RNA表达,并且在肝脏中降低了约10x。重要的是,Capsida已经确定了一种与我们工程化的衣壳结合的新型血脑屏障受体。受体在猕猴和人类之间表现出完整的氨基酸序列同源性,从而使临床翻译变得过时。
需要特定的c c类型的转换类型,这些转换不是天然发生的。5为了利用这些过程中的巨大酶良好的益处,已经设计了人工酶来产生新的催化反应性。6 - 8个促酶,从而产生基本的酶,然后可能会受到定向进化的能力,以实现通常与酶催化相关的高活性和选择性。9,10然而,尽管有明显的进展,但大多数人促酶的催化效率尚未与天然酶相媲美。11迄今为止,使用人工酶的大多数定向进化运动仅针对催化中心近距离的残留物,以直接影响其化学环境。越来越清楚的是,就像天然酶一样,整个蛋白质的12个结构合作也需要与人工酶促进酶进行催化。例如,刘易斯和同事观察到在模型环丙烷化反应中,在引入脱离活性位点的突变后,由人工hodios的模型环化反应提高了对映选择性。13 o s,远端突变的引入产生由蛋白质的先天结构动力学决定的细微结构重排,该结构动力学已在天然酶的进化中被逐渐构成。18,19是Hilvert等人设计的KEMP消除酶HG3.17的局部示例。14,15那些可以间接地通过调节结构动力学的催化活性的残基称为动力学的远端位点或热点。16,17针对定向演化算法中这些热点的16,17可以将构象动力归为催化生产构象,从而导致高度效率高的设计师酶。能够通过开发具有催化能力的构象合奏的速率加速度提高10 8倍。20当前,它们的鉴定阳离子o cen依赖于广泛的分子动力学(MD)模拟,这对工作的吞吐量构成了显着的限制。21尽管最近已经描述了基于机器的新策略并保持了大大减轻计算费用的希望,但对大型培训数据集的需求阻碍了他们在鲜为人知的系统中的应用。为了确定远端突变和远距离网络在人工酶中的作用,我们以23,24的lactocococococcal多药耐药性调节剂(LMRR)为示例,是探讨了以较广泛的新型到Nature Adectivitivitivities量身定制的混杂蛋白SCA效率的示例。该蛋白质属于padr遗传因素的PADR家族,并调节乳酸乳酸菌中LMR操纵子的表达。lMRR的特征是独特的构象thimational质量和结构可塑性25,26,在其大型恐惧孔中引起了宽阔的配体滥交。然后将这些基本酶定向进化,从而导致专业酶显着增加活性和(对映)的选择性。引入各种人工催化部分,金属复合物,27个非典型氨基酸(NCAA),28甚至两者均为29个具有多种新型催化性活性的endow LMRR。但是,迄今为止,迄今为止,定向进化仅集中在孔内的残基上,以优化新创建的活性位点的结构。在这里,我们展示了如何通过利用LMRR的构象动力学来进一步增加这些设计师酶之一的活性。
玉米:美国人熟知并喜爱的作物……或者至少我们是这么认为的。现代玉米看起来与其原始形态——一种名为大刍草的野草——如此不同,你很难认识到这两种植物有关联。经过数千年的定向进化,大刍草的小穗和难以消化的谷粒进化成了玉蜀黍的大穗,每个穗上有多达 500 颗多汁的谷粒(图 1)。1 玉米只是人类主导植物进化的一个例子;自文明开始以来,我们就一直在驯化和栽培农作物品种。虽然用于选择性育种植物的技术随着时间的推移而变得越来越先进,但基本原理仍然是一样的——利用物种中现有的变异来增加我们认为“理想”性状的流行率,比如玉米的穗更大。从历史上看,这是通过连续的育种实现的;今天,借助强大的基因组编辑工具,我们能够用更少的时间和精力获得相同(甚至更显著)的结果。
随着酶(即蛋白质工程)和微生物细胞(即基因组编辑)工程技术的革命性进步,生物催化剂的商业规模应用有望在不久的将来取代现有的化学工艺。这些技术的影响在弗朗西斯·阿诺德(2018 年)和詹妮弗·杜德纳(2020 年)分别因蛋白质定向进化和成簇的规律间隔短回文重复序列 (CRISPR) 基因编辑而获得诺贝尔化学奖时得到了认可。本期特刊“生物催化技术:基础与应用”将重点介绍酶和微生物全细胞系统的生物技术应用的最新进展和新视角。本期特刊的范围将从新兴生物催化剂的基本特征到它们的实际应用,重点关注当前的工程技术。我们期待收到您对这些迷人领域的贡献。- 生物催化 - 酶 - 全细胞生物转化 - 微生物生物技术 - 生物合成 - 蛋白质工程 - 代谢工程
深层科学正在使高通量实验(HTE)设计具有所需特性的新型生物实体。,例如,通过创新的定向进化分析(例如M-Cre-tee and Tracer)鉴定出了全身性基因疗法向脑细胞进行全身性递送基因疗法所需的血脑屏障(BBB)跨腺相关病毒(AAV)载体。但是,即使这些高通量实验也只能探索生物实体的大型设计空间的一部分。在本文中,我们介绍了基于自动克的蛋白质功能(AutomaxProfit)的最大化,以学习并改善用高通量筛选产生的蛋白质设计。使用基于跨前的生成AI网络和蛋白质语言模型,我们改进了先前通过HTE发现的变体的设计,以通过分子动力学(MD)模拟估计,在脑内皮细胞中产生2倍的富集。这表明,深技术模型可以从深层实验实验产生的观察结果中学习,并继续为生物制药中的应用找到更多最佳的设计候选者。
定向进化可以有效地改造蛋白质、生物合成途径和细胞功能。传统的基于质粒的方法通常对一个或偶尔多个感兴趣的基因进行诱变,需要耗时的人工干预,并且进行诱变的基因在其原生基因组背景之外。其他方法不加选择地诱变整个基因组,这可能会扭曲结果。最近的重组工程和基于 CRISPR 的技术通过允许在其原生基因组背景下的多个预定位点上实现极高的突变率,从根本上改变了这一领域。在这篇综述中,我们重点介绍了最近的技术,这些技术可能允许在这些目标序列的原生基因组背景下在多个基因组位点上加速可调诱变。这些技术将通过四个主要标准进行比较,包括诱变规模、对多种微生物物种的可移植性、脱靶诱变和成本效益。最后,我们讨论这些技术进步如何为基础研究和生物技术开辟新的途径。
背景 定向进化将达尔文进化原理应用于实验室,以改良蛋白质特性 [ 1 , 2 ]。在多轮诱变和选择过程中,会产生大型基因变体文库(~ 10 5 – ~ 10 8 )[ 3 – 5 ]。筛选文库以识别有效变体传统上是一个手动过程,耗费大量人力、资源和时间。此外,可供测试的变体数量有限,这降低了识别最佳变体的概率。希望有一种用于比较大量酶的高通量方法。事实上,已经开发了许多用于高通量筛选酶变体的应用程序。例如,CombiSEAL [ 6 ] 允许筛选确定的突变组合,但它不太适合分析进化产物。另一方面,Evoracle [ 4 ] 适合此目的,因为它使用多个进化周期的序列数据推断基因的适应度和序列组成。然而,它不能用于分析多个目标位点上的变异。evSeq [ 7 ] 是一种基于微孔板的方法,可以分别筛选变异表型,并分析基因