基因编辑是指精确改变特定核酸序列的方法。随着成簇的规律间隔短回文重复序列 (CRISPR)/Cas9 系统的最新发展,基因编辑变得高效、方便和可编程,为遗传和非遗传疾病的转化研究和临床试验带来了希望。CRISPR/Cas9 系统应用中的一个主要问题是其脱靶效应,即在基因组中产生意想不到的、不需要的甚至是不利的改变。迄今为止,已经开发出许多方法来指定或检测 CRISPR/Cas9 的脱靶位点,这为成功升级具有更高精确度的 CRISPR/Cas9 衍生物奠定了基础。在这篇综述中,我们总结了这些技术进步,并讨论了未来基因治疗在脱靶效应管理方面面临的当前挑战。
使用 SpCas9 核酸酶进行 ONE-seq 脱靶分析的结果 a,群图显示五个先前分析的 SpCas9 gRNA 的 ONE-seq 核酸酶分数。每个圆圈代表一个单独的 ONE-seq 文库成员。彩色圆圈代表先前确认的真正脱靶位点。未显示 ONE-seq 核酸酶分数低于 0.001 的位点。n/a,未在先前发表的 CIRCLE-seq 研究中进行验证。b,维恩图比较了 ONE-seq、CIRCLE-seq 和 Digenome-seq(空心彩色圆圈)提名先前由 GUIDE-seq(实心紫色圆圈)验证的真正脱靶位点的能力。所有被视为由 ONE-seq 验证的位点的 ONE-seq 核酸酶分数均 >0.01。
成簇的规律间隔短回文重复序列 (CRISPR)/CRISPR-Cas 系统彻底改变了基因编辑,可应用于治疗、诊断、农业和开发疾病模型。然而,CRISPR-Cas 存在脱靶效应——即在使用过程中导致基因组中出现非预期的遗传修饰。在这项工作中,我们提出了 crispr2vec:一种用于嵌入 CRISPR 单向导 RNA (sgRNA) 序列并预测脱靶切割的深度度量学习方法。给定一个固定的靶序列,我们表明我们学习到的嵌入可以忠实地表示潜在的脱靶。我们提出了一种专门针对 CRISPR 序列的新型三重采样策略,可提高嵌入的质量。我们表明,生成的嵌入可推广到不同的脱靶切割检测分析中。最后,我们证明了深度度量学习方法在预测脱靶切割方面的优势,与之前的文献相比,该方法在不同数据集上对可见和未可见的 sgRNA 进行交叉折叠验证。
源自 Cas9 RNA 引导核酸酶的遗传工具为研究和改造细菌提供了必不可少的能力。虽然在 Cas9 应用于哺乳动物细胞的早期就已注意到脱靶效应的重要性,但由于细菌基因组较小,因此很容易避免 Cas9 在细菌基因组中的脱靶切割。尽管如此,一些研究报告了 Cas9 表达有毒的实验设置,即使使用催化失活的 Cas9 变体 (dCas9)。具体而言,dCas9 在与共享特定 PAM(原间隔区相邻基序)近端序列基序的引导 RNA 复合时具有毒性。在这里,我们证明这种毒性是由 Cas9 与必需基因启动子的脱靶结合引起的,脱靶基因的沉默发生在 PAM 近端序列中仅 4 个 nt 的同一性处。在大肠杆菌和其他肠细菌的各种菌株中进行的筛选表明,有毒向导 RNA 的性质会随着脱靶位置序列的进化而改变。这些结果凸显了 Cas9 可能与细菌基因组中数百个脱靶位置结合,从而导致不良影响。在设计和解释细菌中的 CRISPR-Cas 实验时必须考虑这一现象。
碱基编辑器是专门设计的脱氨酶,能够以精确有效的方式定向转换基因组或转录组中的特定碱基,并有望纠正致病突变。限制这种强大方法应用的一个主要问题是脱靶编辑问题。最近的几项研究表明碱基编辑器会诱导大量脱靶 RNA 活性,并证明脱靶突变可能会被改进的脱氨酶版本或优化的向导 RNA 抑制。在这里,我们描述了一类新的脱靶事件,这些事件对于现有的检测基因组变异的方法来说是不可见的,因此迄今为止一直被忽视。我们表明,非特异性、看似随机的脱靶事件会影响整个基因组或转录组中的大量位点,并占脱靶活动的大多数。我们开发并采用一种对随机脱靶活动敏感的不同互补方法,并使用它来量化由于当前优化的脱氨酶编辑器而导致的大量脱靶 RNA 突变。我们提供了一种计算工具来量化全局脱靶活动,可用于优化未来的碱基编辑器。工程碱基编辑器能够以单碱基分辨率定向操纵基因组或转录组。我们相信,实施这种计算方法将有助于设计更具体的碱基编辑器。
然而,尽管 CRISPR/Cas 技术具有革命性的地位,但它也存在明显的局限性和缺陷。CRISPR/Cas 最重要的限制是可能出现脱靶编辑,即 CRISPR/Cas 在非预期的位置切割 DNA。这种脱靶(OT)编辑会扭曲功能实验的解释,引入噪音和变异性,从而降低实验结果和功能性结论的可靠性。重要的是,OT 活性在 CRISPR 的治疗应用中尤其危险,在这种情况下,即使非常低频率的 OT 编辑也可能产生极其灾难性的后果 2,3 。为了应对这一挑战,该领域的许多努力都集中在改进 guideRNA(gRNA)设计以确保靶标特异性 4 和设计具有更高保真度的 Cas 变体 5 。同时,测量 OT 效应的方法,例如 GUIDE-seq 6 、CIRCLE-seq 7 和 SITE-seq 8 ,也有助于提高我们量化和合理化 OT 编辑的能力。此外,预测 OT 的能力对于该领域来说越来越重要,从而导致开发出各种用于预测 OT 位点的计算方法。
RNA 引导的核酸内切酶(如 Cas9)可在细胞中提供有效的靶向基因组编辑,但也可能切割整个基因组中的脱靶位点。化脓性链球菌 Cas9 (SpCas9) 的工程变体已被开发出来以全面降低脱靶活性,但个别脱靶可能仍然存在,或者靶向活性可能受到损害。为了在保持强大的靶向编辑的同时对抗特定脱靶的活性,我们开发了一种新颖的 M13 噬菌体介导选择方法。使用这种方法,连续几轮正向和负向选择用于识别增强或减弱特定基因组序列编辑活性的 Cas9 突变。我们还引入了寡核苷酸定向靶标扫描诱变 (SMOOT),这是一种全面的诱变方法,用于创建高度多样化的 Cas9 变体库,这些库可以通过基于噬菌体的选择进行挑战。我们的平台识别出新的 SpCas9 突变体,这些突变体在生化测定和 T 细胞中减轻了对脱靶的切割,同时保持了比以前描述的变体更高的靶向活性。我们描述了一种进化的变体,S . pyogenes Adapted to Reduce Target Ambiguity Cas9 (SpartaCas),它由最丰富的突变组成,每个突变的功能未知。这种进化的 Cas9 突变体减少了脱靶切割,同时保留了对多个治疗相关靶标的有效编辑。使用我们的系统对 Cas9 进行定向进化展示了一种改进的结构独立方法,可以有效地设计核酸酶活性。
预印本(未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此版本的版权所有者于 2020 年 2 月 9 日发布。;https://doi.org/10.1101/2020.02.07.939074 doi:bioRxiv 预印本
缩写:Cmax:脑内巴瑞替尼的最大浓度,小鼠实验:在小鼠中实验观察到的,QIVIVE BBB:血脑屏障渗透的定量体外-体内外推,QSAR:定量结构-活性关系。
摘要 化脓性链球菌的 RNA 引导 Cas9 核酸酶已成为一种重要的基因编辑工具。然而,其固有的脱靶活性是生物医学应用面临的主要挑战。与一些报道的专门针对单个结构域的工程策略不同,考虑到 Cas9 的特异性是由各个结构域协同决定的,我们合理地在酶的多个结构域中引入了多个氨基酸替换,以创建潜在的高保真度变体。我们还利用了我们之前推导的活化 Cas9 复合物结构的原子模型来指导新的修饰。这种方法已鉴定出具有增强的 DNA 切割特异性的 HSC1.2 Cas9 变体。虽然 HSC1.2 变体的特异性增强在体外切割试验中似乎与位置有关,但这种 Cas9 变体的脱靶 DNA 编辑频率远低于人类细胞中的野生型 Cas9。通过分子动力学模拟研究了导致观察到的位置依赖性效应的潜在机制。我们的发现为利用结构和动态信息开发具有高基因编辑特异性的 Cas9 样酶奠定了坚实的基础。