。CC-BY 4.0 国际许可(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者此版本于 2020 年 3 月 9 日发布。;https://doi.org/10.1101/2020.03.09.983494 doi:bioRxiv 预印本
基于CRISPR的单细胞转录组筛选是有效的遗传工具,可同时评估由一组指南RNA(GRNA)靶向的细胞的表达式,并从观察到的扰动中推断靶基因函数。然而,由于各种局限性,这种方法在检测弱扰动方面缺乏灵敏度,并且在研究主调节器(例如转录因子)时基本上是可靠的。为了克服检测微妙的GRNA诱导的转录组扰动和对响应最快的细胞进行分类的挑战,我们开发了一种新的监督自动编码器神经网络方法。我们稀疏的监督自动编码器(SSAE)神经网络提供相关特征(基因)和实际扰动细胞的选择。我们将此方法应用于基于基于缺氧的长期非编码RNA(LNCRNA)的子集的基于内部单细胞CRISPR干扰(CRISPRI)转录组筛查(CROCPRI)转录组筛选(CROP-SEQ),该子集受缺氧调节的疾病,该疾病在肺腺癌(Lung adenacoarcinoma)(LUAD)的背景下促进了肿瘤的侵略性和耐药性。针对LNCRNA的子集进行了经过验证的GRNA的农作物序列库,并且作为阳性对照,HIF1A和HIF2A(低氧反应的2个主要转录因子)在3、6或24 h期间在正态氧中培养的A549 LUAD细胞中转导的2个主要转录因子。我们首先通过确定在低氧反应的时间开关期间确定其敲低的特定效应,从而验证了HIF1A和HIF2上的SSAE方法。接下来,SSAE方法能够检测出稳定的短缺氧依赖性转录组特征,该特征是由某些LNCRNA候选者的敲低诱导的,表现优于先前发表的
。CC-BY-NC-ND 4.0 国际许可,根据 提供(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者此版本于 2023 年 7 月 15 日发布。;https://doi.org/10.1101/2022.10.31.514627 doi:bioRxiv 预印本
CRISPR 干扰(CRISPRi)和 CRISPR 激活(CRISPRa)由于其设计简单且有效,已成为控制细菌基因表达的普遍方法。通过调节目标基因的转录,CRISPRi/a 可以动态地设计细胞代谢,实现转录调控电路,或阐明从较小的靶向文库到整个基因组文库的基因型-表型关系。虽然 CRISPRi/a 主要在模型细菌大肠杆菌和枯草芽孢杆菌中建立,但越来越多的研究表明这些工具可以扩展到其他细菌物种(这里泛指非模型细菌)。在这篇小型评论中,我们讨论了导致 CRISPRi/a 工具在不同非模型细菌中创建速度较慢的挑战,并总结了这些方法在细菌门中的现状。我们发现,尽管在非模式微生物中建立新型 CRISPRi/a 存在潜在困难,但文献中已报道了 8 个细菌门类中 190 多个近期实例。大多数研究都侧重于工具开发或使用这些 CRISPRi/a 方法来探究基因功能,而将 CRISPRi/a 基因调控应用于代谢工程或高通量筛选和选择的例子较少。迄今为止,大多数 CRISPRi/a 报告都是针对非模式细菌物种的常见菌株开发的,这表明在未驯化细菌中建立这些遗传工具仍然存在障碍。更有效和更通用的方法将有助于实现基于 CRISPR 的可编程转录控制在各种细菌中的巨大潜力。
多重遗传扰动对于测试编码或非编码遗传元件之间的功能相互作用至关重要。与 DNA 切割相比,使用 CRISPR 干扰 (CRISPRi) 抑制染色质形成可避免基因毒性,并且在混合检测中更有效地扰乱非编码调控元件。然而,目前的 CRISPRi 混合筛选方法通常仅限于每个细胞靶向 1-3 个基因组位点。为了开发一种在功能基因组学筛选中使用 CRISPRi 对基因组位点进行高阶 (> 3) 组合靶向的工具,我们设计了一种 Acidaminococcus Cas12a 变体——称为多重转录干扰 AsCas12a (multiAsCas12a)。 multiAsCas12a 在使用慢病毒转导传递的 CRISPR RNA(crRNA)高阶多路复用阵列进行组合 CRISPRi 靶向时,其表现明显优于最先进的 Cas12a 变体,
在没有靶标切割的情况下,催化失活的 dCas9 通过在空间上阻止 CRISPR (cr)RNA 指向的给定基因上的 RNA 聚合酶活性来施加转录基因抑制。这种基因沉默技术称为 CRISPR 干扰 (CRISPRi),已用于各种细菌物种以检测基因,主要是单独或成对检测。在这里,我们在病原体 Legionella pneumophila 中开发了一个多路复用 CRISPRi 平台,能够同时沉默多达十个基因。通过将强进行性启动子与重复/间隔序列上游的 boxA 元素相结合,克服了 Rho 依赖性转录终止对前体 crRNA 表达的限制。使用针对毒力蛋白编码基因的 crRNA,我们证明 CRISPRi 不仅在无菌培养基中生长期间完全发挥作用,而且在巨噬细胞感染期间也完全发挥作用,并且 CRISPRi 的基因耗竭完全重现了缺失菌株的生长缺陷。重要的是,通过改变重复/间隔序列中 crRNA 编码间隔序列的位置,我们的平台实现了目标的逐渐消耗,这反映在表型的严重性上。因此,多重 CRISPRi 有望用于大量探测大量基因,以破译 L. pneumophila 和其他细菌病原体的毒力策略。
基因组编辑 CRISPR/Cas9 技术已导致人工转录抑制因子(也称为 CRISPR 干扰 (CRISPRi))的开发。由 crRNA 引导的失活 Cas9 (dCas9) 蛋白可以特异性地结合靶 DNA 序列,包括启动子和操纵子,而不会切割 DNA。原型间隔区相邻基序 (PAM) 序列依赖性在靶向特异性 CRISPRi 的设计中可能是不利的,因为 PAM 序列对于 CRISPR/Cas9 系统的 DNA 切割至关重要。我们在 L-阿拉伯糖诱导的 P BAD 启动子的控制下,在大肠杆菌中构建了一个染色体整合的 dCas9 系统 (1 araBAD : dcas9)。将携带各种 crRNA 的质粒转化到表达 dCas9 的大肠杆菌中,这些 crRNA 具有针对 gal 启动子(-10 区域)和 gal 操纵子中的 galETK 结构基因的靶序列。在有或没有无偿 L-阿拉伯糖的情况下监测细胞生长和/或半乳糖代谢率。靶向转录延长会部分减缓 D-半乳糖消耗和细胞生长,但靶向转录起始会完全抑制 D-半乳糖消耗和细胞生长。此外,RT-qPCR 分析表明,具有几种修饰 PAM 序列的 CRISPRi 可以抑制靶 DNA 的转录。这些结果表明,可以通过使用 CRISPRi 靶向结构基因或调控区域来控制细胞代谢率和细胞生长;此外,松散的 PAM 序列依赖性可以扩展 CRISPRi 的 DNA 靶标。
高通量的witturb-seq实验遵循CRISPRI屏幕,单细胞库准备,测序和数据分析的工作流程(图1)。虽然多种单细胞测序方法与wisturb-seq兼容,但该实验是由合同研究组织(荷兰乌特雷希特的单细胞发现)进行的,但使用了组合索引套件来最大程度地提高细胞吞吐量。CRISPR液滴测序(农作物Seq)指导RNA(GRNA)载体用于CRISPRI屏幕引入Polya尾巴,以确保与试剂盒中的GRNA捕获引物的兼容性。在CRISPRI屏幕之后,固定细胞并将其存储在-80°C下,直到库制备。生成了两种不同类型的条形码测序库:SCRNA-SEQ库和CRISPR库。对于涵盖100,000至1,000,000个单元的项目,建议使用25B流单元的Novaseq X Plus系统(表1)。
噬菌体是微生物群落动态,功能和进化的关键生态驱动因素之一。尽管它们在细菌生态学和进化过程中的重要性,但噬菌体基因的特征很差,阻碍了它们在各种生物技术应用中的用法。表征此类基因的方法,即使是对噬菌体生命周期至关重要的基因,也是劳动密集型的,通常是噬菌体的。在这里,我们开发了一种可扩展到可扩展到新的噬菌体 - 宿主组合的系统基因质量映射方法,该方法促进了非必需基因的鉴定。作为概念证明,我们使用阵列的基因组宽CRISPR干扰(CRISPRI)分析来映射基因coliphagesλ和p1中的基因本质景观。是由一系列CRISPRI探针导致的,这在很大程度上是根据lambda的数十年遗传分析确定的基本基因花名册,并为P1中必不可少的和非必要的基因座提供了新的见解。我们提供了CRISPRI极性如何导致假阳性基因的必要性分配的证据,并建议对解释CRISPRI的基因本质数据的谨慎态度。最后,我们表明我们可以通过将DNA条形码插入新确定的内部区域来设计噬菌体,这将增强各种应用中噬菌体的识别,量化和跟踪过程的能力。
RNA分子在广泛的生物过程中起着至关重要的作用。 对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。 最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。 在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。 带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。 专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。 rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。 我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。RNA分子在广泛的生物过程中起着至关重要的作用。对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。