摘要:在基因组工程中,传入 DNA 的整合依赖于分裂细胞产生的酶,这一直是提高 DNA 插入频率和准确性的瓶颈。最近,据报道,使用 CRISPR 相关转座酶 (CAST) 的 RNA 引导转座在大肠杆菌中非常有效且具有特异性。在这里,我们开发了 Golden Gate 载体来在丝状蓝藻中测试 CAST,并证明它在鱼腥藻属菌株 PCC 7120 中有效。含有 CAST 和工程转座子的相对较大的质粒通过使用自杀或复制质粒的结合成功转移到鱼腥藻中。编码靶标前导链但不编码反向补体链的单向导 (sg) RNA 与 sgRNA 中包含的原间隔子相关基序 (PAM) 序列有效。在对两个不同靶位点进行分析的六种病例中,有四种的插入位点位于 PAM 之后正好 63 个碱基处。复制质粒上的 CAST 具有毒性,可用于治愈质粒。在分析的所有六种情况下,只有由从左到右元素的序列定义的转座子货物被插入目标位点;因此,RNA 引导的转座是由剪切和粘贴引起的。没有内源转座子通过暴露于 CAST 酶而重新动员。这项工作为通过 RNA 引导的转座在丝状蓝藻中进行基因组编辑奠定了基础,无论是在培养中还是在复杂群落中。关键词:鱼腥藻、CRISPR 相关转座子 (CAST)、基因组工程、RNA 引导的转座、minion 测序、从头基因组组装 ■ 简介
组蛋白去乙酰化酶抑制剂已被研究作为癌症和其他疾病的潜在治疗剂。已知 HDI 可促进组蛋白乙酰化,从而导致开放染色质构象并通常增加基因表达。在之前的研究中,我们报告了一组基因,特别是那些由超级增强子调控的基因,可以被 HDAC 抑制剂拉格唑抑制。为了阐明拉格唑抑制基因的分子机制,我们进行了转座酶可及染色质测序、ChIP-seq 和 RNA-seq 研究。我们的研究结果表明,虽然拉格唑治疗通常会增强染色质的可及性,但它会选择性地降低一组超级增强子区域的可及性。这些基因组区域在拉格唑存在下表现出最显著的变化,富含 SP1、BRD4、CTCF 和 YY1 的转录因子结合基序。 ChIP-seq 分析证实 BRD4 和 SP1 在染色质上各自位点的结合减少,特别是在调节基因(如 ID1、c-Myc 和 MCM)的超级增强子上。拉格唑通过抑制 DNA 复制、RNA 加工和细胞周期进程发挥作用,部分是通过抑制 SP1 表达来实现的。shRNA 消耗 SP1 可模拟拉格唑的几种关键生物学效应并增加细胞对该药物的敏感性。针对细胞周期调控,我们证明拉格唑通过干扰中期染色体排列来破坏 G/M 转换,这种表型在 SP1 消耗时也观察到。我们的结果表明,拉格唑通过抑制超级增强子上的 BRD4 和 SP1 发挥其生长抑制作用,导致细胞抑制反应和有丝分裂功能障碍。
最近的微生物基因组测序工作揭示了大量含有整合酶的移动遗传元件,这些整合酶可能成为有用的基因组工程工具。大型丝氨酸重组酶 (LSR),例如 Bxb1 和 PhiC31,是噬菌体编码的整合酶,可以促进噬菌体 DNA 插入细菌基因组。然而,之前仅鉴定了少数 LSR,它们在人类细胞中的效率有限。在这里,我们开发了一个系统的计算发现工作流程,通过识别数千个新的 LSR 及其同源 DNA 附着位点。我们通过在人类细胞中对 LSR 进行实验表征来验证这种方法,从而产生了三类根据其效率和特异性彼此区分的 LSR。我们识别了可有效整合到与人类基因组正交的合成安装附着位点的着陆垫 LSR、具有计算可预测伪位点的人类基因组靶向 LSR,以及可以单向整合货物的多靶向 LSR,其效率与常用转座酶相似,特异性更高。每个类别的 LSR 在人类细胞中都进行了功能鉴定,总体而言,其质粒重组率比 Bxb1 高出 7 倍,基因组插入效率为 40-70%,载物大小超过 7 kb。总体而言,我们建立了一个范例,用于大规模发现微生物重组酶并直接从微生物测序数据重建其靶位。该策略提供了丰富的资源,包括 60 多种经过实验鉴定的 LSR,这些 LSR 可以在人类细胞中发挥作用,以及数千种额外的候选 LSR,可用于大负载基因组编辑,而不会暴露 DNA 双链断裂。
昆虫学采样和存储条件通常会优先考虑效率,实用性和形态特征的保守性,因此可能是DNA保存的次优。这种做法可能会影响下游分子应用,例如高通量基因组文库的结构,这通常需要大量的DNA输入量。在这里,我们使用了实用的TN5转座酶标记的基于基于96孔板的库制备方法,并从昆虫腿的低屈服DNA提取物中进行了优化,这些昆虫的DNA提取物是在亚最佳条件下存储的DNA保存的。将样品在野外车辆中长时间保存,然后在冰箱中的乙醇中长期存储或在室温下干燥。通过将DNA输入减少到6ng,可以处理更多具有亚最佳DNA产量的样品。我们将这种低DNA输入与市售标记酶的6倍稀释匹配,从而大大降低了库制备成本。通过直接放大后单个图书馆汇集的成本和工作量进一步抑制。我们生成了90个样本中88个中等覆盖范围(> 3倍)基因组,平均覆盖率约为10倍。与储存在乙醇中的样品相比,与储存的样品相比,DNA的DNA明显较少,但这些样品具有较高的测序统计量,其测序读数较长,内源性DNA的速率更高。此外,我们发现基于标记的库制剂的效率可以通过彻底的放大后珠子清理来提高,该珠子可以选择不针对短和大的DNA片段。通过打开使用亚最佳保存的低产量DNA提取物的机会,我们扩大了昆虫标本的整个基因组研究的范围。因此,我们期望这些结果和该协议对于昆虫学领域的一系列应用都有价值。
然而,诸如全基因组测序,转座酶访问的染色质 - 序列或RNA测序(RNA-SEQ)之类的技术暴发可能通过在编码区域外部编码区外的基因组改变区域,分别为3个表面签名,4,5和Gene Cresessional cressions profiles。6在这项研究中,我们选择评估RNA-seq的诊断值,因为该技术允许探索3个遗传信息:基因序列,基因融合和基因表达。有趣的是,这些不同级别的分析都带来了有关肿瘤细胞的独立信息,因此,它们的整合应完善诊断的精度。For example, acute myeloid leukemia (AML) patients prognosis is evaluated by cytogenetics (copy number abnormalities and struc- tural variants), further refined by the analysis of the mutational status of a few genes, and could maybe be improved by transcrip- tomic signatures such as the 17-gene leukemia stem cell score (LSC17) which is a proxy of the number of leukemic stem细胞。已经描述了7种不同的RNA-seq库制备技术,从而可以分析样品的所有RNA分子,或者使用富集步骤来靶向感兴趣的基因,例如Messenger RNA或小RNA物种。值得注意的是,图书馆准备的选择应优化感兴趣的目标数量和所需的测序深度之间的平衡,以便在常规环境中保持经济负担。迄今为止,大多数涉及癌症的基因已经通过整个外显子组测序的大型程序来识别。迄今为止,大多数涉及癌症的基因已经通过整个外显子组测序的大型程序来识别。8基于这些考虑因素,我们决定评估涉及癌症生物学的1385个基因的靶向RNA-seq面板的性能。我们在这里介绍了靶向RNA-Seq检测融合转录本的分析性能,以鉴定与临床相关实体相关的转录曲线,并检测血液恶性肿瘤中临床意义的复发突变。
t Bio Farma(Persero)使用Borde-tella thea thea attuse pelita pelita III生产全细胞百日咳(WP)疫苗。百日咳菌株的抗原特性会随着时间的流逝而变化(1-3),因此,需要监测工作种子的这些特征以产生有效的疫苗。顺便说一句,最近的基因组学革命使全基因组shot弹枪进行了快速,准确且具有成本效益的途径,不仅检查疫苗抗原基因,而且还检查了生产过程至关重要的其他基因。但是,这取决于全基因组序列的可用性。出于这些原因,并且与其他百日咳疫苗生产菌株进行了详细比较,确定了百日咳芽孢杆菌菌株pelita III的整个基因组序列。The sequencing was performed at the University of Delaware Sequencing & Geno- typing Center (Newark, DE) on the PacBio RS II platform, employing single-molecule real-time (SMRT) technology (Pacific Biosciences, Menlo Park, CA) (4), yielding 141,140 reads totaling 888,059,822 bases.通过层次基因组组装过程(HGAP)工作流进行了从头基因组组装(4)。使用Gepard测试了组装序列的圆形,并用AMOS和Minimus2生成圆序(5,6)。最终组装产生了一个具有141.91覆盖率的4.1-MB基因组的重叠群。使用美国能源部联合基因组研究所(美国加利福尼亚州核桃溪)的综合微生物基因组综述(IMG/ER)平台进行了基因的初始识别和注释(7)。GenBank注释利用了NCBI原核基因组注释管道(8)。在基因组水平上,Pelita III与Bordetella buttussis tohama I(9,10),参考菌株(11)和百日咳疫苗的主要来源密切相关(3,12)。每种发病机理基因的核苷酸序列,包括疫苗抗原的核苷酸序列,即百日咳毒素(PT),心霉素(PRN),膜状血凝集素(FHA)(FHA)和纤维mbriae(FIM),在两种菌株中是相同的(13)。观察到的两个基因组之间的差异有两种类型:(i)Pelita III中的其他元素,可能是由于换位引起的,在两个位置的转座酶INSO的串联重复(BP 44713至
基因编辑有望通过直接纠正致病变异来最终治愈遗传病。然而,首次临床试验追逐的是“唾手可得的果实”,使用的编辑策略依赖于基因破坏,即通过引入双链 DNA 断裂,导致 NHEJ 通路插入和删除 (indel)。由于 NHEJ 在整个细胞周期和默认 DNA 修复通路中都处于组成性活跃状态,因此与同源定向修复 (HDR) 相比,这是迄今为止最有效的传统基因编辑类型。HDR 依赖于外源修复模板的递送,并且该通路仅在细胞周期的 S 和 G2 期活跃。这两个参数对 HDR 的临床应用构成了挑战,因为外源 DNA 在大多数治疗相关细胞类型中都是有毒的,并且 NHEJ 和 HDR 之间的固有竞争可能成为瓶颈。然而,HDR 的优势在于能够对基因组进行精确编辑,从而代表真正的基因编辑,并可控制结果。尽管如此,在这两种方式中,DNA 断裂都被认为是潜在的基因毒性来源,因为存在脱靶编辑和染色体畸变(如易位和染色体碎裂)的可能性。依赖于 DNA 单链切口的下一代基因编辑工具(如 Base Editing 和 Prime Editing)降低了此类有害事件的风险,但它们可以生成的编辑范围仍然有限(Anzalone 等人,2020 年)。基于 CRISPR 相关转座酶或 CRISPR 指导的整合酶的最新类型的编辑器可以促进更大规模的编辑,但仍在开发中,尚不成熟,无法用于临床实施(Yarnall 等人,2022 年;Tou 等人,2023 年)。这个快速发展的工具箱有望扩大基于 CRISPR 的工具和其他位点特异性工程核酸酶在治疗人类疾病中的应用。然而,在实现精准基因校正的这一过程中,仍存在一些尚未解决的问题和挑战需要克服,其中一些问题我们希望通过基于 CRISPR 系统或其他工程化位点特异性核酸酶的治疗性基因校正策略这一研究课题来解决。本研究课题涵盖了一系列贡献,包括精准基因工程的重大科学进展以及专家对最新进展的看法。
10摘要11个大型基础模型最近为生命科学开辟了新的人工通用情报12的途径,在分析单细胞转录组数据的分析中表现出了巨大的希望。13 Nevertheless, such challenges as the tremendous number of signaling regions, extreme data sparsity, 14 and the nearly binary nature of single-cell epigenomic data have prevented the construction of a 15 foundation model for epigenomics thus far, though it is evident that abundant epigenomic properties 16 such as chromatin accessibility provide more decisive insights into cell states than transcriptomics, 17 shaping the chromatin regulatory以不同的细胞类型控制转录的景观。在这里,我们介绍了Epiagent,这是第一个单细胞染色质可访问性数据的基础模型,在手动策划的大规模的人 - 示威 - corpus上预定了19个,该模型由20个大约500万个细胞和350亿个标记组成。epiagent编码染色质可访问性21个细胞模式作为简洁的“细胞句子”,并采用双向注意机制来捕获22个捕获调节网络背后的细胞异质性。具有全面的基准测试,我们23证明,Epiagent在典型的下游任务中出色,包括无监督功能24提取,有监督的细胞类型注释和数据插补。通过掺入外部25个嵌入,Epiagent促进了对样本外26的细胞反应的预测,并刺激了看不见的遗传扰动,以及参考数据整合和查询数据27映射。通过模拟关键顺式调节元件的敲除,Epiagent可以实现silico 28治疗癌症分析。我们进一步扩展了Epiagent的零射击功能,允许在新测序数据集上进行29个直接细胞类型注释,而无需进行其他培训。30 31引言32基因表达如何受到候选顺式调节33个元素(CCR)之间的复杂相互作用的控制,长期以来一直是基因组学领域的基本问题。的确,34这些元素不仅取决于其DNA序列,还取决于驱动与基因调节1,2相关的细胞异质性的表观遗传修饰35。在这些见解上,使用测序(SCATAC-SEQ)的单细胞36分析可用于转座酶可访问的染色质(SCATAC-SEQ)为揭示单个细胞的这些调节性景观3提供了前所未有的37个机会3,实现了38个细胞异质性4,组织发育4,组织的疾病机构5和疾病机制6。随着测序39技术的进步,已经构建了众多涵盖胎儿发育7,成人组织8、40脑组织9和神经发育10的大型细胞图谱,并提供了前所未有的资源41,可在多元化的生理条件下揭露调节模式。但是,大量的42个CCR,极端的稀疏性及其几乎二元性质对Scatac- 43
细菌免疫。Science。337 : 816-821, 2012。6)Gaj T, Gersbach CA, Barbas CF.: 基于ZFN、TALEN 和CRISPR/Cas 的基因组工程方法。Trends. Biotechnol. 31 : 397-405, 2013。7)Doudna JA, Charpentier E.: 基因组编辑。利用CRISPR-Cas9 进行基因组工程的新前沿。Science。346 : 1258096, 2014。8)Strecker J, Ladha A, Gardner Z 等:利用CRISPR 相关转座酶进行RNA 引导的DNA 插入。Science。 365 :48-53,2019。9)Klompe SE,Vo PLH,Halpin-Healy TS 等:转座子编码的 CRISPR-Cas 系统直接介导 RNA 引导的 DNA 整合。Nature。571 :219-225,2019。10)Jacobi AM,Rettig GR,Turk R 等:用于高效基因组编辑的简化 CRISPR 工具及其向哺乳动物细胞和小鼠受精卵中的精简协议。方法。121-122 :16-28,2017。11)Lino CA,Harper JC,Carney JP 等:CRISPR 的递送:挑战和方法综述。药物递送。 12)Kaneko T.:用于产生和维持有价值动物品系的生殖技术。J. Reprod. Dev. 64:209-215,2018。 13)Mizuno N,Mizutani E,Sato H等:通过腺相关病毒载体通过CRISPR/Cas9介导的基因组编辑实现胚胎内基因盒敲入。iScience。9:286-297,2018。 14)Yoon Y,Wang D,Tai PWL等:利用重组腺相关病毒在小鼠胚胎中精简体外和体内基因组编辑。Nat. Commun. 9 : 412, 2018。15)Takahashi G, Gurumurthy CB, Wada K, 等:GONAD:通过输卵管核酸递送系统进行基因组编辑:一种新型的小鼠微注射独立基因组工程方法。Sci. Rep. 5 : 11406, 2015。16)Sato M, Ohtsuka M, Nakamura S.:输卵管内滴注溶液作为在体内操纵植入前哺乳动物胚胎的有效途径。New Insights into Theriogenology, InTechOpen, London, 2018, pp 135-150。 17)Sato M,Takabayashi S,Akasaka E 等:基因组编辑试剂在小鼠生殖细胞、胚胎和胎儿体内靶向递送的最新进展和未来展望。Cells。9:799,2020。18)Alapati D,Zacharias WJ,Hartman HA 等:宫内基因编辑治疗单基因肺疾病。Sci. Transl. Med。11:eaav8375,2019。19)Nakamura S,Ishihara M,Ando N 等:基因组编辑成分经胎盘递送导致中期妊娠小鼠胎儿胚胎心肌细胞突变。IUBMB life。 20)Sato T, Sakuma T, Yokonishi T 等:利用 TALEN 和双切口 CRISPR/Cas9 在小鼠精原干细胞系中进行基因组编辑。Stem Cell Reports。5:75-82,2015。21)Wu Y, Zhou H, Fan X 等:通过 CRISPR-Cas9 介导的基因编辑纠正小鼠精原干细胞中的一种遗传疾病