2。在有指导RNA的情况下与靶DNA结合,只要目标是原始的邻接基序的上游(5'),GRNA和cas9核酸内切酶都会形成Cas9:GRNA复合物。cas9核酸内切酶与靶基因组基因核基因座结合均由导向RNA中包含的靶序列介导,又介导了一个3碱基对序列,称为原始序列相邻基序或PAM。为了通过CAS9切割DsDNA,它必须立即包含由导向RNA靶向的位点下游(3')的PAM序列。在没有引导RNA或PAM序列的情况下,CAS9既不会结合也不会切割目标。Cas9同源物(请参见下表)具有不同的PAM要求。这些不同的PAM要求使研究人员能够针对许多不同的基因组基因座。
图1。DNA结构的低能光电离已经研究了3。(a)由腺嘌呤 - 胸腺嘧啶和/或鸟嘌呤胞嘧啶碱基对组成的双链体。(b)G-四链体,其特征在于鸟嘌呤四龙的垂直堆叠(黄色);它们是由单个DNA链(单分子)的折叠,两个单链(双分子)的缔合或在含有Na +或K +阳离子(蓝色领域)的水溶液中四个单链(四分子)的关联而形成的。磷酸脱氧核糖主链以紫罗兰色指示。为简单性,在(b)中省略了环的核苷酸酶,连接鸟嘌呤四核和结束组。关于自由基阳离子的去质子化,在第3.5节中讨论了红色,蓝色和绿色质子。
与疾病相关的人类遗传变异范围从单碱基对替换到兆碱基重复、缺失和重排 1-3 。可以在人类细胞中安装、纠正或补充这些致病变异的基因编辑方法有可能促进对遗传疾病的了解,也可能实现新的治疗方法 4、5。过去十年来,已经开发出几种基于 CRISPR-Cas 系统的哺乳动物细胞基因编辑方法 6,包括核酸酶 7-9 、碱基编辑器 10、11 和主要编辑器 12 ,每种方法都有可能解决一组已知的致病序列变化。CRISPR-Cas 核酸酶(如 Cas9)可用于通过创建导致不受控制的插入/缺失混合的 DSB 来破坏基因。此外,配对的 Cas9 核酸酶策略可以介导长度从约 50 到 > 100,000 个碱基对的基因组 DNA 序列的靶向删除 13 。通过提供线性供体 DNA 序列,可以通过末端连接或同源性定向修复 (HDR) 过程在单个切割位点或成对切割位点之间定向插入新的 DNA 序列 14, 15。单核酸酶和成对核酸酶编辑方法虽然用途广泛,但它们也存在相当大的缺点。DNA 供体敲入伴随着高效的 indel 副产物 16,因为在大多数细胞类型中,HDR 与末端连接过程相比通常效率低下 17, 18。使用成对核酸酶进行靶向删除会产生多种副产物 13, 19,而且缺失的精确位置受到 PAM 可用性的限制。此外,在靶位或脱靶位点的 DSB 可促进大面积缺失 20-22、染色体异常 23、24 和染色体碎裂 25。 DSB 倾向于生成不良副产物和染色体改变的复杂混合物 26 - 28,这在应用基于核酸酶的编辑来操作较大的 DNA 序列时带来了相当大的挑战,特别是在治疗环境中。
多能视网膜祖细胞的视网膜细胞命运决定受染色质结构和基因表达的动态变化控制。DNA 胞嘧啶甲基化 (5mC) 受到积极调控,以正确控制基因表达和染色质结构。许多基因在视网膜发育过程中表现出活性 DNA 去甲基化;这个过程需要将 5mC 氧化为 5-羟甲基胞嘧啶 (5hmC),并由十-十一易位甲基胞嘧啶双加氧酶 (TET) 酶控制。使用一系列等位基因条件性 TET 酶突变体,我们确定 DNA 去甲基化是 NRL 和 NR2E3 表达上游所必需的,以建立视杆细胞命运。使用组织学、行为学、转录组学和碱基对分辨率 DNA 甲基化分析,我们确定抑制活性 DNA 去甲基化会导致整体变化
DNA双螺旋含有金属介导的DNA(mMDNA)碱基对由嘧啶:嘧啶对之间的Ag +和Hg 2 +离子构建,并具有纳米电子的承诺。MMDNA纳米材料的合理设计是不切实际的,没有完整的词汇和结构描述。在这里,探索了结构性DNA纳米技术的可编程性,探索了其自我组装的生物分子结构测定平台的自我组装的使命。使用X射线差异构建MMDNA对的全面结构库,并阐明了MMDNA构建的广义设计规则。发现了两种结合模式:N3-主导,中心对称对和由5位环修改驱动的主要凹槽粘合剂。能量差距计算显示了MMDNA结构的最低未居住的分子轨道(LUMO)中的额外水平,使它们具有吸引力的分子电子候选物。
目前,CRISPR/Cas9 系统已广泛应用于各类生物和细胞的基因组编辑。1,2 遗憾的是,它还会在与靶序列相似的非靶位点引起不必要的突变。3 非靶突变是由 CRISPR/Cas9 RNPs 对 DNA 序列的非特异性识别引起的。4 已证明,除了最佳 PAM 序列 5-NGG-3 之外,Cas9 还可以切割具有 5-NAG-3 或 5-NGA-3′PAM 的位点,尽管效率较低。5 此外,20 nt 的单向导 RNA(sgRNA)可以识别与 sgRNA 存在多达 3 - 5 个碱基对错配的 DNA 序列,这表明在人类基因组中特定核酸酶的可能结合位点多达数千个。 3 此外,CRISPR/Cas9 可以诱导与 RNA 引导链相比含有一些额外碱基(“ DNA 凸起”)或一些缺失碱基(“ RNA 凸起”)的 DNA 序列进行非靶向切割。6 非靶向 DNA 切割可导致
预先训练的大语言模型表明了从DNA序列中提取信息的潜力,但是适应各种任务和数据模式仍然是一个挑战。为了解决这个问题,我们提出了DNAGPT,这是一种对所有哺乳动物的超过2000亿碱基对训练的广义DNA预训练模型。通过使用二进制分类任务(DNA序列顺序)增强经典的GPT模型,一个数值回归任务(鸟嘌呤 - 环胞嘧啶内容预测)以及全面的令牌语言,DNAGPT可以处理多功能DNA分析任务,同时处理序列和数值数据。我们对基因组信号和区域识别,mRNA丰度回归和人工基因组生成任务的评估表明,与为特定的下游任务设计的现有模型相比,DNAGPT的表现优于卓越的性能,受益于使用新设计的模型结构的预培训。
多年来,通过 CRISPR 技术,斑马鱼、果蝇和秀丽隐杆线虫的定向诱变技术得到了显著改进。通过在体内诱导小的靶向突变,CRISPR 使研究人员能够有效地检查细胞通路。虽然这些突变通常是随机插入或缺失 (indel),但如果 CRISPR 组件设计得当,它们通常会导致靶基因的功能性破坏。但是,当前用于识别 CRISPR 生成的插入/缺失的协议通常需要大量劳动力、耗时或成本高昂。在这里,我们描述了一种直接、高通量的方法,用于通过使用片段分析仪平台来识别突变的存在,该平台允许通过高分辨率毛细管凝胶电泳进行 DNA 片段大小测定。按照该协议,可以快速可靠地识别小的插入/缺失(少至 2 个碱基对),从而可以对新生成的或稳定的突变系进行大规模基因分型。
在细菌防御和基因组编辑应用中,CRISPR 相关蛋白 Cas9 搜索数百万个 DNA 碱基对,以定位与原型间隔区相邻基序 (PAM) 相邻的 20 个核苷酸、向导 RNA 互补的靶序列。靶标捕获需要 Cas9 使用未知的 ATP 独立机制在候选序列处解开 DNA。在这里,我们展示了 Cas9 在 PAM 结合时急剧弯曲和下扭转 DNA,从而将 DNA 核苷酸从双链体中翻转并转向向导 RNA 进行序列询问。在询问途径的不同状态下捕获的 Cas9:RNA:DNA 复合物的低温电子显微镜 (EM) 结构以及溶液构象探测表明,整体蛋白质重排伴随着未堆叠的 DNA 铰链的形成。弯曲诱导的碱基翻转解释了如何