。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权持有人,该版本发布于2024年11月1日。 https://doi.org/10.1101/2023.10.28.564543 doi:Biorxiv Preprint
图 1 RBSD(针对缺失的复制阻滞)的概念。(A)复制解旋酶、复制叉和复制体,后者是含有至少 50 种动态相关蛋白质的复合体,可介导 DNA 复制和相关过程。图中仅显示 DNA 解旋酶。在真核生物中,主要的复制解旋酶从 3′ 转移到 5′。另一种复制酶从 5′ 转移到 3′。冈崎 DNA 片段的合成方向用虚线箭头表示。序列特异性复制阻滞(参见正文)用红色星号表示。(B)在 RBSD 中,两个序列特异性复制阻滞分别位于癌细胞特有的两个缺失位点,位于两个汇聚的复制叉前方。如图 2A 和正文所述,由于两个纯合 DNA 缺失,存在用于结合两个障碍的癌症特异性 DNA 位点,这两个纯合 DNA 缺失仅限于癌细胞,并被选为放置障碍的位置。在早期阶段,如图 (B) 所示,两个相邻复制子中的两个复制起点启动四个复制叉的移动,其中两个开始接近两个序列特异性的障碍。 (C) 两个汇聚的复制叉(图中的四个)与两个障碍相撞的阶段。 (D) 四个复制叉中的两个继续移动,复制 DNA,而其他两个复制叉被两个障碍阻止,导致路障之间出现一段未复制的亲本 DNA(蓝色)。 (E) 如果一段未复制的亲本 DNA 持续存在直到有丝分裂期间,则会导致染色体不分离。后者会导致非整倍性或细胞死亡,具体取决于细胞类型和其他条件。如正文所述,RBSD 可以通过在几条不同的染色体上放置序列特异性、癌症限制的复制障碍对来扩展。这些染色体在癌细胞中同时不分离会进一步增加 RBSD 的癌症特异性毒性。复制体用绿色椭圆表示。箭头对表示叉运动的方向。单链亲本和子代 DNA 分别用黑色和橙色表示。未复制的亲本 DNA 用蓝色表示。
为了健康发育,染色体应包含适量的物质——不多不少。7q 缺失的人有一条完整的 7 号染色体,但另一条缺失了一段,这会影响学习和身体发育。大多数临床困难可能是由于多个基因只有一个拷贝(而不是通常的两个)造成的。作为一条中等大小的染色体,7 号染色体上的 1150 个基因约占人类基因组中基因总数的 4%,基因组是每个细胞中染色体的完整补充。然而,孩子的其他基因、环境(包括饮食、运动、接触、成长等)和个人特征也有助于决定他们未来的发展、需求和成就。最终,临床结果很可能取决于 7q21-32 区域中哪些基因缺失以及哪些基因保持重复。
出版商的免责声明。e-发布在印刷前对于快速传播科学而言越来越重要。Haematologica是已完成常规同行评审并已被接受出版的早期手稿的电子发布PDF文件。出版已由作者批准。在印刷之前发行电子版本后,手稿将进行技术和英语编辑,排版,证明校正和呈现以供作者的最终批准;然后,手稿的最终版本将出现在日记的常规期刊中。所有适用于该期刊的法律免责声明也与该生产过程有关。
。cc-by 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他已授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本发布于2024年8月26日。 https://doi.org/10.1101/2024.08.26.609494 doi:Biorxiv Preprint
结果:我们通过检查不同脊椎动物基因组中的保守区域并与可靠注释的人类特异性固定缺失重叠,确定了 10,032 个 hCONDEL。我们发现这些 hCONDEL 富含删除源自干羊膜动物的保守序列。与转录、表观基因组和表型数据集的重叠都暗示了神经元和认知功能的影响。我们使用 MPRA 在六种不同的人类细胞类型中表征了这些 hCONDEL,包括诱导多能干细胞衍生的神经祖细胞。我们发现 800 个 hCONDEL 显示出物种特异性的调节效应。虽然许多 hCONDEL 会扰乱活性增强子中的转录因子结合位点,但我们估计 30% 会创建或改善结合位点,包括激活剂和抑制剂。
结果:我们通过检查各种脊椎动物基因组的保守区域并与自信注释的人类特异性固定缺失重叠,从而确定了10,032个HCONDEL。我们发现,这些HCONDEL富含源自茎羊膜的保守序列。与转录,表观基因组和表型数据集重叠均暗示神经元和认知功能影响。我们在六种不同的人类细胞类型中使用MPRA表征了这些HCONDEL,包括诱导多能干细胞衍生的神经祖细胞。我们发现800个HCONDEL显示出物种特异性的调节作用。尽管许多HCONDELS扰动转录因子 - 有效增强子中的结合位点,但我们估计30%创建或改善了结合位点,包括激活剂和阻遏物。
1 Precise genomic deletions using paired prime editing 2 3 Junhong Choi 1,2*# , Wei Chen 1,3* , Chase C. Suiter 1,4 , Choli Lee 1 , Florence M. Chardon 1 , Wei Yang 1 , Anh 4 Leith 1 , Riza M. Daza 1 , Beth Martin 1 , and Jay Shendure 1,2,5,6# 5 6 1 Department of Genome Sciences, University美国西雅图,华盛顿州华盛顿州98195,美国7 2霍华德·休斯医学研究所,西雅图,西雅图,华盛顿州98195,美国8 3分子工程与科学研究所,华盛顿大学西雅图大学,华盛顿大学98195,美国9 4分子和细胞生物学计划98195,美国11 6 Allen Discovery Cell Lineage Tracing中心,华盛顿大学西雅图,华盛顿州98195,美国12 13 *这些作者同样贡献了14#对应关系:junhongc@uw.edu(J.C.)15 16 17摘要18 19精确地删除基因组序列的技术可用于研究20功能,并有可能用于基因治疗。针对编程的21删除的领先当代方法使用CRISPR/CAS9和成对的指南RNA(GRNA)产生附近的两个双链22间断,然后通常在DNA修复过程中删除中间序列。但是,23这种方法可能是效率低下和不精确的,其中包括两个目标站点24的小indels,以及意外的大删除和更复杂的重排。我们证明,与CRISPR/CAS9和GRNA Pairs相比,Prime-Del在编程缺失中的精度明显高28。44 45在这里,我们描述了一种基于Prime-Del的基于25个编辑的方法,该方法使用一对原始编辑的26个GRNA(PEGRNA)诱导删除,该方法靶向相反的DNA链,有效地编程了27个站点,还可以对其进行修复的结果进行编程。我们还表明,29个Prime-Del可用于将基因组删除与短插入相结合,从而使30个连接的缺失不落在原始的Adjacent-Adjacent基序(PAM)位点。最后,我们证明了延长31素数编辑组件的表达时间窗口可以大大提高效率32,而不会损害精度。我们预计,Prime-Del将在启用33个精确,灵活的基因组缺失编程(包括框内删除)以及epiTope 34标记以及可能用于编程重排的基因组删除方面非常有用。35 36简介37 38精确操纵基因组的能力可以严格地研究39个特定基因组序列的功能,包括基因和调节元件。在过去的十年中,基于CRISPR/CAS9的40个技术在这方面已被证明具有变革性,从而可以将41个基因组基因座的精确靶向,并迅速扩大了编辑或扰动方式的曲目1。在42中,特定基因组序列的精确和不受限制的缺失尤为重要,功能性基因组学和基因治疗中有43例关键用例。
随着被忽视的热带疾病利什曼病在全球范围的蔓延,再加上治疗方法有限,且这些治疗方法都存在耐药性、成本、毒性和/或给药问题,在病原昆虫媒介原生动物利什曼原虫中验证新药物靶点比以往任何时候都更加重要。在 2015 年引入 CRISPR Cas9 技术之前,新靶点的基因验证主要通过同源重组进行靶向基因敲除,其中大多数靶向基因(约 70%)被视为非必需基因。在本研究中,我们利用现成的全基因组测序技术重新分析了这些历史细胞系之一,即 L. major 敲除丝氨酸棕榈酰转移酶 (LCB2) 催化亚基,这会导致鞘脂生物合成完全丧失,但仍具有活力和感染性。结果发现了许多单核苷酸多态性,但也揭示了几个编码区的完全丢失,包括一个编码假定的 ABC3A 直系同源物(假定的固醇转运蛋白)的基因。假设这种转运蛋白的缺失可能促进了 LCB2 催化亚基的定向敲除和从头鞘脂生物合成的完全丧失,我们重新检查了 L. mexicana 品系中的 LCB2,该品系经过工程改造,可直接通过 CRISPR Cas9 定向操作。令人惊讶的是,LCB2 无法被敲除,表明其是必需的。然而,同时删除 LCB2 和假定的 ABC3A 是可能的。这表明假定的 ABC3A 的缺失促进了利什曼原虫中鞘脂生物合成的丧失,并表明我们应该重新检查许多其他基因被视为非必需的利什曼原虫敲除品系。
DNA分子上的数据存储是存档大量数据的有前途的方法[1] - [4]。在经典的DNA存储系统中,将二进制信息编码为由四个DNA碱基{a,c,g,t}组成的序列。编码序列用于使用DNA合成的生化过程生成称为链的DNA分子。合成的链储存在管中。要检索二进制信息,必须通过DNA测序读取链,并将解码回到二进制表示中。合成过程和测序程序是容易出错的,并且随着DNA的自然降解,它们会向DNA链引入错误。为了确保数据可靠性,必须通过算法和错误校正代码(ECC)来纠正错误。最近,为了允许更高的潜在信息能力[5],[6]引入了复合DNA合成方法。在此方法中,使用标准DNA合成方法创建的多个副本可用于创建复合DNA符号,该符号由DNA碱基的混合物及其比率定义,其比率及其特定位置。通过定义不同的混合物和比率,可以将字母扩展到具有4个以上的符号。更正式地,可以将特定位置的复合DNA符号抽象为概率的四重奏{p a,p c,p g,p g,p t},其中p x,0≤px≤1是基本x∈{a,c,g,t}的底数。因此,要识别复合符号,需要对多个读数进行测序,然后在每个位置估算p a,p c,p g,p t。由于该方法中字母符号的独特结构,基本级别的误差可以轻松更改观察到的碱基的混合物及其比率,因此更改了观察到的复合符号。此外,在此设置中,合成过程的固有冗余性(即,每股多个副本)不能直接用于