。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本发布于2024年10月29日。 https://doi.org/10.1101/2024.10.24.620004 doi:Biorxiv Preprint
摘要:RNA 编辑旨在通过改变转录水平的基因表达来治疗遗传疾病。将定点 RNA 靶向机制与工程脱氨酶配对,可以可编程地校正 RNA 中的 G > A 和 T > C 突变。这为一系列遗传疾病提供了一种有前途的治疗方法。对于由大基因点突变引起的遗传性视网膜变性(不适合单腺相关病毒 (AAV) 基因治疗,例如 USH2A 和 ABCA4),校正 RNA 提供了一种基因替换的替代方法。由于对 RNA 进行的编辑具有短暂性和潜在可逆性,因此 RNA 而不是 DNA 的基因组编辑可能提供更好的安全性。本综述考虑了当前的定点 RNA 编辑系统,以及将其转化为临床治疗遗传性视网膜变性的潜力。
图1:Encodon和Decodon的概述:A)已从NCBI基因组数据库中提取了5000种物种的6000万个编码序列,并用于预先培训Encodon和Decodon基础模型。b)绝大多数数据(98.7%)由细菌编码序列组成。显示了NCBI中非细菌编码序列的分裂构成的饼图。c)NCBI基因组数据库中编码序列长度(密码子数)的直方图。我们将2048用作由Encodon和Decodon支持的最大序列长度,并考虑到所示的分散量以覆盖超过99.8%的序列。d)我们使用蒙版语言建模(MLM)目标仔细研究了Encodon,其中序列的一部分被损坏/掩盖了,并且该模型必须在给定其余的令牌(即上下文)。decodon是一种有条件的生成变压器模型,它通过将序列生物体作为第一个输入令牌来提供可控的编码序列生成。我们在汇总的编码序列中,用因果(自动性)语言建模目标进行了训练,其中每个序列都用特殊的有机体令牌培养。旋转位置自我注意事项均在Encodon和Decodon块中使用。e)3个ecdodons和2个解码,比例不同(即可训练参数的数量)已在NCBI基因组数据库的汇总语料库上进行了超过1,000,000个优化步骤的预训练。
我们报告了一系列适用于检测和克隆翻译控制信号和外源基因 5' 编码序列的质粒载体的构建和使用。在这些质粒中,乳糖操纵子 β-半乳糖苷酶基因 lacZ 的氨基末端的前八个密码子被去除,并在 lacZ 的第八个密码子附近插入独特的 BamHI、EcoRI 和 SmaI (XmaI) 内切酶切割位点。将含有适当调节信号和 5' 编码序列的脱氧核糖核酸片段引入此类 lac 融合质粒导致产生由 β-半乳糖苷酶残基的羧基末端片段和含有外源脱氧核糖核酸序列编码的氨基末端氨基酸的肽片段组成的混合蛋白。这些杂合肽保留了 1,8-半乳糖苷酶的酶活性,并产生了 Lac' 表型。此类杂合蛋白可用于纯化由外源脱氧核糖核酸片段编码的肽序列,以及用于研究特定肽片段的结构和功能。
癌症是我们年龄的重要文明问题。科学家继续寻找负责致癌过程的新因素。在1993年,维克多·安布罗斯(Victor Ambros),罗莎琳(Rosalind Lee)和隆达·费恩鲍姆(Rhonda Feinbaum)发现,埃列哥秀丽隐杆线虫基因lin-4涉及控制这种非寄生虫线虫的幼虫发育,没有编码蛋白质,但没有编码蛋白质,而是一对短rna-about 22和大约61个基础。相关的RNA反过来是对3'UTR LIN-14基因结束时许多地方的反义互补的[1]。进一步的研究表明,LIN-4基因产物通过减少LIN14蛋白的量来调节LIN-14基因,同时保持LIN-14的mRNA浓度[2]。最后,有人认为这些短RNA对LIN-14的作用具有抑制作用,从而调节了从秀丽隐杆线虫的第一个幼虫阶段到第二阶段的转化开始[2]。RNA被认为是丰富的microRNA家族的第一个,主要是执行调节功能[2]。接下来的几年带来了新的microRNA分子。在许多生物体中,不仅在哺乳动物,昆虫,结节或植物中都观察到它们的存在[1]。绝大多数microRNA仍然在进化上保守[1,2]。单个microRNA通常也存在于特定细胞中,例如肝细胞中的miR-122 [1]。microRNA的基因以非常多样化的方式位于基因组中。它们是操纵子的一部分,发生在蛋白质编码序列的一部分之间[2]。它们发生在未翻译的外显子,内含子或序列中[2]。它们可能构成一个独立的转录单元[2]。作为内含子的一个组成部分,可以将它们与编码蛋白质的整个基因一起转录,从而导致microRNA和mRNA(PRE-mRNA)[1]。MicroRNA的基因由聚合酶II或III RNA转录[1,2]。microRNA的基因通常是在被转录为多孔子转录单元的簇中组织的[3]。它们可以在蛋白质编码序列和作为独立转录单元的功能之间发生,它们也可以位于编码序列中[4]。转录单元的这种布置可以导致miRNA和mRNA转录本的同时形成[5]。miRNA基因以某种方式组织