核糖体分析 (Ribo-Seq) 揭示了目前注释的编码序列 (CDS) 之外的数千个非规范核糖体翻译位点,从而改变了我们对人类基因组和蛋白质组的理解。保守估计至少有 7000 个非规范 ORF 被翻译,乍一看,这有可能将人类蛋白质 CDS 的数量扩大 30%,从约 19,500 个注释的 CDS 增加到超过 26,000 个注释的 CDS。然而,对这些 ORF 的进一步审查提出了许多问题,即它们中有多少部分真正产生了蛋白质产物,又有多少部分可以根据对该术语的传统理解理解为蛋白质。进一步复杂化的是,已发表的非规范 ORF 估计值相差约 30 倍,从几千到几十万。这项研究的总结让基因组学和蛋白质组学界既对人类基因组中新编码区域的前景感到兴奋,又在寻找如何继续的指导。在这里,我们讨论了非规范 ORF 研究、数据库和解释的现状,重点是如何评估给定的 ORF 是否可以说是“蛋白质编码”。
驯化导致番茄耐盐性降低。为了确定造成这种缺陷的遗传成分,我们对由 369 个具有较大自然变异的番茄种质组成的群体进行了根系 Na + /K + 比的全基因组关联研究 (GWAS)。与根系 Na + /K + 比相关的最显著变异是在编码进化枝 IV HAK/KUP/KT 转运蛋白成员的基因 SlHAK 20 中确定的。我们进一步发现,SlHAK 20 运输 Na + 和 K + 并在盐胁迫条件下调节 Na + 和 K + 稳态。发现 SlHAK 20 编码序列的变异是与 Na + /K + 比相关的致病变异,并赋予番茄耐盐性。番茄 SlHAK 20 和水稻同源基因的敲除突变导致对盐胁迫的高度敏感性。总之,我们的研究揭示了一种以前未知的耐盐分子机制,该机制是造成栽培番茄品种耐盐性不足的原因。我们的研究结果为通过分子育种提高番茄和其他作物的耐盐性提供了重要信息。
CRISPR/Cas9 系统天然存在于细菌和古细菌免疫系统中 [ 1 ] ;然而,它已被改造用于真核生物,成为获得诺贝尔奖的基因组编辑系统 [ 2,3 ] 。CRISPR/Cas9 系统使用 gRNA 将 Cas9 核酸酶引导至 NGG 原型间隔区相邻基序序列附近的特定靶标。然后,Cas9 切割 DNA,细胞的天然 DNA 损伤修复机制修复双链断裂。在 CRISPR/Cas9 编辑过程中,用于敲除和修饰靶基因的两种主要修复途径是非同源末端连接 (NHEJ) 和同源定向修复途径。当供体 DNA 模板不可用时,NHEJ 是修复双链断裂的主要选择,这使其成为 CRIPSR/Cas9 敲除实验的一个不错选择。核苷酸的丢失和获得是 NHEJ 介导的修复过程中的常见现象,而敲除则来自编码序列的移动。同源定向修复基于供体 DNA 模板的可用性,主要用于编码或非编码序列中的定制基因修饰 [4,5]。CRISPR/Cas9 系统越来越多地用于高级疗法,包括细胞和基因疗法,前景广阔(例如,用于治疗镰状细胞病的 CRISPR 测试)[6,7]。许多用于实现 CRISPR/Cas9 核酸酶 RNA 引导的基因组编辑的商业产品可通过多种递送方式获得。这些产品包括病毒、质粒、mRNA 和 RNP 中编码的 DNA。此外,CRISPR gRNA 可以分为两部分递送,即 crRNA 和 tracrRNA,或作为 sgRNA。多种细菌物种提供 CAS 蛋白选择;常用的一种是化脓性链球菌 Cas9。同样,这些分子进入细胞的方式也有很多,包括病毒载体(如慢病毒和腺相关病毒载体)和化学方法(如脂质、注射和电穿孔)[8,9]。尽管 CRISPR/Cas9 是一种令人兴奋的基因组编辑工具,但在使用 CRISPR/Cas9 编辑细胞后,关于基因组和表型稳定性的纵向数据有限。目前有几份报告提供的证据表明,CRISPR/Cas9 编辑还可能带来其他意想不到的长期变化[10–12]。此外,在选择编辑的细胞亚群时可能会出现遗传瓶颈。因此,对用于细胞和基因疗法等高级疗法的编辑细胞进行表征至关重要,因为这种疗法通常涉及给患者施用编辑过的细胞群[13]。
基因组编辑工具的出现,例如CRISPR-CAS9,已使遗传和基于细胞的疗法的发展用于治疗遗传疾病(Porteus,2019年)。进行了多项临床试验,以测试自体基因编辑的造血干细胞(HSC)的安全性治疗遗传疾病(NCT03655678,NCT04208529,NCT0485576肝脏的编辑以治疗经性淀粉样变性(ATTR,NCT04601051)或遗传血管性水肿(HAE,NCT05120830)(Frangoul等,2021; Gillmore等,2021)。值得注意的是,目前大多数开放临床试验都集中在基因敲除(KO)而不是同源性基因修复上。KO不需要同时递送同源序列来纠正引起疾病的突变,因此通常与较高的成功编辑效率有关。由于我们已经广泛的知识和骨髓中HSC移植的既定程序(Consiglieri等,2022)以及脂质纳米颗粒技术的可用性,因此这些示例的可行性得到了加速,并有效地靶向了肝脏(QIU等,20221)。Unfortunately, such techniques and technologies are not available for targeting the lung speci fi cally, therefore, expanding the use of genome editing tools to treat other inherited disorders, such as cystic fi brosis (CF), primary ciliary dyskinesia (PCD) and surfactant protein disorders impacting the lungs is of signi fi cant interest.图1总结了这些研究的发现。CF是由CF跨膜电导调节剂(CFTR)基因突变引起的。在这些情况下,体内基因组编辑受到挑战的限制,其中1)将基因组编辑试剂递送到所需的细胞中,基因校正所需的同源重组需要CRISPR-CAS9和CRISPR-CAS9和同源DNA才能将其传递到同一细胞中,以及2)对理想细胞/干细胞的长期疾病矫正的理解。EX-VIVO基因编辑可能是一种更有效的方法,但是基因编辑的细胞和调理方案的递送,使上皮接受细胞的植入而没有损害患者的肺功能,但仍表现出重要的挑战。在本研究主题中,我们提供了四篇文章,描述了产生自体基因校正的气道基底细胞(BCS),移植气道BC的努力,并讨论了扩展这些工具以治疗影响肺泡的表面活性剂蛋白质疾病的潜力。一个主要挑战是气道干细胞的有效基因校正,同时保持其再生潜力。许多基因校正工作都集中在CF上,因为它是影响肺部最有特征的遗传疾病之一(Suzuki等,2020; Vaidyanathan等,2020)。在CFTR中已经描述了2000多种不同的突变,因此,人们对替换整个CFTR编码序列的兴趣引起了极大的兴趣,以开发适用于所有CF患者的治疗。但是,CFTR编码序列(4,500 bp)接近常用腺相关病毒的包装极限
基因组语言模型(GLM)的出现提供了一种无监督的方法,可以在非编码基因组中学习各种顺式调节模式,而无需湿LAB实验产生的功能活动标签。先前的评估表明,可以利用预训练的GLM,以提高广泛的调节基因组学任务的预测性能,尽管使用了相对简单的基准数据集和基线模型。由于这些研究中的GLM在对每个下游任务的重量进行微调时进行了测试,从而确定GLM表示是否体现了对顺式调节生物学的基本理解仍然是一个悬而未决的问题。在这里,我们评估了预训练的GLM的代表性,以预测和解释跨越DNA和RNA调控的细胞类型特异性功能基因组学数据。我们的发现表明,当前的GLM与使用单热编码序列的常规机器学习方法没有实质性优势。这项工作强调了当前GLM的主要局限性,从而在非编码基因组的常规预训练策略中提出了潜在的问题。
替代蛋白(AltProts)代表了一种新认识的生物活性蛋白,这些蛋白质是根据已经注释的基因中的替代开放式阅读框(ALTORF)编码的。这项研究的重点是SLC35A4基因,该基因编码参考蛋白SLC35A4和替代蛋白AltSLC35A4。结合了显微镜和生化分析,我们证实了内部线粒体膜中AltSLC35A4的存在,从而解决了先前的相互矛盾的报告。先前采用核糖体分析的研究表明,在砷钠诱导的氧化应激期间,SLC35A4的参考编码序列在所有细胞mRNA中的转化效率上的提高最大。我们的结果证实了这种翻译的上调,在氧化应激期间以上游ORF依赖性方式出现了SLC35A4蛋白同工型。值得注意的是,在氧化应激期间,AltSLC35A4的表达保持不变。敲出SLC35A4以可救出的方式增强对氧化应激的敏感性,表明对SLC35A4在应力抗性中的直接影响。总而言之,我们的研究为SLC35A4双重编码性质的功能意义提供了令人信服的证据,以抗氧化应激,并突出了在真核基因功能研究中考虑AltProts的重要性。
从转录到蛋白质合成的道路铺有许多障碍,从而允许几种基因表达的转录后调节模式。mRNA生物学中的基本参与者是DDX3X,它是一种RNA结合蛋白,可通过规范调节mRNA翻译。通过监测DDX3X耗竭后的mRNA丰度和翻译的动力学,我们观察到翻译抑制的mRNA的稳定。我们使用可靠的统计学习模型来发现编码序列中的GC含量作为RNA稳定的主要特征。该结果证实了在其他研究中可检测到的与GC含量相关的mRNA调控,包括数百个编码数据集和最近关注细胞周期中mRNA动力学的工作。我们通过详细分析了数百个样品中的RNA-seq Pro填充物,包括表现出细胞周期和神经发生缺陷的DDX3X敲除小鼠模型,提供了进一步的mRNA稳定证据。我们的研究确定了mRNA调节的根本特征,并强调了量化基因表达级联的多个步骤的重要性,其中通常将RNA丰度和蛋白质的产生均未偶联。
摘要:腺病毒作为基因传递工具的应用导致了高容量腺病毒载体(HC-AdV)的开发,这种载体也被称为辅助依赖型或“无肠型”。与前几代(E1/E3 缺失载体)相比,HC-AdV 保留了相关特征,例如遗传稳定性、体内转导效率高以及高滴度生产。更重要的是,HC-AdV 基因组中缺乏病毒编码序列,可将克隆容量扩大至 37 Kb,并允许转基因在非分裂细胞中长期保持游离状态。这些特性为基因补充和基因校正领域开辟了广泛的治疗机会,过去二十年来,这些领域已在临床前水平进行了探索。在此期间,生产方法已得到优化,以获得临床实施所需的产量、纯度和可靠性。更好地了解炎症反应并实施控制炎症反应的方法提高了这些载体的安全性。我们将回顾最重要的成就,这些成就将有趣的研究工具转变为可靠的载体平台,有助于克服基因治疗领域目前的局限性。
基因组库:基因组库也称为克隆银行或基因库。它是来自单个生物体的DNA的集合,尽管不一定一定包含其整个基因组DNA序列。来自感兴趣的源生物的DNA分为多个片段,并包装在克隆载体中,使每个片段都带有一部分。由于以下原因,可以将矢量DNA插入由λ噬菌体载体而不是质粒矢量制成的宿主生物。整个人类基因组的长度约为3 x 109 bp,而质粒或λ噬菌体载体可能带有多达20 kb的碎片。这将需要1.5 x 105重组质粒或λ噬菌体。将大肠杆菌菌落镀在3英寸的培养皿上时,允许单个菌落隔离的最大数量约为每盘菌落。因此,构建人类基因组文库需要至少700种培养皿。相比之下,可以在典型的培养皿上筛选多达5 x104λ噬菌体鼠疫。这仅需要30培养皿来构建人类基因组文库。λ噬菌体载体的另一个优点是其转化效率比质粒载体高约1000倍。互补DNA(cDNA):cDNA是mRNA的逆转录酶产物,代表mRNA分离时所有转录基因的编码序列
摘要:线粒体是细胞能量代谢的中心。它包含自己的基因组,即mtDNA,这是原核共生祖先的遗物。在植物中,线粒体的遗传信息影响重要的农学性状,包括生育力、植物活力、叶绿体功能和交叉兼容性。植物mtDNA具有显着的特征:它比其他真核生物的mtDNA大得多,并且结构进化非常迅速。这是因为重组活动会产生替代的mtDNA配置,这是促进mtDNA快速进化的重要遗传多样性库。另一方面,异位重组的高发生率导致mtDNA不稳定和基因嵌合体的表达,具有潜在的有害影响。与基因组的结构可塑性相反,在大多数植物物种中,mtDNA编码序列进化非常缓慢,即使基因组的组织高度可变。修复机制可能是造成如此低突变率的原因,特别是通过同源重组进行修复。本文我们回顾了植物细胞器基因组的一些特征以及在植物线粒体中发现的修复途径。我们进一步讨论了同源重组如何参与植物线粒体 DNA 的进化。