准确复制核酸序列对于自我复制系统至关重要。现代细胞利用能够进行动力学校对的复杂酶,将错误率降低至 10-9。相比之下,探索无酶复制 RNA 和 DNA 作为潜在前生命复制过程的实验发现错误率约为 10%。鉴于这种低内在复制保真度,分子进化自发出现的合理情景需要一种提高准确性的机制。在这里,我们研究了一种“动力学错误过滤”场景,它大大提高了产生精确核酸序列副本的可能性。该机制利用了以下观察结果:DNA 和 RNA 模板定向聚合中的初始错误可能会引发一系列连续错误并显著阻碍下游延伸。我们将这些特性纳入具有实验估计参数的数学模型中,并利用该模型探索在多大程度上可以通过动力学区分准确和错误的聚合产物。虽然限制聚合的时间窗口可以防止错误链的完成,从而产生一个全长产品池,其中的准确性更高,但这是以产量降低为代价的。我们表明,这种保真度-产量权衡可以通过在周期性变化的环境中反复复制来规避,例如在热液系统附近自然发生的温度循环。这种设置可以在其生命周期内产生长达 50 个碱基的序列的精确副本,从而促进具有催化活性的寡核苷酸的出现和维持。
1. Ferrarini M、Moretto M、Ward JA、Surbanovski N、Stevanovic V、Giongo L、Viola 88 R、Cavalieri D、Velasco R、Cestaro A、Sargent DJ。2013 年。对 89 PacBio RS 平台进行叶绿体基因组测序和从头组装的评估。BMC 基因组学 14:670。91 2. Stadermann KB、Weisshaar B、Holtgräwe D。2015 年。仅 SMRT 测序甜菜 (Beta vulgaris) 叶绿体基因组的从头组装。BMC 93 生物信息学 16:295。 94 3. Pucker B、Holtgräwe D、Stadermann KB、Frey K、Huettel B、Reinhardt R、95 Weisshaar B。2019 年。染色体水平序列组装揭示了拟南芥 Nd-1 基因组及其基因集的结构。PLoS One 97 14:e0216233。98 4. Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。1990 年。基本局部比对搜索工具。分子生物学杂志 215:403-410。100 5. Koren S、Walenz BP、Berlin K、Miller JR、Bergman NH、Phillippy AM。2017 年。Canu:通过自适应 k-mer 加权和 102 重复分离实现可扩展且准确的长读组装。基因组研究 27:722-736。103 6. Jansen RK、Kaittanis C、Saski C、Lee SB、Tomkins J、Alverson AJ、Daniell H. 2006. 基于完整叶绿体基因组序列的葡萄科(Vitaceae)系统发育分析:分类单元抽样和系统发育方法对解决蔷薇科间关系的影响。BMC 进化生物学 6:32。107 7. Goremykin VV、Salamini F、Velasco R、Viola R. 2009. 葡萄的线粒体 DNA 和猖獗的水平基因转移问题。分子生物学与进化 26:99-110。110 8. Wick RR、Schultz MB、Zobel J、Holt KE。 2015. Bandage:从头基因组组装的交互式可视化。生物信息学 31:3350-2。112 9. Wheeler TJ、Eddy SR。2013. nhmmer:使用概要 HMM 进行 DNA 同源性搜索。113 生物信息学 29:2487-2489。114 10. Chan PP、Lowe TM。2019. tRNAscan-SE:在基因组序列中搜索 tRNA 基因,第 1-14 页。在 Kollmar M(编辑)的《基因预测:方法和协议》中,116 2019/04/26 编辑,第 1962 卷。Springer New York,纽约。117 11. Lowe TM、Eddy SR。 1997. tRNAscan-SE:一种改进基因组序列中 118 种转移 RNA 基因检测的程序。核酸研究 25:955-964。119 12. Laslett D、Canback B。2004. ARAGORN,一种检测核苷酸序列中的 tRNA 基因和 120 种 tmRNA 基因的程序。核酸研究 32:11-16。121 13. Tillich M、Lehwark P、Pellizzer T、Ulbricht-Jones ES、Fischer A、Bock R、Greiner 122 S。2017. GeSeq - 多功能且准确的细胞器基因组注释。123 核酸研究 45:W6-W11。 124 14. Lohse M、Drechsel O、Kahlau S、Bock R. 2013. OrganellarGenomeDRAW——一套用于生成质体和线粒体基因组物理图谱并可视化表达数据集的工具。核酸研究 41:W575-581。127 15. Lohse M、Drechsel O、Bock R. 2007. OrganellarGenomeDRAW (OGDRAW):128 一个用于轻松生成高质量自定义质体和 129 线粒体基因组图形图的工具。当代遗传学 52:267-274。130
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本发布于2024年10月29日。 https://doi.org/10.1101/2024.10.24.620004 doi:Biorxiv Preprint
基因编辑有可能解决农业、生物技术和人类健康领域的基本挑战。源自微生物的基于 CRISPR 的基因编辑器虽然功能强大,但在移植到非原生环境(例如人类细胞)时通常会表现出显著的功能权衡。人工智能 (AI) 支持的设计提供了一种强大的替代方案,有可能绕过进化限制并生成具有最佳属性的编辑器。在这里,使用在大规模生物多样性上训练的大型语言模型 (LLM),我们展示了首次使用 AI 设计的可编程基因编辑器成功精确编辑人类基因组。为了实现这一目标,我们通过系统地挖掘 26 兆碱基的组装基因组和元基因组,整理了超过一百万个 CRISPR 操纵子的数据集。我们通过生成自然界中发现的 CRISPR-Cas 家族中 4.8 倍的蛋白质簇数量并为 Cas9 样效应蛋白定制单向导 RNA 序列来展示我们模型的能力。生成的几个基因编辑器与 SpCas9(典型的基因编辑效应器)相比,表现出相当或更好的活性和特异性,同时在序列上相差 400 个突变。最后,我们展示了一个 AI 生成的基因编辑器,称为 OpenCRISPR-1,它表现出与碱基编辑的兼容性。我们公开发布 OpenCRISPR-1,以促进在研究和商业应用中广泛、合乎道德的使用。
图3。增加MGCL₂浓度对目标下90%的扩增的影响。富裕的s。金黄色葡萄球菌gDNA靶序列使用Phusion Plus Plus DNA聚合酶在Proflex PCR系统上进行扩增。每个20 µL反应含有10 ng的s。金黄色葡萄球菌和另外1 mm,1.5 mm,2 mm或2.5 mmmgcl₂。热循环条件:98°C的30秒;在98°C,最佳退火温度下10秒的10秒循环(表4),在64°C时为1分钟/kb;在64°C下5分钟。PCR产品以2%E-Gel 48含Sybr安全染色的琼脂糖凝胶运行。车道M:E-GEL 1 KB Plus Express DNA梯子。
非编码重复膨胀会导致几种神经退行性疾病,例如脆弱的X综合征,肌萎缩性侧面硬化症/额颞痴呆和脊椎没收(SCA31)。必须研究这种重复的序列,以了解疾病机制并使用新颖的方法来防止它们。然而,合成寡核苷酸的合成重复序列由于不稳定,缺乏独特的序列而表现出二级结构的倾向。综合重复序列通常很难。在这里,我们采用了滚动圆扩增技术,使用微小的合成单链圆形DNA作为模板获得无缝的长重复序列。我们获得了2.5 - 3 KBP不间断的TGGAA重复序列,在SCA31中观察到,并使用限制消化,Sanger和Nanobore测序对其进行了确认。这种无细胞的体外克隆方法可能适用于其他重复膨胀疾病,并用于产生动物和细胞培养模型,以研究体内和体外的重复扩张疾病。
每个科学纪律都制定了出版标准,旨在帮助研究人员简洁地传达支持他们结论的证据,并允许其他人在工作基础上建立。例如,要发布新化合物的第一份报告,合成化学必须提供NMR和质谱,因为有广泛的共识,即这些分析技术必须表明根据预期制备了化合物。同样,当开发新软件时,几乎需要普遍要求在出版物上提供源代码,以便其他人可以检查其功能并重复使用它。在2011年,建议应报告完整的DNA序列以支持合成生物学出版物[1]。今天,生物工程和生命科学的其他领域仍然遭受令人困惑,不一致和发布DNA序列的足够标准。在研究期间开发的质粒和基因组的序列有时根本不作为出版物的一部分,或者仅以指示形式以如何组装它们而不是最终序列的形式。这类似于计算机科学纸,省略了其代码或描述如何通过在其他论文中复制代码来重建代码。如果生物学家正在重新编程,为什么他们不期望发布其源代码?通过复制和粘贴一部分现有DNA序列来构建工程DNA时的一些实践,并且它很昂贵,困难甚至无法检查结果。然而,测序技术现已改善,以至于确定质粒甚至基因组的整个核苷酸序列变得廉价且易于访问。在2023年,对整个质粒进行测序的费用为15美元,并且测序细菌基因组的成本为100美元,这些价格可能会下降。与compoter代码不同,DNA可以突变,当酶或细胞复制时会积累其顺序变化。这种意外进化的可能性使得验证研究中使用的DNA序列即使不是新构建也是特别重要的。
摘要 定制寡核苷酸(oligos)是生物医学研究中广泛使用的试剂。寡核苷酸的一些常见应用包括聚合酶链式反应(PCR)、测序、杂交、微阵列和文库构建。寡核苷酸在这些应用中的可靠性取决于其纯度和特异性。本文报告,市售的寡核苷酸经常被非特异性序列(即其他不相关的寡核苷酸)污染。我们设计的用于扩增成簇的规律散布回文重复序列(CRISPR)指导序列的大多数寡核苷酸都含有非特异性的 CRISPR 指导序列。这些污染物是在从位于世界三个不同地理区域的八家商业寡核苷酸供应商处采购的研究级寡核苷酸中检测到的。对一些寡核苷酸的深度测序揭示了多种污染物。鉴于寡核苷酸的应用范围广泛,寡核苷酸交叉污染的影响因领域和实验方法的不同而有很大差异。在研究设计中加入适当的对照实验有助于确保寡核苷酸试剂的质量符合预期目的。这还可以根据寡核苷酸的用途将风险降至最低。
合成至少 5 g PET/TH - 至少 15 kDa - 分解为至少 25 wt % 单体。 - 至少 1 g 回收的单体/低聚物将重新聚合至至少 1 kDa(通过 GPC)并通过 DSC 进行表征。
大型丝氨酸重组酶 (LSR) 是一种 DNA 整合酶,可促进移动遗传元件在细菌基因组中的位点特异性整合。迄今为止,只有少数 LSR(如 Bxb1 和 PhiC31)被鉴定,作为人类细胞中 DNA 整合的工具,其效率有限。在这项研究中,我们开发了一种计算方法来识别数千个 LSR 及其 DNA 附着位点,将已知的 LSR 多样性扩大了 100 倍以上,并能够预测它们的插入位点特异性。我们在人类细胞中测试了它们的重组活性,将它们归类为着陆垫、基因组靶向或多靶向 LSR。总体而言,我们实现了比 Bxb1 高出七倍的重组率,基因组整合效率为 40-75%,货物大小超过 7 kb。我们还展示了无病毒的质粒或扩增子文库的直接整合,以改进功能基因组学应用。这种直接从微生物测序数据中系统地发现重组酶的做法,提供了超过 60 种在人体细胞中经过实验表征的 LSR 资源,可用于大负载基因组插入,且不会暴露 DNA 双链断裂。