DNA链的合成仍然是DNA存储系统中最昂贵的一部分。因此,要使DNA存储系统更加实用,必须优化合成过程中使用的时间和材料。我们考虑了最常见的合成过程,其中多个DNA链与一个共同的交替超台式并行合成,一次是一个核苷酸。合成时间或合成周期的数量由这种共同超台式的长度确定。在此模型中,我们设计的第四纪代码可以最大程度地减少可以纠正缺失或插入的合成时间,这是基于数组的合成中最普遍的错误类型。我们还提出了将二进制字符串编码为这些代码的多项式时间算法,并表明速率接近容量。
表现出典型的 B30.2 结构域折叠,由两个反向平行的七链和六链 β 片层组成,排列成扭曲的 β 夹层。此外,两个长环部分覆盖由六链 β 片层定义的 β 夹层的凹面,从而形成带正电的腔体。我们使用序列保守性和突变分析来提供 GN1 假定结合界面的证据。这些研究表明,TRIM7 B30.2 的 Leu423、Ser499 和 Cys501 以及 GN1 的 C 端 33 个氨基酸对于这种结合相互作用至关重要。分子动力学模拟还表明,氢键和疏水相互作用在模拟的 TRIM7 B30.2-GN1 C 端肽复合物的稳定性中起主要作用。这些数据提供了有用的信息,可用于针对这种相互作用开发潜在的治疗剂。
RNA 世界假说虽然是有关地球生命起源的可行假说,但迄今为止未能为通过非生物过程从游离核苷酸合成具有催化功能的 RNA 分子提供令人信服的解释。为了解决这个长期存在的问题,我们使用实验确定的聚合反应速率开发了一个 RNA 世界起源的现实模型。我们从对初始状态的最小假设开始,该初始状态仅需要存在短寡聚体或游离核苷酸,并通过将一天划分为干、半湿和湿阶段来考虑环境循环的影响,这三个阶段以其支持的反应性质为特征。长聚合物的最大长度有时超过 100 个核苷酸,由于非酶促、非模板聚合物延伸和模板指导的引物延伸过程的组合而自发出现。前者有助于增加 RNA 链的长度,而后者有助于产生互补的链副本。链也以结构依赖的方式进行水解,有利于断开连接未配对核苷酸的键。我们确定了核酶和 tRNA 样结构以及双链 RNA 分子出现所需的最有利条件,根据二级结构对所有 RNA 链进行分类,并确定它们在群体中的丰度。我们的结果表明,在适当的环境条件下,非酶促过程足以导致各种具有复杂二级结构和潜在催化功能的核酶样分子的出现。
•转录和复制等过程要求DNA的两条链暂时分开,从而允许聚合酶访问DNA模板。但是,核小体的存在以及将染色质折叠为30纳米纤维的折叠构成障碍物,以放松并复制DNA的酶。
缺失 缺失与基因组学相关,是一种突变,涉及 DNA 片段中一个或多个核苷酸的丢失。缺失可能涉及任意数量的核苷酸的丢失,从单个核苷酸到整条染色体。 脱氧核糖核酸 (DNA) 脱氧核糖核酸(缩写 DNA)是一种携带生物体发育和功能遗传信息的分子。DNA 由两条相互缠绕、形似扭曲的梯子的连接链组成 — — 这种形状称为双螺旋。每条链都有一个由交替的糖(脱氧核糖)和磷酸基团组成的骨架。每个糖上附着有四种碱基之一:腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 或胸腺嘧啶 (T)。两条链通过碱基之间的化学键连接:腺嘌呤与胸腺嘧啶结合,胞嘧啶与鸟嘌呤结合。 DNA 主链上的碱基序列编码了生物信息,例如制造蛋白质或 RNA 分子的指令。
计算思维(新) 创造力和创新 数据素养、管理和表达(新) 数字公民 实用技术概念(新) TEKS 包括“在协助下”和“有或没有技术” 技术以对新兴技术的广泛描述为特色 各部分与日常生活息息相关
I. 引言 DNA 分子具有高密度和长期稳定性,因此成为存档海量信息的一种有前途的解决方案。传统数字存储介质(如硬盘和磁带)受限于物理尺寸,且易随时间推移而退化。相比之下,DNA(生物体中携带遗传信息的分子)则为数据存储提供了一种紧凑而耐用的介质。多项开创性研究已证明这一潜力 [1]–[4]。在传统的 DNA 数据存储系统中,二进制数据被编码为四种 DNA 碱基序列:腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T)。然后,这些序列通过 DNA 合成的生化过程合成 DNA 分子,称为链。合成的链被集体储存在一个管子里,或封装在二氧化硅颗粒中,在适当的条件下,它们可以保持数千年的稳定 [5]。为了检索存储的二进制数据,需要使用 DNA 测序技术读取 DNA 链,该技术可以确定 DNA 分子中碱基的顺序。然后将测序数据解码回其原始二进制形式。然而,使用 DNA 存储和检索数据的过程并非没有挑战。一个重大问题是 DNA 合成、存储和测序过程中会出现错误。这些错误可能包括替换、插入、删除,尤其是链断裂。当 DNA 分子被切割成两个或多个片段时,就会发生链断裂,这会使准确重建原始数据的过程变得复杂。多项研究 [6]–[8] 已经探讨了纠正传统 DNA 数据存储通道中断裂的问题,这些研究提出了各种编码方案来减轻此类错误的影响。
