I. 引言 DNA 分子具有高密度和长期稳定性,因此成为存档海量信息的一种有前途的解决方案。传统数字存储介质(如硬盘和磁带)受限于物理尺寸,且易随时间推移而退化。相比之下,DNA(生物体中携带遗传信息的分子)则为数据存储提供了一种紧凑而耐用的介质。多项开创性研究已证明这一潜力 [1]–[4]。在传统的 DNA 数据存储系统中,二进制数据被编码为四种 DNA 碱基序列:腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T)。然后,这些序列通过 DNA 合成的生化过程合成 DNA 分子,称为链。合成的链被集体储存在一个管子里,或封装在二氧化硅颗粒中,在适当的条件下,它们可以保持数千年的稳定 [5]。为了检索存储的二进制数据,需要使用 DNA 测序技术读取 DNA 链,该技术可以确定 DNA 分子中碱基的顺序。然后将测序数据解码回其原始二进制形式。然而,使用 DNA 存储和检索数据的过程并非没有挑战。一个重大问题是 DNA 合成、存储和测序过程中会出现错误。这些错误可能包括替换、插入、删除,尤其是链断裂。当 DNA 分子被切割成两个或多个片段时,就会发生链断裂,这会使准确重建原始数据的过程变得复杂。多项研究 [6]–[8] 已经探讨了纠正传统 DNA 数据存储通道中断裂的问题,这些研究提出了各种编码方案来减轻此类错误的影响。
胸苷酸合酶 (TS) 已在多种生物体中得到鉴定,并且是癌症化疗中已证实的靶点 (25)。TS 应该是白色念珠菌(一种常见的真菌病原体)的良好化疗靶点,因为该酶的产物 dTMP 只能在酵母中从头合成;酵母缺乏胸苷激酶,并且胸腺嘧啶、胸苷和 dTMP 无法渗透 (6)。有效抑制酵母中的 TS 会导致死亡,因为这些生物体无法产生自己的 dTMP 或从环境中获取它。5-氟胞嘧啶可在体外和体内抑制白色念珠菌和几种其他真菌 (3)。此外,用 5-氟胞嘧啶 (9) 处理白色念珠菌会导致 5-氟-dUMP 积累并抑制 TS,因此表明该酶是真菌的化疗靶点。从体外靶酶表征中获得的信息有助于设计新的潜在化疗剂。大量纯酶的可用性促进了此类研究。由于白色念珠菌培养物中存在低水平的 TS,因此在大肠杆菌中克隆和过表达了白色念珠菌 TS。我们报告了通过功能补充缺乏 TS 的酿酒酵母菌株分离白色念珠菌 TS 基因。该基因的序列包括基因 5' 端约 400 个碱基对 (bp) 的 DNA 和一段较短的 3' 侧翼区,并使用 T7 表达载体在大肠杆菌中表达。制备了来自白色念珠菌和大肠杆菌的纯化酶,并检查了其特性,以确保在大肠杆菌中表达的克隆 TS 酶与白色念珠菌的天然 TS 酶相同。
DNA 分子为蛋白质生产提供信息,这对于维持生命的过程和细胞繁殖至关重要。就像一本书一样,DNA 具有可以分解成字母以传达特定指令的部分和代码。这些指令以信使 RNA (mRNA) 的语言编写,信使 RNA 与 DNA 结合以制作基因的 RNA 副本。mRNA 通过找到由氮碱基编码的起始点序列或“单词”来“读取”DNA。该过程被组织成基因,起始序列作为章节页面。然后,mRNA 链离开细胞核并前往细胞质,在那里通过涉及转移 RNA (tRNA) 分子的过程将其翻译成蛋白质。DNA 可以比作一个信息库,其中以编码格式存储蛋白质合成的指令。遗传物质被组织成称为基因的部分或“章节”,其中包含生产蛋白质的必要代码,这些蛋白质可执行维持生命的过程并为细胞繁殖提供必需的化合物。这些基因由氮碱基腺嘌呤 (A)、鸟嘌呤 (G)、胞嘧啶 (C) 和胸腺嘧啶 (T) 组成,它们按特定顺序排列,以传达特定的信息或指令。信使 RNA (mRNA) 分子读取此编码序列,然后形成 DNA 模板的互补碱基链。mRNA 包含“密码子”——编码氨基酸的三个核苷酸碱基——并进入细胞质,在那里通过结合转移 RNA (tRNA) 分子执行其指令。就像食谱包含制作食物的食谱一样,细胞的 DNA 是构建和维持生命的说明书,其遗传密码指导蛋白质的产生并促进基本细胞功能。
摘要:化学家现在已经合成了在标准Terran DNA中发现的四种标准核苷酸(鸟嘌呤,腺嘌呤,胞嘧啶和胸腺嘧啶)中添加核苷酸的新型DNA。今天在分子诊断中使用了这种“人为扩展的遗传信息系统”;支持定向进化以创建医学上有用的受体,配体和催化剂;并探索与生命早期演变有关的问题。进一步的应用受到无法直接序列DNA含有非标准核苷酸的限制。纳米孔测序非常适合此目的,因为它不需要酶促合成,扩增或核苷酸修饰。在这里,我们采取了第一步来实现8个字母“ Hachimoji”的纳米孔测序,通过使用MSPA(smegmacterium smegmatis porin a)纳米孔评估其纳米孔信号范围,扩展了DNA字母。我们发现Hachimoji DNA在纳米孔测序中表现出比单独标准DNA更广泛的信号范围,并且Hachimoji单碱基取代是可以高度置信的。由于纳米孔测序依赖于分子电机来控制DNA的运动,因此我们通过跟踪Hachimoji DNA的单个Hel308分子的易位来评估HACHIMOJI DNA的易位,从而评估了HACHIMOJI DNA的hel308运动酶与非标准核苷酸的兼容性,从而监测了酶基因酶的eNzeme disnzeme disnzeme disna。我们发现HEL308与Hachimoji DNA兼容,但是与N-糖苷相比,在C-糖苷核苷上行走时会更频繁地分离。c-糖化核苷通过HEL308中的特定位点会诱导更高的解离可能性。这强调了优化纳米孔测序电机以处理不同的糖苷键的需求。它还可以为未来的替代DNA系统的设计提供信息,这些系统可以与现有电动机和毛孔进行测序。
DNA 胞嘧啶甲基化是一种表观遗传机制,参与调节植物对生物和非生物胁迫的反应,其改变能力随胞嘧啶出现的序列环境(CpG、CHG、CHH,其中 H = 腺嘌呤、胸腺嘧啶、胞嘧啶)而变化。模型植物物种中的 DNA 甲基化定量通常通过全基因组亚硫酸盐测序(WGBS)进行,这需要高质量的参考基因组。精简代表性亚硫酸盐测序 (RRBS) 是一种经济有效的潜在替代方案,适用于基因组资源有限且实验设计规模大的生态研究。在本研究中,我们首次全面比较了 RRBS 和 WGBS 的输出,以表征 DNA 甲基化对给定环境因素的反应变化。具体而言,我们使用 epiGBS(最近优化的 RRBS)和 WGBS 来评估 Populus nigra cv. 无性系中昆虫和人工食草后的整体和序列特异性差异甲基化。 'italica'。我们发现,在两种食草处理中的任何一种之后,CHH 中的全局甲基化百分比都会增加,并且只有 epiGBS 检测到这种转变具有统计学意义。至于食草引起的位点特异性差异甲基化(epiGBS 中的胞嘧啶和 WGBS 中的区域),两种技术都表明昆虫和人工食草引起的反应具有特异性,并且 CpG 中的低甲基化和 CHH 中的高甲基化频率更高。当存在于 CpG 和 CHG 中时,甲基化变化主要发现在基因体和基因间区域,而在 CHH 环境中则发现在转座因子和基因间区域。因此,epiGBS 成功地表征了伦巴第杨对食草反应的全局全基因组甲基化变化。我们的研究结果支持 epiGBS 在旨在探索非模型植物物种对多种环境因素反应的表观遗传变化的大型实验设计中特别有用。
花生 ( Arachis hypogaea L.) 是豆科植物的异源四倍体,能够在热带和亚热带地区生长茂盛,被认为是一种很有前途的全球油籽作物。提高油酸含量已成为花生育种的主要目标之一,因为它具有降低血液胆固醇水平等健康益处、抗氧化特性以及延长保质期等工业效益。花生基因组测序已证明存在编码脂肪酸去饱和酶 2 ( FAD2 ) 的同源基因 AhFAD2A 和 AhFAD2B,它们负责催化单不饱和油酸转化为多不饱和亚油酸。研究表明,导致 FAD2 基因移码或终止密码子的突变会导致油中油酸含量升高。在本研究中,使用与不同脱氨酶融合的 Cas9 构建了两个表达载体 pDW3873 和 pDW3876,并测试了它们作为诱导花生 AhFAD2 基因启动子和编码序列点突变的工具。两种构建体都含有单核酸酶无效变体 nCas9 D10A,PmCDA1 胞嘧啶脱氨酶与该变体融合到 C 端(pDW3873),而 rAPOBEC1 脱氨酶和尿嘧啶糖基化酶抑制剂 (UGI) 分别融合到 N 端和 C 端(pDW3876)。将三个 gRNA 独立克隆到两个构建体中,并在 AhFAD2 基因的三个靶位点测试其功能和效率。两种构建体都显示出碱基编辑活性,其中在靶向编辑窗口中胞嘧啶被胸腺嘧啶或其他碱基取代。 pDW3873 的效率高于 pDW3876,表明前者是花生中更好的碱基编辑器。这是一个重要的进步,因为将现有突变基因渗入优良品种可能需要长达 15 年的时间,这使得该工具对花生育种者、农民、行业以及最终对消费者都大有裨益。
本文尝试从量子透视模型的角度,将法拉第常数用化学核苷酸碱基(AT、G、C和U)表示。首先,将逗号后的法拉第常数的准确值排列成双数(0,96,48,53,32,12,33,10,01,84×10 5 C∙mol −1 )。其次,将这一对十进制数转换成二进制数。第三,在完成这些数的转换过程之后,再将二进制数转换成十进制数。第四,对这些十进制数分别求和。第五,将上述加法过程的总和对应到遗传密码[腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)、尿嘧啶(U)]。第六,此转换的结果大致对应于尿嘧啶(U)和鸟嘌呤(G)核苷酸碱基,即数字“64”相当于尿嘧啶(U)核苷酸碱基,而近似数字“79”相当于鸟嘌呤(G)核苷酸碱基。第七,将[尿嘧啶(U)和鸟嘌呤(G)]核苷酸碱基转换为[“AG”腺嘌呤(A)和鸟嘌呤(G)]后,此结果不仅与电化学中法拉第常数之间的联系有意义,而且与量子物理学中叠加态对偶位置之间的联系也有意义。第八,在NCBI(美国国家生物技术信息中心)数据库中搜索[“AG”腺嘌呤(A)和鸟嘌呤(G)]序列后,NCBI的搜索结果与家蚕(Bombyx Mori)基因序列“AGAAAAAGGA”相似。它们是具有该序列的蚕遗传学和丝茧膜 (SCM) 基因工程可能性的非常有趣的特定模型生物。第九,这种复杂的天然蛋白质纤维膜由于具有良好的电导性而受到研究界的极大关注。最后,本文不仅揭示了法拉第常数之间的关系
许多生物学过程和机制取决于DNA中碱基配对和氢键的细节。氢键由于难以可视化氢原子位置而通过X射线晶体学和冷冻EM进行量化,但可以通过溶液中的NMR光谱探测到位点特异性,而固态的固态,后者特别适合大型,缓慢滚动的DNA复合物。最近,我们表明低温动态核极化(DNP)增强的固态NMR是在本机样条件下在各种DNA系统中区分Hoogsteen碱基对(BPS)与规范的Watson-Crick BPS的有价值工具。在此使用12型摩尔DNA双工,在Watson-Crick或Hoogsteen确认中含有两个中央腺嘌呤 - 胸腺氨酸(A-T)BPS,我们证明了DNP固态NMR测量值,这些NMR的测量值是胸腺胺N3-H3键的长度,这些长度与N-H-H-H的详细信息敏感,并允许NH-H·n-H·的n-H·n-H·的水性键合敏感。相同的DNA序列上下文。对于此DNA双链体,对于Watson-Crick A-T和HOOGSTEEN A-T和HOOGSTEEN A(SYN)-T碱基对的有效相同的TN3-H3键长的长度为1.055±0.011Å和1.060±0.011Å,相对于参考磁键长度为1.015±0.010Å,分别为N-Acety-ny-acetyl ny-acetyl ny-acetyl ny-acetyl,分别为watson-Crick a-t和hoogsteen a(syn)a(syn)-t碱基对。非常明显的是,在模型DNA双链体的背景下,这些结果表明,watson-Crick和Hoogsteen BP构型构象异构体之间N-H··N-t a-t氢键没有显着差异。考虑到零点运动的先前量子化学计算预测有效较长的肽n-h键长度为1.041Å,与溶液和环境温度下的肽和蛋白质的固态NMR研究一致,以促进这些早期的研究tn3-h3键长度的直接比较。 Watson-Crick A-T和Hoogsteen A(Syn)-t BPS相对于1.041Å参考肽N-H键长。更一般地,基于低温DNP固态NMR的方法对N-H键长度进行高精度测量有望促进对一系列DNA复合物和基本配对环境的氢键的详细比较分析。
每个物种都有生存,生长和繁殖所需的所有生物学信息。此信息是在称为DNA的复杂分子结构中编码的。腺嘌呤,胞嘧啶,鸟嘌呤和胸腺素是使DNA序列的四个核苷酸。DNA链遗传密码取决于这些核苷酸的精确排列[1]。每年都会确定数百种新物种。NCBI当前管理35个数据库,总共3个数据库。60亿记录[2]。存在物种的起源需要鉴定同源序列,以及对DNA序列中相似性和差异的识别。由于DNA序列改变了进化,因此仅根据序列得出结论是一项挑战。探索DNA序列在基因组时代已经变得至关重要,以理解遗传数据,进化连接和功能基因组学的复杂性。在这里,高性能的计算机方法在巨大的基因组概念中的模式极为可能。这项工作使用图理论中的思想提出了一种独特的DNA序列分析方法,并通过K-均值聚类加强了结果。大规模DNA序列数据分析对于生物学家来说是高度挑战性的。已经提出了几种方法来描述DNA序列并从统计上检查其相似性。序列比对是一种通过使用序列中的核苷酸阶在基本核苷酸序列水平上比较基因组的方法。然而,由于子序列的重排,基于一致性的相似性措施在物种随着时间的流逝时会失去有效性。计算生物学家已经搜索了具有低温复杂性的无对齐技术,可以考虑单核苷酸的变化和子序列重排以评估序列相似性[3]。这些无对准的甲基苯丙胺取代了基于比对的策略,并构成了图形和数值过程[4-7]。图理论为表征,解释和理解生物学数据的详尽框架。这有助于识别新的分子机制,遗传联系和复杂的生物学过程。生物学上复杂的系统,例如基因调节网络,代谢途径和蛋白质相互作用的网络,以图形方式表示。这些例子有助于我们理解几种生物学成分之间的联系和相互作用。系统发育图结构用于了解
杂环化合物在合成和天然化学空间中普遍存在,是各种应用的基本骨架(Reymond,2015)。杂环化合物意义重大,因为它们对人类、植物和动物至关重要(Katritzky 等人,2010)。在广泛的中小型杂环化合物中,嘧啶核构成了一组重要的药理活性化合物(Das 等人,2022)。该核心的重要性得到了充分的支持,因为它是核碱基(胞嘧啶、胸腺嘧啶、尿嘧啶)以及许多临床批准药物的片段。例如,嘧啶核存在于 5-氟尿嘧啶、伊马替尼(抗癌药)、利匹韦林(抗病毒药)、艾克拉普林(抗生素)、甲氧苄啶(抗菌药)和许多其他药物中(Nammalwar and Bunce,2024 年)。此外,它能够充当生物电子等排体(用于芳香核)并通过非共价相互作用 (NCI) 与生物靶标相互作用,使其成为药物发现计划的绝佳候选者(Nammalwar and Bunce,2024 年)。大量研究表明,嘧啶是开发针对慢性和传染病的药物的有希望的支架(Nadar and Khan,2022 年)。近年来,已鉴定出几种具有抗原虫(Rahman 等人,2024;Singh 等人,2024)、抗炎(Fatima 等人,2023)、抗神经炎症(Manzoor 等人,2023)和碳酸酐酶抑制(Manzoor 等人,2021a)活性的 4,6-二取代嘧啶。一个多世纪前就有报道,阿尔茨海默病 (AD) 现已成为痴呆症最普遍的原因,全球已报告数百万例病例。这导致了巨大的经济和人力负担(Bell,2023;Gustavsson 等人,2023)。到 2050 年,患有 AD 和其他痴呆症的人数估计将超过 1.52 亿(Nichols 等人,2022 年)。为了对抗这种使人衰弱的疾病,研究人员正在采用各种方法,其中一种方法是开发针对一种或多种 AD 机制(例如 β-淀粉样斑块、神经纤维缠结)的小分子(Takahashi 等人,2017 年)。在迄今为止鉴定出的不同类别的小分子中,基于嘧啶的化合物成为一种有希望的候选化合物(Singh 等人,2021 年;Das 等人,2022 年)。例如,Nain 及其同事(Pant 等人,2024 年)报道了一系列取代的