基因疗法有可能通过将治疗性遗传货物传递给疾病相关细胞来治疗疾病。对其广泛使用的一种局限性是缺乏较短的调节序列或启动子,该序列会差异地诱导靶细胞中传递的遗传货物的表达,从而最大程度地减少其他细胞类型的副作用。这种细胞类型特异性的启动子很难使用现有方法发现,需要手动策划或访问来自靶向和未靶向细胞的启动子驱动表达的大型数据集。基于模型的优化(MBO)已成为一种以自动化方式设计生物学序列的有效方法,最近已用于启动子设计方法。但是,这些方法仅使用昂贵的大型培训数据集进行了测试,并专注于为明显不同的细胞类型设计启动子,从而忽略了与与具有相似调节特征的紧密相关细胞类型设计启动子相关的复杂性。因此,我们引入了一个综合框架,用于利用MBO以数据有效的方式设计启动子,重点是发现类似细胞类型的启动子。我们将保守的目标模型(COM)用于MBO,并突出显示了实际的考虑因素,例如改善序列多样性,估算模型不确定性的最佳实践,并选择用于实验验证的最佳序列集。使用三种相对相似的血液癌细胞系(Jurkat,K562和THP1),我们表明我们的方法在实验验证了设计的序列后发现了许多新型细胞型特异性启动子。对于K562细胞,我们发现了一个启动子,该启动子的细胞类型特异性比最初用于训练模型的最初数据集高75.85%。
中央教条是理解活生物体中遗传信息的流量和表达的基本框架,从而促进了分子类型中各种生物学序列的联系。在这项研究中,我们提出了CD-GPT(中央教条生成预审计的变压器),这是一种包含10亿个参数的生成生物基础模型,旨在捕获生物系统中的复杂的系统范围的分子相互作用。我们介绍了统一的代表空间的概念,并采用共同的多分子词汇来有效地表示生物序列并缩小其在嵌入空间中的距离。通过对全面的完整分子水平数据进行广泛的预处理,CD-GPT在广泛的预测性和生成性下游任务中表现出非凡的性能,包括单分子和多分子分析。值得注意的是,CD-GPT在基因组元素检测,蛋白质性能预测,RNA - 蛋白相互作用鉴定以及生成性任务等任务中表现出色。CD-GPT的多功能性为高级多词分析提供了有希望的途径。
摘要:磁共振成像 (MRI) 是一种利用强磁场产生人体各部位图像的成像技术。通常进行的检查是脑部检查。这项研究是在巴厘岛曼达拉医院进行的。为了了解大脑的状况,可以进行 MRI 检查。MRI 可以产生称为序列的图像,这些序列产生 T1 加权图像 (T1WI)、T2 加权图像 (T2WI),从而产生具有不同强度的可见图像。为了获得 T2WI,时间回波 (TE) 和时间重复 (TR) 必须很长,以使脂肪和水有机会衰减,这样脂肪和水的对比度才能很好地显现出来。这项研究旨在确定 TR 变化对 SNR 值的影响,并确定最佳 TR 以产生良好的图像值。在脑部 MRI 上生成 T2WI SNR。这个街头小贩活动使用了 Phillips 1.5 特斯拉型 MRI 飞机。数据收集自20名患者,TR值有3种变化,分别为3,500毫秒、5,500毫秒和7,500毫秒,总共获取了60张图像。通过直接在MRI设备上测量ROI来评估组织SNR值。对脑脊液(CSF)组织、脊髓进行SNR值分析。依次获得的SNR值在CSF组织中为174.24、211.22和244.51,在脊髓组织中为78.53、80.64和84.81。这个街头小贩活动表明,给出的TR值越长,SNR值就会增加。这是因为长TR值能够在更多切片中评估网络并提供更好的噪声信号值。7,500毫秒的TR变化可以产生最高的SNR值,从而得到的图像非常好。
该预印本版的版权持有人于2024年6月12日发布。 https://doi.org/10.1101/2024.06.11.598423 doi:Biorxiv Preprint
(‡等等贡献。∗应向谁解决。)9公共存储库中可用的生物测序数据量正在成倍增长,形成了10个宝贵的生物医学研究资源。然而,使其在11种生活和数据科学中的研究人员可以访问且易于访问是一个未解决的问题。在这项工作中,我们利用了最近开发的,非常有效的12个数据结构和算法来表示序列集。我们在所有13个生命的进化枝中制作了DNA序列的石柄,包括病毒,细菌,真菌,植物,动物和人类,都可以完全搜索。我们的索引可供研究社区免费使用。在单个消费者硬盘驱动器(≈100USD)上,输入序列(最多15 5800×)的高度压缩表示形式,使使用可使用的有价值的资源成本效益和16个易于运输。我们提出了一种基本的方法论框架,称为Metagraph,该框架使我们使用注释的DE Bruijn图可缩减索引非常大的DNA或蛋白质序列。我们证明了18个可行性,即索引现有的测序数据的全部范围,并提出新的方法,以实现高效和成本-19有效的全文搜索,按点数为0.10美元,每个查询的MPB $ 0.10。我们探索了几个实际用例20,以挖掘现有的档案,以进行有趣的关联,并证明了我们对综合21分析的索引的实用性。22
1美国明尼苏达州明尼苏达州大学的药物学系,美国明尼苏达州55455,美国; schey013@umn.edu 2美国乔治亚州乔治亚大学生物化学与分子生物学系,美国佐治亚州30602,美国; erh@uga.edu(E.R.H. ); erl99598@uga.edu(e.r.l. ); wschmidt@uga.edu(W.K.S。) 3美国北卡罗来纳州达勒姆大学医学院生物化学系,美国北卡罗来纳州27710; you.wang@duke.edu(Y.W。 ); lorena.beese@duke.edu(l.s.b.) 4明尼阿波利斯大学,明尼苏达州明尼苏达州55455的化学系; diwan005@umn.edu(S.D. ); hap5160@psu.edu(H.A.P. ); gwp002@morningside.edu(G.W.P。) 5美国锡拉丘兹大学化学系,纽约州锡拉丘兹,美国13244; anspragu@syr.edu(a.m.s.-g.); hougland@syr.edu(J.L.H。) 6明尼阿波利斯大学,明尼苏达州明尼苏达大学的生物信息学与计算生物学研究生课程,美国,美国55455; kuebl010@umn.edu(t.s.k. ); shamx002@umn.edu(Y.Y.S。) 7明尼苏达州明尼阿波利斯大学的综合生物学与生理学系,美国MN 55455,美国8美国锡拉丘兹大学生物学系,纽约州锡拉丘兹,纽约州13244,美国9 Bioinspired Syracusiled Syracuse,Syracuse University,Syracuse University,Syracuse,Syracuse,Syracuse,Syracuse,NY 13244,USA * SOCTONCENCES:DIVEDENCES:DIVEDECENCENCENCENCE:DIVEDECENCENCE:DIVENDECENCEND:DIVEDECENDECED:1美国明尼苏达州明尼苏达州大学的药物学系,美国明尼苏达州55455,美国; schey013@umn.edu 2美国乔治亚州乔治亚大学生物化学与分子生物学系,美国佐治亚州30602,美国; erh@uga.edu(E.R.H.); erl99598@uga.edu(e.r.l.); wschmidt@uga.edu(W.K.S。)3美国北卡罗来纳州达勒姆大学医学院生物化学系,美国北卡罗来纳州27710; you.wang@duke.edu(Y.W。 ); lorena.beese@duke.edu(l.s.b.) 4明尼阿波利斯大学,明尼苏达州明尼苏达州55455的化学系; diwan005@umn.edu(S.D. ); hap5160@psu.edu(H.A.P. ); gwp002@morningside.edu(G.W.P。) 5美国锡拉丘兹大学化学系,纽约州锡拉丘兹,美国13244; anspragu@syr.edu(a.m.s.-g.); hougland@syr.edu(J.L.H。) 6明尼阿波利斯大学,明尼苏达州明尼苏达大学的生物信息学与计算生物学研究生课程,美国,美国55455; kuebl010@umn.edu(t.s.k. ); shamx002@umn.edu(Y.Y.S。) 7明尼苏达州明尼阿波利斯大学的综合生物学与生理学系,美国MN 55455,美国8美国锡拉丘兹大学生物学系,纽约州锡拉丘兹,纽约州13244,美国9 Bioinspired Syracusiled Syracuse,Syracuse University,Syracuse University,Syracuse,Syracuse,Syracuse,Syracuse,NY 13244,USA * SOCTONCENCES:DIVEDENCES:DIVEDECENCENCENCENCE:DIVEDECENCENCE:DIVENDECENCEND:DIVEDECENDECED:3美国北卡罗来纳州达勒姆大学医学院生物化学系,美国北卡罗来纳州27710; you.wang@duke.edu(Y.W。); lorena.beese@duke.edu(l.s.b.)4明尼阿波利斯大学,明尼苏达州明尼苏达州55455的化学系; diwan005@umn.edu(S.D. ); hap5160@psu.edu(H.A.P. ); gwp002@morningside.edu(G.W.P。) 5美国锡拉丘兹大学化学系,纽约州锡拉丘兹,美国13244; anspragu@syr.edu(a.m.s.-g.); hougland@syr.edu(J.L.H。) 6明尼阿波利斯大学,明尼苏达州明尼苏达大学的生物信息学与计算生物学研究生课程,美国,美国55455; kuebl010@umn.edu(t.s.k. ); shamx002@umn.edu(Y.Y.S。) 7明尼苏达州明尼阿波利斯大学的综合生物学与生理学系,美国MN 55455,美国8美国锡拉丘兹大学生物学系,纽约州锡拉丘兹,纽约州13244,美国9 Bioinspired Syracusiled Syracuse,Syracuse University,Syracuse University,Syracuse,Syracuse,Syracuse,Syracuse,NY 13244,USA * SOCTONCENCES:DIVEDENCES:DIVEDECENCENCENCENCE:DIVEDECENCENCE:DIVENDECENCEND:DIVEDECENDECED:4明尼阿波利斯大学,明尼苏达州明尼苏达州55455的化学系; diwan005@umn.edu(S.D.); hap5160@psu.edu(H.A.P.); gwp002@morningside.edu(G.W.P。)5美国锡拉丘兹大学化学系,纽约州锡拉丘兹,美国13244; anspragu@syr.edu(a.m.s.-g.); hougland@syr.edu(J.L.H。) 6明尼阿波利斯大学,明尼苏达州明尼苏达大学的生物信息学与计算生物学研究生课程,美国,美国55455; kuebl010@umn.edu(t.s.k. ); shamx002@umn.edu(Y.Y.S。) 7明尼苏达州明尼阿波利斯大学的综合生物学与生理学系,美国MN 55455,美国8美国锡拉丘兹大学生物学系,纽约州锡拉丘兹,纽约州13244,美国9 Bioinspired Syracusiled Syracuse,Syracuse University,Syracuse University,Syracuse,Syracuse,Syracuse,Syracuse,NY 13244,USA * SOCTONCENCES:DIVEDENCES:DIVEDECENCENCENCENCE:DIVEDECENCENCE:DIVENDECENCEND:DIVEDECENDECED:5美国锡拉丘兹大学化学系,纽约州锡拉丘兹,美国13244; anspragu@syr.edu(a.m.s.-g.); hougland@syr.edu(J.L.H。)6明尼阿波利斯大学,明尼苏达州明尼苏达大学的生物信息学与计算生物学研究生课程,美国,美国55455; kuebl010@umn.edu(t.s.k.); shamx002@umn.edu(Y.Y.S。)7明尼苏达州明尼阿波利斯大学的综合生物学与生理学系,美国MN 55455,美国8美国锡拉丘兹大学生物学系,纽约州锡拉丘兹,纽约州13244,美国9 Bioinspired Syracusiled Syracuse,Syracuse University,Syracuse University,Syracuse,Syracuse,Syracuse,Syracuse,NY 13244,USA * SOCTONCENCES:DIVEDENCES:DIVEDECENCENCENCENCE:DIVEDECENCENCE:DIVENDECENCEND:DIVEDECENDECED:
未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印本的版权持有人(此版本发布于2024年5月10日。; https://doi.org/10.1101/2024.05.09.593242 doi:biorxiv Preprint
摘要 定制寡核苷酸(oligos)是生物医学研究中广泛使用的试剂。寡核苷酸的一些常见应用包括聚合酶链式反应(PCR)、测序、杂交、微阵列和文库构建。寡核苷酸在这些应用中的可靠性取决于其纯度和特异性。本文报告,市售的寡核苷酸经常被非特异性序列(即其他不相关的寡核苷酸)污染。我们设计的用于扩增成簇的规律散布回文重复序列(CRISPR)指导序列的大多数寡核苷酸都含有非特异性的 CRISPR 指导序列。这些污染物是在从位于世界三个不同地理区域的八家商业寡核苷酸供应商处采购的研究级寡核苷酸中检测到的。对一些寡核苷酸的深度测序揭示了多种污染物。鉴于寡核苷酸的应用范围广泛,寡核苷酸交叉污染的影响因领域和实验方法的不同而有很大差异。在研究设计中加入适当的对照实验有助于确保寡核苷酸试剂的质量符合预期目的。这还可以根据寡核苷酸的用途将风险降至最低。
摘要:小米是禾本科的一种小粒谷物。它们被认为是气候适应性强、未来人类营养丰富的谷物。与其他主要谷物相比,小米对生物和非生物胁迫具有抗性,在低质量、维护较少、降雨较少的土壤中生长良好。由于小米在亚洲和非洲半干旱热带地区不太流行和不常种植,许多人仍然不太了解小米的重要性。联合国已宣布 2023 年为国际小米年 (IYM 2023),以促进小米种植并在全球范围内推广其健康益处。几年前,由于缺乏基因组序列,分子生物学在小米中的应用还处于起步阶段。大多数小米的基因组序列都可以在 NCBI 和 Phytozome 数据库中找到。在这篇综述中,我们讨论了小米基因组序列的细节,以及从小米原生基因组中识别出的候选基因。本文还讨论了小米数量性状基因座和全基因组关联研究的现状。利用小米基因组序列进行功能基因组学研究并将信息转化为作物改良将有助于小米和非小米谷物在未来的恶劣环境中生存。这些努力将有助于加强粮食安全并减少 2050 年全球营养不良。