RNA分子在广泛的生物过程中起着至关重要的作用。 对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。 最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。 在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。 带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。 专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。 rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。 我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。RNA分子在广泛的生物过程中起着至关重要的作用。对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是此预印本版本的版权持有人,该版本发布于12月29日,2024年。 https://doi.org/10.1101/2024.03.19.585778 doi:Biorxiv Preprint
摘要背景和目的观察性研究暗示了肠道微生物组参与中风发育。相反,中风可能破坏肠道微生物组平衡,可能导致全身感染加剧脑梗塞。但是,因果关系仍然存在争议或未知。为了研究双向因果关系和潜在的种族差异,我们在东亚(EAS)和欧洲(EU)种群中进行了双向两样本的孟德尔随机化(MR)研究。利用Mibiogen Consortium(N = 18 340,EU)和BGI(n = 2524,EAS)的迄今为止最大基因组 - 大型结合研究(GWAS)的摘要数据,用于肠道微生物组,stoke stroke gwas gwas gwas gwas gwas constroke constorme constorce consortium controke gwas数据分别分析EA和欧盟人口。结果,我们通过中风或其亚型确定了EA中的85个肠道微生物类群和欧盟64个肠道微生物类群之间的名义显着关联。Following multiple testing, we observed that genetically determined 1 SD increase in the relative abundance of species Bacteroides pectinophilus decreased the risk of cardioembolic stroke onset by 28% (OR 0.72 (95% CI 0.62 to 0.84); p=4.22e−5), and that genetically determined 1 SD increase in class Negativicutes resulted in a 0.76% risk increase in small vessel stroke在EA中。在欧盟人群和反向MR分析中未发现明显的因果关系。结论我们的研究表明,EA和欧盟人群中肠道微生物组和中风风险之间的亚型特异性和人群特异性因果关系。确定的因果关系有望制定新的中风策略,需要进一步的机械验证,并需要进行临床试验研究。
摘要 在过去的几十年中,全基因组关联研究 (GWAS) 导致与人类特征和疾病有关的遗传变异急剧增加。这些进展有望带来新的药物靶点,但从 GWAS 中识别致病基因和人类疾病背后的细胞生物学仍然具有挑战性。在这里,我们回顾了基于蛋白质相互作用网络的 GWAS 数据分析方法。这些方法可以在没有直接遗传支持的情况下对 GWAS 相关位点或疾病基因相互作用因子中的候选药物靶点进行排序。这些方法可以识别出不同疾病中共同受影响的细胞生物学,为药物重新利用提供机会,也可以与表达数据相结合以识别局部组织和细胞类型。展望未来,我们预计这些方法将随着特定情境相互作用网络表征和罕见与常见遗传信号的联合分析方面的进展而得到进一步改进。
免疫耐受性的丧失会导致自身免疫性疾病,而维持自身耐受性的机制(尤其是在人类中)尚不完全清楚。全基因组关联研究 (GWAS) 已确定数百个与自身免疫性疾病风险有统计学相关性的人类基因位点,这些位点的 DNA 和染色质表观遗传修饰与自身免疫性疾病风险相关。由于这些信号绝大多数位于远离基因的位置,因此识别致病变异及其对正确效应基因的功能性影响一直颇具挑战性。这些限制阻碍了将 GWAS 发现转化为新的药物靶点和临床干预措施,但最近在理解细胞核中基因组的空间组织方面取得的进展为基因调控提供了机制见解,并解答了 GWAS 留下的问题。在这里,我们讨论了“变异到基因映射”方法的潜力,该方法将 GWAS 与 3D 功能基因组数据相结合,以识别参与维持耐受性的人类基因。
I。在全基因组关联研究(GWAS)中,分析了基因组之间的遗传变异,以鉴定与特定疾病或性状统计上有关的遗传变异。GWA旨在识别基因型与表型之间的关联[1]。他们检查了遗传变异的等位基因频率在遗传相关但表型差异的个体中的差异。GWA中研究的最常见的遗传变异是单核苷酸多态性(SNP)[2]。SNP是DNA水平上的单基突变[3]。这些多态性几乎位于每个基因附近,可以用作遗传标记。也可以使用SNP检测基因和表型之间的关联,尤其是在具有多因素遗传学的疾病中[4]。
摘要 本研究探讨了利用全基因组关联研究(GWAS)策略加速作物抗性性状改良的现状和未来前景。随着高通量测序技术和生物信息学的快速发展,GWAS已成为将DNA变异与重要作物性状联系起来的有力工具。本研究特别强调了整合多组学数据的策略,以及基于GWAS结果的精准育种和基因编辑技术的应用,为作物抗性性状的改良提供了新的方向和策略。此外,转录组关联研究(TWAS)等方法的出现为识别与复杂性状相关的基因提供了强有力的工具,表明未来人们对基因组调控和遗传调控基因的理解将更加全面。这些进展不仅推动了作物遗传改良的科学研究,也为作物生产和食品安全的可持续发展提供了坚实的科学基础。 关键词 全基因组关联研究(GWAS);高通量测序技术;生物信息学;作物抗性性状;转录组关联研究(TWAS)
从GWAS上的IC的摘要统计数据是从GWAS目录(Sollis等,2023)中获得的,其中1个包括240例病例和456,108个对欧洲血统的控制。 英国生物银行是一项涵盖50万名40至69岁成年人的队列研究,于2006年至2010年在英国进行了(Neale Lab,2021年)。 依靠ICD 10编码的IC的诊断。 Jiang及其同事开发了一种高级基因组关联(GWA)工具,称为“ FastGWA-GLMM”,该工具专为处理涉及数百万个个人的大规模GWAS数据集而设计。 该工具能够分析所有二元表型中的常见变体和稀有变体,即使是以高度不平衡的病例 - 控制比为特征的(Jiang等,2021)。 他们已应用FastGWA-GLMM使用UK Biobank(UKB)数据来调查2,989个二元性状。 通过FastGWA数据门户可以公开访问这些分析所产生的全面摘要统计信息。 2从GWAS上的IC的摘要统计数据是从GWAS目录(Sollis等,2023)中获得的,其中1个包括240例病例和456,108个对欧洲血统的控制。英国生物银行是一项涵盖50万名40至69岁成年人的队列研究,于2006年至2010年在英国进行了(Neale Lab,2021年)。依靠ICD 10编码的IC的诊断。Jiang及其同事开发了一种高级基因组关联(GWA)工具,称为“ FastGWA-GLMM”,该工具专为处理涉及数百万个个人的大规模GWAS数据集而设计。该工具能够分析所有二元表型中的常见变体和稀有变体,即使是以高度不平衡的病例 - 控制比为特征的(Jiang等,2021)。他们已应用FastGWA-GLMM使用UK Biobank(UKB)数据来调查2,989个二元性状。通过FastGWA数据门户可以公开访问这些分析所产生的全面摘要统计信息。2