Loading...
机构名称:
¥ 3.0

解密基因组中的核苷酸如何编码调节指令和分子机器是生物学的长期目标。DNA语言模型(LMS)通过对每个核苷酸的序列上下文进行建模概率来隐式捕获功能元素及其组织。但是,由于缺乏可解释的方法,使用DNA LMS发现功能基因组元素一直在挑战。在这里,我们引入了核苷酸依赖性,该核苷酸依赖性量化了一个基因组位置的核苷酸取代如何影响其他位置核苷酸的概率。我们生成了动物,真菌和细菌种类千倍体范围内成对核苷酸依赖性的全基因组图。我们表明,核苷酸依赖性比序列比对和DNA LM重建更有效地表明了人类遗传变异的有害性。调节元素在依赖图中显示为密集块,从而可以准确地对转录因子结合位点的系统识别,就像在实验结合数据上训练的模型一样准确地识别。核苷酸依赖性还突出了RNA结构内接触的基础,包括伪诺和三级结构接触,精确地。这导致发现了四个小说,实验验证的RNA结构中的大肠杆菌。最后,使用依赖图,我们通过基准测试和视觉诊断来揭示几种DNA LM体系结构和训练序列选择策略的临界局限性。完全,核苷酸依赖性分析为发现和研究功能元件及其在基因组中的相互作用开辟了新的途径。

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件PDF文件第1页

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件PDF文件第2页

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件PDF文件第3页

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件PDF文件第4页

DNA语言模型的核苷酸依赖性分析揭示了基因组功能元件PDF文件第5页

相关文件推荐

2023 年
¥2.0
2024 年
¥1.0
2025 年
¥1.0
2025 年
¥23.0
2021 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2019 年
¥4.0
2025 年
¥1.0
2024 年
¥1.0