Loading...
机构名称:
¥ 2.0

DNA 甲基化是一种关键的表观遗传修饰,可调节基因表达并在发育和疾病过程中发挥重要作用。在这里,我们介绍了胞嘧啶-磷酸-鸟嘌呤预训练转换器 (CpGPT),这是一种新颖的基础模型,在 1,500 多个 DNA 甲基化数据集上进行了预训练,涵盖来自不同组织和条件的 100,000 多个样本。CpGPT 利用改进的转换器架构来学习甲基化模式的综合表示,使其能够从有限的输入数据中推断和重建全基因组甲基化谱。通过捕获序列、位置和表观遗传背景,CpGPT 在针对与衰老相关的任务进行微调时优于专门的模型,包括按时间顺序的年龄预测、死亡风险和发病率评估。该模型在不同的甲基化平台和组织类型中具有很强的适应性。此外,对样本特定注意力权重的分析可以识别出对个体预测最有影响力的 CpG 位点。 CpGPT 作为基础模型,为 DNA 甲基化分析树立了新的标杆,在

CpGPT:DNA甲基化的基础模型

CpGPT:DNA甲基化的基础模型PDF文件第1页

CpGPT:DNA甲基化的基础模型PDF文件第2页

CpGPT:DNA甲基化的基础模型PDF文件第3页

CpGPT:DNA甲基化的基础模型PDF文件第4页

CpGPT:DNA甲基化的基础模型PDF文件第5页

相关文件推荐