Loading...
机构名称:
¥ 2.0

GPT系列的成功证明,GPT可以从序列中提取一般信息,从而使所有下游任务受益。这促使我们使用预训练的模型来探索DNA序列中的隐藏信息。但是,DNA序列分析中的数据和任务需求是复杂性和多样性,因为DNA相关数据包括不同类型的信息,例如序列,表达水平等,而目前尚无专门为这些特征设计的模型。在此,我们提出了DNAGPT,这是一种从9种的超过100亿个碱基对进行预训练的广义基础模型,可以对任何DNA序列分析任务进行微调。我们的模型可以同时处理或输出DNA序列和数字。此外,我们独特的令牌设计使用户可以根据自己的任务要求设计提示,从而适用于任何类型的任务。我们已经评估了我们的分类,回归和生成任务的模型。我们证明了DNAGPT受益于预训练,因此可以为任何下游任务带来绩效提高。我们的模型不仅是基因组分析领域的新尝试,而且为在生物学中应用基础模型提供了新的方向。

非人类灵长类动物的深脑区域中远程控制的药物释放

非人类灵长类动物的深脑区域中远程控制的药物释放PDF文件第1页

非人类灵长类动物的深脑区域中远程控制的药物释放PDF文件第2页

非人类灵长类动物的深脑区域中远程控制的药物释放PDF文件第3页

非人类灵长类动物的深脑区域中远程控制的药物释放PDF文件第4页

非人类灵长类动物的深脑区域中远程控制的药物释放PDF文件第5页

相关文件推荐

2024 年
¥2.0
2025 年
¥1.0
2024 年
¥1.0