获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
序列到功能分析是人类遗传学中的一项具有挑战性的任务,特别是在从生物序列(例如个体化基因表达)预测细胞类型特异性多组学表型时。在这里,我们提出了一种新方法 UNICORN,其预测性能比现有方法有所提高。UNICORN 将来自生物序列的嵌入以及来自预先训练的基础模型的外部知识作为输入,并使用精心设计的损失函数优化预测器。我们证明 UNICORN 在细胞水平和细胞类型水平的基因表达预测和多组学表型预测方面均优于现有方法,并且它还可以生成预测的不确定性分数。此外,UNICORN 能够将个性化的基因表达谱与相应的基因组信息联系起来。最后,我们表明 UNICORN 能够表征不同疾病状态或扰动的复杂生物系统。总体而言,基础模型的嵌入可以促进理解生物序列在预测任务中的作用,并且结合多组学信息可以提高预测性能。