由于基因组元素具有细胞类型特异性,并且受遗传和表观遗传调控的影响,因此识别基因组元素具有挑战性。揭示基因组元素对基因和细胞状态的功能作用需要大量资源。在这里,我们提出了顺式调控元件转换器 (CREformer),这是一种大型深度学习模型,可通过多模态方法揭示功能和调控机制。CREformer 包含 30 亿个参数,通过整合批量和单细胞数据集的优势进行预训练,涵盖批量多组学片段中的 550 亿个核苷酸和 1.65 亿个单细胞配对多组学谱。预训练后,CREformer 以零样本方式执行所有预测,这使得在没有数据可供微调的情况下也能进行预测。这包括主调节器、增强子、基因调控网络 (GRN) 和功能变体的计算推断,以及表观遗传扰动、细胞状态转变和疾病治疗的计算机模拟。此外,CREformer 还发现了新的肿瘤治疗靶点,并在体外进行了验证。总体而言,CREformer 的基础、零样本能力有可能加速对广泛范围内功能元素及其动态的全面发现的研究。