顺式调节元件(CRE),例如启动子和增强子,是直接调节基因表达的相对较短的DNA序列。CRE的适应性,通过其调节基因表达的能力来衡量,高度取决于Nu-Cleotide序列,尤其是特定的基序被称为转录因子结合位点(TFBSS)。设计高素质CRE对于治疗和生物工程应用至关重要。当前的CRE设计方法受两个主要缺点的限制:(1)他们通常依靠迭代优化策略来修改现有序列并易于局部Optima,并且(2)他们缺乏序列优化的生物学先验知识的指导。在此过程中,我们通过提出一种生成方法来解决这些局限性,该方法杠杆化的增强学习(RL)以微调预先训练的自动回旋(AR)模型。我们的方法通过得出基于综合推理的奖励来模拟激活剂TFBS并去除阻遏物TFBS,从而结合了数据驱动的生物学先验,然后将其集成到RL过程中。我们在两个酵母媒体条件下的启动子设计任务和三种人类细胞类型的增强剂设计任务中评估了我们的方法,这表明了其产生高素质CRE的能力,同时保持序列多样性。该代码可在https://github.com/yangzhao1230/taco上找到。
![arxiv:2503.07948v1 [cond-mat.supr-con] 2025年3月11日PDF文件第1页](/bimg/9/91b4d224c7e75ad07cb3fbeedb54fd025644a80f.webp)
![arxiv:2503.07948v1 [cond-mat.supr-con] 2025年3月11日PDF文件第2页](/bimg/4/44d232e1d65ac11e7906e6494594ad34142b9646.webp)
![arxiv:2503.07948v1 [cond-mat.supr-con] 2025年3月11日PDF文件第3页](/bimg/0/0f916f478f79e2580ab24c01a282e16b2a4c4e62.webp)
![arxiv:2503.07948v1 [cond-mat.supr-con] 2025年3月11日PDF文件第4页](/bimg/b/b7b1eab8b86d75211c0adc22eb006dd4ba53a71a.webp)
![arxiv:2503.07948v1 [cond-mat.supr-con] 2025年3月11日PDF文件第5页](/bimg/3/3dda143c02cf4a38e5e314cc9ab4ea027de35bbb.webp)
