RNA分子在广泛的生物过程中起着至关重要的作用。 对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。 最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。 在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。 带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。 专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。 rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。 我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。RNA分子在广泛的生物过程中起着至关重要的作用。对其功能有更深入的了解可以显着提高我们对生活机制的了解,并推动各种疾病的药物发展。最近,RNA基础模型的进步使RNA工程的新方法实现了新的方法,但是现有方法在生成具有特定功能的新序列方面缺乏。在这里,我们引入了rnagenesis,这是一个基础模型,通过潜在扩散结合了RNA序列理解和从头设计。带有带有混合N-Gram tokenization的Bert样变压器编码器,用于编码,用于潜在空间压缩的查询变压器以及用于序列生成的自动回归解码器,rnagenesis从学习的表示中重建了RNA序列。专门针对这一生成,训练了基于得分的脱氧扩散模型,以捕获RNA序列的潜在分布。rnagenesis在RNA序列理解中的表现优于当前方法,在13个基准中(尤其是在RNA结构预测中)中获得了最佳结果,并且在设计具有理想特性的天然样品和CRISPR SGRNA方面进一步优先。我们的工作将rnagenesis确立为基于RNA的治疗和生物技术的强大工具。
主要关键词