结构化的RNA位于许多中心生物学过程的核心,从基因表达到催化。RNA结构预测由于缺乏与有机体表型相关的高质量参考数据而无法为RNA功能提供的,因此无法进行预测。我们提出了石榴石(GTDB获得了带有环境温度的RNA),这是一个固定在基因组分类数据库(GTDB)的RNA结构和功能分析的新数据库。石榴石将RNA序列与GTDB参考生物的实验和预测的最佳生长温度联系起来。使用石榴石,我们开发了序列和结构感知的RNA生成模型,重叠的三重态Tokeni-Zation为GPT样模型提供了最佳的编码。在石榴石和这些RNA生成模型中利用高嗜热RNA,我们确定了核糖体RNA中的突变,这些突变赋予了赋予大肠杆菌核糖体的热稳定性。此处介绍的GTDB衍生的数据和深度学习模型为理解RNA序列,结构和功能之间的连接提供了基础。
主要关键词