人工智能找到控制植物生长的基因

来源:OSP网站大数据新闻

来源:Lippman 实验室/CSHL

随着气候变化的加速,农作物日益面临干旱、高温和其他极端天气的压力。与此同时,使植物适应环境的努力遇到了遗传学的主要谜团之一:植物通常有几个控制所需特性的相关基因。而寻找功能重叠的基因就成为一项非常困难的任务。

针对这种情况,冷泉港实验室 (CSHL) 的科学家们提出了突破性的解决方案,开发了一种基于人工智能的计算模型,可以识别重复基因并预测其突变对植物的影响。

利用 1.4 亿年开花植物基因变化的进化数据,研究人员训练了一个模型来识别冗余模式并预测应该编辑哪些基因来改变某些特征。

这是关于了解基因复制后会发生什么。想象一下,一株植物最初有一个特定的基因。由于重复,已经有两个了。此后会发生什么?根据理论,它们应该是不同的。但如何呢?

为了回答这个问题,研究小组重点研究了 CLE 基因家族,该基因家族参与细胞信号传导和植物发育。 CLE 肽在所有植物物种中都很常见。然而,它们的许多具体功能仍然未知。由于这些基因长度短、进化快且冗余,研究这些基因非常困难。

利用人工智能的新进展,该团队在多种植物物种中鉴定出了数千个以前未知的 CLE 基因。计算机模型已经识别出可能冗余的基因。冗余基因很可能在一两个地方相似——它们产生的肽或启动子——控制基因活性的DNA区域。