人工智能为植物遗传学提供“路线图”

CSHL 科学家正在使用人工智能来识别农作物中的冗余基因,通过有针对性的基因编辑来改善性状,以提高抵御能力。

来源:Scientific Inquirer

随着全球气温上升,冷泉港实验室 (CSHL) 的科学家们致力于种植更强壮、更有弹性的作物。然而,这个过程充满挑战。植物通常具有几个控制所需性状的相关基因,例如大小或抗旱性。寻找具有重叠功能的基因,或“冗余基因”,是一场几乎不可能的寻宝游戏。

“大多数时候,作物改良的途径都存在重大限制,”CSHL 扎卡里·利普曼实验室的博士后 Iacopo Gentile 说。 “那是因为基因家族的进化和相互补偿的方式存在太多冗余和复杂性。”

现在,Gentile 和同事追踪了开花植物中一个重要的基因家族,以了解它在 1.4 亿年的进化过程中是如何变化的。利用这些数据,他们训练模型来识别冗余模式并预测要编辑哪些基因来修改特定性状。

“这是为了了解基因复制后会发生什么,”Gentile 解释道。 “你有一个复制基因。然后你有两个。之后会发生什么?理论告诉你它们会彼此分歧。该领域的最大问号是如何分歧。”

为了回答这个问题,研究小组聚焦于 CLE,一个参与细胞信号传导和植物发育的基因家族。 CLE 肽普遍存在于所有植物物种中。然而,关于它们的具体功能的许多信息仍然未知。由于它们的篇幅短、演化快且冗余,研究它们一直很困难。

利用人工智能的新进展,该团队在 1,000 个物种中识别出了数千个以前未知的 CLE 基因。他们将这些数据输入计算机模型,该模型标记出可能冗余的基因。冗余基因可能在一两个地方有相似之处——它们产生的肽,或者基因启动子,即控制表达的DNA区域。

“这是番茄中第一次同时针对如此多的基因进行如此大的靶向,”Gentile 说。 “我们的目标是 10 个。”

图片来源:Lippman 实验室/CSHL。