测序和转录组学的进步使得通过共表达分析可以发现酶,其中候选基因通过组织表达模式与已知途径酶的相似性来识别 — — 最近在 C.roseus 和 Podophyllumpeltatum 中的发现证明了这一点 [ 4 , 5 ]。自组织映射等机器学习方法进一步优化了候选基因 [ 6 ]。这些方法,加上对植物体内生物合成定位的更深入理解,以及单细胞代谢组学等技术的发展,进一步改善了候选基因的选择,加速了酶的发现 [ 7 ]。借助基于 OMIC 的工具(如 plantiSMASH)识别物理基因簇有助于阐明缺失的生物合成酶,如那可丁和长春花碱途径中的酶 [ 8–10 ]。然而,这种方法是有限的,因为许多植物生物合成途径几乎没有或没有基因聚集,如喜树碱生物合成途径[11]。基于同源性的克隆可以加速发现与已知生物合成酶具有直系同源功能的基因,例如在 Tabernanthe iboga 的 ibogaine 生物合成途径中鉴定出 C. roseus 脱羧酶直系同源物[12]。然而,途径的复杂性往往需要采用组合方法,例如 Gelsemiumsempervirens 氧化吲哚途径的发现[13]。