单步反向合成旨在预测一组导致靶分子创建的反应,这在分子发现中是至关重要的任务。尽管靶分子通常可以通过多种不同的反应合成,但尚不清楚如何验证反应的可行性,因为可用的数据集仅覆盖了可能的溶液的一小部分。因此,不鼓励现有模型充分探索可能的反应空间。为了解决这些问题,我们首先提出了可行性阈值计数(FTC)度量,以估计与机器学习模型的反应可行性。sec- ond,我们开发了一种新型的逆合合成模型RetroGFN,它可以探索有限的数据集并返回一组可行的反应。我们表明,RetrogFN在FTC指标上的现有方法的幅度很大,同时在广泛使用的TOP-K精度度量上保持竞争性结果。
主要关键词