图 S1 。一般工作流程。左侧:使用小型数据集进行 TL 以聚焦 Prior(生成模型)的状态,随后将其用于具有自定义 MPO 目标的 RL。右侧:对生成模型的不同状态进行采样时化合物分布的示意图。A ) 一般 Prior 是在 ChEMBL 上训练的初始生成模型的状态。与其他状态相比,它生成给定 SMILES 字符串的概率分布更均匀。B ) 聚焦先验是生成模型的一种状态,在该状态下,它可以以比其他区域更高的概率生成某些化学空间区域。C ) 生成模型作为聚焦先验进入 RL,并在整个过程中导航化学空间以寻找高 MPO 分数区域。导航过程中获取的数据属于 MPO 得分较高的区域,可作为新颖想法的来源。
主要关键词