当前的药物发现生成模型主要使用分子对接作为指导活性化合物产生的甲骨文。但是,这种模型在实践中通常没有用,因为即使是具有较高对接得分的化合物也不会始终显示出实验活动。存在更准确的活动预测方法,例如基于分子动力学的结合能量计算,但是在生成模型中使用它们在计算上太昂贵。为了应对这一挑战,我们提出了多保真潜在空间主动学习(MF-lal),这是一种生成的建模框架,将一组与成本准确性的折衷方案集成在一起。与以前分别学习替代模型和生成模型的方法不同,MF-LAL将生成性和多余的代孕模型结合到一个框架中,从而可以进行更准确的活动预测和更高质量的样本。我们使用一种新型的主动学习算法来训练MF-lal,以进一步降低计算成本。我们对两种相关疾病蛋白的实验表明,MF-LAL产生的化合物具有比其他单一单一和多忠诚方法更好的结合自由能评分。该代码可在https://github.com/rose-stl-lab/ mf-lal上找到。
主要关键词