具有数值推理的学习程序
药物设计是识别负责药物活性的分子的过程。假设我们想用机器学习来自动化药物设计。为此,我们希望自动学习解释分子为何活跃或不活跃的程序。例如,如上图所示,程序可能会确定 […]
来源:ΑΙhub药物设计是识别负责药物活性的分子的过程。假设我们想用机器学习来自动化药物设计。为此,我们希望自动学习能够解释分子为何活跃或不活跃的程序。例如,如上图所示,如果分子含有电荷大于 0.2C 的氢原子,并且位于碳原子 0.1 埃以内的范围内,程序可能会确定分子是活跃的。发现这个程序需要识别数值 0.2 和 0.1。
要学习这样的药物设计程序,我们需要一种可以从少量示例中概括的方法,并且可以得出可解释的程序来描述分子的性质及其原子之间的关系。
程序合成是从示例中自动生成计算机程序。归纳逻辑编程 (ILP) 是一种程序合成形式,可以从少量示例中学习可解释的程序。例如,现有的 ILP 技术可以学习用于简单药物设计问题的程序。
然而,当前的 ILP 方法很难学习具有数值的程序,例如上面介绍的程序。主要的困难在于数值通常具有很大的、可能无限的域,例如实数集。大多数方法依赖于枚举候选数值,这在大域中是不可行的。此外,识别数值通常需要复杂的数值推理,例如求解方程组和不等式。当前的方法在每个示例上独立执行程序,因此无法对多个示例进行联合推理。因此,当前的方法难以确定阈值,例如原子的电荷超过特定数值。
[1] 可满足性模理论 [2]参考文献
C. Hocquette, A. Cropper 带有数值推理的关系程序合成 此处标签:
AAAI,