• 基于效用的代理。在大多数环境中,仅靠目标不足以产生高质量的行为。目标只是粗略地区分了“快乐”和“不快乐”的状态。更通用的绩效衡量标准应该允许根据不同的世界状态对代理的快乐程度进行比较。代理的效用函数本质上是绩效衡量标准的内化。如果内部效用函数和外部绩效衡量标准一致,那么根据外部绩效衡量标准,选择行动以最大化其效用的代理将是理性的。在两种情况下,目标不足,但基于效用的代理仍然可以做出理性的决策。首先,当存在相互冲突的目标时,只有部分目标可以实现,效用函数会指定适当的权衡。其次,当代理可以瞄准多个目标,但没有一个可以肯定地实现时,效用提供了一种方法,可以将成功的可能性与目标的重要性进行权衡。
主要关键词