摘要 13 14 预期结果以“巴甫洛夫”的方式影响行为:奖励前景激发行动,而惩罚前景抑制行动。理论认为,巴甫洛夫偏见是陌生或无法控制的环境中整体行动的“先验”。然而,这种解释无法解释这些偏见的强度——即使在熟悉的环境中也会导致频繁的行动失误。我们认为,如果通过工具控制灵活地运用巴甫洛夫控制,它会更加有用。19 具体而言,工具行动计划可能会塑造对奖励/惩罚信息的选择性注意,从而影响巴甫洛夫控制的输入。在两个眼动追踪样本(N = 35/64)中,我们观察到 Go/NoGo 行动计划影响参与者关注奖励/惩罚信息的时间和时长,这反过来又以巴甫洛夫的方式影响他们的反应。23 注意力效应更强的参与者表现更高。因此,人类似乎将巴甫洛夫控制与其工具性行动计划结合起来,将其作用从行动默认值扩展到确保稳健行动执行的有力工具。 关键词:巴甫洛夫偏见;强化学习,眼动追踪;行动准备;注意力 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44