摘要 13 14 预期结果以“巴甫洛夫”的方式影响行为:奖励前景激发行动,而惩罚前景抑制行动。理论认为,巴甫洛夫偏见是陌生或无法控制的环境中整体行动的“先验”。然而,这种解释无法解释这些偏见的强度——即使在熟悉的环境中也会导致频繁的行动失误。我们认为,如果通过工具控制灵活地运用巴甫洛夫控制,它会更加有用。19 具体而言,工具行动计划可能会塑造对奖励/惩罚信息的选择性注意,从而影响巴甫洛夫控制的输入。在两个眼动追踪样本(N = 35/64)中,我们观察到 Go/NoGo 行动计划影响参与者关注奖励/惩罚信息的时间和时长,这反过来又以巴甫洛夫的方式影响他们的反应。23 注意力效应更强的参与者表现更高。因此,人类似乎将巴甫洛夫控制与其工具性行动计划结合起来,将其作用从行动默认值扩展到确保稳健行动执行的有力工具。 关键词:巴甫洛夫偏见;强化学习,眼动追踪;行动准备;注意力 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
第 9 章 巴甫洛夫、斯金纳和其他行为主义者对人工智能的贡献 *** Witold Kosinski 和 Dominika Zaczek-Chrzanowska 波兰-日本信息技术研究所,波兰-日本计算机技术研究中心 ul. Koszykowa 86, 02-008 Warszawa wkos@pjwstk.edu.pl mado@pjwstk.edu.pl 摘要 将在真实和人工系统的背景下提供一种智能行为的定义。将简要介绍学习原理,从巴甫洛夫的经典条件作用开始,到桑代克和斯金纳的强化反应和操作性条件作用,最后到托尔曼和班杜拉的认知学习。本文将描述行为主义中最重要的人物,尤其是那些对人工智能做出贡献的人物。本文将介绍一些根据这些原理行事的人工智能工具。本文将尝试说明何时一些简单的行为修改规则可以导致复杂的智能行为。 1. 智能:描述 毫无疑问,行为主义者对人工智能的发展做出了巨大贡献。动物学习理论的证据,尤其是行为主义者发现的学习规律,多年来吸引了人工智能领域的研究人员,许多模型都以此为基础。智能是一个复杂而有争议的概念,因此很难用一个简单的定义来概括它。根据 Jordan 和 Jordan [1] 的说法,将智能视为我们用来描述具有一定质量的行为的概念是恰当的。在这方面应该使用两个标准,即速度(即代理执行需要智力的特定任务的速度)和能力(即代理可以执行的任务的难度)。另一方面,我们可以找到另一种智能定义,即执行认知过程的能力。有三个基本的认知过程:1) 抽象,2) 学习,3) 处理新颖性。该领域的杰出研究人员对智力给出了许多定义,例如,它被定义为: