过去的历史事件和实验研究表明,符合当局的命令对人们的行为有很大的影响。然而,遵守秩序如何影响道德行为的机制在很大程度上是未知的。在这里,我们检验了以下假设:当男性和女性人类对另一个人产生痛苦的刺激时,当此行动符合实验者(强迫状况)的顺序时,他们的移情反应就会减少,而与自由决定遭受痛苦(自由状态)相比,他们的移情反应会减少。我们观察到,即使参与者知道在强迫和自由条件下传递给“受害者”的冲击强度是完全相同的,他们也将冲击物评为在强迫状态下的痛苦。MRI结果进一步表明,遵守与目睹ACC,Insula/IFG,TPJ,TPJ,MTG和背侧纹状体(包括尾状和壳骨)以及耐心疼痛的神经签名的ACC,Insula/IFG,TPJ,MTG和背侧纹状体的冲击有关的活动减少的活动减少。我们还观察到,参与者的责任感降低,并且在被迫的自由条件下,在多元神经内gui签名中的活动降低,这表明与同理心相关的神经反应的减少可能与减少毛毡责任和罪恶感有关。这些结果表明,服从命令对人们如何看待和处理他人的痛苦具有可衡量的影响。这可能有助于解释人们在强迫情况下如何改变人们进行道德违法行为的意愿。
在1970年代,哈佛大学教授克里斯·阿吉里斯(Chris Argyris)开发了“双重循环”模型,这是一种高度影响力的理论,解释了组织从错误中学习的两个层次[4]。“内部循环”是在任何组织过程中学习并纠正个人错误。Argyris将其比作恒温器“学习”,从环境反馈到调整并纠正其行为。“外循环”是考虑哪些组织过程甚至重要和必要,并在响应中做出巨大的结构变化;恒温器“质疑基本政策和目标及其计划。”双循环是关键整合工作流程的方便隐喻,知识工作者现在发现自己。调整和课程校正单个模型输出,并更广泛地考虑如何补充AI的工作流程,转化或取代。这似乎是故事的逻辑结局。
图3:静止的图像来自陈述中所示的视频。(a)显示了女性友好的主导条件(b)显示男性友好的顺从状况(c)显示男性敌对的占主导地位(d)显示女性敌对的服从条件(E)显示女性中性言语状况(F)显示了男性中性的非言语状况(G)显示了男性对照条件。所有行为后来在主要研究中使用,除了(e)女性中性言语
[26] Jiahao Yu、Xingwei Lin 和 Xinyu Xing。Gptfuzzer:使用自动生成的越狱提示对大型语言模型进行红队测试。arXiv 预印本 arXiv:2309.10253,2023 年。[27] Liangming Pan、Michael Saxon、Wenda Xu、Deepak Nathani、Xinyi Wang 和 William Yang Wang。自动纠正大型语言模型:调查各种自我纠正策略的概况。arXiv 预印本 arXiv:2308.03188,2023 年。[28] Susmit Jha、Sumit Kumar Jha、Patrick Lincoln、Nathaniel D Bastian、Alvaro Velasquez 和 Sandeep Neema。使用形式化方法引导的迭代提示消除大型语言模型的幻觉。2023 年 IEEE 国际保证自主会议 (ICAA),第 149-152 页。 IEEE,2023 年。[29] Jacob Menick、Maja Trebacz、Vladimir Mikulik、John Aslanides、Francis Song、Martin Chadwick、Mia Glaese、Susannah Young、Lucy Campbell-Gillingham、Geoffrey Irving 等人。教授语言模型以支持带有经过验证的引文的答案。arXiv 预印本 arXiv:2203.11147,2022 年。[30] Advait Sarkar。计算机应该易于使用吗?质疑用户界面设计的简单性原则。在 2023 年 CHI 计算机系统人为因素会议的扩展摘要中,第 1-10 页,2023 年。[31] Haiyan Zhao、Hanjie Chen、Fan Yang、Ninghao Liu、Huiqi Deng、Hengyi Cai、Shuaiqiang Wang、Dawei Yin 和 Mengnan Du。大型语言模型的可解释性:一项调查。 arXiv preprint arXiv:2309.01029,2023 年。[32] Todd Kulesza、Simone Stumpf、Margaret Burnett、Sherry Yang、Irwin Kwan 和 Weng-Keen Wong。过多、过少还是恰到好处?解释如何影响最终用户的心智模型。2013 年 IEEE 视觉语言和以人为本的计算研讨会,第 3-10 页。IEEE,2013 年。[33] Elaine Simpson RN 和 Mary Courtney RN。护理教育中的批判性思维:文献综述。国际护理实践杂志,8(2):89–98,2002 年。[34] Robert J Sternberg 和 Diane F Halpern。心理学中的批判性思维。剑桥大学出版社,2020 年。
机器人应该按照指令行事。对许多人来说,机器人或人工智能 (AI) 代理不完全按照人类用户的指令行事的想法引发了令人担忧的担忧:即使是简单代理违抗命令的例子,也是无法控制的“超级智能”[ 4 ] 或机器人起义的末日场景的预兆。虽然这些推测场景的可能性和可行性值得商榷,但它们的不可取性却毋庸置疑。更具体地说,目前现实世界中的自主系统有各种各样的例子,它们的行为危险地违背了公认的人类法规和规范。例如,据报道,一些当前的自动驾驶汽车原型“不服从”停车标志 [ 22 ],如果不纠正,这种行为可能会导致严重的人身伤害。因此,无论是科幻小说中推测的机器人末日,还是更常见的违反交通法规的自动驾驶汽车,都存在明显表现出不良“不服从”行为的空间,这些行为构成了必须避免的危险。
摘要。随着服务机器人越来越多地融入辅助技术,需要对这些机器人自主性的界限和范围进行推理,例如它们何时应该仅仅对环境做出反应,何时应该做出主动决策,何时应该覆盖命令。在大多数现有研究中,“好”辅助机器人的定义是遵从给定命令的机器人。最近的两篇论文挑战了这一观点,并描述了系统可能选择反抗命令或由于深刻理解处理者的意图而违抗处理者的情景。本文对这两篇论文进行了比较讨论,以及它们如何共同为可以覆盖命令的辅助机器人创建一个更全面的框架。
过去的历史事件和实验研究表明,符合当局的命令对人们的行为有很大的影响。然而,遵守秩序如何影响道德行为的机制在很大程度上是未知的。在这里,我们检验了以下假设:当男性和女性人类对另一个人产生痛苦的刺激时,当此行动符合实验者(强迫状况)的顺序时,他们的移情反应就会减少,而与自由决定遭受痛苦(自由状态)相比,他们的移情反应会减少。我们观察到,即使参与者知道在强迫和自由条件下传递给“受害者”的冲击强度是完全相同的,他们也将冲击物评为在强迫状态下的痛苦。MRI结果进一步表明,遵守与目睹ACC,Insula/IFG,TPJ,TPJ,MTG和背侧纹状体(包括尾状和壳骨)以及耐心疼痛的神经签名的ACC,Insula/IFG,TPJ,MTG和背侧纹状体的冲击有关的活动减少的活动减少。我们还观察到,参与者的责任感降低,并且在被迫的自由条件下,在多元神经内gui签名中的活动降低,这表明与同理心相关的神经反应的减少可能与减少毛毡责任和罪恶感有关。这些结果表明,服从命令对人们如何看待和处理他人的痛苦具有可衡量的影响。这可能有助于解释人们在强迫情况下如何改变人们进行道德违法行为的意愿。