1. 威拉姆特大学阿特金森管理学院,900 State Street,塞勒姆,俄勒冈州,美国 97301 2. 再生项目,旧金山,加利福尼亚州 94104 *通信地址:tjohnson@willamette.edu 摘要。科学家和哲学家一直在争论人类是否可以信任先进的人工智能 (AI) 代理尊重人类的最大利益。但反过来呢?先进的 AI 代理会信任人类吗?衡量 AI 代理对人类的信任具有挑战性,因为——没有不诚实的代价——此类代理可能会对它们对人类的信任做出错误的回应。在这里,我们提出了一种激励机器决策的方法,而无需改变 AI 代理的底层算法或目标导向。在两个独立的实验中,我们随后在 AI 代理(来自 OpenAI 的大型语言模型 (LLM))和人类实验者(作者 TJ)之间的数百场信任游戏中使用此方法。在我们的第一个实验中,我们发现人工智能代理在面对实际激励时决定信任人类的比例高于做出假设决策时。我们的第二个实验通过自动化游戏和同质化问题措辞复制并扩展了这些发现。我们再次观察到人工智能代理在面对真实激励时具有更高的信任率。在这两个实验中,人工智能代理的信任决策似乎与赌注的大小无关。此外,为了解决人工智能代理的信任决策反映出对不确定性的偏好的可能性,实验包括两种条件,向人工智能代理提供非社交决策任务,提供选择确定或不确定选项的机会;在这些条件下,人工智能代理始终选择确定选项。我们的实验表明,迄今为止最先进的人工智能语言模型之一会根据激励改变其社交行为,并在受到激励时表现出与对人类对话者的信任一致的行为。关键词:人工智能;信任游戏;激励;机器行为;自然语言处理;实验经济学;行为经济学;博弈论 引言 人类是否应该相信先进的人工智能会尊重人类的最大利益?人工智能会表现出这样的信任吗?这些问题以及相关的协调问题 [1] 主导了关于人类如何适应先进人工智能的热门讨论 [2, 3],并促使研究人员将对人工智能的信任究竟意味着什么正式化 [4]。然而,在这场对话的背景下,存在着一个类似的问题:先进的人工智能代理信任人类吗?也就是说,抛开信任的内部或心理表征问题,先进的人工智能代理的行为是否表现出对人类的信任?毕竟,当代理缺乏信息、在正式机构之外运作或拥有诡计机会时,相互信任可以促进社会和经济交流 [5-7],因此,人工智能对人类的信任成为人类与人工智能代理交互环境中的关键关注点。然而,衡量人工智能代理对人类的信任是一项挑战,因为代理可能会对其对人类的信任做出错误的回应,而不存在与不诚实相关的成本。因此,我们设计了一种激励机器决策的方法,即通过为人工智能代理的服务提供代币(即不修改内部人工智能算法或目标导向),然后,我们在 OpenAI 的 GPT-3.5 模型开发的高级人工智能代理 text-davinci-003(以下简称 Davinci)和人类实验者(作者之一,TJ)之间的数百场信任游戏中使用这种方法。我们的工作建立在经济学研究的基础上,该研究表明,与假设的激励相比,真实的激励会改变人类的行为 [8],引发更准确的信念 [9],并促进对行为和态度的衡量,否则这些行为和态度可能会被各种反应偏见 [10] 所掩盖,包括社会期望偏见 [11]。事实上,这样的观察促使实验经济学家致力于为实验参与者提供诚实描述的、真实的激励[12]。
在2002年至2012年之间使用疾病控制和预防中心(CDC的)行为风险因素监视系统(BRFS)的一项研究发现,平均最高温度大于30°C(86°F)的平均最高温度将精神健康问题的可能性大于10°C至15°C(50°C)(59°F),而59°C的平均平均水平增加了1%。 2018)。如果在美国人口中推断出来,这一数字将转化为30天内报告心理健康问题的200万人。研究发现,温度逐渐变化对心理健康的影响是暴露于卡特里娜飓风所产生的影响的一半(Obradovich等,2018)。Liu等人对文献的荟萃分析。(2021)发现,行为健康相关的发病率和死亡率随温度升高而增加。Thompson等人的荟萃分析。(2023)显示,平均每月温度的每1°C每1°C每1°C的自杀发生率增加1.5%,而在平均每日温度平均温度每1°C的尝试和完成自杀的发生率增加1.7%。
最近的科学证据表明,气候变化慢慢,例如环境温度,天气变化,污染,例如空气污染和光污染影响了睡眠 - 效果时间表,睡眠时间的总持续时间以及促进睡眠障碍(如缺失,睡眠综合征和阻塞性睡眠呼吸暂停)等睡眠障碍。环境温度:环境温度对人睡眠有重大影响。这些作用导致睡眠不足,在妇女,老年人和低收入组中更加明显(Minor等,2020; Obradovich等,2017)。
我们的研究人员的工作值得称赞,正如 2022 年和 2023 年引用次数最多的出版物所证明的那样,这凸显了我们研究工作的多学科性和综合性。从采用最先进的神经成像技术(Chun Chieh Fan、Wes Thompson、Haixia Zheng)和计算方法(Ryan Smith、Maëlle Gueguen)到探索焦虑(Maria Ironside)和情绪障碍(Robin Aupperle、Salvador Guinjoan、Aki Tsuchiyagaito、Masaya Misaki)的炎症(Leandra Figueroa-Hall)和神经基础,我们研究的广度和深度确实令人惊叹。我们特别关注精神病患者大脑和身体处理功能障碍的描述(Sahib Khalsa)、人工智能在精神保健中的整合(Nick Obradovich)、创伤性脑损伤的研究(Jonathan Savitz)以及物质使用对大脑处理范式影响的彻底检查(Jennifer Stewart),这些都是我们致力于解决精神疾病多方面挑战的一部分。