超人人工智能 (AI) 将如何影响人类决策?这种影响背后的机制是什么?我们在 AI 已经超越人类表现的领域中解决这些问题,分析了过去 71 年(1950 年至 2021 年)专业围棋选手做出的 580 多万步决策。为了解决第一个问题,我们使用超人人工智能程序来估计人类决策随时间变化的质量,生成 580 亿个反事实游戏模式,并将实际人类决策的胜率与反事实人工智能决策的胜率进行比较。我们发现,在超人人工智能出现后,人类开始做出明显更好的决策。然后,我们研究了人类玩家随时间变化的策略,发现在超人人工智能出现后,新颖的决策(即以前未观察到的举动)出现得更频繁,并且与更高的决策质量相关。我们的研究结果表明,超人类人工智能程序的发展可能促使人类玩家摆脱传统策略,并引导他们探索新颖的动作,从而可能改善他们的决策能力。
从历史角度来看,人工智能研究一直以认知科学领域的计算机科学家、心理学家、工程师、哲学家和生物学家之间的密切合作为基础。这种合作受到控制论方法对自然和人工系统研究的影响,多年来,在仿生学、机器人学、生物和神经启发系统以及更普遍的认知人工系统和系统科学领域形成了卓有成效的研究方向 [ 1 ][ 2 ]。然而,经过数十年的相互和开创性的合作,人工智能和认知科学已经产生了几个子学科,每个学科都有自己的目标、方法和评估标准。一方面,这种分裂促进了一些人工智能系统的发展,这些系统能够在受限领域(例如计算机视觉,或国际象棋、Jeopardy、围棋等游戏)产生超人的能力。但另一方面,它基于一种分而治之的方法,极大地阻碍了跨领域合作和科学努力,这些努力旨在更全面地了解自然和人工智能是什么,以及如何通过考虑来自自然界的见解来设计智能制品。然而,近年来,认知启发的人工系统领域重新引起了学术界和工业界的关注,人们普遍意识到需要在这个跨学科领域进行更多研究。事实上,用 Aaron Sloman 的话来说,“
1.0 什么是人工智能? 1.1 人工智能 (AI) 是机器执行通常与人类智能相关的任务的能力,例如学习和解决问题。人工智能应用包括生成或创作工具(例如 ChatGPT 和 AI art )、高级网络搜索引擎(例如 Google Search )、推荐系统(YouTube、Amazon 和 Netflix 使用)、理解人类语音(例如 Siri 和 Alexa )、自动驾驶汽车(例如 Waymo )以及参加国际象棋和围棋等战略游戏。 1 1.2 生成式人工智能 (GenAI) 是指“旨在创建未由人类明确编程或提供的新内容、数据或信息的人工智能系统和算法。相反,这些人工智能系统根据它们在训练期间从大型数据集中学习到的模式、规则和示例自主生成内容。这些系统可以创建文本、图像、音乐、代码等,通常在生成过程中表现出类似人类的创造能力。” 2 大型语言模型 (LLM) 是一种 GenAI 系统,它经过大量文本数据的训练,可以对用自然语言编写的提示生成合理的文本响应。1.3 人工智能与其他技术之间的界限很模糊,人工智能越来越多地以用户不可见或不明显的方式融入数字系统。
Harnad,S。(1990) Kodansha。 3。Matsubara,J。和Kawamura,H。(2019年)。 , 240–246。 McCarthy, J., & Hayes, P. (1969). 从人工智能的角度看一些哲学问题。收录于 B. Meltzer 和 D. Michie (编),机器智能,4 (第 463–502 页)。英国爱丁堡:爱丁堡大学出版社。 (McCarthy, J. Hayes, P. Miura (译) (1990). 人工智能为什么需要哲学?框架问题的起源和发展。哲学书房) Searle, J. (1980). 思想、大脑和程序。行为与脑科学,3,417–457。 Shanahan, M. (1997). 解决框架问题。马萨诸塞州剑桥:麻省理工学院出版社。 Silver, D., Huang, A., Maddison, CJ、Guez、A.、Sifre、L.、van den Driessche、G.、...... Hassabis、D. (2016)。利用深度神经网络和树搜索掌握围棋游戏。《自然》,529,445–446。Watanabe、A. 和 Yasuki、K. (2007)。Bonanza 与游戏大脑:最强的将棋软件会超越人类吗?角川书店 Yamamoto、K. (2017)。人工智能是如何超越大师的? ─最强将棋AI开发者Ponanza教授
然而,尽管取得了这些进展,但许多人工智能应用领域仍然相当不成熟,在某些情况下,未能完全满足预期和早期的炒作。早在 1965 年,赫伯特·西蒙就预测“机器将在二十年内完成人类可以做的任何工作” [7]。60 年后,人工智能仍然无法协助完成大多数人类任务。最近,即使在狭窄的应用人工智能领域,许多人工智能预测也被证明过于乐观,挑战比最初认识到的更为重大。即使在取得了一些技术成功并投入大量资源的地方,情况也是如此。例如,2015 年,基于自动驾驶汽车技术的重大发展,《卫报》报道称“从 2020 年开始,你将成为一名永久的后座驾驶员” [8]。然而,尽管自动驾驶汽车取得了进展,但大多数人现在都认为,完全自动驾驶的挑战仍然很大,完全自动驾驶汽车可能还需要一段时间才能实现 [9]。然而,尽管某些领域缺乏突破,但在人工智能研究的其他领域,已经取得了远远超出预期的重大进展。例如,2016 年,谷歌的 AlphaGo 代理成功击败了世界上最好的围棋选手 [10],尽管一两年前有人预测这一成就还需要十多年的时间 [11]。
然而,尽管取得了这些进展,但许多人工智能应用领域仍然相当不成熟,在某些情况下,未能完全满足预期和早期的炒作。早在 1965 年,赫伯特·西蒙就预测“机器将在二十年内完成人类可以做的任何工作” [7]。60 年后,人工智能仍然无法协助完成大多数人类任务。最近,即使在狭窄的应用人工智能领域,许多人工智能预测也被证明过于乐观,挑战比最初认识到的更为重大。即使在取得了一些技术成功并投入大量资源的地方,情况也是如此。例如,2015 年,基于自动驾驶汽车技术的重大发展,《卫报》报道称“从 2020 年开始,你将成为一名永久的后座驾驶员” [8]。然而,尽管自动驾驶汽车取得了进展,但大多数人现在都认为,完全自动驾驶的挑战仍然很大,完全自动驾驶汽车可能还需要一段时间才能实现 [9]。然而,尽管某些领域缺乏突破,但在人工智能研究的其他领域,已经取得了远远超出预期的重大进展。例如,2016 年,谷歌的 AlphaGo 代理成功击败了世界上最好的围棋选手 [10],尽管一两年前有人预测这一成就还需要十多年的时间 [11]。
Khirod Chandra Panda Asurion Insurance,美国 电子邮件:1khirodpanda4bank@gmail.com,联系方式:0009-0008-4992-3873 摘要 人工智能 (AI) 已达到关键阶段,在击败国际象棋和围棋大师等复杂任务中超越了人类的能力。这项技术进步不仅限于游戏;AI 现在能够写诗、预测决策、实时交互以及处理大量数据以在几毫秒内提供解决方案。随着 AI 融入各个商业领域,其对客户关系管理 (CRM) 的影响尤为显著,显著提升了客户体验 (CX)。本研究论文通过研究五种专门用于评估消费者认知度、有效性和忠诚度的 AI 工具,探讨了 AI 在 CRM 中的应用。研究人员采用了基于调查的研究方法,通过 Google 表单收集原始数据。对这些数据的分析表明,消费者不仅知道这些 AI 工具,而且发现它们的有效。此外,消费者对这些工具的忠诚度很高,表明他们对人工智能在 CRM 中的能力持积极态度并信任其能力。这项研究强调了人工智能通过先进的技术工具促进改善客户关系的变革潜力。关键词人工智能 (AI)、客户体验 (CX)、客户关系管理 (CRM)
人工智能如何改善人类的决策?回答这个问题很有挑战性,因为很难评估每个决策的质量,也很难理清人工智能对决策的影响。我们研究专业的围棋比赛,这为克服这些挑战提供了一个独特的机会。2016 年,一个人工智能围棋程序 (APG) 意外击败了最优秀的人类选手,超越了人类数千年来积累的最佳知识和技能。为了研究 APG 的影响,我们在 APG 首次公开发布之前和之后将人类的举动与人工智能的卓越解决方案进行了比较。我们对 1,242 名专业选手在 25,033 场比赛中的 750,990 步进行了分析,结果表明,APG 显著提高了选手的举动质量,以每一步获胜概率的变化来衡量。我们还表明,关键机制是减少人为错误的数量和比赛中最关键错误的严重程度。有趣的是,这种改进在游戏的早期阶段最为明显,因为不确定性更高。此外,年轻球员对 APG 更加开放并且能够更好地利用 APG,因此他们比资深球员受益更多,这表明在 AI 的采用和使用方面存在代际不平等。
随着互联网、大数据、云计算等技术的发展,以生命要素数据、机器自动决策为核心的人工智能算法得到越来越广泛的应用。随着AlphaGo战胜人类顶级围棋大师李世石的里程碑事件,人工智能在金融、医疗、自动驾驶、安防、家居、营销等领域创造了广泛的应用,给整个人类社会带来了巨大的变革。与此同时,物理世界与个体之间的界限不断模糊,引发了一系列的伦理危机,给社会治理和结构体系的发展带来多重阻碍。[1]业界早已认识到科幻作家阿西莫夫制定的著名“机器人三定律”的局限性。欧盟委员会发布的《欧盟人工智能》、韩国产业通商资源部发布的《机器人伦理宪章》等国外研究著作从一定角度对人工智能技术的伦理问题进行了探讨,但尚未形成被广泛接受的伦理框架。在国内,多数学者对人工智能技术的发展历史、优越性与局限性,以及人工智能与人类智能的关系等进行了分析和探讨,但对人工智能技术的伦理问题及相应对策的专业研究还比较缺乏。[2]
摘要 — 尽管在游戏人工智能(AI)开发方面取得了重大突破,但麻将作为一种流行的多人不完美信息游戏仍然颇具挑战性。与围棋和德州扑克等游戏相比,麻将具有更多的不可见信息、不固定的游戏顺序和复杂的计分系统,导致强化学习过程中的奖励信号具有很高的随机性和方差。本文通过将奖励方差减少(RVR)引入到一种新的自对弈深度强化学习算法中,提出了一种麻将人工智能。RVR通过相对价值网络处理不可见性,该网络利用全局信息引导模型在具有完美信息的预言机下收敛到最优策略。此外,RVR使用预期奖励网络提高了训练稳定性,以适应复杂、动态和高度随机的奖励环境。大量实验结果表明,RVR 显著降低了麻将 AI 训练中的方差,提高了模型性能。经过在一台拥有 8 个 GPU 的服务器上仅三天的自我对战训练,RVR 在 Botzone 平台上击败了 62.5% 的对手。索引术语 — 不完全信息博弈、多智能体学习、强化学习、麻将 AI