IBM深蓝色:IBM的棋手超级计算机AI在1990年代后期击败了国际象棋大师加里·卡斯帕罗夫(Garry Kasparov),通过分析董事会上的作品并预测每一步的可能结果。
Glickman,M。E.和Jones,A。C.(1999)。评估国际象棋评级系统。Chance-Berlin,然后是纽约,12,21-28。Kim,B.,Wattenberg,M.,Gilmer,J.,Cai,C.,Wexler,J.,Viegas,F。等。 (2018)。 可解释性超出特征归因:具有概念激活向量(TCAV)的定量测试。 在国际机器学习会议上(pp。) 2668–2677)。 Lee,S。(2000)。 非负矩阵因子化算法。 nips。 McGrath,T.,Kapishnikov,A. 。 。 Kramnik,V。(2022)。 在Alphazero中获得国际象棋知识。 国家科学院的会议记录,119(47),E2206625119。 Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。 (2018)。 一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。 Sci-Ence,362(6419),1140–1144。 Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。 。 。 其他人(2017年)。 掌握没有人类知识的Go的游戏。 自然,550(7676),354–359。 Steingrimsson,H。(2021)。 国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。 在2021年IEEE游戏会议(COG)会议(pp。) 1–8)。 Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。Kim,B.,Wattenberg,M.,Gilmer,J.,Cai,C.,Wexler,J.,Viegas,F。等。(2018)。可解释性超出特征归因:具有概念激活向量(TCAV)的定量测试。在国际机器学习会议上(pp。2668–2677)。Lee,S。(2000)。 非负矩阵因子化算法。 nips。 McGrath,T.,Kapishnikov,A. 。 。 Kramnik,V。(2022)。 在Alphazero中获得国际象棋知识。 国家科学院的会议记录,119(47),E2206625119。 Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。 (2018)。 一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。 Sci-Ence,362(6419),1140–1144。 Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。 。 。 其他人(2017年)。 掌握没有人类知识的Go的游戏。 自然,550(7676),354–359。 Steingrimsson,H。(2021)。 国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。 在2021年IEEE游戏会议(COG)会议(pp。) 1–8)。 Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。Lee,S。(2000)。非负矩阵因子化算法。nips。McGrath,T.,Kapishnikov,A. 。 。 Kramnik,V。(2022)。 在Alphazero中获得国际象棋知识。 国家科学院的会议记录,119(47),E2206625119。 Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。 (2018)。 一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。 Sci-Ence,362(6419),1140–1144。 Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。 。 。 其他人(2017年)。 掌握没有人类知识的Go的游戏。 自然,550(7676),354–359。 Steingrimsson,H。(2021)。 国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。 在2021年IEEE游戏会议(COG)会议(pp。) 1–8)。 Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。McGrath,T.,Kapishnikov,A.。。Kramnik,V。(2022)。 在Alphazero中获得国际象棋知识。 国家科学院的会议记录,119(47),E2206625119。 Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。 (2018)。 一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。 Sci-Ence,362(6419),1140–1144。 Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。 。 。 其他人(2017年)。 掌握没有人类知识的Go的游戏。 自然,550(7676),354–359。 Steingrimsson,H。(2021)。 国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。 在2021年IEEE游戏会议(COG)会议(pp。) 1–8)。 Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。Kramnik,V。(2022)。在Alphazero中获得国际象棋知识。 国家科学院的会议记录,119(47),E2206625119。 Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。 (2018)。 一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。 Sci-Ence,362(6419),1140–1144。 Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。 。 。 其他人(2017年)。 掌握没有人类知识的Go的游戏。 自然,550(7676),354–359。 Steingrimsson,H。(2021)。 国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。 在2021年IEEE游戏会议(COG)会议(pp。) 1–8)。 Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。在Alphazero中获得国际象棋知识。国家科学院的会议记录,119(47),E2206625119。Silver,D.,Hubert,T.,Schrittwieser,J.,Antonoglou,I.,Lai,M。,等。(2018)。一种普遍的增强学习算法,掌握了国际象棋,Shogi并进行自我游戏。Sci-Ence,362(6419),1140–1144。Silver,D.,Schrittwieser,J.,Simonyan,K.,Antonoglou,I.,Huang,A.,Guez,A.,。。。其他人(2017年)。掌握没有人类知识的Go的游戏。自然,550(7676),354–359。Steingrimsson,H。(2021)。国际象棋堡垒,这是对技术状态象征[Neuro]架构的因果测试。在2021年IEEE游戏会议(COG)会议(pp。1–8)。Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。 ARXIV预印ARXIV:2206.10498。 (2023)。Valmeekam,K.,Olmo,A.,Sreedharan,S。和Kambhampati,S。(2022)。ARXIV预印ARXIV:2206.10498。(2023)。大型语言模型仍然无法计划(LLMS的基准计划和推理有关变更的理由)。van Opheusden,B.,Kuperwajs,I.,Galbiati,G.,Bnaya,Z.,Li,Y。,&Ma,W。J.专业知识增加了人类游戏玩法的计划深度。自然,618(7967),1000–1005。
人工智能简史 人工智能 (AI) 可以追溯到很多年前。最早的一些发明(15 至 17 世纪)包括时钟和计算机。这些可能不如我们目前可用的技术先进,但在当时却是巨大的创新,代表着一大飞跃。第一台现代计算机主要专注于数字和计算。ENIAC(电子数字积分计算机)是第一台通用数字计算机,它有 150 英尺宽,重约 50 吨。 第一台向公众发售的笔记本电脑是 Osborne 1。这台笔记本电脑重 24.5 磅,配备 5 英寸显示屏。 为了衡量计算机的能力和智能,人们开发了国际象棋等程序。20 世纪 90 年代,一台计算机击败了世界国际象棋冠军、俄罗斯人加里卡斯帕罗夫。
摘要可解释人工智能 (XAI) 方法试图通过生成解释来阐明复杂机器学习模型的决策过程。然而,对于大多数现实世界数据,没有“基本事实”解释,这使得评估 XAI 方法和模型决策的正确性变得困难。通常,视觉评估或轶事证据是唯一的评估类型。在这项工作中,我们建议使用国际象棋游戏作为“接近基本事实”(NGT) 解释的来源,可以使用各种指标将 XAI 方法与之进行比较,作为“健全性检查”。我们在深度卷积神经网络的实验中演示了这个过程,我们向该网络应用了一系列常用的 XAI 方法。作为我们的主要贡献,我们发布了 3000 万个国际象棋位置的数据集及其 NGT 解释,供 XAI 研究免费使用。
4有关最新实施大师级国际象棋程序的示例,而无需搜索,请参见Ruoss等。[RDM24]。此实现使用了大型(270 M参数)训练有素的神经网络位置评估器,并且非常适合在MPC-MC体系结构中使用;请参阅第4节。5用RL术语,我们可以将Q(x,u)视为对(x,u)的Q因子。我们采用了较小的Q因子对应于更好移动的惯例。6对于某些发动机,E(x)的公式并非严格正确,因为修剪了X的某些法律移动,因此定义E(x)的最小化是近似的。7一些国际象棋引擎并非真正没有记忆。例如,他们构建了评估位置的哈希表,这些位置是从一个动作到另一个游戏过程中的下一个。发动机记忆对MPC-MC性能的影响是一个尚未完全评估的复杂问题。
1 人工智能,ENG. OXFORD LIVING DICTIONARIES,https://en.oxforddictionaries.com/definition/artificial_intelligence [https://perma.cc/WF9V-YM7C](最后访问时间为 2023 年 12 月 26 日);参见 STUART J. RUSSELL 和 PETER NORVIG,人工智能:一种现代方法 1(第 3 版,2010 年)。2 RUSSELL & NORVIG,上文注 4,第 1 页。在本次讨论中,我们先把关于人类“智能”是什么或应如何定义这个词的多种多样的观点放在一边。3 同上,第 1 页,21 页。4 JM Unterrainer 等人,规划能力和国际象棋:伦敦塔任务中国际象棋和非国际象棋玩家的比较,97 BRIT。 J. PSYCHOL. 299, 299–300, 302 (2006)。8. RUSSELL & NORVIG,上文注4,第21页。5 Shunichi Doi,基于人类行为特征的驾驶支持系统的技术开发,30 IATSS RES. 19, 20–21 (2006)。