1.0 简介 计算机程序几乎在各个游戏层面上都在挑战人类的表现:世界西洋双陆棋冠军是一个神经网络程序 [7]。国际象棋程序(最初是人工智能搜索技术研究的雏形)的性能处于大师级别:1994 年,世界上等级分最高的国际象棋选手卡斯帕罗夫在一场计时锦标赛中被计算机国际象棋程序击败,不过他还没有输过一场不计时比赛。然而,这些顶级程序早已不再能启发或教导人工智能和认知科学研究人员如何将人类认知的灵活性和技巧融入计算机程序。数十年的国际象棋研究中得出的一个常见误解是,一旦问题得到正式指定,利用良好的搜索和评估算法的蛮力技术就足以解决任何问题。围棋领域与这种常见误解相矛盾。正式指定围棋规则很容易,然而,所有当前程序的表现都比不上人类,甚至连初级中级玩家的水平都比不上。最初,我们认为国际象棋和围棋之间程序性能的差异与相对分支因子有关,因此也与国际象棋和围棋的相对复杂性有关。虽然围棋的分支因子确实要大得多,这对编程有相当大的影响(如表 1 所示),但我们逐渐意识到,这两种游戏中战略和战术之间的差异更为重要。在国际象棋中,棋盘位置的良好评估函数通常仅通过战术手段就可以估计出来——也就是说,搜索可能的走法树,直到发现位置强度的重大变化。在围棋中,战术考虑涉及争夺特定的棋子组(定义见第 2.1 节),而战略考虑涉及构建棋子组,这些棋子组将在后期对游戏产生巨大影响。人类棋手要想在国际象棋和围棋中表现出色,就必须精通战略和战术。在国际象棋程序中,战术技能与长远搜索技术相结合足以产生出色的表现。这些技术在围棋程序中失败了,原因我们将在下文中讨论。
摘要 在围棋和预测蛋白质结构等截然不同的领域,人工智能 (AI) 技术的表现已开始超越人类。这一事实是否代表着一件可悲的事情?超人类的人工智能表现是否会以某种方式削弱人类在这些领域的成就价值?围棋大师李世石在宣布退出职业围棋界时就表达了同样的观点,他指责 AlphaGo 等围棋程序的进步削弱了他打高水平比赛的意愿。在本文中,我试图理解李世石的哀叹。我考虑了超人类表现的人工智能技术的存在可能以多种方式削弱人类成就的价值。我认为,技术本身的性质很少值得如此绝望。(比较一下:战斗机的存在会削弱成为人类最快短跑运动员的价值吗?)但我还认为,在几个更局部的领域,这些技术有可能取代人类,使人类无法取得任何有价值的成就。我认为,对于那些生活在不平等社会的人来说,这尤其令人担忧,因为实现许多成就非常困难,而且要实现伟大的成就需要大量资源。
在人工智能发展史上,2016年被普遍视为具有里程碑意义的一年,人工智能项目数量大幅增加(赵建军、袁志强,2016)。这一年,DeepMind 的 AlphaGo 战胜了围棋冠军李世石,成为首个战胜职业围棋选手的计算机围棋系统。这场人机大战的结果引起了全球的广泛关注,为人工智能技术的发展注入了新的动力。在各国人工智能战略和资本涌入的推动下,人工智能技术的应用领域得到了极大的拓展,教育是受影响最为显著的领域之一。2017全球(上海)人工智能创新峰会呼吁进一步探索人工智能与教育的融合。在过去几年大数据、互联网、云计算等技术的快速发展中,人工智能在中国教育改革中发挥了至关重要的推动作用(张建军、顾志强,2023)。
我们研究人类如何向人工智能学习,利用了一款出人意料地超越了最佳职业选手的人工智能围棋程序 (APG)。我们将职业选手的走棋质量与 APG 公开发布前后的优秀解决方案进行了比较。我们对 749,190 步走棋的分析表明,选手的走棋质量显著提高,同时错误数量和程度也减少了。这种影响在游戏的早期阶段最为明显,因为此时不确定性最高。此外,年轻选手和人工智能国家/地区的选手进步更大,这表明从人工智能中学习可能存在不平等。此外,虽然各个级别的选手都在学习,但技能较差的选手获得的边际效益更高。这些发现对于寻求在组织内有效采用和利用人工智能的管理者具有重要意义。关键词:人工智能、从人工智能中学习、决策、职业围棋选手、人工智能与不平等
Steven J. Brams,纽约大学 摘要 Catch-Up 是一个简单的 2 人顺序游戏,其中一个玩家 (A) 首先从自然数集合 {1, 2, 3, …, n } 中选择一个数字。然后另一个玩家 (B) 选择一个或多个数字,其和等于或略大于 A 的数字。然后玩家轮流选择数字,不重复,这样他们的和在每一轮中等于或略大于对手的和——直到所有数字都被选出——最终一个玩家的和等于或超过对手的和,使其成为平局或绝对赢家。与国际象棋或围棋不同,没有发现任何 AI(人工智能)或深度学习程序能够在 Catch-Up 中持续击败对手——比如说,90% 或更多的时间——对手在每一轮中随机选择数字,而在国际象棋或围棋中随机移动将是灾难性的。人工智能在其最强的领域——计算和学习——遇到对手了吗? 1. 简介
我们研究人类如何向人工智能学习,利用人工智能围棋程序 (APG) 的介绍,该程序出人意料地超越了最优秀的职业选手。我们将职业选手的走棋质量与 APG 公开发布前后的优秀解决方案进行了比较。我们对 749,190 步的分析表明,玩家的走棋质量显著提高,同时错误数量和程度也有所减少。这种效果在游戏的早期阶段最为明显,因为此时不确定性最高。此外,年轻玩家和 AI 国家/地区的玩家进步更大,这表明从 AI 学习方面可能存在不平等。此外,虽然各个级别的玩家都在学习,但技能较低的玩家获得的边际效益更高。这些发现对于寻求在组织内有效采用和利用 AI 的管理者具有重要意义。关键词:人工智能、向人工智能学习、决策、职业围棋选手、人工智能与不平等
简介 游戏长期以来一直是人工智能的流行基准。许多研究人员研究了各种算法和技术,试图在国际象棋、围棋、赛车游戏、吃豆人小姐、实时战略 (RTS) 游戏和超级马里奥兄弟等不同的计算机游戏中逼近最佳玩法。有时,这些研究主题伴随着某种竞赛,在统一的基准中测试不同的方法。游戏研究使算法 AI 取得了一些有趣的进展,例如使用并行 Alpha-Beta 剪枝(在国际象棋中),或在围棋游戏中看到的游戏 AI 中最流行的算法之一蒙特卡洛树搜索 (MCTS) 的进展。虽然特定游戏研究的贡献确实很重要,但特定游戏竞赛由于其固有结构而存在一个问题:提出的大多数解决方案往往过于专注于它们所应用的领域。换句话说,挑战的性质,甚至是赢得比赛的斗争,都鼓励参与者为算法提供高度定制的启发式方法,这些启发式方法仅适用于用于挑战的游戏。例如,世界冠军星际争霸代理