3 (C) 考虑一个双人零和游戏。该游戏的每个状态 s PS 都可以紧凑地编码为 111 到 999 之间的一个 3 位自然数。s 的后继状态定义为可以通过将 s 的每个数字递增 1 而获得的所有状态,例如 succ p 235 q “ t 335 , 245 , 236 u 。但是,包含数字 9 的状态是终止状态,因此没有后继状态,例如 succ p 932 q “ H 。在终止状态下,第一个玩家的收益(MAX)等于第一位和第三位数字之间的差,例如 utility p 932 q “ 9 ´ 2 “ 7。第二个玩家的收益(MIN)是第一个玩家收益的负数。游戏采用两种极小极大算法进行,A 1(MAX 玩家)和 A 2(MIN 玩家)。两种算法都提前两步搜索,也就是说,极小极大算法的深度限制设置为 2。但是,这两个算法使用不同的启发式方法。A 1 使用的启发式方法 h 1 返回 s 中的第一位数字,而 A 2 使用的启发式方法 h 2(从该算法的角度定义)返回 s 中的第三位数字。例如,h 1 p236 q = 2 和 h 2 p236 q = 6(计算以 MAX 为根的游戏树中的极小极大值时,必须对 h 2 的值取反)。让初始游戏状态为 s 0 = 175。算法 A 1(MAX 玩家)将迈出第一步。如果两个玩家都采用极小极大策略,游戏将经历什么样的状态序列?
课程内容/教学大纲简介:范围;历史、趋势和未来方向。通过搜索解决问题:生产系统和人工智能;图搜索策略:无信息搜索、启发式搜索技术;约束满足问题;随机搜索方法;搜索博弈树:极小极大、Alpha-Beta 剪枝。知识表示和推理:人工智能中的谓词演算:语法和语义、表达力、统一性、解析度;解析度反驳系统;情境演算。不确定性下的推理:不确定性概念;不确定知识和推理、概率;贝叶斯网络。规划:使用状态空间搜索进行规划;规划图;偏序规划。决策:顺序决策问题、最优策略算法。机器学习:从观察中学习:不同形式学习的概述、学习决策树、计算学习理论、统计学习方法、神经网络和联结主义学习。
评估 ML 算法的性能 UNIT - I:简介:AI 问题、代理和环境、代理结构、问题解决代理基本搜索策略:问题空间、无信息搜索(广度优先、深度优先搜索、深度优先与迭代深化)、启发式搜索(爬山法、通用最佳优先、A*)、约束满足(回溯、局部搜索) UNIT - II:高级搜索:构建搜索树、随机搜索、AO* 搜索实现、极小极大搜索、Alpha-Beta 剪枝基本知识表示和推理:命题逻辑、一阶逻辑、前向链接和后向链接、概率推理简介、贝叶斯定理 UNIT - III:机器学习:简介。机器学习系统,学习形式:监督学习和无监督学习,强化 – 学习理论 – 学习可行性 – 数据准备 – 训练与测试和拆分。第四单元:监督学习:回归:线性回归、多元线性回归、多项式回归、逻辑回归、非线性回归、模型评估方法。分类:支持向量机 (SVM)、朴素贝叶斯分类
提供对各种机器学习算法的理解以及评估 ML 算法性能的方法 UNIT - I:简介:人工智能问题、代理和环境、代理结构、问题解决代理基本搜索策略:问题空间、无信息搜索(广度优先、深度优先搜索、深度优先与迭代深化)、启发式搜索(爬山法、通用最佳优先、A*)、约束满足(回溯、局部搜索) UNIT - II:高级搜索:构建搜索树、随机搜索、AO* 搜索实现、极小极大搜索、Alpha-Beta 剪枝基本知识表示和推理:命题逻辑、一阶逻辑、前向链接和后向链接、概率推理简介、贝叶斯定理 UNIT - III:机器学习:简介。机器学习系统,学习形式:监督学习和非监督学习,强化学习 – 学习理论 – 学习的可行性 – 数据准备 – 训练与测试和拆分。第四单元:监督学习:回归:线性回归、多元线性回归、多项式回归、逻辑回归、非线性回归、模型评估方法。分类:支持向量机 (SVM)、朴素贝叶斯分类第五单元:无监督学习最近邻模型 – K 均值 – 围绕中心点聚类 – 轮廓 – 层次聚类 – kd 树、聚类树 – 学习有序规则列表 – 学习无序规则。强化学习 – 示例:迷路 – 状态和动作空间
最小最大算法 Alpha-Beta 剪枝 人工智能中的最小最大算法 最小最大算法是一种递归或回溯算法,用于决策和博弈论。它为玩家提供最佳走法,假设对手也发挥最佳。最小最大算法使用递归来搜索游戏树。 最小最大算法主要用于人工智能中的游戏,如国际象棋、跳棋、井字游戏、围棋和各种双人游戏。该算法计算当前状态的最小最大决策。在这个算法中,两个玩家玩游戏,一个称为 MAX,另一个称为 MIN。两个玩家都进行战斗,因为对手玩家获得最小利益,而他们获得最大利益。游戏的两个玩家都是对方的对手,其中 MAX 将选择最大值,而 MIN 将选择最小值。最小最大算法执行深度优先搜索算法来探索完整的游戏树。极小最大算法一直进行到树的终端节点,然后以递归的方式回溯树。 极小最大算法的工作原理 可以用一个例子轻松描述极小最大算法的工作原理。下面我们举一个代表双人游戏的游戏树的例子。在这个例子中,有两个玩家,一个叫做最大化者,另一个叫做最小化者。最大化者将尝试获得最高可能的分数,而最小化者将尝试获得最低可能的分数。该算法应用 DFS,因此在这个游戏树中,我们必须一直穿过叶子才能到达终端节点。在终端节点,给出了终端值,因此我们将比较这些值并回溯树,直到初始状态发生。 Alpha-beta 剪枝 Alpha-beta 剪枝是极小最大算法的修改版本。它是极小最大算法的一种优化技术。正如我们在极小最大搜索算法中看到的那样,它必须检查的游戏状态数量在树的深度上呈指数增长。由于我们无法消除指数,但可以将其减半。因此,有一种技术可以计算出正确的极小极大决策,而无需检查博弈树的每个节点,这种技术称为剪枝。这涉及两个阈值参数 Alpha 和 beta,用于未来扩展,因此称为 alpha-beta 剪枝。它也被称为 Alpha-Beta 算法。