弗拉基米尔·普京是不是一个糟糕的战略家,也许是不理性的?俄罗斯之前的军事活动,例如 2014 年吞并克里米亚,在国际上获得的收益有限,但付出了巨大的经济和声誉代价。然而,正如 2022 年入侵乌克兰所表明的那样,普京愿意投入军事力量,尽管要付出制裁和其他可能的报复的代价。这个三人同时进行的游戏最初于 2021 年 6 月创建,展示了弗拉基米尔·普京总统的国内和国际考虑可能导致俄罗斯军事行为变得不可预测。在罗伯特·普特南的“两级游戏”的这个扩展版本中,普京总统理性地将国际舞台用作操纵国内观众的场所。他不是一个糟糕的战略家;他在玩另一种游戏——为了自己的利益。这款游戏预示了俄罗斯对乌克兰的入侵,并描述了下一步的期望
I. 引言人们对自动驾驶汽车 (AV) 的安全问题仍然存在,需要解决这一问题才能成功融入日常交通 [1]。除了真实的交通测试外,计算机模拟的交通环境还可用于加速验证阶段并引入各种各样的交通场景,这些场景可能需要几个小时的驾驶才能遇到 [2]–[4]。为了获得可靠的模拟结果,人类驾驶员模型应以合理的精度展示类似人类的驾驶行为。文献中提出了几种对人类驾驶员进行建模的方法。[5]–[7] 中的马尔可夫模型和 [8] 和 [9] 中的支持向量机用于预测驾驶员行为。[10]–[12] 中也将神经网络用于此目的。用于对驾驶员行为进行建模的其他工具包括动态贝叶斯网络 [13]、高斯过程 [14]、[15] 和逆强化学习 (RL) [16]、[17]。还提出了博弈论驾驶员模型。例如,在 [18] 中,Stackelberg 游戏用于对高速公路驾驶进行建模,但没有考虑由多个动作组成的动态场景。Stackelberg 游戏也用于 [19],它考虑了多动作场景。但是,一旦玩家数量增加到 2 以上,计算就会变得非常复杂。[20] 提出了一种博弈论逆 RL 方法,用于预测两个驾驶员之间的相互作用,同时假设周围车辆的预定义策略。这种方法对于
我认为可以肯定地说,没有人理解量子力学。如果可以避免,不要一直对自己说:“但怎么会这样呢?”因为这样你会“掉进”死胡同,没有人能从死胡同中逃脱。没有人知道怎么会这样。
摘要目的——本文旨在说明博弈论解决方案概念如何告知哪些类别的问题适合人工智能和机器学习 (AI/ML),以及如何发展人与人工智能之间的互动。设计/方法/方法——该方法涉及开发操作游戏以支持规划和决策。然后,它为那些设计和使用游戏的人提供了博弈论的简明摘要,重点是信息条件和解决方案概念。它讨论了实验如何证明人类决策与博弈论解决方案概念的不同之处,以及如何使用游戏来开发 AI/ML。最后,它提出了哪些类别的问题适合 AI/ML,哪些不适合。它接着提出了一种发展人类/人工智能的方法。发现——博弈论解决方案概念为 AI/ML“解决方案”可能存在的问题类别提供了信息。该主题的复杂性需要不断学习。原创性/价值——尽管游戏对于 AI/ML 的发展至关重要,但从业者尚未采用博弈论来了解其局限性。关键词 博弈论、游戏、人工智能 论文类型 概念论文
我们提出了一种通用策略改进算法 (GSIA) 来寻找简单随机博弈 (SSG) 的最优策略。我们证明了 GSIA 的正确性,并推导出一个一般复杂度界限,它暗示并改进了几篇文章的结果。首先,我们删除了 SSG 停止的假设,这通常是通过博弈的多项式爆炸获得。其次,我们证明了与策略相关的值的分母的严格界限,并使用它来证明所有策略改进算法实际上都是随机顶点数量 r 的固定参数可处理的。所有已知的策略改进算法都可以看作是 GSIA 的实例,这允许分析 Condon [ 14 ] 从下方收敛的复杂性,并提出一类推广 Gimbert 和 Horn 算法的算法 [ 16 , 17 ]。这些算法最多在 r 中终止!迭代次数,对于二进制 SSG,它们的迭代次数比 Ibsen-Jensen 和 Miltersen [18] 给出的当前最佳确定性算法要少。
Error 500 (Server Error)!!1500.That’s an error.There was an error. Please try again later.That’s all we know.
对于函数 f : X × Y →{ 0, 1 } 的某些选择。直观地说,对于每个问题对 ( x , y ),函数 f 指定 a 和 b 应该一致还是不一致才能成为获胜答案。请注意,对于每个问题对,两种可能性(即 a 和 b 一致或不一致的可能性)中恰好有一种会获胜,而另一种可能性则会失败。由于每个 XOR 游戏都由集合 X 和 Y、概率向量 π ∈ P ( X × Y ) 和函数 f : X × Y →{ 0, 1 } 唯一确定,因此,当方便时,我们将用四元组 ( X , Y , π , f ) 来标识相应的游戏 G。例如,CHSH 游戏是 XOR 游戏的一个例子,对应于四元组 ( { 0, 1 } , { 0, 1 } , π , f ),其中 π 是均匀概率向量,f ( x , y ) = x ∧ y 是 AND 函数。
我们研究了矩阵博弈的次线性经典算法和量子算法,这是优化和机器学习中的一个基本问题,具有可证明的保证。给定一个矩阵,矩阵博弈的次线性算法以前只知道两种特殊情况:(1)最大化向量位于 L1 范数单位球中,(2)最小化向量位于 L1 或 L2 范数单位球中。我们给出了一个可以在这两种情况之间平滑插值的次线性经典算法:对于 1 到 2 之间的任何固定 q,我们在某些附加误差范围内求解最小化向量位于 Lq 范数单位球中的矩阵博弈。我们还提供了一个相应的次线性量子算法,该算法可以解决同一任务,并且最大化和最小化向量的维度有二次改进。我们的经典算法和量子算法在维度参数上都是最优的,最多可达多对数因子。最后,我们提出了针对近似 Carathéodory 问题的亚线性经典和量子算法以及 Lq-margin 支持向量机作为应用。
博弈证明构成了非量子密码安全论证的强大框架,最显著的应用是在不可微性背景下。此类证明的一个基本要素是随机原语的惰性采样。我们通过概括两种最近开发的证明技术开发了一个量子博弈证明框架。首先,我们描述了如何使用 Zhandry 的压缩量子预言机 (Crypto'19) 对一类非均匀函数分布进行量子惰性采样。其次,我们观察了 Unruh 的单向隐藏引理 (Eurocrypt'14) 也可以应用于压缩预言机,为博弈基本引理提供了量子对应物。随后,我们使用我们的博弈框架来证明海绵结构的量子不可微性,假设内部函数为随机。