这本书是通过反复出现的问题而动画的,即是否有持久的战略原则。在隔离和解释战略的基本原理的过程中,读者面临着令人震惊的实现:战略胜利的概念必须立即丢弃。这并不是说胜利在战略或战略规划中没有地位。战斗和竞选活动的结果是战略家计划中永远存在的变量,但胜利是一个没有意义的概念。纯粹的战略家接受战争只是社会和政治竞争的一个方面,这是一种没有最终结局的持续互动。策略因此将战争的行为与政治意图联系起来。它塑造并指导军事意义,预计可能发生的事件可能会发生。在此过程中,策略改变了事件发生的上下文。纯战略因此是对战略基本真理的调查;它的目的,地点,实用性和价值。它将战略的经典作品置于现代物理和生物科学以及军事科学的框架中。虽然它比利用塔里安的调查更正确地是一种战略的哲学,并且本来是启发式的而不是确定性的,但它仍然用于执业战略家。最终,纯战略为安全政策决策的创新方法提供了一个理由,该方法回荡为太空武器化问题,信息操作发展以及发动国际反恐战争的关键方法。这本书将对战略理论,安全研究和二十一世纪政治的高级本科生和研究生感兴趣。
我们之前研究过纯策略纳什均衡,特别是在拥堵博弈的背景下,这种均衡是肯定存在的。提醒一下,拥堵博弈承认一个潜在函数 Φ,其特性是玩家通过切换策略而导致的成本变化恰好是 Φ 的变化。因此,纯纳什均衡对应于 Φ 的局部最小值,因为没有局部改进的可能性(玩家的单方面行动)可以确保没有玩家可以单方面降低其成本。由于我们的游戏有有限多的玩家,每个玩家都有有限多的策略,因此 Φ 只能取有限多的值,因此具有全局最小值,从而至少有一个局部最小值(因此是纯纳什均衡)。
我们重新审视了广义第一价格拍卖中赞助搜索广告纯策略纳什均衡的(不)存在这一经典结果,并表明当广告排名基于随机质量得分和出价金额的乘积而不是仅基于后者时,结论可能会发生逆转。此外,广义第一价格拍卖的纯策略均衡中的预期收入可能大大超过广义第二价格拍卖的预期收入。
b'假设 S i 是标准形式博弈 G 中局内人 i D 1; : : : ; n 的有限纯策略集,因此 SDS 1 : : : S n 是 G 的纯策略方案集,i .s/ 是局内人选择策略方案 s 2 S 时局内人 i 的收益。我们将在 S 中有支持的混合策略集表示为 SDS 1 : : : S n ,其中 S i 是在 S i 中有支持的局内人 i 的混合策略集,或者等价地,S i 成员的凸组合集。我们用 S i 表示除 i 之外所有局内人的混合策略向量集。如果对于每个 i 2 S i , i .si ; i / > i .s 0 i ; i / ,则我们说 s 0 i 2 S i 被 si 2 S i 强支配。如果对于每个 i 2 S i , i .si ; i / i .s 0 i ; i / ,且对于至少一个 i 的选择,不等式是严格的,则我们说 s 0 i 被 si 弱支配。请注意,一种策略可能不会被任何纯策略强支配,但可能被混合策略强支配。假设 si 对于玩家 i 是一种纯策略,使得玩家 i 的每个 0 i \xc2\xa4 si 都被 si 弱(分别强)支配。我们称 sia 为 i 的弱(分别强)支配策略。如果存在一个所有玩家都使用支配策略的纳什均衡,我们称其为支配策略均衡。一旦我们消除了每个玩家的劣势策略,结果往往是一开始不占优势的纯策略现在占优势了。因此,我们可以进行第二轮消除劣势策略。事实上,这可以重复进行,直到纯策略不再以这种方式被消除。在 \xef\xac\x81nite 游戏中,这将在 \xef\xac\x81nite 轮次之后发生,并且每个玩家总是会剩下至少一个纯策略。如果强(或弱)劣势策略被消除,我们称之为强(或弱)劣势策略的迭代消除。
当只需做出一个决策时,行动集和纯策略集是相同的。假设行动(或纯策略)集为 { a 1 , a 2 } 。指定随机化行为的唯一方法是使用概率为 p 的 a 1 和概率为 1 − p 的 a 2 。我们表示 β = ( p , 1 − p )。
本研究集中于同时移动的非合作量子博弈。其中一部分显然不是新的,但为了自洽起见,将其包括在内,因为它致力于介绍相关主题的数学和物理基础,以及如何将简单的经典博弈修改为量子博弈(此过程称为经典博弈的量化)。简要强调了博弈论与信息科学之间的联系,并揭示了量子纠缠的作用(在量子博弈论中起着核心作用)。利用这些工具,我们研究了一些基本概念,例如纯策略和混合策略纳什均衡的存在(或不存在)及其与纠缠程度的关系。本研究的主要结果如下:1)基于最佳响应函数法构建数值算法,旨在寻找量子博弈中的纯策略纳什均衡。该形式化方法基于将连续变量离散化为点的网格,可应用于基于最佳反应函数法的双人双策略经典博弈中的量子博弈。2)应用该算法研究纯策略纳什均衡的存在与否与纠缠度(由连续参数γ指定)的关系问题。结果表明,当经典博弈GC存在非帕累托有效的纯策略纳什均衡时,具有最大纠缠度(2γ=π)的量子博弈GQ不存在纯策略纳什均衡。通过研究非对称囚徒困境博弈,发现存在一个临界值02γ<<πc,使得当γγ<c时,存在纯策略纳什均衡
我们看到,由于 s 1 优于 s 2 ,所以玩家 1 的安全水平策略是纯策略 (1,0)(即,玩家 1 使用策略 s 1 的概率为 1)。玩家 2 的安全水平策略是纯策略 (0,1)。但是,策略对 ( s 1 , t 2 ) 并不均衡。如果玩家 2 注意到 s 1 优于 s 2 ,他或她会得出结论,玩家 1 会选择 s 1 。因此,通过使用纯策略 (1,0),玩家 2 将最大化自己的收益。我们看到,通过使用这种策略,玩家 1 保持了自己的安全水平,而玩家 2 获得的单位比自己的安全水平多 19 个。这似乎是没有沟通或合作的博弈的合理解决方案(请注意,如果允许沟通,玩家 1 可能会诉诸威胁以试图获得更好的收益)。