博弈论在战略思维和交互式决策的背景下分析和建模主体的行为。在商业和日常生活中,博弈论对于做出选择和考虑机会至关重要。在经济学 [ 1 ]、政治学 [ 2 ]、生物学 [ 3 , 4 ] 或军事应用 [ 5 ] 中都可以找到需要战略思维的情况的例子。参与方有自己的一组可能的操作(称为策略),并且对这些操作具有由收益矩阵定义的偏好。博弈论涉及对这些活动的建模和寻找最优策略。在所有博弈论概念中,纳什均衡的概念起着重要作用。它描述了关于其他玩家动作的最优决策。在纳什均衡中,任何玩家都不会通过只改变自己的策略而获得任何好处 [ 6 ]。对整个玩家群体有利的博弈论结果被称为帕累托最优。从经济角度来看,这是最理想的结果。然而,在很多情况下,对个人有利的并不总是帕累托最优的。事实往往恰恰相反,力求满足一己利益并不会带来对所有参与者来说都是最佳的解决方案。这种困境在很多现实情况下都会发生,例如交通组织[7]、过度开发自然资源[8]或公共采购监管[9]。量子力学是有史以来最丰富的理论之一。尽管自诞生以来就引起了很多争议,但它的预测已经通过实验得到了令人难以置信的精确度的证实。使用量子力学形式主义的领域之一是量子经济学,这是一个非常有前途的新应用领域[10,11]。可编程量子计算机的出现推动了这一领域的发展[12]。量子经济学的研究领域包括:市场博弈[13]、双头垄断问题[14,15]、拍卖和竞赛[16]、赌博[17]、量子货币[18]、量子退火[19]、量子密码和安全问题[20,21]、量子最优传输[22]甚至高频交易[23]。量子统计学中使用的概率幅概念在经济应用中也发挥着重要作用[24]。这项工作的目的是分析博弈机制,这种机制允许玩家以某种方式调节他们的选择,试图优化他们的个人利益,
截至目前,住宅消费者的能源存储代表着一项相当大的投资,而且并不能保证盈利。文献中提出了由一组消费者共同购买能源存储的共享投资模型,以增加这些设备的吸引力。这种模型自然采用了合作博弈论的概念。在本文中,我们扩展了最先进的合作博弈,通过添加两个关键扩展来建模共享存储投资:负载的随机性和存储设备容量的离散性。由于我们的目标是增加电网的存储容量,因此,一组根据我们提出的方案进行合作的参与者将获得的设备数量与消费者单独购买的设备数量进行了比较。在相同的客户盈利能力标准下,使用真实数据进行的模拟表明,我们提出的方案可以将部署的存储容量提高 100% 到 250%。
摘要:联盟形成通常以几乎非合作的方式进行分析,作为一个两阶段博弈,第一阶段包括成员行动,第二阶段包括物理行动,例如提供公共物品。我们将这种广泛使用的方法形式化为每个阶段同时采取行动的情况。在此,我们特别关注对称物理博弈的情况。提供了各种理论结果,特别是卡特尔博弈。由于它们至关重要,因此重新考虑了关于古诺类物理博弈联盟均衡唯一性的最新结果。其中包括各种具体的例子。最后,我们讨论了研究策略,以获得关于具有抽象物理博弈的均衡联盟结构的结果,这些结果涉及其原始元素的定性属性。
我们看到,由于 s 1 优于 s 2 ,所以玩家 1 的安全水平策略是纯策略 (1,0)(即,玩家 1 使用策略 s 1 的概率为 1)。玩家 2 的安全水平策略是纯策略 (0,1)。但是,策略对 ( s 1 , t 2 ) 并不均衡。如果玩家 2 注意到 s 1 优于 s 2 ,他或她会得出结论,玩家 1 会选择 s 1 。因此,通过使用纯策略 (1,0),玩家 2 将最大化自己的收益。我们看到,通过使用这种策略,玩家 1 保持了自己的安全水平,而玩家 2 获得的单位比自己的安全水平多 19 个。这似乎是没有沟通或合作的博弈的合理解决方案(请注意,如果允许沟通,玩家 1 可能会诉诸威胁以试图获得更好的收益)。
非局部博弈在量子信息论中得到了广泛的研究。我们在这一类中考虑了非局部博弈的众多应用。例如,CHSH 博弈已被用来证明物理学中经典力学和量子力学之间确实存在差异 [CHSH69]。在计算机科学中,量子非局部博弈可用作协议的一部分,该协议使经典多项式时间机器能够验证量子计算的结果,假设我们有两个(可能不受信任的)量子设备,它们可能彼此共享纠缠 [Gri17]。在今年早些时候证明的突破性成果中,表明假设玩家使用量子策略,没有算法可以近似非局部博弈的最大获胜概率。这可以证明 MIP* = RE [JNV + 20],即可由多证明者量子交互式证明验证的问题可以用递归可枚举问题类来精确表征。换句话说,假设与两个纠缠的量子证明器交互,经典的多项式时间验证器可以验证图灵机是否停止,这是一个无法判定的问题!更引人注目的是,复杂性理论结果 MIP* = RE 解决了数学中两个长期存在的未解问题。具体来说,它意味着数学物理中比较两种量子力学模型的 Tsirelson 问题的否定结果,这也给出了冯诺依曼代数理论中 Connes 嵌入猜想的否定结果。在本文中,我们的重点是研究群论和表示论中的工具,这些工具可应用于非局部博弈论和 Connes 嵌入猜想的研究。本文的组织结构如下:我们在第 2 部分介绍基础知识,通过定义一类简单的非局部博弈(称为线性系统博弈)、此类博弈的量子策略的含义以及它们的解组。第 3 节构成了本文的技术核心,其中我们研究了解群的近似表示理论与完美量子策略之间的关系。最后在第 4 节中,我们讨论了其他概念,例如可服从群、社会群和超线性群,以及它们与非局部博弈的刚性之间的联系,最后提出了一些有趣的未解决的问题。
任何国家的成功都不取决于其经济实力,而是取决于该国的政治,因为“金钱是萨拉索塔的豪宅,十年后就会开始倒塌,而权力是屹立数百年的古老石头建筑。”1因此,健全的政治体系是一个国家繁荣的基石。为了证实这一论断,必须深入研究巴基斯坦的案例研究。尽管有论点认为经济实力至关重要,但有证据表明,政治稳定才是最重要的。在巴基斯坦的背景下,政治稳定是该国走向进步的基础。薄弱的机构、政治两极分化和长期不稳定阻碍了经济增长。只有稳定政治体系,巴基斯坦才有可能释放其全部潜力,为发展铺平道路。本文将比较政治和经济稳定的国家的成功,并特别参考巴基斯坦。
对于函数 f : X × Y →{ 0, 1 } 的某些选择。直观地说,对于每个问题对 ( x , y ),函数 f 指定 a 和 b 应该一致还是不一致才能成为获胜答案。请注意,对于每个问题对,两种可能性(即 a 和 b 一致或不一致的可能性)中恰好有一种会获胜,而另一种可能性则会失败。由于每个 XOR 游戏都由集合 X 和 Y、概率向量 π ∈ P ( X × Y ) 和函数 f : X × Y →{ 0, 1 } 唯一确定,因此,当方便时,我们将用四元组 ( X , Y , π , f ) 来标识相应的游戏 G。例如,CHSH 游戏是 XOR 游戏的一个例子,对应于四元组 ( { 0, 1 } , { 0, 1 } , π , f ),其中 π 是均匀概率向量,f ( x , y ) = x ∧ y 是 AND 函数。
摘要 — 随着对网络物理系统的攻击日益复杂,欺骗已成为一种有效的工具,通过混淆攻击者的感知来提高系统安全性。在本文中,我们提出了一种欺骗性博弈的解决方案,其中控制代理要在对手存在的情况下满足由共同安全时间逻辑公式指定的布尔目标。代理故意引入不对称信息来创建收益误解,表现为对博弈模型中标记函数的误解。因此,对手无法准确确定博弈的给定结果满足哪个逻辑公式。我们在图上引入了一个称为超博弈的模型来捕捉具有单边收益误解的不对称信息。基于该模型,我们给出了这种超博弈的解决方案,并使用该解决方案来合成隐秘的欺骗策略。具体来说,通过将超博弈简化为具有可达性目标的双人博弈和单人随机博弈,可以开发出欺骗性必胜和欺骗性几乎必胜策略。引入一个运行示例来演示博弈模型和用于策略综合的解决方案概念。索引术语——基于形式化方法的控制;线性时间逻辑;图上博弈;超博弈论。
在许多多代理交互的环境中,每个代理的最佳选择在很大程度上取决于其他代理的选择。这些耦合的相互作用可以用一般和差分博弈很好地描述,其中玩家有不同的目标,状态在连续的时间中演变,最佳博弈可以用许多均衡概念之一来表征,例如纳什均衡。问题通常允许多重均衡。从这种博弈中的单个代理的角度来看,这种多重解决方案可能会带来其他代理行为方式的不确定性。本文提出了一个通用框架,通过推理其他代理所追求的均衡来解决均衡之间的歧义。我们在多人人机导航问题的模拟中演示了这个框架,得出两个主要结论:首先,通过推断人类所处的平衡状态,机器人能够更准确地预测轨迹;其次,通过发现并使自己适应这种平衡状态,机器人能够降低所有玩家的成本。
博弈论研究独立实体之间的竞争与合作。一种非常简单的博弈类型是标准形式博弈,其中两个玩家 P 0 , P 1 分别从一组离散策略(通常是有限策略)中选择一个策略 s 0 , s 1 ,并分别获得奖励 v 0 ( s 0 , s 1 ) ,v 1 ( s 0 , s 1 )。这种博弈可以用两个矩阵 V 0 , V 1 来表示,矩阵的行和列由玩家所有可能的策略 s 0 , s 1 索引,矩阵的条目是与这些策略相关的奖励。