我们通过研究不同类型的量子资源如何导致新的纳什均衡并改善社会福利(衡量均衡质量的标准),研究在多部分非合作博弈中可以获得哪些量子优势。我们分析了两种不同的量子设置:第一种,玩家可以直接访问纠缠量子态;第二种,我们在这里介绍,玩家只能获得从量子设备获得的经典建议。对于给定的游戏 G ,这两种设置会产生不同的均衡,分别以均衡关联集 Q corr ( G ) 和 Q ( G ) 为特征。我们证明 Q ( G ) ⊆ Q corr ( G ) ,并且通过利用某些关联的自测试特性,对于某些游戏 G ,包含是严格的。我们利用 SDP 优化技术来研究这些量子资源如何改善社会福利,并获得每种设置中可达到的社会福利的上限和下限。对于几场涉及利益冲突的游戏,我们研究了社会福利如何取决于游戏的偏见,并改进了之前使用伪心灵感应解决方案获得的分离。
摘要。本文重点研究了一种在具有模糊偏好的纯交换经济 (PXE-FP) 中实现均衡的新模型。该模型将交换、消费和主体在消费集中的模糊偏好整合在一起。我们在消费集上建立了一个新的模糊二元关系来评估模糊偏好。此外,我们证明了在某些条件下消费集中存在一个连续的模糊保序函数。通过模糊非合作博弈中模糊纳什均衡存在的新结果,证实了 PXE-FP 存在模糊竞争均衡。在模糊非合作博弈中,任何主体的所有策略配置的收益都是模糊数。最后,我们表明模糊竞争均衡可以表征为相关拟变分不等式的解,从而得到均衡解。
旅途中,学生们游览了布拉格,并参观了捷克理工大学和当地公司。亮点包括参观布拉格城堡、圣维特大教堂、圣乔治大教堂、带天文钟的旧市政厅、泰恩教堂以及斯特拉霍夫修道院和图书馆。在捷克理工大学,学生们参观了校园,并详细参观了计算机科学系和捷克信息学、机器人学和控制论研究所(CIIRK)。这次参观包括参加 FIT 讲座和与 CIIRK 教职员工在校园共进午餐。主要演讲来自 G2OAT,这是一个专注于离散优化研究的研究小组。该小组的重点是计算和组合问题,这些问题主要出现在图论、博弈机制、合作和非合作博弈以及计算社会选择理论中。
摘要 — 提出了一种合作能源调度方法,该方法允许对一组微电网进行联合能源优化,以实现微电网单独无法实现的成本节约。所讨论的微电网可能是配电网中的商业实体,根据包括使用时间 (ToU) 和峰值需求费用的公用事业电价计划。将稳定运行定义为所有微电网都愿意参与的情况,结果表明,在这种费率计划下,特别是由于峰值需求费用,看似公平的成本分配并不一定会导致稳定的合作。本文使用合作博弈中的概念得出了这些结果。因此,我们试图设计一种稳定的成本分配算法,在最大限度地提高参与微电网之间的公平性的同时,确保它们都从参与中受益。一个简单的案例研究展示了合作的公平性和稳定性方面。
截至目前,住宅消费者的能源存储代表着一项相当大的投资,而且并不能保证盈利。文献中提出了由一组消费者共同购买能源存储的共享投资模型,以增加这些设备的吸引力。这种模型自然采用了合作博弈论的概念。在本文中,我们扩展了最先进的合作博弈,通过添加两个关键扩展来建模共享存储投资:负载的随机性和存储设备容量的离散性。由于我们的目标是增加电网的存储容量,因此,一组根据我们提出的方案进行合作的参与者将获得的设备数量与消费者单独购买的设备数量进行了比较。在相同的客户盈利能力标准下,使用真实数据进行的模拟表明,我们提出的方案可以将部署的存储容量提高 100% 到 250%。
摘要 —本文提出了一种基于双向拍卖的机制,该机制捕捉由分布式太阳能发电产消者和消费者组成的社区能源共享市场内的互动。假设所有代理都拥有电池储能系统,并可以使用电池进行需求响应。代理可以优化其电池系统的充电/放电计划,以供社区共享,从而降低电力成本。为了确定双边拍卖市场的现货价格,在参与社区共享的所有参与者之间制定了一个非合作博弈。首先设计一种迭代算法来清算市场并减轻供需的不确定性。然后,设计一种自适应定价策略来帮助代理更好地估计市场并预测未来价格。提供了一个有 10 个代理的案例研究来评估拟议的社区共享市场的有效性。
本文 1 旨在建立一个框架,指导一个由简单、专业化、自利的代理组成的社会解决传统上被认为是单一的单代理顺序决策问题。使用分散式方法集体优化一个中心目标之所以具有挑战性,是因为难以描述非合作博弈的均衡策略概况。为了克服这一挑战,我们设计了一种机制来定义每个代理的学习环境,我们知道对于该代理,全局目标的最优解与代理优化其自身局部目标的纳什均衡策略概况相一致。社会作为一个代理经济体发挥作用,代理通过相互买卖操作环境状态的权利来学习信用分配过程本身。我们推导出一类分散式强化学习算法,它们不仅适用于标准强化学习,还适用于选择半 MDP 中的选项和动态组成计算图。最后,我们展示了社会固有的模块化结构对于更有效的迁移学习的潜在优势。
摘要 — 无人机 (UAV) 带来的进步是多方面的,为无人机作为智能对象全面融入物联网 (IoT) 铺平了道路。本文采用博弈论和强化学习的原理和概念,将人工智能引入多服务器移动边缘计算 (MEC) 环境中的无人机数据卸载过程。首先,基于随机学习自动机理论,无人机自主选择 MEC 服务器进行部分数据卸载。然后制定无人机之间的非合作博弈来确定要将无人机的数据卸载到选定的 MEC 服务器,同时通过利用子模博弈的力量证明至少存在一个纳什均衡 (NE)。介绍了一种最佳响应动力学框架和两种收敛到 NE 的替代强化学习算法,并讨论了它们的权衡。通过建模和仿真,在不同操作方法和场景下,就其效率和有效性进行整体框架性能评估。索引术语 — 无人机数据卸载、移动边缘计算、强化学习、博弈论
常识与精神分裂症之间的哲学关系自然地体现在约翰·纳什 (1928 – 2015) 的个性和创造力中,他曾获得诺贝尔经济学奖 (1994),被诊断患有偏执型精神分裂症 (1959)。他的一个基本思想是对博弈论和数学哲学中均衡的新解释,认为均衡在非合作博弈中是非竞争性的,甚至是防止博弈者或因素之间任何竞争的一种方式。这与数学博弈论及其在经济学中的应用的创始人之一约翰·冯·诺依曼的观点截然相反。纳什的几篇早期论文 (1950;1950a;1951) 证明了诺依曼方法的推广 (Park, 2011) (Neumann, Morgenstern, 1953; Israel & Gasca, 2009; Nash et al., 1996)。 “纳什均衡”的可引用性呈指数级增长(Mccain 和 Mccain,2010 年)。纳什获得了诺贝尔经济学奖(Milnor,1995 年)。纳什均衡的本质在于,目标在参与者之间分离地分配,从而实现更稳定的均衡(Marsili 和 Zhang,1997 年)。相反,他们与诺伊曼方法中的目标相同,即始终处于直接竞争状态,导致不稳定和瓦解趋势。纳什均衡可以看作是“战略性的”(Crawford,2002 年)。对于为了获利而采用所有其他策略的博弈者来说,预防竞争对手是最好的策略。如果所有博弈者都采用这些策略,那么他们就会处于稳定状态,即纳什均衡。相反,诺伊曼方法中的博弈者忽略了其他人的策略,因此只针对同一个目标。因此,在纳什方法中,所有博弈者的集体收益要大得多,但在诺伊曼方法中,单个赢家的个人收益更大。此外,纳什博弈者应该具有了解或预测所有其他人的策略的能力。如果博弈者是人类,就像经济模型中那样,这是自然而然的。然而,如果他们不是,诺伊曼方法似乎更有意义。然而,所有热力学方法,包括被视为一种特殊广义热力学理论的量子力学,都承认纳什均衡的选择,尽管代理没有意识,可能不“知道”或“意味着”其他人的策略。统计热力学中的必要条件是代理和整体的二元性,即所有代理的系统,只要系统存在,就应该处于平衡状态。我们可以得出结论,如果假设任何集合是一个系统,那么纳什均衡就适用于描述它。相反,如果它是一个随机集合,作为一个整体存在,偶尔会被破坏或随时重新配置,那么诺伊曼方法似乎是相关的。
现在人们已经认识到信息从根本上植根于物理学 1,2。物理学最终是量子的,信息也是如此。经典信息理论的一些关键障碍已被其量子对应理论所克服,这为量子计算领域开辟了新视野,这主要是由于纠缠作为一种基本资源的可用性 1,2。信息在博弈论这个数学分支中发挥了核心作用,它提供了分析冲突局势的工具,在冲突局势中,各方(称为参与者)做出相互依赖的决策。因此,每个参与者都会考虑其他参与者可能做出的决策或策略,以制定最佳策略。然而,当冲突局势得到解决时,参与者的最佳策略描述了博弈的解决方案。否则,我们会陷入困境,即博弈中没有最佳解决方案的情况。尽管博弈论最初是在数学背景下发展起来的,试图描述机会游戏和赌博,但它很快就成为微观经济学的基础。第一个发展是所谓的零和游戏,其中玩家完全不相上下,没有合作的理由。后来,这一限制被取消,合作博弈论领域诞生了。经典合作博弈的量子扩展被称为量子博弈 2 – 9 (QG)。游戏的量子扩展最近因其在经济学中作为量子技术和谈判的新环境的可能作用而受到评论 10 – 12。在 Eisert 6、7 的量子博弈方案中,玩家的策略是在二分希尔伯特空间中对初始最大纠缠态执行的特定局部幺正变换。在玩家策略到位后,量子态通过解缠门产生最终状态。随后对该状态进行四个“量子”概率(以下称为概率)测量。游戏的支付关系用相应双矩阵的支付条目和由此产生的概率来表示。量子纠缠的一个特点是,纠缠会干扰经典博弈中的困境 6、7 。从经典角度来看,这种困境在于,没有玩家能够在不降低其他玩家预期收益的情况下获胜。从这个意义上讲,对于量子纠缠,可以说原始博弈的困境可以完全消失,也就是说,博弈的困境被打破了。在量子纠缠中,经典博弈中的一些限制被解除,从而干扰了困境,这为获得一种均衡提供了可能性,即两个玩家都获胜,并且在博弈中可用策略的可能收益范围内获得可接受的收益。将纠缠纳入博弈的初始状态,就会生成玩家最初无法使用的策略 7 。这些策略的数学公式可以探索量子和经典玩家之间的竞争互动 5、13。本文针对囚徒困境 6、7 和性别之战 14 测试了这些策略。同样,这种方法也可以用于其他游戏,例如胆小鬼游戏 7。此外,