战略博弈的纳什均衡是一种行动概况,其中每个玩家的行动都是在其他所有玩家的行动的情况下最优的(定义 23.1)。这种行动概况对应于理想情况的稳定状态,其中对于游戏中的每个玩家来说,都有一个个体群体,并且每次游戏时,都会从每个群体中随机抽取一名玩家(参见第 2.6 节)。在稳定状态下,每个玩家在玩游戏时的行为都是相同的,并且没有玩家希望改变自己的行为,因为他们知道(根据自己的经验)其他玩家的行为。在稳定状态下,每个玩家的“行为”都只是一种行动,并且每个群体中的所有玩家都选择相同的行动,游戏的每次游戏结果都是相同的纳什均衡。更一般的稳定状态概念允许玩家的选择发生变化,只要选择模式保持不变。例如,给定群体的不同成员可能会选择不同的行动,每个玩家在玩游戏时都会选择相同的行动。或者,每个人在每次玩游戏时,都可能按照相同的、不变的分布概率地选择自己的行动。这两个更一般的稳定状态概念等同于
•分析外国和战略政策挑战以及印尼和澳大利亚回应的选择•探索澳大利亚和印度尼西亚可以继续共同努力,以应对外国和战略政策挑战,包括大流行带来的健康,健康,经济和粮食安全挑战,并促进与该地区的愿景,并促进与新的兴趣和分析竞争的范围•分析新的竞争•分析全球竞争••分析全球竞争的竞争•新兴的安全问题,包括网络安全,海上安全,非传统和人类安全威胁;抵消虚假信息并确保关键的矿物质,供应链和关键基础设施•了解澳大利亚政府对新兴外交政策问题的反应•分析不同利益相关者在应对外国和战略政策挑战中的作用会议,案例研究,现场访问,讨论和计划会议,模拟和角色扮演,网络活动以及个人或小组项目(奖励项目)。奖励项目模型在印度尼西亚短课程的所有澳大利亚奖中使用。课程参与者在课前研讨会上介绍了项目计划,在澳大利亚课程期间进一步开发了该项目,并在课后研讨会上介绍了实施的项目(原理,目标,步骤,挑战,成果和下一步)。
摘要。在商品交换的经济模型中,市场价格和由此产生的代理人持有量的均衡可以响应商品的少量增加和减少,通过略微调整价格和持有量来独特地重建自身。即使个体代理人只对某些商品感兴趣,而对其他商品的偏好为零,只要某种商品对所有代理人来说都是不可或缺的,并且能够有效地充当货币,均衡的稳定性特性就会持续存在。关于边际效用的假设涉及效用函数的凹度而不仅仅是准凹度,有助于建立这一点,并导致一种新的均衡愿景,其中价格和持有量不是静态的。相反,它们根据基于效用的定律以单侧微分方程的形式随时间不断演变。动态建模开辟了广泛的可能性,其中需要持续调整的持有量变化可能由消费、生产、税收或补贴等影响因素驱动。然后,商品可以不仅仅是用于立即处置的商品。因为任何时刻的均衡都有过去和未来,所以货币尤其可以作为一种商品承载价值,并自然而然地进入偏好。在这些发展中,凸分析和变分分析等工具被用来扩展和重新调整经济均衡理论中的稳定性结果,而此前,经济均衡理论只能依靠微分分析。
(b)假设 ui ( x 1 , x 2 ) = x 1 / 2 1 x 1 / 2 2 , e 1 = (10 , 5), 且 e 2 = (5 , 10). 求瓦尔拉斯
常识与精神分裂症之间的哲学关系自然地体现在约翰·纳什 (1928 – 2015) 的个性和创造力中,他曾获得诺贝尔经济学奖 (1994),被诊断患有偏执型精神分裂症 (1959)。他的一个基本思想是对博弈论和数学哲学中均衡的新解释,认为均衡在非合作博弈中是非竞争性的,甚至是防止博弈者或因素之间任何竞争的一种方式。这与数学博弈论及其在经济学中的应用的创始人之一约翰·冯·诺依曼的观点截然相反。纳什的几篇早期论文 (1950;1950a;1951) 证明了诺依曼方法的推广 (Park, 2011) (Neumann, Morgenstern, 1953; Israel & Gasca, 2009; Nash et al., 1996)。 “纳什均衡”的可引用性呈指数级增长(Mccain 和 Mccain,2010 年)。纳什获得了诺贝尔经济学奖(Milnor,1995 年)。纳什均衡的本质在于,目标在参与者之间分离地分配,从而实现更稳定的均衡(Marsili 和 Zhang,1997 年)。相反,他们与诺伊曼方法中的目标相同,即始终处于直接竞争状态,导致不稳定和瓦解趋势。纳什均衡可以看作是“战略性的”(Crawford,2002 年)。对于为了获利而采用所有其他策略的博弈者来说,预防竞争对手是最好的策略。如果所有博弈者都采用这些策略,那么他们就会处于稳定状态,即纳什均衡。相反,诺伊曼方法中的博弈者忽略了其他人的策略,因此只针对同一个目标。因此,在纳什方法中,所有博弈者的集体收益要大得多,但在诺伊曼方法中,单个赢家的个人收益更大。此外,纳什博弈者应该具有了解或预测所有其他人的策略的能力。如果博弈者是人类,就像经济模型中那样,这是自然而然的。然而,如果他们不是,诺伊曼方法似乎更有意义。然而,所有热力学方法,包括被视为一种特殊广义热力学理论的量子力学,都承认纳什均衡的选择,尽管代理没有意识,可能不“知道”或“意味着”其他人的策略。统计热力学中的必要条件是代理和整体的二元性,即所有代理的系统,只要系统存在,就应该处于平衡状态。我们可以得出结论,如果假设任何集合是一个系统,那么纳什均衡就适用于描述它。相反,如果它是一个随机集合,作为一个整体存在,偶尔会被破坏或随时重新配置,那么诺伊曼方法似乎是相关的。
1 通讯作者,哥本哈根大学经济学系。电子邮箱:peter.k.kruse-andersen@econ.ku.dk。2 埃森哲。3 Ramboll。4 哥本哈根大学经济学系。5 Miljømærkning Danmark 6 丹麦经济分析与建模研究所。
我们从多智能体强化学习 (MARL) 的角度研究了一个双层经济系统,我们称之为马尔可夫交换经济 (MEE)。MEE 涉及一个中央计划者和一组自利的智能体。智能体的目标是形成竞争均衡 (CE),其中每个智能体在每一步都短视地最大化自己的效用。中央计划者的目标是操纵系统以最大化社会福利,社会福利被定义为所有智能体效用的总和。在效用函数和系统动态都未知的环境中,我们建议通过 MARL 的在线和离线变体从数据中找到社会最优策略和 CE。具体而言,我们首先设计一个专门针对 MEE 的新型次优度量,这样最小化这样的度量就可以为计划者和智能体证明全局最优策略。其次,在线设置中,我们提出了一种称为 MOLM 的算法,该算法将探索的乐观原则与子博弈 CE 寻求相结合。我们的算法可以轻松结合用于处理大状态空间的一般函数逼近工具,并实现次线性遗憾。最后,我们根据悲观原则将算法调整为离线设置,并建立次优性的上限。