引言 新冠疫苗研发进展迅速:首个候选疫苗临床试验于 2020 年 3 月 16 日在美国西雅图开始,这距中国分享导致新冠疫情的病毒 SARS-CoV-2 的基因序列仅过去 63 天。截至 2020 年 11 月 12 日,共有 48 种候选疫苗进入临床试验。1 按照标准的流失率,我们可以预计最终将推出至少少量新冠疫苗。然而,仅靠研发安全有效的疫苗并不足以结束这场大流行。疫苗还必须以所有政府都能承受的价格在全球范围内提供,并以最大限度发挥即时和长期公共卫生影响并同时实现公平的方式分配。在以往的大流行中,这些目标均未实现。例如,在 2009 年的甲型流感 (H1N1) 大流行中,富裕国家垄断了疫苗供应;低收入国家 (LIC) 和中等收入国家 (MIC) 在疫情后期才接种了较少剂量的疫苗。2
在大流行事件期间,诸如保持社交距离之类的策略对于减少同时感染和减轻疾病传播至关重要,这与医疗系统崩溃的风险非常相关。尽管可以推荐甚至强制实施这些策略,但它们的实际实施可能取决于人群对潜在感染相关风险的认知。例如,当前的 COVID-19 危机表明,有些人比其他人更容易保持孤立。为了更好地理解这些动态,我们提出了一个流行病学 SIR 模型,该模型使用进化博弈论将社会策略、个人风险感知和病毒传播结合在一个过程中。特别是,我们考虑一种在人群中传播的疾病,其主体可以在自我隔离和不顾任何流行病风险的生活方式之间进行选择。策略的采用是个人的,取决于感知到的疾病风险与隔离成本的比较。博弈收益决定策略的采用,而流行病过程决定主体的健康状况。同时,感染率取决于主体的策略,而感知到的疾病风险取决于受感染主体的比例。我们的结果表明,感染浪潮反复出现,这在以往自愿隔离的历史流行病场景中很常见。特别是,随着人们的疾病意识降低,这种浪潮会再次出现。值得注意的是,风险认知是控制感染峰值大小的基础,而最终的感染规模主要由感染率决定。意识低下会导致单一而强烈的感染峰值,而疾病风险越大,峰值越短,但频率越高。提出的模型自发地捕捉了大流行事件的相关方面,突出了社会策略的基本作用。
摘要。本文提出了一种具有理想均衡选择能力的智能配电网新型整体日前分布式能源管理方法。客户与配电公司之间的互动被建模为单领导者多追随者的 Stackelberg 博弈。客户之间的互动被建模为非合作广义纳什博弈,因为他们面临着共同的约束。客户将总负荷的平均值保持在适当的范围内以重塑它并提高负荷系数 (LF)。配电公司的策略是通过最大化利润进行日前能源定价,在风险优化中将其制定为随机条件值,以考虑批发市场电价的不确定性。客户的策略基于可延迟负荷的每小时消耗和储能设备的预定充电/放电率以响应价格。广义纳什博弈具有多个均衡。因此,本文提出了分布式近端 Tikhonov 正则化算法来实现理想均衡。仿真结果验证了所提算法的性能,LF 提高了 31.46%,最大总需求和总计费成本分别降低了 45.89% 和 14.23%。
摘要 — 随着对网络物理系统的攻击日益复杂,欺骗已成为一种有效的工具,通过混淆攻击者的感知来提高系统安全性。在本文中,我们提出了一种欺骗性博弈的解决方案,其中控制代理要在对手存在的情况下满足由共同安全时间逻辑公式指定的布尔目标。代理故意引入不对称信息来创建收益误解,表现为对博弈模型中标记函数的误解。因此,对手无法准确确定博弈的给定结果满足哪个逻辑公式。我们在图上引入了一个称为超博弈的模型来捕捉具有单边收益误解的不对称信息。基于该模型,我们给出了这种超博弈的解决方案,并使用该解决方案来合成隐秘的欺骗策略。具体来说,通过将超博弈简化为具有可达性目标的双人博弈和单人随机博弈,可以开发出欺骗性必胜和欺骗性几乎必胜策略。引入一个运行示例来演示博弈模型和用于策略综合的解决方案概念。索引术语——基于形式化方法的控制;线性时间逻辑;图上博弈;超博弈论。
在许多多代理交互的环境中,每个代理的最佳选择在很大程度上取决于其他代理的选择。这些耦合的相互作用可以用一般和差分博弈很好地描述,其中玩家有不同的目标,状态在连续的时间中演变,最佳博弈可以用许多均衡概念之一来表征,例如纳什均衡。问题通常允许多重均衡。从这种博弈中的单个代理的角度来看,这种多重解决方案可能会带来其他代理行为方式的不确定性。本文提出了一个通用框架,通过推理其他代理所追求的均衡来解决均衡之间的歧义。我们在多人人机导航问题的模拟中演示了这个框架,得出两个主要结论:首先,通过推断人类所处的平衡状态,机器人能够更准确地预测轨迹;其次,通过发现并使自己适应这种平衡状态,机器人能够降低所有玩家的成本。
摘要 — 本文针对具有潜在光伏产消者的配电网,提出了一种新颖的两阶段博弈论住宅光伏 (PV) 板规划框架。一项创新贡献是将住宅光伏板位置分配模型与能源共享机制相结合,以增加光伏产消者的经济效益,同时促进住宅光伏板的合理安装。住宅光伏板规划决策的优化被制定为一个两阶段模型。在第一阶段,我们开发了一个基于 Stackelberg 博弈的随机双层能源共享模型,以确定具有不确定的光伏能量输出、负载需求和电价的光伏板的最佳尺寸。我们没有使用商业求解器直接解决所提出的双层能源共享问题,而是开发了一种基于有效下降搜索算法的解决方法,可以显着提高计算效率。在第二阶段,我们为所有光伏产消者提出了一个基于随机规划的住宅光伏板部署模型。该模型被制定为最优功率流 (OPF) 问题,以最小化有功功率损耗。最后,在IEEE 33节点和123节点测试系统上的仿真证明了所提方法的有效性。
- N = {1, 2, ..., n} 是有限的参与者集 - S i 是参与者 i 的策略集,对于每个参与者 i ∈ N - 策略组合集表示为 S ≡ S 1 × ... × S n , - ui : S → R 是一个效用函数,它与每个策略组合 s ≡ (s 1 , ..., sn ) 和每个参与者 i ∈ N 的收益 ui (s) 相关联。当 S i 对于每个 i ∈ N 都是有限的时,我们将 Γ 称为有限博弈。所有参与者的策略组合表示为 s ≡ (s 1 , ..., sn ) ∈ S。除参与者 i 之外的所有参与者的策略组合表示为 s −i 。除参与者 i 之外的参与者的所有策略组合的集合表示为 S −i 。 • 如果对于所有 s -i ∈ S -i ,则玩家 i 的策略 si 严格优于其策略 s ' i
回答:最大最小和最小最大最优标准基于以下原则:“如果玩家列出所有潜在策略中最坏的结果,那么他将选择与这些最坏结果中最好的结果相对应的策略。最大最小最优标准:最大最小标准涉及选择使可实现的最小收益最大化的替代方案。玩家会查看每个策略或行动方案中最坏的结果,然后从中选择最高的结果。因此,玩家从所有最小利润中选择最大值。因此,最大最小代表最大化你的最小利润。双人游戏中的获胜玩家会采用这种策略。在双人游戏的收益矩阵中,最大最小是行最小值的最大值。最小最大最优标准:最小最大标准涉及选择使可实现的最大收益最小化的替代方案。玩家会查看每个策略或行动方案中最坏的结果,然后从中选择最低的结果。因此,玩家从所有最大损失中选择最小值。因此,minimax 代表最小化你的最大损失。双人游戏中的失败者采用这种策略。在双人游戏的收益矩阵中,Minimax 是最大值列的最小值。4. 什么是鞍点?
摘要:联盟形成通常以几乎非合作的方式进行分析,作为一个两阶段博弈,第一阶段包括成员行动,第二阶段包括物理行动,例如提供公共物品。我们将这种广泛使用的方法形式化为每个阶段同时采取行动的情况。在此,我们特别关注对称物理博弈的情况。提供了各种理论结果,特别是卡特尔博弈。由于它们至关重要,因此重新考虑了关于古诺类物理博弈联盟均衡唯一性的最新结果。其中包括各种具体的例子。最后,我们讨论了研究策略,以获得关于具有抽象物理博弈的均衡联盟结构的结果,这些结果涉及其原始元素的定性属性。