阿尔伯塔大学鲍林教授领导的团队解决了单挑限注德州扑克问题。这是一场两人游戏,每轮下注金额有上限。他们将扑克建模为一种扩展形式游戏,并使用一种称为反事实遗憾最小化的算法求解纳什均衡的近似值。他们宣称,该游戏本质上是弱解的,这意味着人类一生的游戏不足以从统计意义上证明该策略不是精确解。他们的结果证实,该游戏是庄家的必胜游戏。扩展形式游戏和纳什均衡是博弈论概念。如果您想了解更多信息,请在线搜索或考虑参加博弈论课程。
高频交易 (HFT) 为商用第一代准量子计算机提供了一个绝佳的使用案例和潜在的杀手级应用。为此,我们在此提供一个简单的 HFT 博弈论模型,即著名的双人游戏“囚徒困境”。我们探索使用 Eisert、Wilkens 和 Lewenstein 量子中介通信协议在 (准) 量子云上将 HFT 实现为囚徒困境的一个实例,以及这种实现如何不仅可以提高交易速度,还可以改善 HFT 参与者的命运。使用合作博弈论推理,我们还注意到,在不久的将来,当互联网完全量子化时,玩家将能够在 HFT 中实现帕累托最优,作为强化机器学习的一个实例。
背景:区块链有望减轻药品供应链中消费者对仿制药的风险规避和质量不确定性。本研究调查了区块链采用对披露市场上与原药竞争的仿制药质量信息的影响,并提出了相应的法律措施。方法:我们采用博弈论模型分析包括仿制药制造商、原药制造商和零售商的药品供应链。我们研究供应链成员何时应采用区块链来处理仿制药以及区块链如何影响药品供应链。结果:我们的结果表明,仿制药的质量信息决定了区块链采用如何影响仿制药和原药的价格和销售数量。此外,我们观察到,只有当消费者的风险规避程度足够低时,仿制药制造商和零售商才会决定采用区块链。此外,较低的风险规避程度可以通过采用区块链提高整个供应链的盈利能力,并为消费者、仿制药制造商和零售商创造采用区块链的三赢局面。结论:为了减轻消费者的风险规避,法律应该维护消费者权益。区块链的应用在一定条件下可以惠及药品供应链和消费者,但也需要供应链成员利益的协调和质量信息的公开。关键词:仿制药,药品供应链,风险规避,质量不确定性,区块链应用
2017–2019 硕士,航空航天工程,飞行动力学与控制,KN Toosi 理工大学。论文:基于博弈论的摄像机和飞行物体运动的综合控制算法,导师:J. Roshanian 教授 课程:先进控制、最优控制、非线性控制、博弈论、动态系统建模 2013–2016 学士,机械工程,固体力学,卡尚大学。论文:制作受人眼启发的机器人,导师:M. Irani rahaghi 博士 课程:自动控制与实验室、机器人技术与实验室、动态系统仿真与控制 2011–2013 学士,信息技术工程,伊斯法罕理工大学。四个学期后,我更换了专业和大学(未获得学位) 课程:计算机编程与实验室、高级编程与实验室、数字设计和实验室
摘要:为评估跑道是否能满足安全、可靠、高效的目标,需要建立综合评价指标体系进行评价。首先,建立跑道运行体系,将跑道性能评价指标分为人员因素、保障设施、任务需求、运行环境和管理因素5个方面,建立综合评价指标体系。其次,建立博弈论组合赋权的TOPSIS评价模型,利用博弈论对AHP和CRITIC得到的权重进行优化赋权,采用理想解(TOPSIS)对跑道性能进行综合评价。最后,利用该模型对3个机场的跑道性能水平进行评价,并对3种评价方法进行了比较。结果表明,利用该模型进行跑道性能评估的结果与机场实际运行情况相符。该方法简单易行,结果科学客观,通用性强。
摘要。本文探讨了博弈论在竞争环境中保险业务结构发展最优策略形成问题中的应用,并展示了一类可用于保险组合优化的优化模型。设计的博弈论模型旨在制定保险公司实施的最优策略,该公司提供各种保险。将组织一个旨在分析一组保险产品的模型,以跟踪保险公司在提供保险服务上花费的成本以及保险公司因提供保险服务而获得的收入。任务包括计算公司的最佳保险组合,目的是从开发的保险产品实现中获得最大收入。博弈模型能够确定保险公司提供保险服务的百分比,同时考虑到保险市场的条件和竞争对手的行为。进行的计算使保险公司的高管能够确定某些类型保险产品的有利保险市场条件,并加强有关减少或增加保险服务提供的决策过程。
课程概述 政治涉及利益冲突的复杂互动。对于从业者来说,了解努力如何得到回应至关重要,预测这些回应对于设计成功的战略至关重要。博弈论是社会科学中战略互动的正式数学分析。本课程为博弈论提供了一种通用的理论语言,研究了战略环境中理性行为者的有意思维过程。学生将获得理解导致政治运动或政策制定工作成功的动态的工具。课程主题包括双人博弈、动态博弈、讨价还价和信号。学生还将研究各种案例。课堂课程主要以讲座为主。除了介绍理论材料外,课堂课程还将包括互动练习和应用讨论,重点是政治策略的设计和结果的预测。这是政治分析硕士课程的必修核心课程。POAN 学生优先入学。学生必须熟悉一些社会科学的基础数学,包括概率、微分和优化。
摘要 — 无人机 (UAV) 带来的进步是多方面的,为无人机作为智能对象全面融入物联网 (IoT) 铺平了道路。本文采用博弈论和强化学习的原理和概念,将人工智能引入多服务器移动边缘计算 (MEC) 环境中的无人机数据卸载过程。首先,基于随机学习自动机理论,无人机自主选择 MEC 服务器进行部分数据卸载。然后制定无人机之间的非合作博弈来确定要将无人机的数据卸载到选定的 MEC 服务器,同时通过利用子模博弈的力量证明至少存在一个纳什均衡 (NE)。介绍了一种最佳响应动力学框架和两种收敛到 NE 的替代强化学习算法,并讨论了它们的权衡。通过建模和仿真,在不同操作方法和场景下,就其效率和有效性进行整体框架性能评估。索引术语 — 无人机数据卸载、移动边缘计算、强化学习、博弈论
14.摘要 本研究项目探索了新兴的创新数据分析概念和技术(包括博弈论、机器学习和战争游戏),以有效地管理和分配跨多个领域的战争资源,以解决动态行动中的多项任务。研究团队确定并描述了复杂的战术情况,其中需要优先考虑多项任务并需要动态重新规划。该团队开发了一种概念方法,利用先进的数据分析、博弈论、战争游戏、人工智能和机器学习来支持和实现决策(以最佳地使用和分配战争资源和力量)在这些复杂的战术情况下。该团队开发了基于模型的概念设计系统工程表示,并模拟了涉及复杂战术、作战和战略情况的用例场景。该团队设想并模拟了一种创新的战争游戏决策辅助工具,以支持可能遇到类似复杂情况的作战级任务规划人员,这些情况需要在更高级别上采用动态跨域多任务方法。
摘要 — 基于人工智能 (AI) 的技术通常用于根据策略和机制对决策进行建模,这些策略和机制可以为许多交互实体带来最佳收益,这些实体通常会表现出对抗行为。在本文中,我们提出了一种支持 AI 的多接入边缘计算 (MEC) 框架,该框架由配备计算功能的无人机 (UAV) 支持,以促进物联网应用。首先,基于博弈论模型确定物联网节点向无人机安装的 MEC 服务器的最佳数据卸载策略的问题,同时考虑物联网节点的通信和计算开销。通过证明博弈是子模的,证明了至少一个纯纳什均衡 (PNE) 点的存在。此外,基于最佳响应动态 (BRD) 算法的结果,或通过替代强化学习方法(即梯度上升、对数线性和 Q 学习算法),获得并研究了不同的操作点(即卸载策略),这些方法探索和学习环境以确定用户的稳定数据卸载策略。通过建模和仿真,对这些方法的相应结果和固有特征进行了严格的比较。索引术语 — 边缘计算;博弈论;强化学习;物联网;