讲座很长的一章!我们详细讨论战略游戏的话题有两个原因:一方面,在伴随讲座的实习期间,黑白棋游戏程序逐渐以小组形式开发,并在学期末的锦标赛中相互竞争 -基础理论和实际应用概念的知识是必不可少的,当然也是有用的。另一方面,游戏程序有着令人着迷的近代历史:许多著名的数学家和计算机科学家(包括查尔斯·巴贝奇、艾伦·图灵、约翰·冯·诺伊曼、康拉德·祖斯、克劳德·香农和诺伯特·维纳)都曾研究过它们;此外,还开发了许多游戏程序(最初是针对策略和算法要求不高的儿童游戏,例如 Nim 或 Tic-Tac-Toe,后来也针对“困难”且受到社会尊重的游戏,例如国际象棋和围棋)...
I. 引言人们对自动驾驶汽车 (AV) 的安全问题仍然存在,需要解决这一问题才能成功融入日常交通 [1]。除了真实的交通测试外,计算机模拟的交通环境还可用于加速验证阶段并引入各种各样的交通场景,这些场景可能需要几个小时的驾驶才能遇到 [2]–[4]。为了获得可靠的模拟结果,人类驾驶员模型应以合理的精度展示类似人类的驾驶行为。文献中提出了几种对人类驾驶员进行建模的方法。[5]–[7] 中的马尔可夫模型和 [8] 和 [9] 中的支持向量机用于预测驾驶员行为。[10]–[12] 中也将神经网络用于此目的。用于对驾驶员行为进行建模的其他工具包括动态贝叶斯网络 [13]、高斯过程 [14]、[15] 和逆强化学习 (RL) [16]、[17]。还提出了博弈论驾驶员模型。例如,在 [18] 中,Stackelberg 游戏用于对高速公路驾驶进行建模,但没有考虑由多个动作组成的动态场景。Stackelberg 游戏也用于 [19],它考虑了多动作场景。但是,一旦玩家数量增加到 2 以上,计算就会变得非常复杂。[20] 提出了一种博弈论逆 RL 方法,用于预测两个驾驶员之间的相互作用,同时假设周围车辆的预定义策略。这种方法对于
课程描述 决策在许多职业中都至关重要,决策不是凭空而来的。决策的结果不仅取决于决策者的选择,还取决于客户、业务伙伴、竞争对手等的决策。博弈论提供了在多个“玩家”具有竞争目标的复杂环境中分析理性决策的工具。本课程将发展博弈论的核心思想以及几个示例和应用,包括讨价还价、拍卖、信号和投票。课程授课模式:混合。有些课程是面对面的,有些是在线的(请参阅下面的课程安排)。您需要参加所有面对面的课程。必须参与。所有课程都将被录制。学习管理系统:Canvas 硬件和软件要求:学生应拥有带网络摄像头的台式机或笔记本电脑。课程材料 - 必修课文:
估计此次信息收集的公共报告负担平均每份回应需要 1 小时,其中包括审查说明、搜索现有数据源、收集和维护所需数据以及完成和审查信息收集的时间。请将关于此负担估计或此信息收集的任何其他方面的评论(包括减少此负担的建议)发送至华盛顿总部服务部、信息运营和报告理事会,地址:1215 Jefferson Davis Highway, Suite 1204, Arlington, VA 22202-4302,以及管理和预算办公室、文书工作减少项目 (0704-0188) Washington DC 20503。1.仅供机构使用(留空) 2.报告日期 2009 年 9 月 3.报告类型和涵盖日期 硕士论文
比经典玩家有优势。随后,研究人员分析了许多其他量子博弈的例子,这些例子主要基于Meyer 和Eisert、Wilkens 和Lewenstein 提出的框架。(例如,请参阅综述 [ GZK08 ] 的摘要和参考资料。)这项工作的某些方面因多种原因而受到批评。许多(但肯定不是全部)量子博弈论论文受到的一个共同批评点是它们对经典行为的概念动机不强。具体而言,量子博弈论论文中的经典玩家通常仅限于标准基态的相干排列,或同样受限制的幺正运算类,而量子玩家可以使用一组受限制较少的幺正运算,甚至可能是所有幺正运算。这种经典性概念是Meyer 和Eisert、Wilkens 和Lewenstein 原始例子中的关键要素,它本质上邀请量子玩家加以利用。量子信息论中对经典行为的更标准解释是假设经典玩家操纵的任何量子系统都是完全退相干的。van Enk 和 Pike [ vEP02 ] 提出的另一个批评观点是,在量子博弈论论文通常采用的特定框架内比较量子游戏与经典游戏就像比较苹果和橘子。尽管有人可能会说,当玩家的行为被限制在标准基态的排列中时,这些游戏提供了经典游戏的忠实表示,但它们的量子重构简单地说就是不同的游戏。因此,限制较少的量子玩家可能会找到优势,从而导致新的纳什均衡等等,这并不奇怪。然而,尽管这不是他们的主要关注点,但 Meyer 和 Eisert、Wilkens 和 Lewenstein 都清楚地提出了更一般的量子游戏定义,其中可以考虑广泛的相互作用,包括刚刚提出的批评不再相关的相互作用。尤其是,Meyer 提到了他的量子博弈模型的凸形式,其中经典玩家可以通过完全退相干操作建模。而 Eisert、Wilkens 和 Lewenstein 在其论文的脚注中描述了一个模型,其中玩家的行为不仅对应于幺正操作,还对应于任意量子信道(由完全正和迹保持线性映射建模)。无论哪种情况,都可以考虑更一般的战略互动,而不必将注意力局限于经典博弈的类似物或识别“量子优势”。例如,各种量子交互式证明系统以及许多量子加密场景和原语都可以被视为量子博弈。另一个例子是量子通信,可以将其建模为一个玩家试图将量子态传输给另一个玩家的游戏,而代表对抗性噪声模型的第三个玩家则试图破坏传输。我们在本文中不提供任何具体建议,但想象可以发现具有社会或经济应用的量子游戏并非不合理。现在我们将总结我们采用的量子游戏的定义,从相对简单的非交互式设置开始,然后转向更一般的
博弈论影响了许多领域,从经济学(历史上博弈论最初的研究重点)到政治学、生物学,等等。近年来,博弈论在计算机科学领域的存在已变得无法忽视。它经常出现在人工智能、理论、电子商务以及网络和计算机科学其他领域的顶级会议和期刊上。这有几个原因。一是应用拉动;互联网要求分析和设计跨越多个实体、信息和兴趣各异的系统。博弈论尽管有种种局限性,但它是迄今为止此类互动最发达的理论。另一个是技术推动;博弈论的数学和科学思维方式与许多计算机科学家的相似。事实上,值得注意的是,现代计算机科学和现代博弈论在很大程度上起源于同一时间和地点,即约翰·冯·诺依曼领导下的普林斯顿大学。2
摘要:随着近年来空中交通需求的不断增长,安全风险评估对维护航空运输系统的运行安全、实现可持续发展具有重要意义。本文基于博弈论和云物元分析对空中交通管制(ATC)系统进行了安全风险评估。从人、机、环境和管理四个方面评估ATC系统的安全风险,引入博弈论中的纳什均衡来对指标进行权重计算。云物元评估采用模糊集和概率论中的云模型来取代传统物元理论中的确定性值,考虑到指标的随机性、模糊性和不相容性,通过计算指标与风险之间的标准云物元关联度来评估ATC系统的安全风险水平。本文通过引入并结合博弈论和云物元分析,扩展了研究范围。此外,以ATC系统为例,检验了该方法的适用性和鲁棒性,丰富了现有文献,指明了未来工作的方向。
随着我国电力市场建设步伐的加快,亟待建立统一的电力交易机制,平衡各方利益,构建竞争性电力市场。博弈论在研究相互作用、竞争的多决策主体之间的决策优化方面具有显著的优势,因此博弈论在电力系统中的应用受到了大量学者的关注和研究,其中对电力市场的研究占比最高。本研究首先详细描述了博弈论中的合作博弈论、非合作博弈论、演化博弈论的概念及演化;其次对国内外电力市场的现状及规模进行了梳理和总结;最后根据近年来三类博弈论在电力市场中应用的研究成果,对发电侧、售电侧、用电侧三个典型环节进行了评价分析,并提出了未来博弈论在电力市场中的应用展望。
预测具有多个人类交互的网络物理系统的结果是一个具有挑战性的问题。本文回顾了一种解决此问题的博弈论方法,其中采用强化学习来预测时间延长的交互动态。我们解释说,该方法最吸引人的特点是提出一种计算上可行的方法来同时将多个人建模为决策者,而不是确定感兴趣的智能代理的决策动态并强迫其他人遵守环境施加的某些运动学和动态约束。我们介绍了该方法的两种最新应用,用于建模 (1) 无人机融入国家空域系统和 (2) 公路交通。我们在文章的最后提供了有关使用、改进和验证该方法的正在进行和未来的工作。我们还提供了相关的未解决的问题和研究机会。