慈善资助通常是迈向新发现和了解患者体验的第一步。这些发现证明了您的支持所产生的影响,您将了解 LRF 研究人员如何将新见解转化为对淋巴瘤的更好理解、推进新治疗方法并探索患者及其护理人员的需求。我们感谢 LRF 捐助者和志愿者以及参加淋巴瘤步行、淋巴瘤研究骑行或其他筹款活动和活动的人的合作,所有这些都可以产生重大影响,使创新理念得以生根发芽。
摘要 — 我们考虑一个自私节点网络,这些节点希望尽量缩短它们在其他节点上的更新时间。节点使用基于 CSMA/CA 的访问机制通过共享频谱发送更新。我们将由此产生的竞争建模为非合作的一次性多址接入博弈,并研究两种不同介质访问设置的均衡策略 (a) 碰撞比成功传输短,(b) 碰撞更长。我们研究 CSMA/CA 时隙中的竞争,其中节点可以选择传输或保持空闲。我们发现介质访问设置对节点具有强大的激励作用。我们表明,当碰撞较短时,传输是一种弱主导策略。这导致所有节点都在 CSMA/CA 时隙中传输,从而保证发生碰撞。相反,当碰撞较长时,不存在弱主导策略,并且在时隙开始时的某些条件下,我们得出混合策略纳什均衡。
本论文旨在通过明确推理其模型与现实世界之间的差距,奠定必要的基础,使自主系统能够在复杂、变化和不确定的环境中确保自身安全。它首先介绍了一套新颖的鲁棒最优控制公式和算法工具,允许在时变、多智能体系统中进行可处理的安全分析,以及在部分未知环境中进行安全的实时机器人导航;这些方法在大型无人机交通模拟和物理四旋翼平台上得到了演示。此后,它借鉴贝叶斯机器学习方法将基于模型的保证转化为高置信度保证,根据有关物理系统和周围智能体的证据变化来监控预测模型的可靠性。该原则首先应用于通用安全框架,允许对无人机等安全关键型机器人系统使用基于学习的控制(例如强化学习),然后结合认知科学和动态博弈论的见解,实现安全的以人为本的导航和交互;这些技术在实体四旋翼飞行器(在未建模的风中和人类行人中飞行)和模拟高速公路驾驶中得到展示。论文最后讨论了未来的挑战和机遇,包括安全分析和强化学习之间的衔接,以及围绕学习和适应“闭环”的必要性,以便自信地部署日益先进的自主系统。
本论文旨在通过明确推理其模型与现实世界之间的差距,奠定必要的基础,使自主系统能够在复杂、变化和不确定的环境中确保自身安全。它首先介绍了一套新颖的鲁棒最优控制公式和算法工具,允许在时变、多智能体系统中进行可处理的安全分析,以及在部分未知环境中进行安全的实时机器人导航;这些方法在大型无人机交通模拟和物理四旋翼平台上得到了展示。此后,它利用贝叶斯机器学习方法将基于模型的保证转化为高置信度保证,根据有关物理系统和周围智能体的证据变化来监控预测模型的可靠性。该原则首先应用于通用安全框架,允许对无人机等安全关键型机器人系统使用基于学习的控制(例如强化学习),然后结合认知科学和动态博弈论的见解,实现以人为本的安全导航和交互;这些技术在物理四旋翼飞行器(在未建模的风中和人类行人中飞行)和模拟高速公路驾驶中得到展示。论文最后讨论了未来的挑战和机遇,包括安全分析和强化学习之间的衔接,以及围绕学习和适应“闭环”的必要性,以便自信地部署日益先进的自主系统。
预测具有多个人类交互的网络物理系统的结果是一个具有挑战性的问题。本文回顾了一种解决此问题的博弈论方法,其中采用强化学习来预测时间延长的交互动态。我们解释说,该方法最吸引人的特点是提出一种计算上可行的方法来同时将多个人建模为决策者,而不是确定感兴趣的智能代理的决策动态并强迫其他人遵守环境施加的某些运动学和动态约束。我们介绍了该方法的两种最新应用,用于建模 (1) 无人机融入国家空域系统和 (2) 公路交通。我们在文章的最后提供了有关使用、改进和验证该方法的正在进行和未来的工作。我们还提供了相关的未解决的问题和研究机会。
2.1 简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....................................................................................................................................................................................................................................................................................... 6 欺骗模型....................................................................................................................................................................................................................................................................................................................................................................... 10 2.3 欺骗的实用性....................................................................................................................................................................................................................................................................... 10 2.3 欺骗的实用性....................................................................................................................................................................................................................................................................................... . . 17 需要使用欺骗手段的情况. . . . . . . . . 18 欺骗的必要条件. . . . . . . . . . . . . . 21 所需属性. . . . . . . . . . . . . . . . . 22 欺骗机制. . . ................. ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....... ....... ....... ....... ....... .......
作者:H Tavafoghi · 被引用 6 次 — Teneketzis。一种用于大规模网络动态防御的 pomdp 方法。IEEE 信息取证与安全交易,13(10):...
回想一下第 2 章,如果玩家必须在不知道对手选择做什么的情况下采取行动,则称游戏具有同时行动。如果玩家在完全相同的时间选择行动,则显然如此。如果玩家孤立地选择行动,即使选择是在不同的时间做出的,也不知道其他玩家已经做了什么或将要做什么,游戏也是同时的。(出于这个原因,同时行动游戏具有我们在第 2 章第 2.D 节中定义的不完全信息。)本章重点介绍玩家之间具有这种纯同时互动的游戏。我们考虑各种类型的同时游戏,为这些游戏引入一个称为纳什均衡的解决方案概念,并研究具有一个均衡、多个均衡或根本没有均衡的游戏。许多熟悉的战略情况可以描述为同时行动游戏。电视机、立体声音响或汽车的各种生产商在不知道竞争对手公司对自己产品做什么的情况下就产品设计和功能做出决策。美国选举中的选民同时投出各自的选票;没有选民在做出自己的决定时知道其他人做了什么。足球守门员和对方前锋在罚点球时之间的互动要求两名球员同时做出决定——守门员不能等到球真正被踢出后才决定往哪个方向走,因为那时就太晚了。当同步移动游戏中的玩家选择自己的行动时,她显然不知道其他玩家的选择。她也
1 美国宾夕法尼亚州立大学生物系,宾夕法尼亚州立大学,宾夕法尼亚州立大学,宾夕法尼亚州立大学,宾夕法尼亚州立大学,哈克生命科学研究所。3 英国诺里奇东英吉利亚大学生物科学学院。4 美国马里兰州巴尔的摩约翰霍普金斯医学院布雷迪泌尿科研究所。癌细胞通过分泌扩散因子,在肿瘤内以及与微环境中的基质细胞合作,表现出癌症的许多特征。这种合作不能简单地解释为细胞为了肿瘤的利益而采取的集体行动,因为不合作的克隆可以不断入侵并搭便车,利用合作细胞产生的生长因子。要全面了解癌细胞之间的合作,需要使用进化博弈论的方法和概念,该理论已成功用于生物学的其他领域以了解类似的问题,但在癌症研究中尚未得到充分利用。博弈论可以通过破坏这种合作,深入了解癌细胞之间合作的稳定性以及进化防线疗法的设计。癌细胞内的合作 肿瘤内的细胞不仅竞争空间和资源,而且也通过分泌促进肿瘤生长和侵袭的可扩散因子相互合作 1-5 。癌细胞之间及其微环境的协同作用对于癌症进展至关重要,并且是驱动对疗法的耐药性的关键 6-8 。负责这些相互作用的许多分子、它们的基因和它们激活的信号通路已被人们所知,但肿瘤内细胞为何合作仍未得到解释。这里的“为什么”与合作的适应性优势 9-11 有关:细胞通过合作(产生生长因子)获得了什么选择优势?
摘要 — 预测将无人机系统 (UAS) 集成到国家空域系统 (NAS) 的结果是一个复杂的问题,在允许 UAS 常规访问 NAS 之前,需要通过模拟研究来解决。本文重点介绍使用博弈论方法提供一个三维 (3D) 模拟框架,以使用有人驾驶和无人驾驶飞行器共存的场景来评估集成概念。在所提出的方法中,人类飞行员交互式决策过程被纳入空域模型,这可以填补文献中的空白,其中飞行员行为通常被认为是先验已知的。所提出的人类飞行员行为是使用动态 k 级推理概念和近似强化学习建模的。k 级推理概念是博弈论中的一个概念,基于人类具有不同决策水平的假设。在传统的“静态”方法中,每个代理都会对其对手做出假设,并据此选择其行动。另一方面,在动态 k 级推理中,代理可以更新其对对手的信念并修改其 k 级规则。在本研究中,神经拟合 Q 迭代(一种近似强化学习方法)用于对具有 3D 机动的飞行员的时间延长决策进行建模。在有人驾驶飞机和配备感知和避免算法的全自动 UAS 的情况下,使用示例 3D 场景对 UAS 集成进行分析。
