合作的多代理增强学习(MARL)需要在代理之间进行无缝的协作,通常以基本关系图来表示。现有学习该图的现有方法主要集中于代理关系关系,并具有高阶关系。虽然几种方法试图扩展合作模式以包含组内的行为相似性,但它们通常同时学习潜在图,从而在部分观察到的药物之间限制了信息交换。为了克服这些局限性,我们提出了一种新的方法来推断群体感知的坐标图(GACG),该方法旨在根据当前观察结果和群体级别的依赖性从跨轨迹观察到的行为模式来捕获代理对之间的合作。该图进一步用于图形卷积,以在决策过程中进行信息交换。为了进一步确保同一组中的代理人之间的行为一致性,我们引入了群体距离损失,该距离损失会产生群体的凝聚力并鼓励组之间的专业化。我们的评估是在Starcraft II微管理任务上进行的,是GACG的出色表现。一项消融研究进一步提供了我们方法每个组成部分有效性的实验证据。
我是计算机科学博士学位的研究员,游戏设计师和首席执行官。我共同创立了Östergötland的两家领先的游戏开发公司:Dimfrost Studio AB(2020年由纳斯达克上市的Maximum Entertainment完全收购)和Pugstorm AB(私人持有)。我还是斯坦福大学算法游戏理论实验室的邀请研究员,我是Core Keeper的游戏总监,这是一款拥有超过200万玩家的游戏。我对人工智能,计算机科学和计算机游戏的贡献为我赢得了奖项,包括Lilla Polhemspriset和年轻的年轻企业家。在业余时间,我喜欢创作艺术,游戏和音乐。我也喜欢创意写作和举重,而且我是实时策略游戏《星际争霸II》的前大师。
人工智能的最新进展已经产生了可以在围棋、星际争霸和 Dota2 等游戏中击败人类世界冠军的代理。然而,这些模型中的大多数似乎并没有以类似人类的方式进行游戏:人们从他人的行为中推断出他们的意图,并利用这些推断来策划和制定战略。在这里,我们使用贝叶斯心智理论 (ToM) 方法,研究了在合作游戏中明确表达他人意图对提高表现的程度。我们比较了人类在具有和不具有 ToM 的最佳规划代理的情况下在合作游戏中的表现,玩家必须灵活合作才能实现共同目标。我们发现,在与所有类型的合作伙伴(非 ToM、ToM 以及人类玩家)合作时,拥有 ToM 代理的团队表现明显优于非 ToM 代理,并且 ToM 代理越多,ToM 的好处就越大。这些发现对于设计更好的合作代理具有重要意义。
简介 游戏长期以来一直是人工智能的流行基准。许多研究人员研究了各种算法和技术,试图在国际象棋、围棋、赛车游戏、吃豆人小姐、实时战略 (RTS) 游戏和超级马里奥兄弟等不同的计算机游戏中逼近最佳玩法。有时,这些研究主题伴随着某种竞赛,在统一的基准中测试不同的方法。游戏研究使算法 AI 取得了一些有趣的进展,例如使用并行 Alpha-Beta 剪枝(在国际象棋中),或在围棋游戏中看到的游戏 AI 中最流行的算法之一蒙特卡洛树搜索 (MCTS) 的进展。虽然特定游戏研究的贡献确实很重要,但特定游戏竞赛由于其固有结构而存在一个问题:提出的大多数解决方案往往过于专注于它们所应用的领域。换句话说,挑战的性质,甚至是赢得比赛的斗争,都鼓励参与者为算法提供高度定制的启发式方法,这些启发式方法仅适用于用于挑战的游戏。例如,世界冠军星际争霸代理
2019 年 8 月 - 至今 博士研究(机器学习、自然语言处理、计算机视觉)普渡大学(指导老师:David Inouye 博士),印第安纳州西拉斐特 • • 创建一个因果基础的生成式 AI 模型,该模型生成反事实示例来回答以下问题“如果发生 X 而不是 Y,情况会是什么样子?” (例如,如果我在 B 医院而不是 A 医院拍摄的胸部 X 光片会是什么样子。) • 派生出可解释领域翻译的方法,用于向人类操作员解释分布变化,可用于系统监控或知识发现。 • 根据《星际争霸 II》的人类比赛构建了一个新的大规模多智能体计算机视觉 (CV) 数据集,该数据集表现出复杂且不断变化的智能体行为,产生了 180 万张具有多种数据表示的图像,例如可以用作 CIFAR10 和 MNIST 的替代品。 • 创建了一种轻量级机器学习算法,该算法使用深度密度模型来检测分布的变化,并将变化定位到导致变化的特定问题特征,从而允许以很少的额外开销进行在线监控。
类似于Alphastar [3]中采用的方法,这项研究强调了实时适应性和决策。尽管取得了重大进步,但挑战仍在处理高维输入,设计有效的奖励系统以及在动态场景中确保稳健的性能[4]。本研究通过实施一个模块化框架来解决这些问题,该框架将有效的数据预处理,可扩展体系结构和迭代培训策略集成在一起。2。文献调查加强学习(RL)已确立自己的强大方法,用于开发能够在动态和高维环境中运行的智能代理。其在多人游戏中的应用引起了重大的研究兴趣,从而在自适应策略和强大的决策框架方面取得了进步。Togelius和Yannakakis(2017)强调了深度强化学习(DRL)对通用视频游戏AI的潜力,强调了环境界面的重要性,在这些界面中,代理可以感知国家,采取行动并根据反馈来优化决策。这种方法已被证明有效地开发了能够响应复杂游戏机制的适应性代理。同样,Vinyals等人。(2019)展示了DRL在Starcraft II中的功能,在那里,代理商学会了通过广泛的
我很高兴为这本出色而及时的书编写前言。游戏长期以来一直被视为人工智能(AI)方法的理想测试床,并且也已成为越来越重要的应用领域。游戏AI是一个广阔的领域,涵盖了从为GO或Starcraft等艰难游戏制作超人AI的挑战到诸如自动化一代新颖游戏之类的创意应用程序。游戏AI与AI本身一样古老,但是在过去的十年中,该领域的扩展和充实视频游戏的扩展和丰富了,现在占该地区所有已发表工作的50%以上,并使我们能够应对具有巨大的商业,经济,经济,经济,经济,经济和Scien-ticien-ticien-ticiac-ticiac-ticiac-ticiac-ticiac-ticiac-ticien-tice。2005年发生的研究输出激增,与我与Graham Kendall共同主持的第一次IEEE计算智能和游戏(会议)(会议)和第一次AAAI AIDERCORENCE(数字娱乐中的人工智能)。从那以后,这个丰富的研究领域得到了更加探索和更好地理解。游戏AI社区开创了许多研究的大部分研究,这些研究正在变得(或即将成为)更多主流AI,例如Monte Carlo Tree搜索,程序内容生成,基于屏幕截图的游戏以及自动化游戏设计。在过去的十年中,深度学习的进步对许多困难问题产生了深远而跨性的影响,包括语音识别,机器翻译,自然语言理解和计算机视觉。因此,现在可以在广泛的感知和识别任务中实现人类竞争性绩效。现在,这些系统中的许多系统都可以通过一系列所谓的认知服务提供给程序。最近,深厚的强化学习在许多困难的挑战中取得了突破性的成功,包括GO和学习直接从屏幕截图(从像素玩游戏)中玩游戏的惊人壮举。令人着迷的是,当我们偶然发现人类水平的智能中,这对游戏意味着什么
这段对话来自 2014 年电影《机械姬》的早期场景,其中 Nathan 邀请 Caleb 判断 Nathan 是否成功创造了人工智能。1 强大的通用人工智能的成就长期以来一直吸引着我们的想象力,不仅因为它令人兴奋和担忧的可能性,还因为它为人类带来了一个新的未知时代。Stuart Russell 在 2021 年 BBC Reith 讲座“与人工智能共存”的开幕式上表示,“通用人工智能的最终出现 [将是] 人类历史上最大的事件。” 2 在过去十年中,一系列令人印象深刻的成果引起了公众对强大人工智能可能性的广泛关注。在机器视觉方面,研究人员展示了在某些情况下可以像人类一样甚至比人类更好地识别物体的系统。然后是游戏。复杂的策略游戏长期以来一直与高级智能联系在一起,因此当人工智能系统在国际象棋、雅达利游戏、围棋、将棋、星际争霸和 Dota 中击败最优秀的人类玩家时,全世界都注意到了。这不仅仅是人工智能击败了人类(尽管这在第一次发生时令人震惊),而是他们如何做到这一点的不断进步:最初是通过向人类专家学习,然后是自我学习,然后是从头开始自学游戏原理,最终产生了可以学习、玩游戏并获胜的单一系统
游戏长期以来一直是人工智能研究的基准和试验台。近年来,随着人工智能算法的发展和计算能力的提升,人工智能系统在围棋[Silver et al. ,2017]、星际争霸[Vinyals et al. ,2019]和德州扑克[Zhao et al. ,2022]等许多游戏中都取得了超越人类的表现。这些游戏在世界各地举办的季节性和年度活动中都很受欢迎。这种受欢迎程度促使学术界投入精力并开发新算法来解决它们。麻将在世界各地都很流行,尤其是在中国,并且有很多地区变体。由于其不完全信息和多目标性质,它对人工智能算法提出了挑战,但却被人工智能研究界忽视了。为了促进人工智能研究和探索人工智能在麻将中的应用,我们在 IJCAI 举办了三场麻将人工智能竞赛。来自学术界和工业界的数十支团队参与了比赛,他们运用各种算法来构建自己的代理。我们每年都会组织研讨会,邀请顶尖团队进行口头报告,分享他们的方法。比赛结果和他们的报告表明,基于深度学习的现代人工智能算法在这款游戏上具有巨大的潜力,并且优于启发式方法。然而,为了进一步提高人工智能代理的性能,仍有一些悬而未决的问题需要解决。我们希望我们在比赛中的经验能够促进对麻将等复杂现实世界游戏的进一步人工智能研究。
这段对话来自 2014 年电影《机械姬》的早期场景,其中内森邀请凯勒布判断内森是否成功创造出了人工智能。1 强大的通用人工智能的成就长期以来一直吸引着我们的想象力,不仅因为它令人兴奋和担忧的可能性,也因为它为人类带来了一个全新的未知时代。斯图尔特·罗素在 2021 年 BBC 里斯讲座“与人工智能共存”的开场白中指出,“通用人工智能的最终出现将是人类历史上最大的事件。”2 在过去十年中,一系列令人印象深刻的成果引起了公众对强大人工智能可能性的广泛关注。在机器视觉方面,研究人员展示了在某些情况下可以像人类一样甚至比人类更好地识别物体的系统。然后是游戏。复杂的策略游戏长期以来都与超强的智能联系在一起,因此当人工智能系统在国际象棋、雅达利游戏、围棋、将棋、星际争霸和 Dota 中击败最优秀的人类玩家时,全世界都注意到了。这不仅仅是人工智能击败了人类(尽管这在第一次发生时令人震惊),而是他们如何做到这一点的不断进步:最初是通过向人类专家学习,然后是自我学习,然后是从头开始自学游戏原理,最终产生单一系统,