摘要 — 设计能够实现不同游戏风格同时又能保持竞争水平的代理是一项艰巨的任务,尤其是对于研究界尚未发现超人表现的游戏,如策略游戏。这些游戏要求人工智能处理大动作空间、长期规划和部分可观察性,以及其他众所周知的使决策成为难题的因素。除此之外,使用通用算法实现不同的游戏风格而不降低游戏实力并非易事。在本文中,我们提出了用于玩回合制策略游戏 (Tribes) 的具有渐进式反剪枝的组合蒙特卡洛树搜索,并展示了如何对其进行参数化,以便使用质量多样性算法 (MAP-Elites) 来实现不同的游戏风格,同时保持竞争水平。我们的结果表明,即使对于超出用于训练的游戏级别范围的大量游戏级别,该算法也能够实现这些目标。