摘要在不断发展的人工智能领域(AI)中,研究正在从专注于个别自主代理转变为探索代理团队的动态。这种转变需要从具有统一能力(同质)的代理转变为表现出多种技能和功能(异质)的人。在此阶段,对混合人类团队的研究是这种演变的自然扩展,有望将AI的应用扩展到其传统,高度控制的环境之外。但是,这种进步为学习系统带来了新的挑战,例如可信度和解释性。这些素质对于确保混合团队的有效合作和决策至关重要,在混合团队中,相互合作和分散控制是基本的。强化学习是一种灵活的学习框架,可以很好地适应半结构化的环境和互动,例如本工作中正在考虑的那些。本文旨在为弥合多代理增强学习(MARL)与其他专注于人类在团队中的存在或深入研究人类互动之间的差距。我们探讨了如何将MARL框架适应人类团队,突出一些必要的建模选择,讨论关键的建模决策,并突出主要的挑战和约束。我们的目标是为混合学习团队建立一个统一的框架,鼓励跨学科的捐款,以改善MARL的复杂环境。
主要关键词