多臂老虎机 (MAB) 问题模拟了一个决策者,该决策者根据当前和获得的新知识优化其行动以最大化其回报。这种类型的在线决策在脑机接口 (BCI) 的许多程序中都很突出,MAB 以前曾用于研究,例如,使用哪些心理命令来优化 BCI 性能。然而,BCI 背景下的 MAB 优化仍然相对未被探索,即使它有可能在校准和实时实施期间提高 BCI 性能。因此,本综述旨在向 BCI 社区进一步介绍 MAB 的成果丰硕的领域。本综述包括 MAB 问题和标准解决方法的背景,以及与 BCI 系统相关的解释。此外,它还包括 BCI 中 MAB 的最新概念和对未来研究的建议。