预测和建模人类行为并在人类决策过程中发现趋势是社会科学的主要问题。石头剪刀布(RPS)是许多博弈论问题和现实世界竞赛中的基本战略问题。找到击败特定人类对手的正确方法是一项挑战。在这里,我们使用基于一个固定记忆长度的马尔可夫模型的 AI(人工智能)算法(简称“单 AI”)在迭代的 RPS 游戏中与人类竞争。我们通过结合许多具有不同固定记忆长度的马尔可夫模型(简称“多 AI”)来建模和预测人类竞争行为,并开发具有可变参数的多 AI 架构以适应不同的竞争策略。我们引入了一个称为“焦点长度”(一个正数,例如 5 或 10)的参数来控制我们的多 AI 适应对手策略变化的速度和灵敏度。焦点长度是多 AI 在确定哪个单 AI 具有最佳性能并应该选择进行下一场比赛时应该查看的前几轮次数。我们与 52 位不同的人进行了实验,每个人都与一个特定的多 AI 模型连续下注 300 轮,并证明我们的策略可以战胜 95% 以上的人类对手。
主要关键词