在博弈论中,通才有时会战胜专家

研究人员表明,对于某些类型的游戏,一类被忽视的算法的表现比预期要好得多。

来源:MIT新闻 - 人工智能

无论您是与单一对手玩扑克,还是发现自己与另一位潜在买家陷入购房竞价战,您都是在信息不完善的情况下进行操作。你知道自己在扑克游戏中持有什么牌,也知道自己能负担得起比房屋要价高出多少的钱,但你不知道对手在扑克游戏中的手牌,也不知道其他购房者愿意出多高的价格。

一篇由麻省理工学院研究人员共同撰写并于 4 月份在里约热内卢举行的国际学习表征会议上发表的论文不会告诉您在这些情况下具体该怎么做。但它确实为所谓的不完美信息游戏提供了新的见解,这种游戏涉及两名参赛者在“零和”竞争中对峙,其中一个玩家的收益意味着另一个玩家的损失。

参与该项目的麻省理工学院研究人员包括麻省理工学院电气工程与计算机科学系 (EECS) 以及信息与决策系统实验室 (LIDS) 的博士生 Sobhan Mohammadpour; Gabriele Farina 是 EECS 的助理教授,也是 LIDS 的首席研究员。其他合著者包括德克萨斯大学奥斯汀分校 (UT) 的 Max Rudolph、加州大学伯克利分校 (UCB) 的 Nathan Lichtlé、UCB 的 Alexandre Bayen、卡内基梅隆大学 (CMU) 的 J. Zico Kolter、UT 的 Amy X.Zhang '11、MNG '12;纽约大学的尤金·维尼茨基(Eugene Vinitsky);和卡耐基梅隆大学的塞缪尔·索科塔。

尽管在 20 世纪 90 年代初构思策略梯度方法时,战略博弈并未列入最初的议程,但新论文的作者仍然想知道此类算法在两人博弈中的表现如何。法里纳表示,在多智能体环境中,这些方法的分析变得更加复杂。 “你仍然可以朝某个方向前进,以改善你的处境,但是,由于其他玩家的行为,这个方向可能会在游戏过程中不断改变。而且这些转变可能会很快。”