详细内容或原文请订阅后点击阅览
马拉松游戏
一个具有完美信息的单人扩展形式游戏。玩家的名字是 Zeno。游戏有无限的视野。对于每个非负整数 N,都有一个节点,Zeno 可以选择继续或退出。如果他在节点 N 退出,他的收益为 -N/(N+1)。如果他继续,他将转到节点 N+1。[…]
来源:廉价交谈一个具有完美信息的单人扩展形式游戏。玩家的名字是 Zeno。游戏有无限的范围。对于每个非负整数 N,都有一个节点可供 Zeno 选择继续或退出。如果他在节点 N 退出,他的收益为 -N/(N+1)。如果他继续,他将移动到节点 N+1。
在无穷远处还有一个终端节点。当且仅当 Zeno 在所有有限节点继续时,才能到达此节点。无穷远处的收益为 1。
故事是这样的:Zeno 站在马拉松的起跑线上。跑完一段距离后,他决定是否退出,等等。他的目标是完成马拉松并跑进他骄傲而崇拜的粉丝的怀抱。如果他没有到达终点线(无穷远处的节点),那么他所做的一切就是让自己疲惫不堪,却得不到任何补偿性的爱慕。在退出之前,他跑得越远,就越累。
这个游戏有一个独特的子博弈完美均衡:芝诺完成了马拉松。但是它还有另一种无法通过单阶段偏差改进的策略:芝诺一有机会就退出。
后一种策略有一个很好的行为解释。芝诺对自己完成马拉松的决心缺乏信心。特别是他想完成马拉松,但他预计,如果他再跑一半的距离,他到达那里后就会放弃,所以何必呢。事实上,他知道他会在跑完一半的距离后退出,是因为他知道当他到达那里时,他会知道再跑完一半的距离他仍然会退出,所以何必呢。
这是教授单阶段偏差原理的一个很好的例子,该原理断言不可改进的策略也是 SPE。OSDP 要求游戏无限连续。马拉松游戏不是无限连续的。