重复囚徒困境 (IPD) 是研究理性主体长期行为的著名基准。许多著名策略都得到了研究,从简单的针锋相对 (TFT) 到更复杂的策略,如 Press 和 Dyson 最近研究的零决定因素和敲诈策略。在本文中,我们考虑所谓的无敌策略。这些策略在极限情况下的平均收益永远不会输给任何其他策略。我们对这类策略进行了简单的描述,并表明无敌策略也可以是好策略。我们讨论了它与一些重要策略的关系,并将我们的结果推广到一些典型的重复 2x2 博弈。众所周知,从实验上讲,像 TFT 这样的好策略和敲诈策略可以作为合作进化的催化剂。我们的实验表明,一些既不好也不敲诈的无敌策略也是如此。