扑克是一种大型复杂、信息不完全的游戏,已被列为人工智能的主要挑战问题。最近出现了一系列突破,最终出现了一些代理,它们在双人无限注德州扑克游戏中成功击败了最强的人类玩家。最强的代理基于近似纳什均衡策略的算法,这些算法存储在大量二进制文件中,人类无法理解。最近的一项研究探索了从强大的博弈论策略中推断出人类可以理解的知识的方法。当人类是最终决策者时,这将很有用,并允许人类从大量算法生成的策略中做出更好的决策。利用机器学习技术,我们发现了扑克策略的一条新的简单基本规则,与最佳先前规则相比,该规则可以显著提高性能,并且人类玩家也可以轻松应用。
主要关键词