Loading...
机构名称:
¥ 1.0

许多研究表明,人类具有“可预测的非理性”特征:他们不会以完全理性的方式行事,但他们偏离理性行为的行为却相当系统化。我们的目标是看看我们能在多大程度上解释和证明这些偏差是理性但资源有限的代理在考虑到其局限性的情况下尽力而为的结果。我们重点研究了护林员-偷猎者游戏,其中护林员试图保护一些地点免遭偷猎。我们通过将偷猎者和护林员建模为概率有限自动机 (PFA) 来捕捉计算限制。我们表明,有了足够大的内存,PFA 可以学会玩博弈中的纳什均衡 (NE) 策略并获得 NE 效用。然而,如果我们限制记忆,我们就会得到更多“类似人类”的行为,例如概率匹配(即访问与犀牛出现的概率成比例的站点),以及避开结果不好的站点(例如,偷猎者被护林员抓获),我们在 Amazon Mechanical Turk 上进行的实验中也观察到了这些行为。有趣的是,我们发现添加概率匹配和增加重要事件(如被抓获)等类似人类的行为实际上可以提高性能,表明这种看似不合理的行为可能非常合理。

安全游戏中资源受限代理的战略发挥

安全游戏中资源受限代理的战略发挥PDF文件第1页

安全游戏中资源受限代理的战略发挥PDF文件第2页

安全游戏中资源受限代理的战略发挥PDF文件第3页

安全游戏中资源受限代理的战略发挥PDF文件第4页

安全游戏中资源受限代理的战略发挥PDF文件第5页