点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
本文的目的是双重的。首先,它试图揭示人类和其他动物在非零和游戏中在决策策略中学习的算法,特别是专门针对完全可观察到的迭代囚犯的困境情景。第二,它旨在开发一种新模型来解释战略决策,反映了以前的神经生物学发现,表明不同的大脑电路负责自指的处理和理解他人。该模型源于参与者 - 批评框架,并结合了多个批评家,以允许对自我和他人状态进行独特的处理。我们通过与人类的实验数据进行比较,验证了算法的生物学合理性和可传递性。
主要关键词