点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
我们应用多代理增强学习方法来研究在游戏中相互作用的强化学习者之间合作的出现。至关重要的是,代理商在游戏中的激励措施在对齐或错位的程度上尚不确定。在此框架中,我们通过计算实验在模型的进一步特征(例如沟通,声誉机制,风险态度变化)的情况下探索,可能支持学习更多合作的政策。
主要关键词