Davide Grossi___XiaoMi-AI 助力科研平台

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

¥ 1.0

热度

我们应用多代理增强学习方法来研究在游戏中相互作用的强化学习者之间合作的出现。至关重要的是，代理商在游戏中的激励措施在对齐或错位的程度上尚不确定。在此框架中，我们通过计算实验在模型的进一步特征（例如沟通，声誉机制，风险态度变化）的情况下探索，可能支持学习更多合作的政策。

添加pdf代下载 VIP点击下载文件

Davide Grossi

主要关键词

合作确定重要的作用的学习者合作的机制计算实验对齐模型错位的代理商错位学习方法方法模型的上尚声誉相互作用互作用游戏学习增强态度至关重要

Davide GrossiPDF文件第1页