马尔可夫的独立和分散学习...___XiaoMi-AI 助力科研平台

马尔可夫的独立和分散学习...

可下载资源数量

已经购买

下载数量：1

单价	0 4.0
Coupon	100% 0%
Total	0 4.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

马尔可夫的独立和分散学习...

¥ 4.0

热度

算法1独立和分散学习动力学初始化：n 0（s）= 0，∀s∈S; 〜n 0 i（s，a i）= 0，〜q 0 i（s，a i）= 0，π0i（s，a i）= 1 / | A I | ，∀（i，a i，s）和θi∈（0，1）。在迭代0中，每个玩家都会观察S0∈S，选择其动作A 0 I〜π0 I（S 0），然后观察R 0 I = U I（S 0，A 0）。在每个迭代中t = 1，2，...，每个玩家都会观察到S t，并且独立更新{n t，〜n t i，〜q t i，πt i}。更新n t，〜n t i：

添加pdf代下载 VIP点击下载文件