非平稳强化学习的复杂性___XiaoMi-AI 助力科研平台

非平稳强化学习的复杂性

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

非平稳强化学习的复杂性

¥ 2.0

热度

在强化学习领域的持续学习问题（通常称为非固定强化学习）被确定为对强化学习的应用的重要挑战。我们证明了最坏情况的复杂性结果，我们认为这会捕捉到这一挑战：在强化学习问题中修改单个州行动对的概率或奖励需要几乎与状态数量一样大的时间以保持价值功能的最新功能，除非有强的指数时间假设（SETH）为false;塞思（Seth）是p̸= np猜想的广泛接受的加强。回想一下，在当前应用学习中的状态数量通常是天文学的。相比之下，我们表明，仅添加新的州行动对就更容易实现。关键字：非平稳加强学习，细粒度的复杂性

添加pdf代下载 VIP点击下载文件