点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
在本文中,我们提出了一个基于模型的增强学习系统,其中以贝叶斯方式处理过渡模型。这种方法自然可以通过引入先验来对基础学习任务强加结构来利用专家知识。引入系统的其他信息意味着我们可以从少量数据中学习,恢复可解释的模型,并且重要的是,提供了相关的不确定性的预测。为了显示该方法的好处,我们使用一个具有挑战性的数据集,其中基础系统的动力学既表现出操作相移和异质噪声。将我们的模型与NFQ和BNN+LV进行了比较,我们展示了我们的方法如何产生对基本动力学的可隔离见解,同时也提高了数据效率。
主要关键词