Loading...
机构名称:
¥ 1.0

在本文中,我们提出了一个基于模型的增强学习系统,其中以贝叶斯方式处理过渡模型。这种方法自然可以通过引入先验来对基础学习任务强加结构来利用专家知识。引入系统的其他信息意味着我们可以从少量数据中学习,恢复可解释的模型,并且重要的是,提供了相关的不确定性的预测。为了显示该方法的好处,我们使用一个具有挑战性的数据集,其中基础系统的动力学既表现出操作相移和异质噪声。将我们的模型与NFQ和BNN+LV进行了比较,我们展示了我们的方法如何产生对基本动力学的可隔离见解,同时也提高了数据效率。

多模式动力学系统的贝叶斯分解用于加固学习

多模式动力学系统的贝叶斯分解用于加固学习PDF文件第1页

多模式动力学系统的贝叶斯分解用于加固学习PDF文件第2页

多模式动力学系统的贝叶斯分解用于加固学习PDF文件第3页

多模式动力学系统的贝叶斯分解用于加固学习PDF文件第4页

多模式动力学系统的贝叶斯分解用于加固学习PDF文件第5页

相关文件推荐

2025 年
¥1.0
2023 年
¥1.0
2023 年
¥2.0