Loading...
机构名称:
¥ 1.0

摘要。我们提出了一种适合深入加强学习(DRL)问题的新颖算法,该算法利用信息几何形状实施战略性和选择性遗忘。我们的方法旨在解决DRL的首要偏见,并在顺序决策框架内提高适应性和鲁棒性。我们从经验上表明,通过包括利用Fisher Information Matrix来实现的选择性遗忘机制,与仅专注于学习的传统DRL方法相比,人们可以获得更快,更健壮的学习。我们的实验是在流行的DeepMind Control Suite基准上执行的,可以加强该想法 - 已经存在于文献中 - 忘记是学习的基本组成部分,尤其是在具有非平稳目标的情况下。

Fisher指导的选择性遗忘(FGSF),用于深钢筋学习

Fisher指导的选择性遗忘(FGSF),用于深钢筋学习PDF文件第1页

Fisher指导的选择性遗忘(FGSF),用于深钢筋学习PDF文件第2页

Fisher指导的选择性遗忘(FGSF),用于深钢筋学习PDF文件第3页

相关文件推荐

2024 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0