Loading...
机构名称:
¥ 3.0

可解释的强化学习(XRL)是可解释的机器学习的新兴子场,近年来引起了相当大的关注。XRL的目标是阐明在顺序决策设置中加强学习(RL)代理的决策过程。配备了这些信息,从业人员可以更好地理解有关RL代理(尤其是在现实世界中部署的代理人)的重要问题,例如代理商将要做什么和原因。尽管兴趣提高,但在组织众多论文的文献中仍存在差距,尤其是以某种方式集中了问题的决策性质。在本调查中,我们提出了一种新的分类法,以组织优先级RL设置的XRL文献。我们提出了三个高级类别:特征重要性,学习过程和马尔可夫决策过程以及政策级别。我们根据这种分类法概述技术,强调了未来工作的挑战和机会。我们通过利用这些差距来激励和概述未来工作的路线图。

可解释的强化学习:调查和比较审查

可解释的强化学习:调查和比较审查PDF文件第1页

可解释的强化学习:调查和比较审查PDF文件第2页

可解释的强化学习:调查和比较审查PDF文件第3页

可解释的强化学习:调查和比较审查PDF文件第4页

可解释的强化学习:调查和比较审查PDF文件第5页