Loading...
机构名称:
¥ 1.0

我们提出了Crystalbox,这是一个新颖的,模型的,后的,后的解释性框架,用于深钢筋学习(DRL)控制器,包括包括计算机系统在内的大型输入驱动的环境。我们将奖励函数在输入驱动的环境中的自然可分解性与分解重新转弯的解释力相结合。我们提出了一种有效的算法,以在离散和连续控制环境中生成基于未来的解释。使用自适应比特率流和拥堵控制等应用程序,我们演示了Crystal-box产生高保真解释的能力。我们进一步说明了在三种实际用例中的较高效用:对比解释,网络可观察性和指导性奖励设计,而不是先前的解释性技术来识别出色的特征。

Crystalbox:输入驱动的深度RL系统的基于未来的解释

Crystalbox:输入驱动的深度RL系统的基于未来的解释PDF文件第1页

Crystalbox:输入驱动的深度RL系统的基于未来的解释PDF文件第2页

Crystalbox:输入驱动的深度RL系统的基于未来的解释PDF文件第3页

Crystalbox:输入驱动的深度RL系统的基于未来的解释PDF文件第4页

Crystalbox:输入驱动的深度RL系统的基于未来的解释PDF文件第5页

相关文件推荐