Loading...
机构名称:
¥ 1.0

摘要 - 深处增强学习(DRL)是一种强大的机器学习范式,用于生成控制自主系统的代理。但是,DRL代理的“黑匣子”性质限制了其在现实世界中关键应用程序中的部署。为代理行为提供强大保证的一种有前途的方法是使用神经Lyapunov屏障(NLB)证书,该证书是通过系统中学的功能,其属性间接地暗示着代理的行为。但是,基于NLB的证书通常很难学习,甚至更难验证,尤其是对于复杂的系统。在这项工作中,我们提出了一种新颖的方法,用于培训和验证基于NLB的离散时间系统证书。具体来说,我们引入了一种证书组成的技术,该技术通过策略性地设计一系列证书来简化高度复杂系统的验证。当通过神经网络验证引擎共同验证时,这些证书提供了正式的保证,即DRL代理都实现了其目标并避免了不安全的行为。此外,我们引入了一种用于证书过滤的技术,该技术大大简化了生成正式验证的证书的过程。我们通过案例研究证明了我们的方法的优点,该案例研究为DRL控制的航天器提供了安全性和livesice保证。

用Lyapunov屏障证书正式验证深钢筋学习控制器

用Lyapunov屏障证书正式验证深钢筋学习控制器PDF文件第1页

用Lyapunov屏障证书正式验证深钢筋学习控制器PDF文件第2页

用Lyapunov屏障证书正式验证深钢筋学习控制器PDF文件第3页

用Lyapunov屏障证书正式验证深钢筋学习控制器PDF文件第4页

用Lyapunov屏障证书正式验证深钢筋学习控制器PDF文件第5页