Loading...
机构名称:
¥ 1.0

本文调查了使用深度强化学习(DRL)训练的政策的弹性,以解决敏捷的地球观察卫星调度问题(AEOSSP),重点是操作过程中反应轮(RW)断层的影响。尽管基于DRL的策略旨在处理动态和不可预见的场景,但在断层条件下的弹性并未得到很好的理解。本研究评估了各种断层场景下此类政策的适应性,从而确定了性能和安全性降解的阈值。调度问题被提出为可观察到的马尔可夫决策(POMDP),并使用在无故障环境中训练的策略解决。然后在各种故障场景中测试该策略,包括单独的RW故障,功率限制,摩擦增加,编码器测量错误以及电池容量。结果探索了界限,随着RW越来越多的断层,发生重大的性能和安全性降解。功率限制,摩擦和电池容量故障会随着故障严重程度的增加而导致逐渐下降的性能下降,并具有明显的安全阈值。但是,由于基于扭矩的态度控制机制,编码器断层的性能影响最小。

AAS 25-159增强的故障弹性 - ...

AAS 25-159增强的故障弹性 -  ...PDF文件第1页

AAS 25-159增强的故障弹性 -  ...PDF文件第2页

AAS 25-159增强的故障弹性 -  ...PDF文件第3页

AAS 25-159增强的故障弹性 -  ...PDF文件第4页

AAS 25-159增强的故障弹性 -  ...PDF文件第5页

相关文件推荐