Loading...
机构名称:
¥ 1.0

太空任务操作的高成本促使多个航天机构优先开发自主航天器指挥和控制技术。深度强化学习 (DRL) 技术为创建复杂、多方面的操作问题的自主代理提供了一个有前途的领域。这项工作研究了将 DRL 驱动的策略生成算法应用于航天器决策问题的可行性,包括构建航天器决策问题的策略,例如马尔可夫决策过程、降维途径、使用专家领域知识进行简化、对超参数的敏感性以及面对错误建模的环境动态时的鲁棒性。此外,在屏蔽深度强化学习的新颖改编中,考虑通过将这些方法与构造正确的控制技术相结合来确保这些方法的安全性。这些策略针对原型低保真驻留场景和高保真姿态模式管理场景进行了演示,涉及飞行遗产姿态控制和动量管理算法。研究发现,DRL 技术与这些问题的其他黑盒优化工具或启发式解决方案相比具有优势,并且需要与深度学习社区中广泛使用的测试数据集类似的网络规模和训练持续时间。

使用深度强化学习生成航天器操作程序

使用深度强化学习生成航天器操作程序PDF文件第1页

使用深度强化学习生成航天器操作程序PDF文件第2页

使用深度强化学习生成航天器操作程序PDF文件第3页

使用深度强化学习生成航天器操作程序PDF文件第4页

使用深度强化学习生成航天器操作程序PDF文件第5页

相关文件推荐

2023 年
¥1.0
2024 年
¥1.0
2021 年
¥1.0
2023 年
¥1.0