Loading...
机构名称:
¥ 1.0

强化学习(RL)是一个高度适应性的框架,用于在广泛的问题领域中产生自主代理。虽然RL已成功地应用于高度复杂的现实世界系统,但大量文献研究了抽象和理想化的问题。尤其是航天器任务领域的情况,在这种情况下,即使是传统的预备方法也倾向于使用高度简化的航天器动力学和操作模型。当在全面模拟中测试简化的方法时,它们通常会导致保守的解决方案,这些解决方案是不可行的次优或侵略性解决方案。因此,需要高保真的航天器仿真环境来评估基于RL的和其他任务算法。本文介绍了BSK-RL,BSK-RL是一种开源Python软件包,用于为航天器任务问题创建和自定义加固学习环境。它结合了Basilisk(一种高速和高保真的航天器仿真框架)与RL环境的标准体育馆API包装器中的卫星任务和操作目标的抽象相结合。该软件包旨在满足RL和航天器操作研究人员的需求:环境参数易于重现,可自定义和随机化。环境是高度模块化的:可以指定卫星状态和操作空间,可以定义任务目标和奖励,并且可以配置卫星动力学和飞行软件,并隐式地引入操作限制和安全限制。可以为考虑沟通和协作的更复杂的任务场景而创建异质的多机构环境。使用包装的培训和部署用于具有资源限制的地球观察卫星。

BSK-RL:航天器任务的模块化,高保真增强学习环境

BSK-RL:航天器任务的模块化,高保真增强学习环境PDF文件第1页

BSK-RL:航天器任务的模块化,高保真增强学习环境PDF文件第2页

BSK-RL:航天器任务的模块化,高保真增强学习环境PDF文件第3页

BSK-RL:航天器任务的模块化,高保真增强学习环境PDF文件第4页

BSK-RL:航天器任务的模块化,高保真增强学习环境PDF文件第5页