当应用于地月轨道模式时,利用经典的地面和/或太空传感器在近地空间执行空间领域感知 (SDA) 变得越来越困难。因此,地月周期轨道被提出作为填补这一能力空白的一种手段。虽然周期轨道有许多用途,但这项工作评估了各种地月周期轨道在样本 SDA 任务架构中的有效性。具体而言,对地月空间内几种不同类型的周期轨道进行了建模,以评估它们在跟踪/监视围绕 L1 拉格朗日点的 Lyapunov 轨道上均匀分布的两颗假想卫星方面的各自有效性。所分析的轨道是在圆形限制三体问题 (CR3BP) 中建模的。还介绍了在过渡到双圆限制四体问题 (BCR4BP) 时保持相同轨迹所需的推进剂。为了比较从 CR3BP 过渡到 BCR4BP 等更高保真度模型时的轨道维护成本,我们寻求实施多种动力学模型。概念性空间对空间传感器用于确定 SDA 任务周期轨道几何的限制,该限制与范围、能力和太阳/地球/月球排斥角有关。视觉星等用于确定目标是否可见。结果列表与地月 SDA 最有效周期轨道的建议一起呈现。
I. 引言随着火星立方体一号 (MarCO) 任务的成功和小型化技术的进步,小型卫星不再局限于在低地球轨道 (LEO) 运行。相反,通过低推力小型卫星进行深空探索、技术演示和有针对性的科学任务可能很快就会成为现实。事实上,即将到来的任务,如月球冰立方、LunaH-map 和 NEA Scout,将把小型卫星作为次要有效载荷搭载在 Artemis 1 上,部署到多体重力环境内的各种位置[1-3]。然而,混沌多体系统中航天器的轨迹和机动设计本质上是一个高维问题,而且由于结合了与低推力小型卫星相关的约束而变得更加复杂:有限的推进能力、运行调度约束以及固定但不确定的初始条件。虽然存在多种基于最优控制和动态系统理论 (DST) 的数值方法,用于在多体系统的近似动力学模型中构建低推力轨迹和机动剖面,但自主和稳健设计策略的开发需要一种替代方法。强化学习 (RL) 是天体动力学界越来越感兴趣的一类用于实现轨迹和机动设计的自主性的算法。RL 算法通常涉及代理与环境交互,通过对动态状态采取行动来最大化奖励函数。代理会探索环境,直到确定了决定每个状态下最佳动作的策略。如果制定得当,这些算法可以探索许多状态-动作对以确定最佳动作,同时限制对次优动作的探索。RL 方法已用于天体动力学中各种应用和动力学模型的轨迹和机动设计。例如,Dachwald 探索使用人工神经网络和进化算法设计配备低推力航天器到水星的转移 [ 4 ]。Das-Stuart、Howell 和 Folta 近期提出的方法利用 RL 和基本动力学结构来设计圆形限制三体问题 (CR3BP) 中周期轨道之间的复杂转移轨迹 [ 5 ]。此外,Scorsoglio、Furfaro、Linares 和 Massari 还使用演员-评论家深度强化学习 (DRL) 方法来开发地月空间近直线轨道航天器的对接机动 [ 6 ]。最近,Miller 和 Linares 应用著名的近端策略优化 (PPO) 算法来设计地月系统中遥远逆行轨道之间的转移,通过 CR3BP 进行建模 [ 7 ]。这些研究的成功为天体动力学界继续探索和扩展 RL 在多体轨迹设计策略中的应用奠定了宝贵的基础。具体来说,本文以这些先前的研究为基础,重点关注实施基于 RL 的轨迹设计方法的一个重要组成部分:制定一个奖励函数,该函数既反映了设计目标,也反映了影响恢复机动轮廓操作可行性的约束。该分析是在低推力 SmallSat 的轨迹设计背景下进行的,以快速访问位于与 CR3BP 中的周期轨道相关的稳定流形上的附近参考轨迹。
本研究旨在利用数值优化方法提供一种新型的地月初始轨道确定 (IOD) 方法。在 CR3BP 动力学下,针对各种观测器和目标轨道几何形状模拟副卫星和主卫星。然后使用粒子群优化器 (PSO) 将一组观测值(仅距离、角度和角度)拟合到从初始粒子状态向前传播到测量时间计算出的粒子观测值。通过包含收缩因子、以网格方式初始化粒子以及限制初始粒子状态的范围,有助于 PSO 的收敛。结果表明,PSO 收敛到副卫星的精确初始状态估计。并行处理和 GPU 处理方法用于加快计算时间。
随着民用和军用领域对地月空间的兴趣日益增加,对地月空间物体的空间域感知 (SDA) 的需求也随之增加。地月空间的太空 SDA 具有挑战性,部分原因是难以准确估计观测卫星的位置,而准确估计是有效执行 SDA 任务的必要条件。使用多颗配备低保真度设备的观测卫星有助于缓解这些问题,因为可以将方差较大的多个数据集聚合在一起,以实现与较少高质量测量系统相同或更高的精度。地月周期轨道用于观测星座,目标航天器位于 L1 Halo 轨道上。所有轨道均使用圆形限制三体问题 (CR3BP) 建模。系统工具包 (STK) 用于计算轨道几何形状和角度 - 仅提取测量值以模拟带有光学传感器的观测航天器。然后利用扩展卡尔曼滤波器处理测量数据以估计目标航天器的位置。分析重点是比较不同数量的观测航天器的有效性。模拟结果发现,使用低保真度星座可以达到高保真度星座所达到的性能。
