摘要:将于2030年左右建立的国际月球研究站,将为月球漫游器提供机器人武器作为建筑商。建筑需要月球土壤和月球漫游者,为此,由于短暂的一天,尤其是在南极附近,漫游者必须在有限的时间内遇到不同的航路点,而不会在有限的时间内遇到障碍。传统的计划方法,例如从地面上载指令,几乎无法以高效的效率同时处理许多流浪者。因此,我们提出了一种基于深度强化学习的新的协作路径规划方法,在该方法中,人工电位领域的目标和障碍都证明了启发式方法。的环境是随机生成的,在创建大小障碍和不同的航路点以收集资源,训练深厚的增强学习代理以提出行动,并带领流浪者在没有障碍,完成漫游者的任务并达到不同目标的情况下移动。在每个步骤中,由障碍物和其他流浪者创造的人工潜力领域都会影响流动站的动作选择。人工潜力领域的信息将转变为有助于保持距离和安全性的深度加强学习中的奖励。实验表明,我们的方法可以引导流浪者更安全地移动,而不会变成附近的大障碍或与其他流浪者发生碰撞,并且与具有改进的避免障碍物方法的多代理A-Star路径计划算法相比,消耗的能量更少。
390 Interlocken Crescent, Suite 500 • Broomfield, CO 80021 USA | 303-530-1925 sierraspace.com/spaceflight-hardware-catalog | 电子邮件:spaceapps@sierraspace.com 警告 – 本文档不包含《国际武器贸易条例》(ITAR)或《出口管理条例》(EAR)所定义的技术数据或技术。本文讨论的产品和技术的出口、销售和提供均需获得美国政府的批准。
日本正在参加网关计划,以利用通过人类空间飞行活动为国际空间站(ISS)开发的经验和技术在月球轨道上建造一个新的船员空间站,包括日本实验模块,称为“ Kibo”和货物转让车辆,HTV称为“ Kounotori”。日本负责提供居住能力,例如国际栖息地(I-HAB)对机组人员必不可少的环境控制功能,并将提供控制空气循环,气压,氧气供应,温度和湿度以及二氧化碳和有害气体的设备。此外,日本还将为门户(I-HAB和居住物流前哨基地(Halo)),i-Hab内外的摄像机提供电池,以及用于循环制冷剂的泵到凉爽的I-HAB设备。
系统(GPS)信号确定登机上的精确定位和时机。与以仪表级准确性利用伪龙的先前作品不同,我们提出了一种精确的定位和计时技术,该技术利用毫米级的准确性来利用载载相 - 相位测量(当整数模棱两可正确地固定时)。我们设计了一个扩展的Kalman FIL TER框架,该框架利用间歇性可用的陆地GPS时间差异载体相(TDCP)值(TDCP)值和轨道过滤器预测的重力加速度。为了估算过程噪声协方差,我们实施了一种自适应状态噪声补偿算法,该算法适应了挑战性的月球环境,其重力较弱,并且每个涡轮型强大。此外,我们执行测量残差分析,以丢弃被周期滑动损坏并增加测量噪声损坏的TDCP测量。我们介绍了在椭圆形的月球轨道上的月球卫星的蒙特卡洛模拟,与唯一的导航解决方案相比,我们展示了更高的定位和时机准确性。
•CCSD的选择和更新的月球通信•SFCG/ITU频率协调与治理•安全访问标准和网络管理•导航的时间/空间参考框架•频率共享和多个链接访问管理
摘要。月球着陆器问题在强化学习领域提出了巨大的挑战,因此需要创建能够在月球表面安全着陆的自主航天器。在这项研究中,研究并检查了三种突出的增强学习算法,即深Q-Network(DQN),Double Deep Q-Network(DDQN)和策略梯度,并进行了检查并检查以解决此问题。最初,将神经网络和Q学习的DQN算法利用以学习最佳着陆政策。通过通过神经网络培训近似Q值,该航天器学会了做出明智的决定,从而成功着陆。随后,使用减轻高估偏差的DDQN算法。利用两个神经网络(一个用于行动选择,另一个用于评估),DDQN可提高稳定性和收敛性,从而产生精致的着陆策略。此外,这项工作探讨了策略梯度方法在此问题中的应用。通过使用梯度上升直接优化策略,该航天器可以最大化累积奖励,从而实现有效而准确的降落。通过广泛的模拟来评估该算法的性能,该模拟涵盖了不同的月球表面条件。结果证明了这些方法的有效性,展示了它们促进成功和燃油效率的航天器登陆的能力。总而言之,这项研究有助于了解Lunar Lander问题的DQN,DDQN和政策梯度算法。这些发现突出了每种算法的独特优势及其在自主航天器上的潜力。这项研究所获得的见解对未来的月球任务中智能着陆系统的发展具有影响,从而推进了航空航天应用中强化学习领域。
首字母缩略词 .cvs Excel codex ⁰ 度 < 小于 % 百分比 ABC Artemis 大本营 ACES 学院颜色编码系统 ANOVA 方差分析 CEL 概念探索实验室 cm 厘米 conops 作战概念 deg 度 DEM 数字环境模型 DOUG 动态机载无处不在的图形 DRATS 沙漠研究和技术研究 DSN 深空网络 DTE 直接对地 EDGE 探索图形 EHP 美国宇航局的舱外活动和人类地面机动计划 ESDMD 探索系统发展任务理事会 EVA 舱外活动 F ANOVA F 值 FOD 异物碎片 FOV 视场 fps 每秒帧数 GUNNS 通用节点网络求解器软件 HAB 栖息地 HDR 高数据速率 HITL 人在回路 hh:mm:ss 小时、分钟、秒 IES 照明工程学会 IMU 惯性测量单元 ISRU 现场资源利用单元 JEOD 约翰逊航天中心工程轨道动力学集团 JSC 约翰逊航天中心 kg 千克 km 公里 kph 公里每小时 千瓦 千瓦时 千瓦每小时 激光雷达 光增强探测与测距
C. 地面通信 NASA 正在对月球表面网络的不同方法进行权衡研究,以选出最符合探索要求的实施方案。这些潜在方法包括: • 采用 NASA 的空间对空间通信系统(一种双向通信系统,旨在在航天飞机轨道器、国际空间站和舱外活动机动单元之间提供语音和遥测数据)以超高频率进行语音通信。 • 使用 Wi-Fi 进行近距离高速率视频通信。 • 利用地面无线蜂窝标准实现可扩展、更长距离、高吞吐量的 PNT 服务连接。 [8] 这样的网络可以增强
• 雄心勃勃的时间表。2023 年 11 月 (GAO-24-106256),GAO 发现,鉴于延误和剩余的技术工作,Artemis III 登月不太可能按计划在 2025 年 12 月进行。2024 年 1 月,NASA 将发射日期调整为 2026 年 9 月,以便承包商有时间完成大量剩余的复杂工作。• Artemis III 任务成本。2019 年 12 月 (GAO-20-68),GAO 发现 NASA 不打算为这次任务建立官方成本估算。NASA 同意 GAO 的建议,但尚未这样做。虽然 NASA 在其 2024 财年预算申请中要求 68 亿美元支持 Artemis III 计划,但决策者对 Artemis III 任务成本的全部范围了解有限。• 收购管理。NASA 最大、最复杂的项目(包括支持 Artemis 任务的项目)继续影响着该机构的投资组合。当这些项目超出其成本基准并需要成本储备来满足其资金需求时,就会对其他项目产生连锁反应。NASA 官员正在探索更好地管理此类项目成本和进度增长的方法。