要继续遵循可持续和灵活的道路,NASA需要应对在目的地收集和移动大量岩石的挑战。NASA的Regolith Advanced Surface Systems操作机器人(Rassor)[1]主要旨在挖掘和运送Regolith,以用于现场资源利用率(ISRU)处理。Rassor的设计使其能够有效地收集和存入Regolith,返回收集的处理材料以及无数相关的ISRU活动。要可靠地在月球表面执行这些操作,Rassor软件和感觉系统需要稳健,并最大化从减少的传感器有效载荷中提取的信息。在此,我们介绍了智能可增强的Rassor项目的初步发现[2]。我们创建了减少阶的仿真环境,以通过增强学习和原型状态估计架构来开发自主沟通控制器。强化学习的目的是让代理通过与环境的互动来学习政策(任务策略)。当代理执行诉讼时,会在环境状态下发生更改,并收到数值奖励,该奖励告知代理商是否良好。由于增强学习算法通过反复试验学习,因此模拟是开发和学习的最佳环境。我们开发了两个模拟,第一个是为促进参数选择而开发的2D挖掘模拟,并使用游戏物理发动机开发了3D模拟,以模拟简化的土壤相互作用并增加机器人代理动力学模型的实现。这种3D仿真的开发使得在粒状力学和操作水平上都可以培训其他感应能力和研究。我们探索了各种虚拟传感器有效载荷,以识别启用了有效发掘操作和学习的组合。我们的奖励功能是基于每个步骤授予多少材料。离开挖掘地点并平滑鼓臂的加速度也受到了罚款。我们实施了伪随机传感器,以报告从每个鼓到地面的距离和地面上方的高度,这比现有解决方案更加有效。我们的发现表明,自主行动的强化学习在我们简化的2D环境中学习了3000个培训事件中的可行沟渠策略,并有助于确定所需的感应能力,安排和考虑因素,例如交流时间传感器的位置。未来的工作包括将我们的模拟扩展到更复杂的环境和场景,以及将学习从模拟转移到Rassor 2.0硬件,以在NASA的肯尼迪航天中心的Regolith Test bin中进行部署。
1. Glaser, P. (1973)。将太阳辐射转换为电能的方法和装置。美国专利商标局,华盛顿特区 2. JE Drummond, JE (1980)。低地球轨道和地球同步地球轨道的比较,Power Conversion Technology, Inc. 3. Jones, R. (2010)。替代轨道 - 一种新的太空太阳能发电参考设计,在线空间通信杂志,2010 年第 16 期 http://spacejournal.ohio.edu/issue16/jones.html 4. Mankins, JC Mankins。(2006)。美国土木工程师学会地球与空间会议论文集。2006 年大会,德克萨斯州联盟城。空间电网 - 太空太阳能发电的进化方法。美国国家航空航天局,华盛顿特区 5. Komerath, N., Boechler, N. Wanis, N. (2006)。空间电网 — 空间太阳能发电的进化方法,美国土木工程师学会地球与空间分会 2006 大会论文集,德克萨斯州联盟城,2006 年 4 月 6. Brown, C. (1992)。波束微波电力传输及其在空间中的应用,IEEE 微波与技术学报,第 40 卷第 6 期。 7. 格鲁曼航空航天公司,星载雷达研究,1974 年 8. Komerath, N., Nicholas B. (2010)。空间电网,佐治亚理工学院航空航天工程学院,美国佐治亚州亚特兰大 30332-0150 9. Criswell, D. (2009)。月球太阳能发电 (LSP) 系统:实现可持续繁荣的实用方法,搜索与发现文章 #70070 10. Bekey, R. 和 Boudreault, R. (1999)。经济上可行的太空电力中继系统,Elsevier Science Ltd. 出版。11. Hopkins, M. (1980)。卫星发电站和非成本不确定性风险方面。兰德公司。12. Geoffrey A. Landis,《重新发明太阳能卫星》,美国国家航空航天局,格伦研究中心,俄亥俄州克利夫兰,2004 年。13. Mankins, JC (1997)。重新审视太空太阳能:新架构、新概念和技术,IAF-97-R.2.03,第 38 届国际宇航联合会,美国国家航空航天局高级项目办公室。14. 美国国家科学院国家研究委员会。(2001)。为太空太阳能奠定基础:对 NASA 太空太阳能投资战略的评估。对 1999-2000 年进行的 NASA 空间太阳能 (SSP) 探索性研究和技术 (SERT) 计划的评估,95 页。15. Komerath, N.、Venkat V. 和 Butchibabu, B. 空间电网的参数选择