Loading...
机构名称:
¥ 1.0

本文探讨了视觉语言模型 (VLM) 作为操作代理在太空领域的应用,重点关注软件和硬件操作范例。基于大型语言模型 (LLM) 及其多模态扩展的进步,我们研究了 VLM 如何增强太空任务中的自主控制和决策。在软件环境中,我们在 Kerbal 太空计划差分博弈 (KSPDG) 模拟环境中使用 VLM,使代理能够解释图形用户界面的视觉屏幕截图以执行复杂的轨道机动。在硬件环境中,我们将 VLM 与配备摄像头的机器人系统集成在一起,以检查和诊断物理空间物体,例如卫星。我们的结果表明,VLM 可以有效地处理视觉和文本数据以生成适合上下文的操作,在模拟任务中与传统方法和非多模态 LLM 竞争,并在实际应用中显示出良好的前景。

视觉语言模型作为空间领域的操作员代理

视觉语言模型作为空间领域的操作员代理PDF文件第1页

视觉语言模型作为空间领域的操作员代理PDF文件第2页

视觉语言模型作为空间领域的操作员代理PDF文件第3页

视觉语言模型作为空间领域的操作员代理PDF文件第4页

视觉语言模型作为空间领域的操作员代理PDF文件第5页

相关文件推荐

2022 年
¥11.0
1900 年
¥1.0
2022 年
¥11.0