ANT61 使用 AWS 加速太空机器人的强化学习

简介 ANT61 机器人公司是一家位于澳大利亚悉尼的初创公司,开发用于太空应用(例如在轨卫星服务)的自主机器人,以避免危及人类生命。他们的机器人使用基于 AI 的控制系统,使它们能够在无法进行远程控制的不可预测环境中执行安装和维修任务。在这篇文章中,[...]

来源:AWS博客_机器人

简介

ANT61 robotics 是一家位于澳大利亚悉尼的初创公司,致力于开发用于太空应用(例如在轨卫星维修)的自主机器人,以避免危及人类生命。他们的机器人使用基于 AI 的控制系统,使其能够在无法进行远程控制的不可预测环境中执行安装和维修任务。

在本文中,您将了解 ANT61 如何使用基于模拟的强化学习来训练其机器人在太空中执行任务。您将了解他们如何使用 AWS 并行运行模拟以减少开发时间和成本。

机器人通过反复试验进行学习

在过去的几年中,强化学习越来越多地被用作训练机器人 AI 模型的方法。借助强化学习,机器人通过尝试不断改进。工程师无需编写移动机器人关节的代码,而是通过来自环境的反馈来学习更快、更安全、更可靠地执行移动。

ANT61 正在利用人工智能的最新发展来构建自主机器人,用于在太空和其他危险环境中工作。他们预测,很快学习到的机器人技能将超越人类编码的行为,类似于神经网络首先超越手写算法,然后最终超越人类的物体识别能力。他们使用深度强化学习来训练机器人的一般安装和组装技能以及卫星维修技能,如对接、翻滚、加油和零件更换。

通过使用强化学习,ANT61 可以更好地利用它们的大脑,解决目前需要人类解决的问题。

观察是新的大数据

十年前,人们竞相积累尽可能多的数据。更多的数据意味着更好的机器学习模型、更准确的预测、更满意的客户和更大的市场份额。

实验成本

在一个 EC2 实例上使用一次模拟进行训练

多智能体训练