在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 扩展机器人强化学习 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 扩展机器人强化学习

2026年6月9日 20:07 33 Comments

在这篇文章中，我们展示了如何在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 跨两个计算选项训练 Unitree H1 人形机器人策略：Amazon SageMaker HyperPod 和 Amazon SageMaker 训练作业。

来源:亚马逊云科技 _机器学习

物理人工智能正在从研究转向生产。机器人在部署到工厂、仓库和物流中心之前，越来越多地接受高保真模拟训练，因为现实世界中的训练缓慢、昂贵且通常不安全，而 GPU 加速模拟可以将数月的学习时间压缩为数小时。

这将挑战转移到了计算上。针对复杂行为（例如崎岖地形上的人形运动）的强化学习 (RL) 属于计算密集型任务，单节点训练运行时间从几小时到几天不等。机器人团队需要在研究过程中快速迭代，并运行生产级、长期训练作业，而无需承担维护计算集群的操作负担。

在这篇文章中，我们展示了如何使用 NVIDIA Isaac Lab 在 Amazon SageMaker AI 上跨两个计算选项训练 Unitree H1 人形机器人策略：Amazon SageMaker HyperPod 和 Amazon SageMaker 训练作业。该解决方案的完整代码可在随附的 GitHub 存储库中找到。

图片来源：NVIDIA

1. 为什么选择 Amazon SageMaker AI 进行物理 AI 训练

Amazon SageMaker AI 消除了管理机器学习 (ML) 训练计算基础设施的繁重工作。该服务提供实例、配置驱动程序和网络、监控节点运行状况，并在作业完成时拆除资源，因此工程工作主要集中在开发机器人策略上，而不是其底层的基础设施上。这对于机器人策略强化学习尤其重要，因为它需要大量基础设施：运行时间长，GPU 密集型，并且通常分布在多个节点上。开发通常涉及两个阶段：用于调整奖励函数、观察空间和模型架构的短期迭代实验，以及训练调整后的配置以实现收敛的较长生产运行。 SageMaker AI 提供了两种适合这些阶段的计算选项。

使用 SageMaker HyperPod 实现集群弹性和控制

2. NVIDIA Isaac Lab 和训练任务

运行时间 NVIDIA 底层的管理机模拟训练运行状况为什么研究时间压缩迭代人工智能崎岖地形生产收敛的驱动程序基础设施集群机器学习配置动程序训练节点 SageMaker 计算 AI Amazon 机器人作业 GPU 训练任务