从运动控制到具身智能

使用人类和动物的动作教机器人运球,并模拟人形角色搬运箱子和踢足球

来源:DeepMind - 新闻与博客

研究

从运动控制到具身智能

已发布2022 年 8 月 31 日作者Siqi Liu、Leonard Hasenclever、Steven Bohez、Guy Lever、Zhe Wang、S. M. Ali Eslami、Nicolas Heess
已发布
2022 年 8 月 31 日
作者
Siqi Liu、Leonard Hasenclever、Steven Bohez、Guy Lever、Zhe Wang、S. M. Ali Eslami、Nicolas Heess

Siqi Liu、Leonard Hasenclever、Steven Bohez、Guy Lever、Zhe Wang、S. M. Ali Eslami、Nicolas Heess

使用人类和动物的动作教机器人运球球,并模拟人形角色搬运箱子和踢足球

人形角色通过反复试验学习穿越障碍赛道,这可能会导致独特的解决方案。Heess 等人。“丰富环境中运动行为的出现”(2017 年)。
人形角色通过反复试验学习穿越障碍赛道,这可能会导致独特的解决方案。Heess 等人。“丰富环境中运动行为的出现”(2017 年)。

人形角色通过反复试验学习穿越障碍赛道,这可能会导致独特的解决方案。Heess 等人。“丰富环境中运动行为的出现”(2017 年)。

五年前,我们接受了教一个完全清晰的人形角色穿越障碍赛道的挑战。这证明了强化学习 (RL) 可以通过反复试验实现的目标,但也强调了解决具身智能的两个挑战:

穿越障碍赛道 具身
  • 重复使用以前学到的行为:代理需要大量数据才能“起飞”。由于对每个关节施加的力量没有任何初步了解,代理开始随机抽搐身体并迅速摔倒在地。通过重复使用以前学到的行为可以缓解此问题。
  • 重复使用以前学到的行为: 特殊行为: 尽管很有趣 人形足球论文,

    使用 NPMP 将数据提炼为可控运动原语

    通过 RL