Video Friday: Gemini Robotics Improves Motor Skills
视频星期五是您每周选择的令人敬畏的机器人视频,由您的朋友在IEEE Spectrum Robotics收集。我们还发布了接下来几个月即将举行的机器人事件的每周日历。请向我们发送您的活动。 Gemini Robotics 1.5是我们最强大的视觉语言操作(VLA)模型,它将视觉信息和说明转换为电动机命令,以执行任务。该模型在采取行动并显示其过程之前就考虑一下,帮助机器人更透明地评估和完成复杂的任务。它还跨实施例学习,加速技能学习。[Google DeepMind]一个简单的“力量拉”手势将卡特直接进入了她的手。这是一个很棒的例子,说明直觉互动如何能够将复杂的技术转化为我们意图的扩展。[Robus