学生教 AI 玩 Atari 2600(+ 视频)

Студенты Стэнфордского университета недавно смогли запустит на старенькой игровой консоли Atari 2600 такую сложную иг ру,как Месть Монтесумы под управлением ИИ。 Эти начинающие исследователи надеются, что подобный подход может пригодиться и в будущем, когда простые домохозяйки возьмутся за обучение роботов и ИИ.

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

斯坦福大学的学生最近能够在旧的 Atari 2600 游戏机上在人工智能控制下运行《蒙特祖玛的复仇》这样复杂的游戏。 这些崭露头角的研究人员希望这种方法在未来有用,当普通家庭主妇承担训练机器人和人工智能的任务时。

正如该研究的合著者之一拉塞尔·卡普兰 (Russell Kaplan) 在接受采访时所说:“普通人应该能够与他们的汽车对话。”

为了教 AI 如何玩《蒙特祖玛的复仇》,他们训练 AI 模型识别人类语言命令和游戏动作,而不是按照游戏像素数据模式训练 AI 模型的通常方法,直到它知道如何获胜。然后研究人员通过“获得奖励”或“抓住绳子”等指令来引导人工智能。

经过这样的训练,AI能够获得3500分的高分。这是一个令人印象深刻的分数,但还不是最好的——去年,谷歌 DeepMind 实验室的人工智能模型在这款游戏中获得了 6,600 分,这是机器的最高分。然而,学生们指出,由于机器的处理能力有限,他们无法像 DeepMind 那样彻底地训练人工智能。

《蒙特祖玛的复仇》对于计算机来说尤其困难,因为该游戏的奖励很少,例如在充满危险的房间中获得钥匙,这使得机器很难了解哪些游戏操作会导致胜利。 DeepMind 通过创建新的数学能力来指导人工智能研究来实现这一点。斯坦福大学团队采取了不同的方法:他们不使用伪奖励,而是训练计算机理解人类语言的命令。虽然这更让人想起人类与机器人的互动。

也许将来可以通过这种方式教家庭机器人复杂的烹饪艺术:“拿着这个勺子。现在混合配料。一切都准备好了!”