学生教 AI 玩 Atari 2600（+ 视频） XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

学生教 AI 玩 Atari 2600（+ 视频）

2017年4月24日 10:30 33 Comments

Студенты Стэнфордского университета недавно смогли запустит на старенькой игровой консоли Atari 2600 такую сложную иг ру，как Месть Монтесумы под управлением ИИ。 Эти начинающие исследователи надеются, что подобный подход может пригодиться и в будущем, когда простые домохозяйки возьмутся за обучение роботов и ИИ.

来源:Robogeek新闻频道（关于机器人技术的俄罗斯与世界新闻）

斯坦福大学的学生最近能够在旧的 Atari 2600 游戏机上在人工智能控制下运行《蒙特祖玛的复仇》这样复杂的游戏。这些崭露头角的研究人员希望这种方法在未来有用，当普通家庭主妇承担训练机器人和人工智能的任务时。

正如该研究的合著者之一拉塞尔·卡普兰 (Russell Kaplan) 在接受采访时所说：“普通人应该能够与他们的汽车对话。”

为了教 AI 如何玩《蒙特祖玛的复仇》，他们训练 AI 模型识别人类语言命令和游戏动作，而不是按照游戏像素数据模式训练 AI 模型的通常方法，直到它知道如何获胜。然后研究人员通过“获得奖励”或“抓住绳子”等指令来引导人工智能。

经过这样的训练，AI能够获得3500分的高分。这是一个令人印象深刻的分数，但还不是最好的——去年，谷歌 DeepMind 实验室的人工智能模型在这款游戏中获得了 6,600 分，这是机器的最高分。然而，学生们指出，由于机器的处理能力有限，他们无法像 DeepMind 那样彻底地训练人工智能。

《蒙特祖玛的复仇》对于计算机来说尤其困难，因为该游戏的奖励很少，例如在充满危险的房间中获得钥匙，这使得机器很难了解哪些游戏操作会导致胜利。 DeepMind 通过创建新的数学能力来指导人工智能研究来实现这一点。斯坦福大学团队采取了不同的方法：他们不使用伪奖励，而是训练计算机理解人类语言的命令。虽然这更让人想起人类与机器人的互动。

也许将来可以通过这种方式教家庭机器人复杂的烹饪艺术：“拿着这个勺子。现在混合配料。一切都准备好了！”

复仇复杂的蒙特人工智能能够方法 DeepMind 祖玛能力训练奖励游戏 AI 获得人类机器人

学生教 AI 玩 Atari 2600（+ 视频）

其他外部链接

Tags

XiaoMi-AI