详细内容或原文请订阅后点击阅览
一个名为Dreamer的人工智能学会了在Minecraft中开采钻石的人 - 不被教导
一种自我资助的算法掌握了一项复杂的游戏任务,暗示了AI的新时代。
来源:ZME科学在Minecraft的块状景观中,每天数以百万计的玩家挖,建造和战斗。但是有一天,一个新人以他的钻石采矿技巧打破了比赛,这是游戏最珍贵的资源。
Minecraft新来者不是玩家,而是由Google DeepMind开发的人工智能系统,称为Dreamer。从Noob到Grand Master的旅程可能会瞥见智能机器的未来。
Dreamer学习学习
任务仅在名称上很简单:收集钻石。对于人类而言,这已经是一个涉及的过程。您需要将树木切成木头,修理桌子,建造一条拾音器,收集石头和铁,然后陷入一个随机生成的世界的深处 - 沿途躲避熔岩和危险 - 甚至有机会找到闪烁的宝石。
现在可以想象在零指导下完成所有操作。
梦想家就是这样做的。它没有被教导玩Minecraft,也没有显示人类如何做的例子。取而代之的是,除了游戏的规则和目标外,它一无所有:冰(钻石)。
使用一种称为强化学习的技术,AI实验了其前进的方向。它尝试了不同的动作,在取得进步时获得了少量奖励 - 并从错误中学到了学到的东西。
增强学习“梦想家标志着迈向通用AI系统的重要一步,” Google DeepMind的计算机科学家Danijar Hafner告诉Nature。 “它允许AI理解其物理环境,并且可以随着时间的流逝而自我破坏,而无需人类必须确切地告诉它该怎么做。”
自然这项壮举在本月在自然界发表的一篇论文中描述,远非微不足道。与国际象棋或棋子不同 - 带有固定板和完美信息的游戏 - Minecraft每次都凌乱,开放式和不同。每个新的游戏会议都会产生一个独特的世界,其中包括森林,沙漠,海洋和隐藏的地下洞穴。为了取得成功,AI必须发展灵活的技能并学习如何概括。