dreamerv3:AI掌握了Minecraft和150多个World Models

Dreamer是一种强化算法,可以通过建立世界模型来掌握各种控制任务。与需要为每个新任务进行大量微调的专业算法不同,Dreamer可以使用固定的超级参数执行各种域。该算法由三个主要组成部分组成:一种世界模型,可以预测可能的文档的结果,[…] Dreamerv 3:AI掌握Minecraft和150多个具有世界模型的150多个数据的AI首次出现在AI新闻上。

来源:AI新闻
Dreamer超过了具有固定的超级参数的八个不同域(包括Atari Games,Procgen,DMLAB,机器人运动)的150多个数据的专业算法。强化学习算法可以通过建立世界模型来掌握各种控制任务。与针对每个新任务需要大量罚款的专业算法不同,Dreamer可以处理具有固定超级参数的各种域。通过强大的学习技术,Dreamer在几个不同的比较点上的表现要比专业专家的表现更好,并且是第一个在没有人类示范数据的情况下完全从头开始收集钻石的算法。 Minecrafti Minecraft上下文中的信息涉及钻石收集。 Dreamer在理解游戏不同的地形和机制方面的成功来强调了Dreamer驾驶这项复杂任务的能力。 Dreamer技术如何应用​​于模拟之外的真实机器人系统? “机器人模拟”,该模拟表明技术是考虑到机器人技术的。 Dreamer使用固定的超参数处理不同领域的能力对于真正的机器人