详细内容或原文请订阅后点击阅览
Minecraft 人工智能系统:MIPT 团队赢得国际 MineRL 竞赛
MIPT 认知动态系统实验室的员工成为 MineRL 竞赛的获胜者。他们提出了一种新的基于演示的强化学习方法,可以快速有效地解决 Minecraft 环境中的分层问题:寻找资源并创建新工具。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)MIPT 认知动态系统实验室的员工成为 MineRL 竞赛的获胜者。他们提出了一种新的基于演示的强化学习方法,可以快速有效地解决 Minecraft 环境中的分层问题:寻找资源并创建新工具。
在创建自主移动机器人和机器人操纵器时可以使用开发的算法。该竞赛是 2019 年神经网络技术神经信息处理系统国际会议的一部分。
强化学习是最有前途的人工智能方法之一,它在游戏和机器人任务中取得了惊人的成功,但需要大量的计算资源和训练时间。 MIPT 认知动态系统实验室和 IU RAS 联邦研究中心人工智能问题研究所的员工和学员 - Alexey Skrynnik、Ermek Aitygulov、Alexey Staroverov、Kirill Aksenov、Vasily Davydov 和 Alexander Panov - 提出了一种新方法,使用忘记解决给定问题的错误专家演示的机制。
“实验室团队取得了优异的成绩,在国际会议上充分代表了 Phystech 和俄罗斯。在《我的世界》游戏环境中,我们能够展示代理的智能行为,它实现了与复杂、不可预测的外部环境的各种不同类型的人类交互。从这方面来说,它是一个优秀的模拟器,接近现实,并且对于它来说,开发训练行为的方法比围棋、Dota 或星际争霸等环境要困难得多。我们提出的方法为强化学习在应用问题中的应用开辟了新途径,例如无人驾驶车辆和机器人操纵器。”认知建模中心认知动态系统实验室负责人亚历山大·帕诺夫说。