详细内容或原文请订阅后点击阅览
BYOL-探索:使用引导式预测进行探索
我们提出了 BYOL-Explore,这是一种概念简单但通用的方法,用于在视觉复杂的环境中进行好奇心驱动的探索。BYOL-Explore 通过优化潜在空间中的单个预测损失(无需额外的辅助目标)来学习世界表征、世界动态和探索策略。我们表明 BYOL-Explore 在 DM-HARD-8 中是有效的,DM-HARD-8 是一个具有挑战性的部分可观察连续动作硬探索基准,具有视觉丰富的 3-D 环境。
来源:DeepMind - 新闻与博客研究
BYOL-Explore:利用 Bootstrapped 预测进行探索
- 发表于2022年6月20日作者赵涵·丹尼尔·郭、尚塔努·塔库尔、米鲁娜·皮斯拉尔、贝尔纳多·阿维拉·皮雷斯、弗洛伦特·阿尔切、科伦坦·塔莱克、阿拉·萨德、丹尼尔·卡兰德列洛、让-巴斯蒂安·格里尔、云浩、米哈尔·瓦尔科、坦格什、拉吉米德·穆尼尔、巴利尔·B·皮奥特< /div>
郭兆涵、Shantanu Thakoor、Miruna Pîslar、Bernardo Avila Pires、Florent Altché、Corentin Tallec、Alaa Saade、Daniele Calandriello、Jean-Bastien Grill、唐云浩、Michal Valko、Rémi Munos、Mohammad Gheshlaghi、Bilal Piot Azar < /div>
BYOL-Explore 智能体解决 DM-HARD-8 级别的 Thow-Across 问题的第二人称和自上而下的视图,而纯 RL 和其他基线探索方法未能在 Thow-Across 上取得任何进展。
引导你自己的潜在 计算机视觉 图表示学习 RL 中的表示学习