点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
[1] Dorfman等。离线元RL - 可识别性挑战和有效的数据收集策略,2021 [2] Yu等。元世界:多任务和元加强学习的基准和评估,2019 [3] Rakelly等。通过概率上下文变量有效的非政策元提升学习,2019
主要关键词