点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
用于机器人感知,计划和控制的经典学习方法倾向于针对特定的技能和实施方案,这是因为很难提取可转移和可操作的表述,而这些表示对环境和代理的物理特性不变(例如,物理或模拟机器人)。但是,这种专业代理的性能可以受到较低的模型容量和相对较少的示例培训的限制。当解决单个机器人上大规模数据收集成本的复杂和长期任务时,这可能是尤其有问题的,并且要学会的策略的复杂性可能会受益于更具表现力的功能类(即具有更多的参数)。
主要关键词