点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要:这项工作评估并分析了模仿学习(IL)和可区分模型预测控制(MPC)的组合,以应用类似人类的自主驾驶。我们将MPC与基于层次学习的政策相结合,并在开环和闭环中衡量其与人类驾驶特征的安全性,舒适性和相似性相关的指标。我们还展示了通过闭环训练增强开环行为克隆的价值,以进行更强大的学习,从而通过MPC使用的状态空间模型近似策略梯度。我们对巷道控制系统进行实验评估,从固定基础驾驶模拟器上收集的示范中学到的学历,并表明我们的模仿策略接近了人类驾驶风格的偏好。
主要关键词