Loading...
机构名称:
¥ 1.0

摘要。对智能车辆的轨迹进行建模是流量模拟系统的重要组成部分。但是,这种轨迹预定符通常受过训练,以模仿人类驾驶员的运动。模仿模型通常没有捕获数据分配长尾端的安全关键事件,尤其是在涉及多个驱动程序的综合环境下。在本文中,我们提出了一种游戏理论的观点,以通过对通用马尔可夫游戏中的车辆的竞争相互作用进行建模,并以相关的平衡来表征这些挑战的竞争。为了实现这一目标,我们为预测自动驾驶场景的环境动态的生成性世界模型提供了预算。基于这个世界模型,我们通过将乐观的Bellman更新和磁性镜下降纳入多代理增强学习(MARL)算法的目标函数来探测用于识别粗相关平衡(CCE)的动作预测因子。我们进行了广泛的实验,以证明我们的算法在有效地关闭CCE间隙并在竞争性自动驾驶环境下产生有意义的轨迹方面优于其他基准。该代码可在以下网址提供:https://github.com/qiaoguanren/marl-cce。

在生成世界模型下的自主驾驶中建模竞争行为

在生成世界模型下的自主驾驶中建模竞争行为PDF文件第1页

在生成世界模型下的自主驾驶中建模竞争行为PDF文件第2页

在生成世界模型下的自主驾驶中建模竞争行为PDF文件第3页

在生成世界模型下的自主驾驶中建模竞争行为PDF文件第4页

在生成世界模型下的自主驾驶中建模竞争行为PDF文件第5页

相关文件推荐

2024 年
¥4.0
2025 年
¥6.0
2024 年
¥5.0
2024 年
¥3.0
2024 年
¥1.0