通过AI：可靠的深入加固学习，用于交通信号控制__

通过AI：可靠的深入加固学习，用于交通信号控制

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过AI：可靠的深入加固学习，用于交通信号控制

¥ 1.0

热度

代理商的输入包括在先前时间段记录的车辆计数和平均速度，以及当前交通信号灯计划中阶段之间的绿时间分布。代理从预定义的列表中选择一个交通灯程序，每个程序仅在周期长度和绿色时间分布方面变化。此动作空间设计反映了现实世界中的交集管理约束。奖励功能，对于指导代理商的性能至关重要，使用负累积的等待时间作为反馈。这确保代理人不会优先考虑一种方法，而不是另一种方法。为了训练代理商，我们采用了良好的深入增强学习方法，深Q网络（DQN），并与Epsilon-Greedy Exploration策略结合使用。

添加pdf代下载 VIP点击下载文件