摘要 - 城市地区对道路使用的需求不断增长,导致了巨大的交通拥堵,构成了挑战,这些挑战仅通过基础设施扩张而减轻了昂贵的挑战。作为替代方案,优化现有的流量管理系统,尤其是通过自适应交通信号控制,提供了有希望的解决方案。本文探讨了使用加固学习(RL)来增强相互作用的交通信号操作,旨在减少没有大量传感器网络的拥塞。我们介绍了两种基于RL的算法:一个基于回合的代理,该算法根据实时队列长度动态优先考虑流量信号,以及一个基于时间的代理,该代理在遵循固定相位周期的同时根据交通条件调整信号相位持续时间。通过将状态表示为标量队列长度,我们的方法简化了学习过程并降低了部署成本。使用七个评估指标在四个不同的交通情况下对算法进行了测试,以全面评估性能。仿真结果表明,这两种RL算法都显着超过常规交通信号控制系统,突出了它们有效改善城市交通流的潜力。
主要关键词