Loading...
机构名称:
¥ 1.0

摘要 - 强化学习(RL)正在迅速成为空中交通管理和控制(ATM/ATC)中的主要研究方向。许多国际财团和个人作品都探索了其对不同ATC和U空间 / Urban Aircraft系统交通管理(UTM)任务的适用性,例如合并交通流,成功的水平有所不同。但是,迄今为止,还没有比较这些RL技术的共同基础,许多研究方从头开始构建自己的模拟器和场景。这可能会降低这项研究的价值,因为算法的性能无法轻易验证,也不能与其他实现相比。从长远来看,这会阻碍发展。体育馆图书馆显示了其他研究领域的库,可以通过提供一组标准化环境来解决,这些环境可用于测试不同的算法,并将它们与基准结果进行比较。本文提出了Bluesky-gym:为航空域提供类似的测试环境的库,建立在现有的开源空中交通模拟器Bluesky上。当前的Bluesky-Gym环境从垂直下降环境到静态障碍物和交通流量的合并。建立在体育馆API和Bluesky空中交通模拟器上,为ATC特定的RL性能基准提供了开源解决方案。在Bluesky-Gym的初始发布中,提出了7个功能环境。本文提出了PPO,SAC,DDPG和TD3的初步实验。结果表明,在所有环境中都具有默认超参数的所有环境。在某些环境中,出现较大的性能差距,并且在政策PPO上经常落后,但总的来说,没有明确的算法在总奖励方面超过了其他人的表现。关键字 - 空气流量管理(ATM),增强学习,自动化,基准测试,人工智能

Bluesky-Gym:空中交通应用的加固学习环境

Bluesky-Gym:空中交通应用的加固学习环境PDF文件第1页

Bluesky-Gym:空中交通应用的加固学习环境PDF文件第2页

Bluesky-Gym:空中交通应用的加固学习环境PDF文件第3页

Bluesky-Gym:空中交通应用的加固学习环境PDF文件第4页

Bluesky-Gym:空中交通应用的加固学习环境PDF文件第5页