Loading...
机构名称:
¥ 1.0

空中交通管制是在高度动态和随机环境中的实时安全关键决策过程。在当今的航空实践中,人类空中交通管制员监控并指挥多架飞机飞过其指定空域。随着传统(商用客机)和低空(无人机和 eVTOL 飞机)空域的空中交通复杂性快速增长,需要一个自主空中交通控制系统来适应高密度空中交通并确保飞机之间的安全分离。我们提出了一个深度多智能体强化学习框架,该框架能够识别和解决具有多个交叉点和合并点的高密度、随机和动态航路区中的飞机之间的冲突。所提出的框架采用了演员-评论家模型 A2C,该模型结合了近端策略优化 (PPO) 的损失函数来帮助稳定学习过程。此外,我们使用集中学习、分散执行方案,其中一个神经网络由环境中的所有代理学习和共享。我们表明,我们的框架既可扩展又高效,可容纳大量进场飞机,实现极高的交通吞吐量和安全保障。我们通过在 BlueSky 环境中进行大量模拟来评估我们的模型。结果表明,在极端高密度空中交通场景中,我们的框架能够分别解决交叉点和合并点的 99.97% 和 100% 的所有冲突。

自主空中交通管制员:深度多智能体强化学习方法

自主空中交通管制员:深度多智能体强化学习方法PDF文件第1页

自主空中交通管制员:深度多智能体强化学习方法PDF文件第2页

自主空中交通管制员:深度多智能体强化学习方法PDF文件第3页

自主空中交通管制员:深度多智能体强化学习方法PDF文件第4页

自主空中交通管制员:深度多智能体强化学习方法PDF文件第5页

相关文件推荐

2009 年
¥42.0
2022 年
¥3.0