情境感知深度强化学习... - arXiv
机构名称:
¥ 1.0

摘要 —随着无人机技术的快速发展,无人机被广泛应用于包括军事领域在内的许多应用领域。本文提出了一种新型的基于情境感知 DRL 的自主非线性无人机机动性控制算法,应用于网络物理巡飞弹药。在战场上,基于 DRL 的自主控制算法的设计并不简单,因为通常无法收集现实世界的数据。因此,本文的方法是利用 Unity 环境构建网络物理虚拟环境。基于虚拟网络物理战场场景,可以设计、评估和可视化基于 DRL 的自动非线性无人机机动性控制算法。此外,在现实战场场景中,存在许多不利于线性轨迹控制的障碍物。因此,我们提出的自主非线性无人机机动性控制算法利用了情境感知组件,这些组件是在 Unity 虚拟场景中使用 Raycast 函数实现的。基于收集到的态势感知信息,无人机可以在飞行过程中自主且非线性地调整其轨迹。因此,这种方法显然有利于在布满障碍物的战场上避开障碍物。我们基于可视化的性能评估表明,所提出的算法优于其他线性移动控制算法。

情境感知深度强化学习... - arXiv

情境感知深度强化学习... - arXivPDF文件第1页

情境感知深度强化学习... - arXivPDF文件第2页

情境感知深度强化学习... - arXivPDF文件第3页

情境感知深度强化学习... - arXivPDF文件第4页

情境感知深度强化学习... - arXivPDF文件第5页

相关文件推荐

约束抽样强化学习
2022 年
¥1.0