我们提出了一种方法,旨在优化穿越敌方高射炮占领的飞行走廊的飞行路径。这与穿越完全或部分由此类枪支控制的空域的所有类型的飞机、导弹和无人机相关。为此,我们使用 Q 学习 - 一种强化(机器)学习 - 它试图通过重复的半随机飞行路径试验找到避开高射炮的最佳策略。Q 学习可以在不直接对高射炮进行建模的情况下产生穿越敌方火力的最佳飞行路径。仍然需要对手的反应,但这可以来自黑盒模拟、用户输入、真实数据或任何其他来源。在这里,我们使用内部工具来生成防空火力。该工具模拟由火控雷达和卡尔曼飞行路径预测滤波器引导的近防武器系统 (CIWS)。Q 学习还可以通过神经网络(即所谓的深度 Q 学习 (DQN))进行补充,以处理更复杂的问题。在这项工作中,我们使用经典 Q 学习(无神经网络)展示了一个防空炮位的亚音速飞行走廊通行结果。