强化学习是一项令人兴奋的新兴技术,可广泛适用于国防部 (DoD) 的一系列任务领域。它是一种机器学习的形式,其中根据代理的表现通过奖励和惩罚来训练代理。深度强化学习 (DRL) 已显示出在复杂和高维环境中找到有效策略的能力,例如学习玩《星际争霸》或《古代防御》等策略游戏。因此,国防部正在投资模拟环境,以训练自主代理解决具有挑战性的国防部问题。例如,该实验室帮助开发了美国陆军环境,用于训练人工智能代理以防御无人机系统、火箭、火炮和迫击炮威胁。同样,国防高级研究计划局开发了 AlphaDogfight 环境来训练完全自主的飞行员进行空战。
主要关键词