点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
AFRL 正在使用名为强化学习 (RL) 的机器学习工具来训练智能代理在环境中采取行动,目标是最大化整体长期回报。RL 基于操作性条件作用的心理学概念,例如,可用于通过正强化和负强化来训练狗。由于 RL 在具有高维状态空间、复杂规则结构和未知动态的环境中表现出色,因此在本项目中使用了 RL。使用传统的、强大的决策工具很难制定可靠且高性能的解决方案。然而,RL 已证明能够在从围棋等棋盘游戏、星际争霸等实时战略游戏到阿尔法空战等军事交战场景等突破性领域创造出优于人类的代理。
主要关键词