Loading...
机构名称:
¥ 1.0

本文介绍了课程交织在一起的在线行为克隆(IOBC),作为一种培训代理进行军事行动的方法,不仅应对复杂和动态的战斗场景所带来的挑战,还解决了军事教义和策略如何转移到这些代理商中。它突出了传统强化学习(RL)方法的局限性,并提出了与课程学习结合结合的在线行为克隆,作为增强RL代理培训的解决方案。通过利用基于规则的代理进行培训期间的指导,IOBC可以加速学习并改善RL代理的表现,尤其是在培训和复杂场景的早期阶段。该研究使用Lealegsim(一种以增强性学习为中心的模拟环境)进行了实验,证明了我们方法在增强剂性能和可伸缩性方面的有效性。结果表明,IOBC在没有指导的情况下明显胜过RL代理,为在具有挑战性的环境中提供了稳定的学习基础。这些发现突显了IOBC在现实世界中的军事应用中的潜力。

WSC'22准备手稿

WSC'22准备手稿PDF文件第1页

WSC'22准备手稿PDF文件第2页

WSC'22准备手稿PDF文件第3页

WSC'22准备手稿PDF文件第4页

WSC'22准备手稿PDF文件第5页

相关文件推荐

2024 年
¥1.0
2022 年
¥4.0
2025 年
¥3.0
2023 年
¥9.0
2023 年
¥12.0
2024 年
¥1.0
2021 年
¥42.0
2023 年
¥7.0
2023 年
¥3.0
2024 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2024 年
¥2.0
2023 年
¥23.0
2022 年
¥1.0
2025 年
¥1.0
2023 年
¥3.0
2020 年
¥3.0
2024 年
¥2.0
2023 年
¥2.0
2024 年
¥1.0
2023 年
¥9.0
2022 年
¥3.0