本文介绍了军事内强大的自动网络防御(ACD)代理商的发展和培训。我们提出了一种架构,该体系结构集成了包括多代理增强学习(MARL),大语言模型(LLMS)的混合AI模型,并将基于规则的系统和一个基于规则的系统纳入分布在网络设备上的蓝色和红色代理团队中。主要目标是自动化关键的网络安全任务,例如监视,检测和缓解措施,从而增加网络安全专业人员保护关键军事基础设施的能力。该体系结构旨在在现代网络环境中运行,其特征是分段云和软件定义的控制器,这些控制器有助于ACD代理和其他网络安全工具的部署。在自动化网络操作(ACO)体育馆中评估了代理团队,该体育馆模拟了北约受保护的核心网络,并可以对自主剂进行可重现的培训和测试。本文以对ACD代理的训练中遇到的主要挑战进行了检查,特别关注培训阶段的数据安全性和AI模型的鲁棒性。
主要关键词