本报告旨在分析不断演变的恶意软件对网络安全系统构成的威胁,特别关注生成和分类过程,以及这些过程的性能如何因不平衡的数据集而严重降低,最终对机器学习模型的性能产生不利影响。本报告旨在通过有效利用生成对抗网络 (GAN) 来应对这些挑战。GAN 将用于增强和平衡受影响的 Malimg 数据集。该报告将对有利于生成灰度恶意软件图像的不同 GAN 架构进行比较分析。这直接相关,因为本报告中考虑的数据集由灰度图像组成。该报告重点关注 Malimg 数据集的类别 Allaple.a,该类别以其在 25 个不同类别中拥有相当大的数据集而闻名。该报告将在 Allaple.a 上测试不同的 GAN 模型。所有将要测试的不同模型都已在不平衡的数据集上进行了仔细训练,并且将根据其特定的生成器和鉴别器损失以及 Fréchet 初始距离 (FID) 分数分析每个模型的有效性。这项评估不仅会平衡数据集,还会对原始恶意软件图像的脆弱性产生保护作用。除此之外,该报告还将观察这些合成平衡数据集对标准恶意软件分类模型的影响。我们提出了用于恶意软件图像生成的模型 MalGAN,并将其与现有模型进行了比较。
主要关键词