摘要 — 机器学习 (ML) 在过去十年中取得了巨大进步,并被应用于各种关键的现实应用。然而,最近的研究表明,ML 模型容易受到多种安全和隐私攻击。特别是,针对 ML 模型的后门攻击最近引起了人们的广泛关注。成功的后门攻击会造成严重后果,例如允许对手绕过关键的身份验证系统。当前的后门技术依赖于在 ML 模型输入上添加静态触发器(具有固定模式和位置),而这些触发器很容易被当前的后门检测机制检测到。在本文中,我们提出了第一类针对深度神经网络 (DNN) 的动态后门技术,即随机后门、后门生成网络 (BaN) 和条件后门生成网络 (c-BaN)。我们的技术生成的触发器可以具有随机模式和位置,从而降低当前后门检测机制的有效性。特别是,基于新型生成网络的 BaN 和 c-BaN 是前两种通过算法生成触发器的方案。此外,c-BaN 是第一种条件后门技术,给定目标标签,它可以生成特定于目标的触发器。BaN 和 c-BaN 本质上都是一个通用框架,为对手提供了进一步定制后门攻击的灵活性。我们在三个基准数据集上对我们的技术进行了广泛的评估:MNIST、CelebA 和 CIFAR-10。我们的技术在后门数据上实现了近乎完美的攻击性能,而效用损失可以忽略不计。我们进一步表明,我们的技术可以绕过当前最先进的后门攻击防御机制,包括 ABS、Februus、MNTD、Neural Cleanse 和 STRIP。
主要关键词