基于变压器的LLM的潜力因其依赖广泛的数据集而受到隐私问题的阻碍,可能包括敏感信息。诸如GDPR和CCPA之类的监管措施呼吁使用强大的AU介绍工具来解决潜在的隐私问题,并使用会员推理攻击(MIA)是评估LLMS隐私风险的主要方法。与传统的MIA方法不同,通常需要对其他模型进行计算进行计算训练,本文介绍了一种有效的方法,该方法通过在嵌入空间中添加随机噪声来为目标样本提供嘈杂的邻居,仅在嵌入式空间中添加随机噪声,要求仅在推论模式下操作目标模型。我们的发现表明,这种方法与采用阴影模型的有效性密切相匹配,显示了其在实践隐私审核场景中的能力。
主要关键词