指纹识别(或复制检测)存储数据库中所有AI生成内容的哈希,例如。Neuralhash(Apple Inc.,2021年)。这些哈希是向量表示∈{0,1} k或r k通常是由自我保护的特征提取器生成的(Oquab等人。,2023; Devlin等。,2018年)。查询一块内容时,我们将其哈希与数据库中的哈希进行了比较,并确定它是否是重新发电的副本。在大规模上,存储哈希并通过它们进行搜索很麻烦,并且反向搜索必须近似以易于处理(Douze等人。,2024)。此外,功能提取器对内容修改并不完全鲁棒:例如,音频及其×1.25速度版本可能具有不同的哈希。这两个因素会导致错误,尤其是在对抗环境中(Douze等人,2021; Papakipos等。,2022)。另一个缺点是需要将哈希存储在数据库中,这使得很难共享,而开源场景不可能。