指纹识别代码与几何学相遇:改进隐私查询发布和自适应数据分析的下限

指纹代码是证明差分隐私下限的重要工具。它们已用于证明几个基本问​​题的严格下限,尤其是在“低准确度”制度下。然而,与重构/差异方法不同,它们更适合证明最坏情况下限,用于自然产生于指纹代码构造的查询集。在这项工作中,我们提出了一个证明指纹类型下限的通用框架,该框架允许我们根据查询集的几何形状定制该技术。我们的方法允许我们……

来源:Apple机器学习研究

指纹编码是证明差分隐私下限的重要工具。它们已用于证明几个基本问​​题的严格下限,尤其是在“低准确度”情况下。然而,与重构/差异方法不同,它们更适合证明最坏情况下限,适用于指纹编码构造自然产生的查询集。在这项工作中,我们提出了一个证明指纹类型下限的通用框架,该框架使我们能够根据查询集的几何形状定制该技术。我们的方法使我们能够证明几个新结果。

首先,我们表明,任何(样本和总体)精确算法,对于在 X\mathcal{X}X 范围内回答 QQQ 任意自适应计数查询达到准确度 α\alphaα 都需要 Ω(log⁡∣X∣⋅log⁡Qα3)\Omega(\frac{\sqrt{\log |\mathcal{X}|}\cdot \log Q}{\alpha^3})Ω(α3log∣X∣​⋅logQ​) 个样本。这表明基于差分隐私的方法是针对该问题的最佳方法,并且显著改进了先前已知的 log⁡Qα2\frac{\log Q}{\alpha^2}α2logQ​ 和 min⁡(Q,log⁡∣X∣)/α2\min(\sqrt{Q}, \sqrt{\log |\mathcal{X}|})/\alpha^2min(Q​,log∣X∣​)/α2 的下限。其次,我们表明任何 (ε,δ)(\varepsilon,\delta)(ε,δ)-DP 算法对于回答 QQQ 计数查询的准确率为 α\alphaα 都需要 Ω(dlog⁡(1/δ)log⁡Qεα2)\Omega\left( \frac{\sqrt{d \log(1/\delta)} \log Q}{\varepsilon \alpha^2} \right)Ω(εα2dlog(1/δ)​logQ​) 样本。我们的框架可以直接证明这个界限,并通过组合将 Bun、Ullman 和 Vadhan (2013) 证明的界限提高了 log⁡(1/δ)\sqrt{\log(1/\delta)}log(1/δ)​。第三,我们描述了在近似差分隐私下回答一组随机 0-1 查询的样本复杂度。为了实现这一点,我们给出了新的上限和下限,结合现有的界限,我们可以完成整个过程。

QQ QQ QQ QQ X\mathcal{X}X X\mathcal{X} X\mathcal{X} X\mathcal{X} X X \mathcal{X} X X X α\alphaα α\alpha α\alpha α\alpha α α α