详细内容或原文请订阅后点击阅览
Wasserstein 距离中的实例最优私有密度估计
从样本中估计分布的密度是统计学中的一个基本问题。在许多实际情况下,Wasserstein 距离是密度估计的合适误差度量。例如,在估计某个地理区域的人口密度时,较小的 Wasserstein 距离意味着估计值能够大致捕捉到人口质量的位置。在这项工作中,我们研究了 Wasserstein 距离中的差分隐私密度估计。我们设计并分析了可以适应简单实例的该问题的实例优化算法。对于分布……
来源:Apple机器学习研究从样本中估计分布的密度是统计学中的一个基本问题。在许多实际设置中,Wasserstein 距离是密度估计的合适误差度量。例如,在估计某个地理区域的人口密度时,较小的 Wasserstein 距离意味着估计值能够大致捕捉到人口质量的位置。在这项工作中,我们研究了 Wasserstein 距离中的差分隐私密度估计。我们设计并分析了可以适应简单实例的此问题的实例优化算法。
对于 R\mathbb{R}R 上的 PPP 分布,我们考虑了一个强大的实例优化概念:对于某个分布 QPQ_PQP,其概率密度函数 (pdf) 在 PPP 的 pdf 的 2 倍以内,统一实现实例最优估计率的算法与被告知分布为 PPP 或 QPQ_PQP 的算法具有竞争力。对于 R2\mathbb{R}^2R2 上的分布,我们使用不同的实例最优概念。如果一个算法与给定分布密度的常数因子乘法近似的算法具有竞争力,我们就说该算法是实例最优的。我们描述了这两种设置中的实例最优估计率,并表明它们是均匀可实现的(最多多对数因子)。我们针对 R2\mathbb{R}^2R2 的方法通过分层分离的树扩展到任意度量空间。作为一个特例,我们的结果导致离散分布的 TV 距离中的实例最优私人学习。
PPP PP