统计数据中最基本的问题,无监督的学习和属性测试涉及以下方案:可以观察到被认为是从未知概率分布p中明确绘制的数据;说P是离散的,并且在[D] = {1,2,。。。,D}。任务是学习,测试或估计p的某些属性。完全估算p到误差ǫ(例如,总变化距离)需要θ(d/ǫ2)样本,因此,当d很大时,可能只想学习或测试p的部分方面。进行检查,一个人可能只想估计一些已知的,固定的随机变量A 1,。。。,a m:[d]→[0,1](有时在学习/隐私文献中称为“统计查询”)。或者,一个人可能想在某些两个或多个假设分布q 1中执行假设选择。。。,[d]上的q m。通常很简单地确定这些任务所需的最佳样本复杂性。例如,很容易证明一个人可以同时估计所有期望e p [a 1],。。。,e p [a m]使用n = o(((log m) /ǫ2)样品(独立于d)的批次的精度±ǫ:一个人简单地计算每个a i的经验平均值,重用每个计算中的样本。
主要关键词