Universally Instance-Optimal Mechanisms for Private Statistical Estimation
我们考虑了在差异隐私的约束下,实例 - 最佳统计估计的问题,机制必须适应输入数据集的难度。我们证明了使用新的差异来确定实例特定的下限,并证明它是局部统计估计的局部最小值最佳率。我们提出了两种新的机制,这些机制在实例上是最佳的,对于对数因素而言,对于一般估计问题而言。我们的第一感机理,总变化机制,建立在指数机制上,总近似值……
Private and Personalized Frequency Estimation in a Federated Setting
受用户设备上的下一个单词预测问题的启发,我们引入并研究了联合设置中的个性化频率直方图估计问题。在此问题中,在某些领域,每个用户都会从特定于该用户的分布中观察多个样本。目标是为所有用户计算用户分布的个性化估计,误差以 KL 散度来衡量。我们专注于解决两个核心挑战:统计异质性和用户隐私保护。我们解决问题的方法依赖于发现和利用类似的……
GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics
单细胞基因组学极大地促进了我们对细胞行为的理解,促进了治疗和精准医疗的创新。然而,单细胞测序技术本质上具有破坏性,只能同时测量有限的数据模式。这一限制凸显了对能够重新排列细胞的新方法的需求。最佳传输 (OT) 已成为一种有效的解决方案,但传统的离散求解器受到可扩展性、隐私和样本外估计问题的阻碍。这些挑战刺激了神经网络的发展……
Private Vector Mean Estimation in the Shuffle Model: Optimal Rates Require Many Messages
我们研究了隐私混洗模型中的隐私向量均值估计问题,其中 nnn 个用户各自在 ddd 维度中都有一个单位向量。我们提出了一种新的多消息协议,该协议使用每个用户 O~(min(nε2,d))\tilde{\mathcal{O}}\left(\min(n\varepsilon^2,d)\right)O~(min(nε2,d)) 条消息来实现最优误差。此外,我们表明,任何实现最优误差的(无偏)协议都要求每个用户发送 Ω(min(nε2,d)/log(n))\Omega(\min(n\varepsilon^2,d)/\log(n))Ω(min(nε2,d)/log(n)) 条消息,证明了我们的消息
Training Diffusion Models with Reinforcement Learning
使用强化学习训练扩散模型replay扩散模型最近已成为生成复杂高维输出的事实标准。您可能知道它们能够制作令人惊叹的 AI 艺术和超逼真的合成图像,但它们也在药物设计和连续控制等其他应用中取得了成功。扩散模型背后的关键思想是将随机噪声迭代地转换为样本,例如图像或蛋白质结构。这通常被激发为最大似然估计问题,其中模型被训练以生成尽可能接近训练数据的样本。然而,扩散模型的大多数用例并不直接与匹配训练数据有关,而是与下游目标有关。我们不只是想要一张看起来像现有图像的图像,而是一张具有特定外观的图像;我们不只是想要一个物理上合理的药物分子,而是想要一个尽可能有效的药物分子。在这篇文章中,我们展示了如何使用