最小完美哈希函数 (MPHF) 用于有效访问大型字典 (键值对集) 的值。发现构建 MPHF 的新算法是一个活跃的研究领域,尤其是从存储效率的角度来看。MPHF 的信息论极限为 1 ln 2 ≈ 1.44 位/键。当前最佳实用算法的范围是每个键 2 到 4 位。在本文中,我们提出了两种基于 SAT 的 MPHF 构造。我们的第一个构造产生的 MPHF 接近信息论极限。对于这种构造,当前最先进的 SAT 求解器可以处理字典包含多达 40 个元素的情况,从而优于现有的 (蛮力) 方法。我们的第二个构造使用 XOR-SAT 过滤器来实现一种实用方法,每个键的长期存储量约为 1.83 位。
学习未知的 n 量子比特量子态 ρ 是量子计算中的一个基本挑战。从信息论角度来看,众所周知,断层扫描需要 n 个 ρ 副本的指数来估计其条目。受学习理论的启发,Aaronson 等人引入了许多(较弱的)学习模型:学习状态的 PAC 模型(皇家学会 A'07 会刊)、用于学习状态“阴影”的阴影断层扫描(STOC'18)、也要求学习者具有差异隐私的模型(STOC'19)和学习状态的在线模型(NeurIPS'18)。在这些模型中,结果表明,可以使用 n 个 ρ 副本的线性“近似地”学习 ρ 。但这些模型之间有什么关系吗?在本文中,我们证明了从差异隐私 PAC 学习到在线学习再到量子稳定性的一系列(信息论)含义。我们的主要结果推广了 Bun、Livni 和 Moran (Journal of the ACM'21) 最近的研究,他们证明了有限的 Littlestone 维度(布尔值概念类的)意味着 PAC 在(近似)差分隐私(DP)设置中的可学习性。我们首先将他们的工作扩展到实值设置,然后进一步扩展到学习量子态的设置。我们结果的关键是我们的通用量子在线学习器,稳健标准最优算法(RSOA),它对对抗性不精确具有鲁棒性。然后,我们展示了 PAC 模型中 DP 学习量子态之间的信息论等价性、单向通信模型中量子态的可学习性、量子态的在线学习、量子稳定性、各种组合参数,并进一步应用于柔和阴影断层扫描和嘈杂量子态学习。
摘要 尽管在某些情况下使用量子样本可能比使用经典样本更有效地学习概念类,但 Arunachalam 和 de Wolf [3] 证明,在量子 PAC 和不可知论学习模型中,量子学习者的渐近效率并不比经典学习者更高。他们通过量子态识别和傅里叶分析建立了样本复杂度的下限。在本文中,我们通过信息论方法推导出 PAC 和不可知论模型中量子样本复杂度的最佳下限。证明可以说更简单,相同的想法可用于推导出量子学习理论中其他问题的最佳界限。然后,我们转向优惠券收集器问题的量子类似物,这是概率论中的一个经典问题,在 PAC 学习研究中也具有重要意义。Arunachalam、Belovs、Childs、Kothari、Rosmanis 和 de Wolf [1] 将该问题的量子样本复杂度表征为常数因子。首先,我们证明了上述信息论方法无法得出最佳下限。作为副产品,我们得到了任意高维纯态的自然集合,这些纯态不易(同时)区分,而集合具有接近最大的 Holevo 信息。其次,我们发现信息论方法为该问题的近似变体得出了渐近最佳界限。最后,我们通过广义 Holevo-Curlander 集合可区分性界限,推导出具有精确领先阶项的量子优惠券收集器问题的尖锐下限。我们研究的量子优惠券收集器问题的所有方面都取决于相关 Gram 矩阵的谱的属性,这可能是独立的兴趣所在。
信息论中的许多问题可以归结为矩阵上的优化,其中矩阵的秩受到约束。我们在秩约束优化和量子纠缠理论之间建立了联系。更准确地说,我们证明了一大类秩约束半定规划可以写成可分离量子态上的凸优化,因此,我们构建了一个完整的半定规划层次来解决原始问题。这个层次不仅为秩约束优化问题提供了一系列经过认证的界限,而且在考虑层次结构的最低层时,在实践中给出了相当好且通常是精确的值。我们证明了我们的方法可以用于量子信息处理中的相关问题,例如纯态优化、混合酉信道和忠实纠缠的表征以及量子语境,以及经典信息论,包括最大割问题、伪布尔优化和图的正交表示。最后,我们表明我们的想法可以扩展到秩约束二次和高阶规划。
非局部量子计算 (NLQC) 用一轮同时进行的通信和共享纠缠取代了两个量子系统之间的相互作用。我们研究了两类 NLQC,f -routing 和 f -BB84,它们与经典信息论密码学和量子位置验证相关。我们给出了两种设置中纠缠的第一个非平凡下界,但仅限于具有完美正确性的下界协议。在这种情况下,我们给出了完成给定函数 f ( x, y ) 的这些任务的任何纠缠态的 Schmidt 秩的下界,其矩阵 g ( x, y ) 的秩为当 f ( x, y ) = 0 时其元素为零,否则严格为正。这也导致了 Schmidt 秩的下界,以 f ( x, y ) 的非确定性量子通信复杂度为依据。由于 f 路由与信息论密码学中研究的条件秘密披露 (CDS) 原语之间的关系,我们获得了一种降低 CDS 随机性复杂度的新技术。
近年来,人们发现了量子信息论与量子引力之间的一些深层次联系。AdS/CFT 对偶为研究这些联系提供了一个富有成效的框架。这种关系的主要例子是 Ryu-Takayanagi 公式,它为对偶 CFT 中的纠缠熵提供了几何解释 [1]。Van Raamsdonk 也强化了这种关系 [2]。他认为两个区域之间的纠缠量与它们的距离有关,我们可以通过纠缠自由度来连接几何,通过解开纠缠来分离它们。后来,这一观察导致了 ER=EPR 猜想 [3]。下一个例子来自将块算子重构为一组非局部模糊的 CFT 算子 [4-6],这导致了一些悖论。为了解决这些悖论,[7] 的作者使用了量子纠错码的概念。量子引力与量子信息论之间的第三个联系是量子计算复杂性 [8]。这些想法源于一个关于热平衡下 AdS 黑洞爱因斯坦-罗森桥增长的难题。全息复杂性使我们能够理解视界背后丰富的几何结构。量子复杂性的一个特性是,即使在边界理论达到热平衡之后很长时间,它仍会继续增长。事实上,据推测复杂性会持续增长,直到系统自由度数量呈指数增长的时间尺度 [9-11]。量子计算复杂性是量子信息论中的一个概念,它估计从简单的基本门构建所需目标状态的难度。在这个概念中,门是可以从全集中获取的幺正算子 [12,13]。在 AdS/CFT 对应关系的背景下,提出了两种评估边界态复杂性的建议。第一个是,复杂度应该是极值余维数为 1 的块超曲面 Σ 的体积的对偶,该曲面在定义边界状态的时间片上与渐近边界相交。该陈述总结为:CV = max V Σ
开源代码贡献: Github 统计:17 个公共存储库,拥有超过 1400 个“star”和超过 250 个“fork”(不包括对学生开发的存储库提供建议) 一些代码已移植到 autoML 系统中,网址为 http://datadrivendiscovery.org 具有非牛顿动量的汉密尔顿动力学用于快速采样 2021 https://github.com/gregversteeg/esh_dynamics 使用线性 CorEx 进行线性因子模型和协方差估计 2017 https://github.com/gregversteeg/linearcorex 针对欠采样、高维生物医学数据优化的非线性 CorEx 模型。 2017 https://github.com/gregversteeg/bio_corex 使用 CorEx 构建主题模型 2016 https://github.com/gregversteeg/corex_topic 离散信息筛选 2016 https://github.com/gregversteeg/discrete_sieve 高斯化数据 2015 https://github.com/gregversteeg/gaussianize 信息论深度学习: 2014 https://github.com/gregversteeg/CorEx 非参数信息论估计代码: 2013 https://github.com/gregversteeg/NPEET
符合微观世界规律的客观实在的出现一直是长期争论的焦点。近期的方法似乎至少在一个方面达成了共识,即对给定可观测量在物理自由度上的信息进行编码是该可观测量成为物理实在元素的必要条件。以此为基本前提,并受到量子信息论的启发,我们在此建立了量子实在论的公理化——一种与量子理论兼容的实在论概念。我们的策略包括列出一些能够以“度量”独立的方式表征量子实在论的物理驱动原理。我们引入了一些定义单调性和实在论测度的标准,然后在一些著名的信息论中寻找潜在候选者——由冯·诺依曼、雷尼和查利斯熵引起的理论。我们明确地构造了一些熵量词类,其中一些被证明满足所有提出的公理,因此可以作为给定物理可观测量的真实度(或确定性)的忠实估计。希望我们的框架可以为进一步讨论量子力学的基础方面提供正式的基础。
信息论与热力学相结合的研究领域的起源可以追溯到麦克斯韦的思想实验“麦克斯韦妖”[1]。这一概念可以表述为,通过基于热涨落水平测量的反馈控制来减少系统的总熵[2][3],这似乎与热力学第二定律相矛盾[4][2][3]。关于这个问题的理论讨论在过去十几年里进展迅速[2],具体地说,已经发现将信息的概念[5][6]纳入非平衡统计力学[7][8][9]的研究结果中,可以完全准确地理解“妖”与热力学第二定律[2][5]之间的一致性。此外,对“妖”的研究实验最近也开始取得进展[2]。具体而言,“妖怪”实际上已经通过实验实现[10],这得益于测量微观热力学系统并通过反馈控制它们的实验技术的进步[2][3][10]。这样,将信息论与热力学相结合的研究形成了新的研究领域,可以称之为信息热力学[5][11][12]。信息热力学的研究不仅解决了“麦克斯韦妖怪”的问题,还揭示了更加丰富的发现[2]。例如,人们发现“妖怪”所能获取的功的上限和测量所需能量消耗的理论下限都与“信息量”定量相关[12]。本综述旨在最简洁地介绍信息热力学。本综述组织如下:后で付け足す我们只考虑经典系统[13]。
我们提出了一个新假设,将温度与量子系统中波函数坍缩的频率联系起来。该框架将热力学熵、量子退相干和信息论联系起来,表明温度升高对应于由于环境相互作用增强而导致的波函数坍缩增加。本文得出的数学模型为实验验证奠定了基础,并通过统一的视角将热力学与量子力学联系起来。