摘要 — 张量分解为因子矩阵,通过核心张量相互作用,在信号处理和机器学习中得到了广泛的应用。到目前为止,将数据表示为 2 阶或 3 阶子张量的有序网络的更通用的张量模型尚未在这些领域得到广泛考虑,尽管这种所谓的张量网络 (TN) 分解在量子物理和科学计算中已经得到了长期研究。在本文中,我们介绍了 TN 分解的新算法和应用,特别关注张量序列 (TT) 分解及其变体。为 TT 分解开发的新算法在每次迭代中以交替方式更新一个或多个核心张量,并表现出对大规模数据张量的增强的数学可处理性和可扩展性。为了严格起见,给定秩、给定近似误差和给定误差界限的情况都被考虑在内。所提出的算法提供了均衡的 TT 分解,并在单一混合盲源分离、去噪和特征提取的经典范例中进行了测试,与广泛使用的 TT 分解截断算法相比,取得了更优异的性能。
如何控制系统规模增大时复杂性的指数增长是量子多体系统理论的主要问题之一。过去二十年,量身定制的 Ansatz 类(如张量网络态)在数值计算 [ 1 – 4 ] 和分析工作 [ 5 , 6 ] 方面取得了巨大进展。这些成果包括基态性质 [ 7 – 9 ]、量子相分类 [ 10 , 11 ]、无序系统 [ 12 – 16 ]、开放量子多体系统的行为 [ 17 , 18 ]、临界系统 [ 19 ],以及与 AdS / CFT 对应相关的研究 [ 20 ]。此类张量网络方法的核心是通过应用局部线性运算从底层资源状态中获得一类感兴趣的物理状态,这可看作是应用随机局部运算和经典通信 [21]。对于矩阵积态 (MPS) 和投影纠缠对态 (PEPS),这些状态由最大纠缠态网络给出。对于某些应用,已经引入了其他张量网络结构,如树张量网络 [22, 23] 和多尺度重正化假设 (MERA) [24, 25],后者捕获了临界系统的基态属性。最近探索的另一种推广 MPS 和 PEPS 的途径允许除了 EPR 对之外的更一般的资源状态 [26-28]。它们基于在多个格点之间共享的多部分量子态,例如 GHZ 态 [27]。在本研究中,我们通过扩展底层资源状态或纠缠结构以及允许的操作类别,进一步推广了这种方法。更准确地说,我们允许单参数近似表示系列,它们可以以任意精度再现感兴趣的状态。我们展示了如何将这些近似表示转换为中等数量张量网络状态的线性叠加的精确表示。这种方法为某些类别的状态提供了更有效的张量网络表示,并产生了一种有效的算法来忠实地重建期望值。此外,我们获得的结果允许以普通 PEPS 的形式模拟或重新表达基于多部分资源状态的张量网络状态,从而能够通过针对 PEPS 的高度优化的方法对这些状态进行数值处理。作为一个具体的例子,我们表明,基于 [ 27 ] 中引入的 GHZ 态的二维方晶格上的半注入 PEPS 具有键维数 D ,可以表示为键维数为 2 D 的正常 PEPS。作为我们结果应用的一个例子,我们考虑共振价键 (RVB) 状态,最初被认为是自旋液体的基态 [ 29 ],在高温超导理论中也具有重要意义 [ 30 ]。RVB 态也在 PEPS 的背景下得到了广泛的研究 [ 31 – 33 ]。在 [ 31 ] 中引入了该状态的第一个张量网络表示,即键维数等于 3 的 PEPS。我们提出了两种新的状态表示:具有非均匀键维数的 PEPS
摘要 - 量子状态之间的歧视是量子信息理论中的一项基本任务。给定两个量子状态ρ +和ρ-,HELSTROM的测量区分它们的误差概率最小。然而,发现和实现HELSTROM测量值对许多量子位上的量子状态可能具有挑战性。由于这种困难,人们对识别接近最佳的局部测量方案非常有兴趣。在这项工作的第一部分中,我们概括了Acin等人的先前工作。(物理。修订版A 71,032338),并证明使用贝叶斯更新的本地贪婪(LG)方案可以最佳区分任何两个可以写成任意纯状态的张量产物的状态。然后,我们表明,相同的算法无法以消失的误差概率(即使在较大的子系统限制中)区分混合状态的张量产物,并引入了一种局部刺激(MLG)方案,并严格效果更好。在这项工作的第二部分中,我们将这些简单的本地方案与一般动态编程(DP)方法进行比较。DP方法发现了一系列最佳的局部测量和子系统测量的最佳顺序,以区分两个张量产生状态。1
摘要 - 数十年来,已成功应用于量子物理系统的模拟网络。最近,它们也用于量子计算的经典模拟,特别是随机量子电路。本文提出了一个名为TDD(张量决策图)的决策模式数据结构,以实现张量网络的更多原则和方便的应用。这种新的数据结构为量子电路提供了紧凑而规范的表示。通过利用电路分区,可以有效地计算量子电路的TDD。此外,我们表明,张量网络在其应用中必不可少的操作(例如加法和收缩)也可以在TDD中有效地实现。提出了TDD的概念验证实施,并在一组基准量子电路上评估了其效率。预计TDD将在与量子电路有关的各种设计自动化任务中发挥重要作用,包括但不限于等效检查,错误检测,合成,仿真和验证。
图 1. 现代云数据中心工作负载需要 NVIDIA GPU 加速 .......................................................... 8 图 2. NVIDIA A100 中的新技术.................................................................................... 10 图 3. 新 SXM4 模块上的 NVIDIA A100 GPU ........................................................................ 12 图 4. 用于 BERT-LARGE 训练和推理的统一 AI 加速 ............................................................. 13 图 5. 与 NVIDIA Tesla V100 相比,A100 GPU HPC 应用程序加速 ............................................. 14 图 6. 带有 128 个 SM 的 GA100 全 GPU(A100 Tensor Core GPU 有 108 个 SM) ............................................................................................. 20 图 7. GA100 流多处理器 (SM) ............................................................................................. 22 图 8. A100 与 V100 Tensor Core 操作 ............................................................................................. 25 图 9. TensorFloat-32 (TF32) ........................................................................................... 27 图 10. 迭代TCAIRS 求解器收敛到 FP64 精度所需的时间 .............................................. 30 图 11. TCAIRS 求解器相对于基线 FP64 直接求解器的加速 ........................................................ 30 图 12. A100 细粒度结构化稀疏性 ...................................................................................... 32 图 13. 密集 MMA 和稀疏 MMA 操作示例 ............................................................................. 33 图 14. A100 Tensor Core 吞吐量和效率 ............................................................................. 39 图 15. A100 SM 数据移动效率 ............................................................................................. 40 图 16. A100 L2 缓存驻留控制 ............................................................................................. 41 图 17. A100 计算数据压缩 ............................................................................................. 41 图 18. A100 强扩展创新 ............................................................................................. 42 图 19. Pascal 中基于软件的 MPS 与硬件加速的 MPS Volta............. 44 图 20. 当今的 CSP 多用户节点 ...................................................................................... 46 图 21. 示例 CSP MIG 配置 .............................................................................................. 47 图 22. 具有三个 GPU 实例的示例 MIG 计算配置。 ...................................................... 48 图 23. 具有多个独立 GPU 计算工作负载的 MIG 配置 ...................................................... 49 图 24. 示例 MIG 分区过程 ............................................................................................. 50 图 25. 具有三个 GPU 实例和四个计算实例的示例 MIG 配置。 .................... 51 图 26. 带有八个 A100 GPU 的 NVIDIA DGX A100............................................................. 53 图 27. 光流和立体视差的说明 .................................................................................... 55 图 28.顺序 2us 内核的执行细分。................................................................ 59 图 29. 任务图加速对 CPU 启动延迟的影响 .............................................................. 60
参考文献 1. Marchioni D、Alicandri‐Ciufelli M、Molteni G、Artioli FL、Genovese E、Presutti L。选择性上鼓室通气障碍综合征。喉镜 2010;120:1028-33。[Crossref] 2. Padurariu S、Roosli C、Roge R、Stensballe A、Vyberg M、Huber A 等。关于正常中耳的功能区室化。其粘膜的形态组织学建模参数。听力研究 2019;378:176-84。[Crossref] 3. Ars B、Dirckx J。耳咽管功能。北美耳鼻喉科临床 2016;49:1121-33。 [交叉引用] 4. Alicandri-Ciufelli M、Gioacchini FM、Marchioni D、Genovese E、Monzani D、Presutti L. 乳突:人类的退化功能?医学假设2012; 78:364-6。 [交叉引用] 5. Marchioni D、Grammatica A、Alicandri-Ciufelli M、Aggazzotti-Cavazza E、Genovese E、Presutti L。选择性通气不良对阁楼中耳病理学的贡献。医学假设2011; 77:116-20。 [Crossref] 6. Shirai K、Schachern PA、Schachern MG、Paparella MM、Cureoglu S。慢性中耳炎的鼓室容积和鼓室峡部阻塞:人类颞骨研究。Otol Neurotol 2015;36:254-9。[Crossref] 7. Proctor B。中耳腔的发育及其外科意义。The J Laryngol Otol 1964;78:631-45。[Crossref] 8. Marchioni D、Mattioli F、Alicandri-Ciufelli M、Molteni G、Masoni F、Presutti L。中耳通气通路阻塞的内窥镜评估。Am J Otolaryngol 2010;31:453-66。 [Crossref] 9. Shinnabe A、Hara M、Hasegawa M、Matsuzawa S、Kanazawa H、Kanaza- wa T 等。在超声心动图检查中,松弛部和紧张部胆脂瘤在中耳通气障碍方面的差异以及鼓室和乳突气化的模式。耳鼻喉科 2012;33:765-8。[Crossref] 10. Marchioni D、Molteni G、Presutti L。内窥镜中耳解剖学
张量网络 (TN) 在机器学习中得到了广泛的应用,特别是 TN 和深度学习有着惊人的相似之处。在这项工作中,我们提出了量子-经典混合张量网络 (HTN),它将张量网络与经典神经网络结合在一个统一的深度学习框架中,以克服常规张量网络在机器学习中的局限性。我们首先分析了常规张量网络在机器学习应用中的局限性,包括表示能力和架构可扩展性。我们得出结论,事实上,常规张量网络不适合成为深度学习的基本构建块。然后,我们讨论了 HTN 的性能,它克服了常规张量网络在机器学习方面的所有缺陷。从这个意义上说,我们能够以深度学习的方式训练 HTN,这是反向传播和随机梯度下降等算法的标准组合。最后,我们提供两个适用案例来展示 HTN 的潜在应用,包括量子态分类和量子-经典自动编码器。这些案例也展示了以深度学习方式设计各种 HTN 的巨大潜力。
引言。目前,人们对拓扑非平凡系统中的凝聚态物理学有着浓厚的兴趣。在过去的二十年里,人们做出了巨大的努力来寻找新型拓扑量子物质,如拓扑绝缘体[1,2]、拓扑半金属[3]或拓扑超导体[4]。拓扑相通常与两个能带相交的能带结构中的孤立奇点有关[5,6]。在拓扑超导体的情况下,零能量的Bogoliubov准粒子(称为Majorana零模式)可用于拓扑保护的量子计算[4]。此类系统中零能量模式的存在受到拓扑保护[7],最近已在超导三端结实验中得到证实[8]。实际上,超导弱链接中的安德烈夫束缚态 (ABS)(也称为约瑟夫森结)也被提议用于实现量子比特 [9,10]。如果将结嵌入射频超导量子干涉装置 (SQUID),则可以轻松调整 ABS,并且可以通过微波 [11 – 14]、隧穿 [15] 和超电流谱 [16] 进行实验访问和相干操控。最近,据预测,由传统超导体制成的多端约瑟夫森结 (MJJ) 将表现出四 [17 – 22] 和三 [23 – 27] 引线的非平凡拓扑。在这样的系统中,不需要奇异的拓扑材料,尽管多端拓扑纳米线也已被讨论过 [27]。在 MJJ 中,两个终端之间的量化跨导是整数值陈数的表现形式 [17,20,21,27]。或者,弗洛凯在周期驱动的约瑟夫森系统中陈述,其连通性比
N 。那么,从理论上讲,当λ远大于 N (1 − p ) / 2 [ 2 , 3 ] 时,可以恢复信息。然而,尚无已知的多项式时间算法能够达到这一性能。相反,最著名的两种算法是谱算法和平方和算法。谱算法最早在参考文献 [ 2 ] 中提出。其中,由 T 0 形成一个矩阵(如果 p 为偶数,则矩阵为 N p/ 2 × N p/ 2 ,其元素由 T 0 的元素给出),并且该矩阵的主特征向量用于确定 v sig 。对于偶数 p ,此方法适用于远大于 N − p/ 4 的λ ,并且推测它的变体对奇数 p 具有类似的效果。基于平方和的方法也具有与谱方法类似的效果。针对该问题,平方和法 [ 4 , 5 ] 产生了一系列算法 [ 6 , 7 ],这些算法可以在小于 N − p/ 4 的 λ 下进行恢复,但运行时间和空间成本在 polylog( N ) N − p/ 4 /λ 中呈指数增长。在参考文献 [ 1 ] 中,展示了一系列具有类似性能的谱算法。
© 编辑(如适用)和作者 2020 开放获取 本书根据知识共享署名 4.0 国际许可证 (http://creativecommons.org/licenses/by/4.0/) 的条款进行许可,允许以任何媒体或格式使用、共享、改编、分发和复制,只要您给予原作者和来源适当的信任,提供知识共享许可证的链接,并指明是否做了更改。 本书中的图像或其他第三方资料包含在本书的知识共享许可证中,除非在资料的致谢中另有说明。 如果资料未包含在本书的知识共享许可证中,且您的预期用途不被法定规定允许或超出允许的用途,则需要直接从版权所有者处获得许可。本出版物中使用的一般描述性名称、注册名称、商标、服务标记等,即使没有特别声明,也并不意味着这些名称不受相关保护法律和法规的约束,因此可以自由使用。出版商、作者和编辑可以放心地认为,本书中的建议和信息在出版之日是真实准确的。出版商、作者或编辑均不对本书所含材料或可能出现的任何错误或遗漏提供明示或暗示的保证。出版商对已出版地图和机构隶属关系中的司法管辖权主张保持中立。