摘要 — 近年来,量子计算取得了重大发展,并在许多应用领域确立了其霸主地位。虽然量子硬件可以通过云环境供公众使用,但仍需要一个强大而高效的量子电路模拟器来研究约束条件并促进量子计算发展,例如量子算法开发和量子设备架构探索。在本文中,我们观察到大多数公开可用的量子电路模拟器(例如 IBM 的 QISKit、Microsoft 的 QDK 和 Google 的 Qsim-Cirq)在量子比特数量增加时模拟速度慢且可扩展性差。为此,我们系统地研究了量子电路模拟(QCS)的缺陷,并提出了 Q-GPU,这是一个利用具有全面优化的 GPU 来实现高效且可扩展的 QCS 的框架。具体而言,Q-GPU 具有 i)主动状态幅度转移、ii)零状态幅度修剪、iii)延迟量子比特参与和 iv)无损非零状态幅度压缩。在九个代表性量子电路上的实验结果表明,Q-GPU 显著缩短了基于 GPU 的 QCS 的执行时间,缩短了 71.89%(加速 3.55 倍)。Q-GPU 还分别比最先进的 OpenMP CPU 实现、Google Qsim-Cirq 模拟器和 Microsoft QDK 模拟器快 1.49 倍、2.02 倍和 10.82 倍。
主要关键词