HPC部署QISKit

最近量子计算兴趣的激增主要是由于“量子优势”的方法,当量子计算机应用于相关和重要的应用用例时,量子计算机将超越最大的经典超级计算机的能力。相反,量子计算模拟是量子应用和图书馆发展的重要组成部分。理想量子系统的大规模仿真使研究人员能够调试他们的应用程序,以便在将来可用的设备上使用,而高保真度噪声仿真则使研究人员能够在可控条件下调查部署时库的行为和效率一个现实的,现代的量子系统。

一年多前,为了准备计算量子系统的更广泛使用,IBM研究部门向所有有兴趣学习如何编码和模拟为量子计算机设计的算法的人提供量子信息软件包(QISKit)。QISKit允许用户在真正的量子计算机上运行基于量子电路的实验程序,或者在云端或笔记本电脑上的传统计算机上运行的量子电路仿真器上运行。

正如人们所期望的那样,考虑到量子计算机的潜在性能以及量子计算机和传统计算机之间的差异,可以将相对高的计算需求放置在运行这种模拟的系统上。为此,我们最近的工作集中于利用IBM POWER8和IBM POWER9计算机体系结构的一些高级功能,包括其高内存带宽,高效多线程容量和高计算吞吐量。

HPC优势:30多个Qubits在您的指尖

QISKit提供了几种模拟器,允许任何希望开发量子计算机应用程序的人在个人计算机上这样做。通过安装QISKit可以使用这些模拟器。然而,模拟具有显着宽度(量子位数)的量子电路需要大量的存储器和CPU资源。例如,使用双精度算法模拟26个量子位配置需要1 GB的内存,更重要的是,内存需求遵循指数曲线,每增加一个量子位就会加倍。重要的CPU资源也需要执行所需的计算和操作涉及的(大)数据结构。作为单个数据点,考虑模拟26个量子位量子傅立叶变换需要160秒以上的时间在2015年初的MacBook Pro上,使用标准的软件安装。

为了讨论量子电路的模拟,有一个具体的例子是有利的。作为一个参考点,我们利用模拟某些随机化电路的例子来对基于QISKit基础结构的量子器件的功率进行基准测试,这是一种称为量子体积的量度。下面,我们提供了对代码的简要描述,指出了本例中使用的QISKit的一些显着特性,并检查了经典模拟器上代码的性能。用于量子电路的开放式高性能模拟器-量子客

使用execute()方法模拟在quantum_volume函数中创建的电路。指定“local_qasm_simulator”后端在运行此程序的计算机上启动多线程CPU仿真。QISKit软件通过其便携式设计良好的API为开发人员提供了生产力,并通过包含的QISKit Simulator为新手和有经验的量子程序员提供了一个用户友好的环境,以开发和部署量子模拟实验。

虽然QISKit Simulator通常部署在个人笔记本电脑或台式机系统上,但由于QISKit支持POWER架构和环境,因此可以使用本地POWER8或POWER9环境进行仿真,允许开发人员安装QISKit并在大型POWER SMP上运行应用程序系统与他们在笔记本电脑上的完全一样。

IBM POWER架构的可扩展性和内存带宽为QISKit用户提供了增强的响应体验,从而提高了生产力。除了本地可用性外,IBM还通过充分利用POWER体系结构的实际功能,提供高性能仿真基于云的仿真服务。该版本的仿真器是公开免费提供的,通过在上例中简单地将“local_qasm_simulator”替换为“ibmq _qasm _simulator”,可以在服务器级POWER系统上进行仿真。无论代码是在您的私人工作站还是在IBM的Cloud环境中运行,模拟规模的唯一限制就是计算机资源上可用的内存量; 该系统已用于运行超过40个量子位的模拟。

用于量子电路的开放式高性能模拟器-量子客
Quantum Volume基准测试(深度= 10)的执行时间,使用笔记本电脑和POWER8机器的量化比特数。POWER8:8001_22c,3.4GHz,10核x 8SMT x 2插槽,512GB RAM,CentOS Linux 7.2.1511。

以上图表显示了POWER架构的仿真优势以及服务器级系统提供的更大内存占用空间。在上面的例子中,Quantum Volume基准的执行时间在笔记本电脑(MacBook,2015年初)和POWER8机器上测量,两台模拟器改变量子比特数。POWER系统(高达32TB)内存的极大内存容量可以模拟较大规模的量子电路,而这些SMP系统上可用的大量线程和计算单元的内存带宽和计算优势允许进行如此大规模的模拟在合理的时间内执行。如上图所示,内部部署和基于云的系统之间存在性能差异。这是因为基于云的仿真软件优化了存储器访问以在POWER架构上更高效地运行仿真。基于云的模拟优化将在不久的将来为QISKit内部用户提供。

POWER9处理器

在2017年,IBM宣布推出POWER9架构,为广泛的应用领域带来极高的性能,特别关注GPU加速的AI应用,因为通过NVLink在POWER9 CPU和GPU,以及PCIe Gen4 I / O设备的性能,CAPI以及内核的可扩展性。

对POWER9的本地支持已经可用,并且云模拟器即将推出。我们目睹了仿真速度的显着提高,并计划未来的增强,优化了POWER9的性能,我们将在本文的更新中介绍这些性能。

结论和未来工作

本文提到的所有基准以及如何重现上述结果的说明均可在OpenQASM存储库中找到。感兴趣的读者可以在该存储库中找到QFT,Quantum Volume,Bernstein-Vazirani和仿冒钱币查找算法。

QISKit为量子电路的高性能仿真打开了大门。它的仿真器随着POWER体系结构的优化而不断发展。我们目前的工作重点是创建一个高性能仿真器,该仿真器将利用SMP和分布式内存并行性,以及通过NVLINK连接多个GPU的POWER处理器上可用的加速机会。这些系统的初步结果表明,性能优势大于10倍。这个模拟器将在不久的将来推出,我们鼓励那些有兴趣观看这个空间,以获得最新进展。