[latexpage]

引子

今天为大家介绍一篇近日(20180611)上海交通大学和中国科学技术大学的金贤敏团队与南方科技大学的翁文康团队以及他们的合作者联合在《 Phys Rev Lett上发表了一篇名为 Experimental Machine Learning of Quantum States的文章,介绍他们用量子机器学习判定量子态的可分性的量子态分类器 (quantum-state classifier)方面取得的进展。

摘要

通常情况下,想要获得量子态的信息需要通过量子层析方法(quantum tomography), 但是完全确定一个量子态所需要的信息随着量子比特数目的增加而成指数级增长,因而 quantum tomography 将消耗很多资源且低效,以至于当量子比特数目很多的时候根本无法实现。人们希望获得一种不需要知道量子态的全部信息,就能够判定量子态的某些性质的方法,当然,研究最多的是量子态的纠缠性。基于这种思想,人们提出了 entanglement witness 的方法。机器学习通过用大量数据训练计算机程序,来对新的数据进行分类或者完成其他任务。本文中便是通过机器学习的算法,构造 CHSH 不等式形式的 entanglement witness 来判定一个量子态是否是可分的(注:量子物理中将不可分的量子态称为量子纠缠态) 。简单地说,这篇文章将机器学习算法跟量子纠缠判定结合在一起构造了一个基于CHSH 不等式的人工神经网络量子态的分类器。

Fig.1 ANN-based quantum state classifier

过程

如图 Fig.1 所示, 构造的人工神经网络(Artificial Neural Network,简称ANN)量子态分类器。 Fig.1(a) 是基于一个 CHSH 算子 $\Pi_{ml}$ 构造的线性量子态分类器,即神经网络只有一个输入层 (input layer),中间没有隐藏层(hidden layer)。$$\Pi_{ml}\equiv \omega_1 a_0 b_0+\omega_2 a_0 b’_0+\omega_3 a’_0  b_0+\omega_4 a’_0 b’_0+\omega_0,$$其中一组参数的集合 $\{\omega_0,\omega_1,\omega_2,\omega_3,\omega_4\}$是需要优化的,使得神经网络分类器能最准确地分类量子态,4个可观测量的期望值 $\{<a_0 b_0>,<a’_0 b_0>,<a_0 b’_0>,<a’_0 b’_0>\}$ 是机器学习的特征。当参数集合为 $\{1,-1,1,1,-2\}$,对应的测量为 $a_0=\sigma_z, a’_0=\sigma_x, b_0=(\sigma_z+\sigma_x)/ \sqrt{2}, b’_0=(\sigma_z-\sigma_x)/ \sqrt{2}$ 时,便是我们熟知的CHSH不等式,当 $\Pi_{ml}>0$ 时,纠缠态,反之,可分态。

如Fig.1(b)所示,为了进一步提高神经网络量子态分类的性能,在中间加上一个隐藏层,构造了一个非线性的神经网络量子态分类器。首先,一个量子态 input layer 的四个可观测量的期望值对应的一个包含四个坐标的向量,记为 $\vec{x_0}$。从 input layer 到 hidden layer 的第一步训练得到一个新的包含 $n_{ne}$ (神经元的个数)个坐标的向量,记为 $\vec{x_1}$, $$\vec{x_1}=\sigma_{RL}(W_1\vec{x_0}+\vec{\omega_{01}}),$$ 其中,矩阵 $W_1$ 的矩阵元由 input layer 到 hidden layer 的每一个神经元的权重组成,$\vec{\omega_{01}}$ 表示 hidden layer 的每一个神经元的阈值组成的一个向量, $\sigma_{RL}$ 表示 ReLu function。 其次,从 hidden layer 到 output layer 的第二步训练,得到最终的分类结果,记为 $$\sigma_S (W_2\vec{x_1}+\vec{\omega_{02}}).$$

Fig.2 Experimental setup of the quantum-state classifier.

如图 Fig.2 所示,实验上产生的用于训练和测试神经网络量子态分类器的量子态是由参量下转换产生,对应的量子态的形式为$$|\psi_{AB}\rangle=\cos\theta|H_AV_B\rangle+e^{i\phi}\sin\theta|V_AH_B\rangle,$$ 其中, $\theta$ 和 $\phi$ 都是可以精确控制的,以产生所需要的用于训练和测试的量子态。实验时,首先将参量下转换产生的光子对收集起来,再通过 time-mixing 的技术构造出 Werner 态来进行实验。Werner state 表示为:$$\rho_{W}=p|\psi_{AB}\rangle\langle\psi_{AB}|+(1-p)I/4,$$ 其中,$p$ 表示纠缠态 $|\psi{AB}\rangle\langle\psi_{AB}|$ 对应的概率, $I$ 表示单位矩阵。实验测量的结果一方面用作神经网络的输入,另一方面通过 PPT 判据 (一种在 two-qubit 时充要的纠缠判据) 来判定是否是纠缠态来label神经网络的输入的量子态和判断神经网络的输入是否准确。

Fig.3 Results predicted by the linear ANN

结果

如图 Fig.3 (a) 表示,对于纠缠态 $|\psi_{AB}\rangle$ 固定相位 $\phi$, 取5个不同的 $\theta$ 值,对应饼状图的五个区域。对每个区域,用 PPT 判据进行判相应的 Werner state 是否是纠缠态时对应的 $p$,灰色阴影部分表示可分态,白色区域表示纠缠态。图中的一个个圈圈表示的是神经网络进行判定的点,红色表示可分态,蓝色表示纠缠态。可以看出,神经网络分类器判定的结果跟 PPT 判据的判断结果基本一致。

Fig.4 Performance comparison between non-linear and linear calssifier

如图 Fig.4 所示,比较了线性神经网络分类器跟非线性神经网络分类器性能。与图 Fig.3 类似,对于柱状图的每个柱体,灰色表示的是PPT判据判断的结果为可分态,白色表示 PPT 判据判断为纠缠态。红色的圈圈表示神经网络分类器判断为可分态,蓝色圈圈表示神经网络分类器判断为纠缠态。从图中可以看出, 非线性神经网络量子态分类器表现的明显优于线性分类器。

 

Fig.5 Comparison of match rates with the classifier trained by theoretical data

如图 Fig.5 所示,(a)表示用实验数据训练神经网络分类器的训练效果,(b)表示用理论数据训练神经网络分类器的训练效果。可以看出用实验数据训练神经网络分类器时,分类器判断量子态时的正确匹配率在多数情况下趋于 1,而且相同情况下总是优于用理论数据训练神经网络分类器。

总结

这篇文章是第一次用机器学习算法进行量子态分类的应用尝试,因而引起大家的广泛讨论。量子态分类是一项非常困难的工作,机器学习应用于量子态分类是量子信息领域内的一次重要的尝试,其在实验上的成功具有非常重大的意义。

作者注:本文整理的相关文献已经添加链接,需要的读者可根据链接下载,图片来源于原文章。本文已授权Qtumist (量子客) 刊登,仅供读者学习查看。

 

发表评论

后才能评论