现在正是深度强化学习(Reinforcement Learning, RL)的巅峰时刻。不论是加持智能机器人,模拟人类脑神经,还是超越医生的医疗诊断,击败人类的围棋比赛。

虽然这种强大的机器学习还并不足以与人类与生俱来的灵活与敏捷相媲美,但不可否认它是未来更高级智能机器的敲门砖

只不过,它不能停止前进。因为这些算法背后的概念基于试错,一个强化学习的AI代理只有在其做出正确的决定,并得到奖励后,才能真正完成它的学习过程

而对于复杂的问题,AI代理需要不断的试错才能做出正确的决定,而这背后的时间代价过高。即便它趋于实用化,我们仍有自己这一关需要克服,因为人类无法完全满足人工智能机器的巨大能源需求。

10000次模拟165项实验,混合量子系统首次展现“超能力”-量子客
图1|AI代理与环境(来源:Wikimedia Commons)

简单来说,我们现在遇到的问题就是,训练人工智能需要耗费大量人力物力,我们目前使用的许多系统都是在大规模GPU网络、超级计算机上训练的,训练过程需要耗用难以想象的巨大能量。

人工智能之所以如此擅长图像识别/自然语言处理,是因为它基本上只是反复做同样的事情,每次只进行微调,直到把事情做对

这并不是运行几次模拟就足够的,要训练出一个强大的人工智能系统,可能需要数百甚至数千小时。不仅如此,训练开支可以说是巨额

如果人工智能就是人类未来,以目前的能耗模式,未来也许根本就不存在。

于是乎,解决方案来了:量子计算。一个由维也纳大学、麻省理工学院、因斯布鲁克大学、莱顿大学等地科学家组成的国际研究团队,于近日发表了研究报告,展示了混合人工智能系统的“量子加速”[3]。

研究团队的侧重点是将量子和经典计算相结合,他们没有完全使用量子力学原理构建该强化学习系统,而是通过一种更为实用的混合办法,该混合型人工智能可以同时筛选出几种不同的问题解决方法。

论文中提到,对于实际应用来说,关键问题是AI代理的学习速度。尽管已经有很多研究使用量子力学来加速AI代理的决策过程,但尚未证明可以缩短学习时间。

论文中提出了一个强化学习实验,在该实验中,通过使用量子通信信道与环境,加速AI的学习过程。实验进一步表明,将这一方案与经典通信相结合,可以对加速予以评估,并允许对学习进度进行优化控制。

10000次模拟165项实验,混合量子系统首次展现“超能力”-量子客
图2| 学习代理示意图(来源:Nature)

使用10000个AI代理并经过165项实验后,研究团队从实际实验数据中发现,在挑战更复杂的问题时,混合量子系统显示出明显的优势。

实验中,团队将经典系统与加入特殊量子芯片的混合量子系统进行对比。所谓特殊,是指团队使用的量子芯片基于纳米光子,称为纳米光子处理器的可编程芯片。简言之,它们用光来代替电。

10000次模拟165项实验,混合量子系统首次展现“超能力”-量子客
图3|实验装置(来源:Nature)

实验结果显示,加入量子计算的强化学习人工智能,要比没有加入量子计算的快60%以上。论文作者表示,该实验首次展示了添加量子计算可以加速AI代理的实际学习过程

这种混合型人工智能一旦规模化,就会对现实世界问题产生影响,例如构建一个高效的量子互联网,因为可以轻而易举地将该装置整合到未来的大规模量子通信网络中

在那之前,团队仍然还有许多工作要做,因为此次的实验并不是最终目标,更像是一个小规模的模型。一旦明确如何将该技术应用到更大的实际问题上,它就能发挥作用。

 

 

参考链接:

[1]https://singularityhub.com/2021/03/16/quantum-computing-and-reinforcement-learning-are-joining-forces-to-make-faster-ai/

[2]https://thenextweb.com/neural/2021/03/17/quantum-computers-save-us-artificial-intelligence-green/

[3]https://www.nature.com/articles/s41586-021-03242-7

 

声明:此文出于传递高质量信息之目的,若来源标注错误或侵权,请作者持权属证明与我们联系,我们将及时更正、删除,所有图片的版权归属所引用组织机构,此处仅引用,原创文章转载需授权。

|编  辑:王嘉雯      |审  校:丁 艳