查看原文
其他

小装置,大未来:量子机器学习1.0时代

Maria Schuld 集智俱乐部 2018-12-20

图源:CSDN


编译:集智翻译组

文章来源:medium.com



导语

量子机器学习不知不觉已经进入1.0时代了。这个如此让人兴奋的新领域,不仅可以帮助我们更好地进行机器学习,还有助于我们对机器学习进行创新,甚至重新定义我们对于机器学习的思考方式。


量子机器学习是量子计算的新流行语。这个新兴领域除其他外,还要求我们了解如何使用量子计算机进行智能数据分析。在Xanadu公司,对于量子机器学习,我们是非常兴奋的并且花了很多时间来思考它。下文是具体原因。


首先,重要的事要注意,量子机器学习是非常年轻的,这意味着尚不清楚能从中期望得到何种结果以及商业应用。这在西班牙毕尔巴鄂举行的量子机器学习会议上的“量子遇见行业”小组中得到了证实。当被问及商业投资量子机器学习的时机是否成熟时,来自IBM,微软和美国宇航局等单位的专家们对他们给出的回答显然非常小心。尽管如此,今天几乎所有涉及量子计算的公司,包括该小组的代表们,都有一个机器学习小组。


对于量子计算机用于机器学习任务的前景,比如说五年之内——如果连“大玩家们”都在努力做出关于这个问题的明确陈述,那么像Xanadu这样的量子计算创业公司应该加入进来吗?我们认为答案是肯定的,并且希望提出三个论点:


  • 早期的量子器件是不断增长的AI加速器集体的新成员,从而使机器学习成为现实。

  • 量子机器学习能够导致新模型的发现,从而使机器学习得到创新。

  • 机器学习,尤其是量子机器学习,将越来越多地渗透到量子计算的各个方面,重新定义了我们对量子计算的认知。


让我们逐一了解这些观点。



1.助力机器学习

 

早期的量子器件在它们的编程模型、通用性、其所承诺的量子优势,以及它们运行的硬件平台等方面各不相同。总体而言,它们与研究人员在20世纪90年代该领域起步时所设想的通用处理器截然不同。对于机器学习,这可能是一个特征而不是一个缺陷。


1.1 量子器件作为专用AI加速器




一个“量子 ASIC”的例子是一个集成的 nanophotonics 芯片,它实现了一个固定数量模式 (这里对应于黄色光束) 的玻色子取样。如果我们增加了模式的数量,玻色子取样很快就会在经典计算机上变得难以解决。


当前许多量子技术类似于特定用途的硬件,如专用集成电路(ASIC),而不是通用CPU。 它们通过硬连线来实现有限的量子算法。 可以对更先进的量子器件进行编程以运行简单的量子电路,这使得它们更像现场可编程门阵列(FPGAs),即使用低级硬件专用硬件描述语言编程的集成电路。 在这两种情况下,都需要熟悉硬件设计和限制才能运行有效的算法。


一个 FPGA (左) 和 IBM 16 量子比特芯片的示意图(右)。近期量子器件可以与 FPGA进行比较,因为它们还包括具有面向硬件编程语言的本地可编程门。

图源:https://quantumexperience.ng.bluemix.net/qx/devices


ASIC和FPGA在机器学习和人工智能中得到越来越多的应用,它们的轻量级架构减少了中央处理器的负荷,并自然地适合它们专门从事的任务。如果当前的量子技术类似于这种经典的特殊用途硬件,它们可以在机器学习中找到类似的应用。这甚至没有通用量子计算和指数量子加速器。


“随着我们开发了越来越新的技术来推进通用人工智能,量子技术最终或许能在混合的AI 硬件中占有一席之地。”


看看最先进的 AI 解决方案, 就会发现它们已经使用了混合技术。越来越多的计算工作被放在了边缘特殊用途设备上完成, 在这些设备上技术与环境存在着相互作用 (如在手机中的指纹解锁或相机中的笑脸检测)。在频谱的另一端,计算工作在GPU 集群上进行 (例如, 通信路由或标记照片)。事实上,现代 GPU 本身已经是一种技术融合了: Nvidia 最新的沃尔特芯片包含的低精度的张量核ASICs 就是专门为加速神经网络的训练而设计的。Google 遵循了同样的路径,设计张量处理单元 (TPUs)来支持 TensorFlow 机器学习框架。简而言之,AI 已经包含了异质性。量子技术最终可能在 AI 硬件的混合中占有一席之地。如果我们想朝着通用人工智能的方向发展,这种混合必须尽可能地强烈。


最后, 硬件可以显著地塑造软件的发展。从2010年以来,GPU的使用促进了神经网络模型的复兴 (已经存在数十年, 但基本上因无法训练而被丢弃)。同样地,加速发展的量子技术可以为提升特定的机器学习方法在可行的、甚至是尖端的领域做出自己的贡献。对于那些难以用经典硬件进行训练并被更方便的竞争者取代的方法,情况尤其如此。


未来的人工智能和机器学习应用程序将需要多个硬件平台, 其中每个组件负责某些子任务。早期的量子器件可以在 AI 加速器的低通用性 (但高速度) 端找到它们的位置。终有一天,一个纠错的通用量子处理单元 (QPU) 可以将频谱向右侧进行扩展。


1.2 量子计算机擅长什么


如果最初几代量子器件可以被认为是特殊用途的 AI 加速器,那么量子计算机究竟能为机器学习和 AI 贡献什么呢?为什么我们要使用 “量子ASIC”?让我们来看看一些激动人心的候选任务, 即优化、线性代数、取样和内核评估。


优化。与机器学习一样, 优化是量子物理中的一个突出任务。物理学家 (和量子化学家) 通常对在高维能量格局中寻找最低能量点感兴趣。这是绝热量子计算和量子退火的基本范式。毫不奇怪,在机器学习的背景下, 量子计算机的首要任务之一就是优化。D-Wave量子退火是一种能解决所谓二次无约束二元优化问题的特殊用途器件, 它早在2008就被用于求解分类任务。最近,提出了变分电路的混合量子经典技术。其中,用量子器件评估一个难以计算的成本函数,而经典设备则基于此信息执行优化。


线性代数。当谈到机器学习的潜在指数量子加速器时,人们通常是指量子计算机在执行线性代数计算时的固有能力。这一说法有许多微妙之处,其在短期内对硬件的展望并不总是明确的。其中一个瓶颈是数据编码: 将量子计算机用作大矩阵乘法和 eigendecompositions (不同于TPU)的一种超快速线性代数启用码,我们必须先将大矩阵 "加载" 到量子器件上,这是一个高度非平凡的过程。


如果我们把描述量子门的矩阵解释为神经网络的线性层,我们就可以想象出栅极是如何连接输入和输出的 (最终是量子态的振幅)。一个量子比特门能以高度对称的方式变换一个指数大向量。左: 任意单个量子比特门应用到五个量子比特的第三位第三个五量子位元。右: 任意两个量子比特门应用于五个量子比特的第三和第四位。每种颜色代表不同的“权重”。


然而,将量子计算机理解为快速线性代数处理单元可能会有近期的好处。从数学上讲,量子门可以将指数大的(或无限大的)矩阵与同样大的向量相乘。因此,特定的代价高昂的线性代数计算 (即与量子门对应的) 可以在量子计算机上的单个操作中完成。这一观点在用量子算法构建机器学习模型时是有利用的,例如可以认为量子门是一个巨大神经网络的 (高度结构化) 线性层。


采样。所有量子计算机都可以被理解为取样器,用于准备一个特殊的分布类 (量子态) 以及通过测量值从这些分布中取样。因此,一个非常有希望的途径是探索如何利用量子器件中的样本来训练机器学习模型。对于这一问题,已有工作针对玻尔兹曼机和马尔可夫逻辑网络进行了研究,其中所谓的吉布斯分布发挥了重要的作用,其受到了物理启发,因此可以相对容易地用物理系统实现。



每一个量子计算机基本上都是一个取样器,它从一个简单的概率分布到所有可能的测量结果, 计算一个更复杂的分布, 并通过测量来取样结果。因此量子器件是基于抽样的训练的有趣协助, 例如玻尔兹曼机。


“我们应该把早期的量子计算机看作是小型的、部分可编程的特殊用途器件, 其可以为机器学习接管耗时的工作, 而这自然很适合它们。”


内核评估。Xanadu的一个最近想法*表明了为何机器学习中有更多具体的任务可以被量子器件处理。 如何有更多的具体任务,机器学习, 可以接管的量子器件。核方法使用机器学习模型,其以数据点间被称为内核的距离度量为基础。内核方法使用基于数据点之间的距离度量的机器学习模型,称为内核。量子器件可以用来估计某些内核,包括那些很难以经典方式计算的核。量子计算机给出的估计可以被送入标准内核方法中,如支持向量机。推理和训练以经典的方式进行,但增加了专用量子器件。

参见:

https://medium.com/xanaduai/analyzing-data-in-infinite-dimensional-spaces-4887717be3d2



“量子核”的思想是使用量子器件通过估计两个非常高维量子态的内积来计算数据点的核。内核给出的估计之后可以被输入到经典机器学习模型中进行训练和预测。该图取自这篇论文https://arxiv.org/abs/1803.07128


总之, 我们应该将早期的量子计算机看作是小的、部分可编程的专用设备,而不是像GPU助力深度学习那样加速机器学习的特定任务。



2. 创新机器学习

 

除了助力现有的机器学习技术外,量子机器学习还有潜力提供更多的东西。最近,越来越多的物理学家接受了量子理论和量子计算方法的训练, 开始思考机器学习的问题。让物理学家们进入机器学习领域已被证明是卓有成效的——回想一下物理学家约翰.霍普菲尔德(John Hopbeld),他把对伊辛模型(Ising model)的深刻认知带到了机器学习领域, 并创造了Hopfield神经网络*中的联想记忆。量子计算可以引出全新的机器学习模型。这些新的模型是为量子器件量身定做的, 其可能工作的很好,而同时机器学习界的人们可能根本没有想过。我们将用量子机器学习中两个被积极研究的例子进行说明。

参见:

https://en.wikipedia.org/wiki/Hopfield_network



2.1 从量子分布取样



Amin et al. (2018) *的结果显示了在训练期间, 经典玻尔兹曼机 (BM) 和两个版本的量子玻尔兹曼机 (bQBM 和 QBM) 的目标和模型分布之间的 KL 散度。经过几次迭代后, 两个量子模型都表现出了比经典模型更好的结果。[图已略有调整]

参见:

https://journals.aps.org/prx/abstract/10.1103/PhysRevX.8.021050


上面已经提到量子器件擅长取样。例如, 量子退火可以用于从吉布斯分布中近似取样来训练玻尔兹曼机。但这并不简单, 因为量子器件实际上准备了一个量子吉布斯分布。研究人员没有试图 "使事物成为经典", 而是研究了如果我们使用自然量子分布的话会发生什么。事实证明, 在某些情况下, "量子样本" 对训练非常有用, 如上图所示。


“发现新的机器学习模型类似于在一个未知的岛屿上寻找黄金。在量子机器学习方面, 我们在第一个海滩发现了一些非常有希望能找到黄金的迹象, 这就是为什么我们正在建造更好的探险装备并准备进一步冒险——我们对可能的发现感到兴奋。”


2.2 变分量子电路

作为第二个例子, 考虑一个可编程的量子器件,其中 “可编程”是指一些可以调整的设备参数,用以改变其他特殊固定计算的规格。我们将其中的一些参数设置为输入数据 x ,并将其他参数与可训练变量θ关联起来。该设备最终给我们一些输出 y = f (x, θ) ,其依赖于输入和变量。这样的量子器件 (这个描述确实很通用) 实现了一个监督学习模型。这个模型有时被称为变分分类器,它与变分 (即可训练) 量子电路的概念有关。以类似的方式, 我们可以建立无监督模型。



可编程量子器件可被解释为一个计算 y = f (x, θ)的有监督机器学习模型 。可训练参数θ可以通过经典优化方法来学习。该图取自这篇论文https://arxiv.org/abs/1804.00633


量子器件计算的函数 f 可以具体地对应于它的硬件体系结构,参数如何输入计算, 以及如何将变量、输入和输出与量子算法联系在一起。之后, 我们得到了完整的 "量子模型"。重要的是, 如果我们不知道如何用经典的计算机模拟量子模型,我们不仅需要一个新的开端来做机器学习,还要有一个只能用量子器件来执行的模型。关于变分电路的新兴文献显示了如何用经典计算机训练这种“硬件衍生” 模型, 世界各地的团队目前正忙于研究这种量子模型的威力和极限。


发现新的机器学习模型类似于在一个未知的岛屿上寻找黄金。在量子机器学习方面, 我们在第一个海滩发现了一些非常有希望能找到黄金的迹象, 这就是为什么我们正在建造更好的探险装备并准备进一步冒险——我们对可能的发现感到兴奋。



3.重新定义我们

对量子计算的思考方式

 

还有第三个更 “幕后”的原因说明了为什么我们认为量子机器学习是必不可少的。量子机器学习及其中心子任务及优化,不仅是量子计算的子领域,更逐渐成为了一种实现量子计算的途径。因此,其有可能重新定义我们对量子计算的思考方式。这对依赖于量子计算的软件设计、硬件开发和应用来说都是如此。


量子机器学习不仅是量子计算的潜在应用, 而且是贯穿其所有方面的思维方式。


3.1 量子软件设计


到目前为止,量子算法是由那些对相关技巧有深刻了解的人精心组织的。甚至量子计算的“圣经”,尼尔森和艾萨克的教科书*都评论道:“想出好的量子算法似乎是一个难题”。但是量子算法也可以学习的。

参见:

https://en.wikipedia.org/wiki/Quantum_Computation_and_Quantum_Information_%28book%29


例如,考虑资源状态的准备。资源状态具有广泛的性质, 即在连续变量的应用程序中或通过魔术状态进行纠错, 其计算依赖于将准备好的特定状态作为输入。通常,准备初始状态的算法是未知的。然而, 给定一个具有某种类型的门, 我们可以让计算机“学习” 一个门序列, 其可在特定硬件上准备所需的状态。同样, 整个量子实验装置 (即生成高度纠缠的量子系统) 都是由机器学习方法设计的。


3.2 量子硬件开发


使用机器学习对于量子计算中测量数据进行后处理正在变得越来越流行。在未来的某一天,任何量子计算的结果或许都将依赖于机器学习方法。


对机器学习的深刻认识也有助于量子计算机的建造。建造量子计算机将会产生大量有标记和无标记的数据。例如,在读出设备的最终量子态时,在评估门的性能时或在估计测量结果时都会有数据产生。量子机器学习有一个非常活跃的子领域,其中经典的机器学习被当做一种方法来理解实验室中的量子实验产生的数据。机器学习系统将自然成作为量子硬件的一个标准组件。


“某一天,机器学习将成为一个读取量子设备计算结果的标准技术。”



应用

 

量子机器学习技术也与多种应用领域密切相关。以量子化学为例,其同样对最小化高维的、复杂的代价函数感兴趣,如为药物研发或材料科学找到最小能量的分子结构。通过使用如上文提到的可变量子本征求解*量子计算机可以解决此类问题。

实例参见https://arxiv.org/abs/1806.00461,其在极度嘈杂的量子计算机上将此方法应用在了水分子上。


由于机器学习和量子化学均十分依赖优化算法,那么它们使用相同的量子算法也就不足为奇了。可变量子本征求解本质上与变分分类器是相同的算法,其作为一种利用量子计算机进行机器学习的创新方法被引入。从机器学习方面获得的理解将被作为新的领悟并用于化学方面。基于数据和优化,优秀的量子机器学习算法将将会对其他的量子应用产生直接的影响。


总之,量子机器学习拥有的助力或革新未来人工智能应用的潜力,以及对量子计算领域自身的发展带来的贡献,上述三条理由即解释了为何当小型量子器件出现时量子机器学习就可能拥有了一个光明的未来。



翻译:Sylvia

审校:非线性

编辑:李沛欣

原文地址:

https://medium.com/xanaduai/quantum-machine-learning-1-0-76a525c8cf69

原文题目:Quantum Machine Learning 1.0,A big future for small devices



线上直播预告


2018北京师范大学复杂系统夏令营名师讲座



(点击图片查看直播详情)


集智AI学园将对夏令营讲座独家全程直播!


更多互动交流,请扫码入群


推荐阅读


对称性与拓扑序:新型量子计算机的物理基础

Science:用人工神经网络解决量子多体问题

引力、量子与人工智能的深度对话 | 尤亦庄

量子计算时代的机器学习

加入集智,一起复杂!集智俱乐部团队招新啦!


推荐课程


扫码听课




集智QQ群|292641157
商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存