当前位置: 编码机 >> 编码机市场 >> 量子机器学习的挑战与机遇综述荐读
光子盒研究院出品
在机器学习和量子计算的交叉点上,量子机器学习有可能加速数据分析,特别是量子数据,在量子材料、生物化学和高能物理方面有应用。然而,关于量子机器学习模型的可训练性仍然存在挑战。
因此,美国洛斯阿拉莫斯国家实验室(LosAlamosNationalLaboratory,LANL)团队在《自然·计算机科学》杂志上,回顾了当前量子机器学习的方法和应用。
现在,作为通信技术基础的香农信息理论已被推广到量子香农理论(或量子信息理论),为量子效应使信息传输更有效率提供了可能。
生物学领域已经扩展到量子生物学,以便更深入地了解生物过程,如光合作用、气味和酶催化作用。图灵的通用计算理论已被扩展到通用量子计算,有可能导致物理系统的模拟速度成倍增长。
本世纪最成功的技术之一是机器学习(ML),其目的是对大型数据集进行分类、聚类和识别模式。学习理论与ML技术同时发展,可以了解和改进量子科技。支持向量机(supportvectormachines,SVM)、神经网络和生成式对抗网络等概念对科学和技术产生了深远的影响。ML现在已经根深蒂固地融入社会,以至于对ML的任何根本性改进都会带来巨大的经济利益。
与其他经典理论类似,ML和学习理论实际上可以嵌入到量子力学形式中。从形式上讲,这种嵌入产生了量子机器学习(QML)领域,其目的是理解物理定律所允许的数据分析的终极极限。实际上,量子计算机的出现,希望在数据分析中实现量子优势,这是使QML如此令人兴奋的原因。
QML的任务。QML通常被考虑用于四个主要任务;左上:张量网络是量子启发的经典方法,可以分析经典数据。右上:来自量子系统的单位时间演化数据U可以经典地编译成量子电路。左下:手写的数字可以映射到量子态,在量子计算机上进行分类。右下:分子基态数据可以直接在量子计算机上进行分类。图中显示了基态能量E对原子间距离d的依赖性。
量子计算利用纠缠、叠加和干涉来执行某些任务,其速度比经典计算大幅提高,有时甚至是指数级的。事实上,虽然已经观察到一个设计好的问题有这样的提速,但对于数据科学来说,即使在理论层面,达到这样的提速仍然是不确定的,但这是QML的主要目标之一。
QML的关键应用。QML已经被设想为在许多应用中带来计算优势。QML可以加强化学的量子模拟(例如,分子基态、平衡态和时间演化)和材料科学(例如,量子相识别和考虑到目标属性的生成设计)。QML可以通过学习量子纠错码和综合征解码器、执行量子控制、学习错误抑制、以及编译和优化量子电路来增强量子计算。QML可以增强传感和计量学,并从量子系统中提取隐藏参数。最后,QML可以加速经典的数据分析,包括聚类和分类。
我们可以推测,上图中所示的所有领域都将受到QML的影响。例如,QML将可能有利于化学、材料科学、传感和计量、经典数据分析、量子纠错和量子算法设计。其中一些应用产生的数据本身就是量子力学的,因此将QML(而不是经典ML)应用于它们是很自然的。
虽然经典和量子ML之间有相似之处,但也有一些区别。因为QML采用了量子计算机,这些计算机的噪声可能是一个主要问题。这包括硬件噪声,如退相干,以及对量子状态的测量所产生的统计噪声(即射击噪声)。这两种噪声源都会使QML的训练过程复杂化。此外,由于量子变换的线性,经典ML中自然的非线性操作(例如,神经激活函数)需要对QML模型进行更仔细的设计。
对于QML领域,近期的目标是在数据科学应用中展示量子优势,即超越分类方法。要实现这一目标,需要对哪些应用能从QML中获益最大保持开放的心态(例如,可能是一个本身就是量子力学的应用)。还需要了解QML方法如何扩展到大问题规模,包括分析可训练性(梯度扩展)和预测误差。高质量量子硬件的可用性也将是至关重要的。
最后,我们注意到,QML提供了一种思考既定领域的新方法,如量子信息论、量子纠错和量子基础。从数据科学的角度来看待这些应用可能会带来新的突破。
a)经典数据x,即猫的图像和狗的图像,通过某种映射x→
ψ(x)〉被编码到希尔伯特空间。理想情况下,不同类别的数据(这里用点和星表示)被映射到希尔伯特空间的不同区域。b)量子数据
ψ〉可以直接在量子设备上进行分析。这里的数据集由代表金属或超导系统的状态组成。c)数据集被用来训练QML模型。QML的两个常见范式是QNN和量子内核(quantumkernels),这两个范式都允许对经典或量子数据进行分类。d)一旦模型被训练好,它就可以用来进行预测
如上图所示,QML可以用来从经典数据或量子数据中学习,因此我们首先对这两种类型的数据进行对比。经典数据最终被编码为比特,每个比特都可以处于0或1的状态:这包括图像、文本、图表、医疗记录、股票价格、分子的属性、生物实验的结果和高能物理实验的碰撞痕迹。量子数据被编码在量子比特中,称为量子比特(或高维类似物)。
一个量子比特可以由状态
0?、
1?或这两者的任何归一化复数线性叠加来表示。在这里,状态包含从一些物理过程中获得的信息:如量子传感、量子计量、量子网络、量子控制,甚至量子模拟数字转换。
原则上,所有的经典数据都可以在量子系统中有效地编码:一个长度为n的经典比特串可以很容易地编码到n个量子比特上。然而,反之却很难,因为人们无法在比特系统中有效地编码量子数据;也就是说,一般的n个量子比特系统的状态需要(2n-1)个复杂的数字来指定。
因此,量子比特系统(以及更普遍的量子希尔伯特空间)构成了最终的数据表示媒介,因为它们不仅可以编码经典信息,而且可以编码从物理过程中获得的量子信息。
我们希望QML模型能够通过访问量子系统中的“量子”来解决学习任务。在不久的将来,量子数据的可用性将大大增加。仅仅是人们会使用现有的量子计算机这一事实,就会在逻辑上导致更多的量子问题被解决和量子模拟被执行。
这些计算将产生量子数据集,因此,有理由期待量子数据的迅速崛起。不过,在短期内,这些量子数据将以准备数据集的量子电路的有效描述形式存储在经典设备上。
最后,随着我们对量子技术控制水平的提高,可能会实现量子信息从物理世界到数字量子计算平台的连贯转换。这将在量子力学上模仿来自物理世界的经典数据的主要信息获取机制,这就是模拟-数字转换。此外,我们可以预期,实用的量子纠错和量子存储器的最终出现将使我们能够将量子数据存储在量子计算机中。
分析和学习数据需要一个参数化的模型,许多不同的模型已经被提出用于QML。
与经典的ML类似,存在几种不同的QML范式:监督学习(基于任务)、无监督学习(基于数据)和强化学习(基于奖励)。虽然这些领域中的每一个本身都是令人兴奋和蓬勃发展的,但监督学习最近因其实现量子优势的潜力、对噪声的弹性和良好的泛化特性(generalizationproperties)而受到相当大的
转载请注明:http://www.aideyishus.com/lkjg/6898.html