浅谈张量网络：从经典数值模拟到量子人工智能

作者：博闻古今发布时间：2023-03-07

人工智能

首都师范大学物理系 冉仕举

文 / 胡月

量子物理与计算方法的发展总是紧密地相互交织在一起,其中,起源于量子物理的张量网络在这二者的发展中扮演者重要的角色。

二十世纪上半叶,量子力学的框架基本构建完成。此后,量子物理的发展面临了新的挑战:在求解量子多体体系时,由于方程由于太过复杂,使用纸与笔进行的解析方法在大部分情况下失效。

解决该问题的一个直接思路是引入近似,将问题简化直到能够实现解析求解,其中,平均场近似便是一个典型的例子。

由于此类方法的近似程度非常大,故而一定需抓住物理系统的本质,否则将带来极大的误差,甚至会得到错误的结果。

也正因为如此,一些成功的平均场理论往往被作为教科书中的经典例子,来提供对相关物理现象的本质解释。

随着计算机技术快速发展,其计算能力以“摩尔定律”的指数级速度高速增长,这为研究复杂的物理问题提供了新的强而有力的计算手段,数值模拟或仿真方法也逐渐成为了物理学的重要研究范式。

例如,基于密度泛函理论的第一性原理计算方法主要依赖于计算机模拟量子体系,其被成功用于具有较弱关联的量子系统数值模拟,时至今日仍然是凝聚态物理前沿研究版图中的重要构成部分。同时,该类方法孕育、催生了包括量子材料、量子化学等在内的一系列重要研究领域,取得了丰硕的研究成果。

随着研究的不断深入,许多不能被平均场准确描述的物理体系越来越得到学界的关注。这些体系往往具备较强或较长程的关联效应,从而展现出平均场等方法无法解释的新奇物理现象。然而,关联量子系统的计算复杂度往往随着系统尺寸增长而指数级地增长,该现象被称为“指数墙”或“维数灾难”。在此情况下,经典计算机的计算能力极限很容易被突破。

例如,当想要严格获取20个电子对应的量子态时,需要储存约1012个复数,这已经接近一般便携式计算机的能力极限。当电子个数达到30时,则需储存约1016个复数,此时需要使用超级计算机或计算集群来进行存储或运算。当电子个数达到135个时,量子态将包含约1080个复数,这几乎要用到我们所能观测到的宇宙空间中所有的原子来建立储存单元,这显然是一件不可能做到的事情。更何况就在人们呼吸的每一口空气中,所含电子个数的数量级高达1023,显然不可能使用经典计算机来严格处理其量子态。

为突破关联量子系统数值模拟中的“指数墙”,张量网络方法应运而生。

简而言之,张量网络将原本指数级复杂的数学表示写为由多个局域张量构成的网络模型,从而使得计算复杂度仅随系统尺寸增长而多项式级地增长。在使用平移对称性等数学技巧后,张量网络甚至可高效处理无穷大尺寸的量子体系。在二十多年的发展过程中,张量网络被成功用于对强关联量子系统相变、量子自旋液体、拓扑序等新奇物理现象的研究,加深了人们对强关联量子物理的理解。

就如同线性代数、微积分一样,张量网络作为一种基本的数学工具,其舞台绝非仅限于关联量子物理领域。其中,张量网络、量子计算、人工智能三者的交叉融合引起了学术界乃至产业界的广泛关注。

在传统人工智能领域,人们利用计算机优化、运行人工智能模型,实现了人脸识别、自动驾驶、机器翻译、棋类比赛等多个具有挑战性的任务,人工智能表现出的性能在多方面远超人类专家。例如在2016年,基于神经网络的智能围棋程序AlphaGo战胜了围棋世界冠军李世石,自此,人工智能开始在围棋这一曾被认为是“人类智力山峰”的活动上碾压人类棋手。

然而,以神经网络为主的人工智能方法所显现的一个重要缺陷是其“不可解释性”。由于神经网络本质上是一类复杂的非线性函数,人们难以对该类模型的数学性质实现系统性地描述,这导致相关研究往往不得不采用低效率的“试错”模式,这类似于缺乏化学科学体系指导下的“炼金术”。

同时,人们也很难定量刻画神经网络模型的学习能力、泛化能力、稳定性等关键性质,通过神经网络获得的也往往是单一的信息而难以形成知识。

近几年,基于张量网络的人工智能方法取得了令人振奋的进展。与神经网络相比,张量网络的独特优势在于其与量子物理的紧密联系,这为建立可解释人工智能模型与方法提供了新的思路,即利用量子理论解释张量网络人工智能。

例如,在使用张量网络处理图形识别问题时,其基本思想是利用量子态振幅捕获并存储经典图像数据的概率统计信息,从而利用量子态的统计特性完成分类、生成等任务。来自多个研究机构的工作证实了该思想的有效性,其中E. Stoudenmire等与Z.-Y. Han等分别提出将张量网络态用于机器学习中的分类与生成模型的构建;Z.-Z. Sun等基于矩阵乘积态提出了新的生成性张量网络分类算法;D. Liu等、I. Glasser等和W. Huggins等分别提出了不同层状结构的张量网络,实现了深度张量网络机器学习;Y.H. Liu等、S.C. Bai等揭示了张量网络量子纠缠特性与特征重要性间的关系,并基于此提出了新的特征选择方法;等等。

除基于量子理论的可解释性外,张量网络的另一个特有优势是其可借助量子硬件实现高效计算。与关联量子物理的数值模拟类似,人工智能也需要极为庞大的计算资源,例如今年提出的ChatGPT-3智能程序的参数量就高达1750亿。

量子计算这一新计算技术的发展,为高效执行超大规模计算任务带来了新的曙光。量子计算的本质是利用量子态承载信息,并利用量子系统实现计算任务。早在二十世纪末,物理学家就已着手论证量子计算在性能上的优越性,这种优越性也被称为“量子霸权”。例如,P. Shor在1994年提出的分解算法理论上可在量子计算机上以指数快的速度实现质因数分解。如果这一指数加速得以实现,现有加密体系将遭到前所未有的挑战。

对量子计算优越性的追求促进了超导体、离子阱等量子硬件技术的高速发展。自本世纪初,量子计算机的规模(即可控量子比特数)正以“超摩尔定律”的速度增长。目前,多个研究机构已实现了含有数百个量子比特的量子计算平台,这预示着在不远的将来,人们将可能从“经典计算时代”逐步迈入“量子计算时代”。

届时,人们预期张量网络将为利用量子计算平台解决量子物理、人工智能等领域中的超大规模计算问题提供强大的数学工具,也期待能够在新的计算平台上,见证新的、更加优越的量子模拟与计算方法,乃至如《流浪地球》中MOSS一样的量子人工智能的诞生与发展。

作者简介:

冉仕举,首都师范大学物理系副教授,主要研究量子多体物理、张量网络理论与方法、量子信息与量子计算、量子机器学习,发表学术论文40余篇,出版专著《Tensor Network Contractions》与《张量网络》。