摘 要:由于量子纠错码的简并性以及传统匹配译码算法在错误相关性探测上的不足,拓扑量子码的译码问题一直以来都是很大的挑战。近年来,神经网络越来越多地应用到量子通信与量子信息中,极大地促进了量子科技的发展。这里,针对传统量子拓扑码的译码算法在错误相关性探测上的不足,搭建了卷积神经网络译码器,实现了拓扑量子码的高效译码。与传统匹配译码算法进行对比,提高了译码器对错误相关性的识别,实现了译码性能的提升。
本文源自马钟; 魏璐; 姚璐阳; 王云江, 无线电通信技术 发表时间:2021-05-31 《无线电通信技术》(双月刊)创刊于1972年,由中国电子科技集团公司第54研究所主办。无线电通信学术刊物。报道有关卫星通信、微波接力通信、散射通信、数字网与交换机等专业技术。
关键词:量子通信;拓扑量子码;神经网络;译码;相关性
量子纠错编码是保障量子通信传输与量子信息处理可靠性的关键手段。目前,关于量子纠错编码的研究主要集中在量子稳定子码领域,特别是拓扑量子纠错码更是近年来量子纠错编码领域的热点问题。拓扑量子码不仅具有容错阈值高、纠错能力强的特点,更因为其仅仅需要相邻量子比特间的关联操控,使其成为未来最有望硬件实现的量子纠错编码方案。然而,除了具有理论较优的性能,是否具有高效的译码算法也是量子纠错码能否真正落地实现的关键。这是因为,相比经典纠错码,量子纠错码更容易受到外界的干扰,造成信息的塌缩。而高效快速的译码策略可以有效缩短译码时间,从而极大地降低译码过程中的错误引入,这对于量子信息的快速处理与可靠存储至关重要。
目前,对于拓扑量子码而言,其应用最广泛的译码算法是基于图论的最小权重最佳匹配译码算法(Minimum Weight Perfect Matching,MWPM) [1]。其基本思想是将拓扑量子纠错码上的最有可能错误映射为该码所对应拓扑图中与错误图样相对应的最短距离,其对应于拓扑量子码上最有可能发生的错误。然而,由于量子纠错码独特的简并错误以及 MWPM 在错误相关性上探测的局限性,其译码效果性能仍未能达到人们的期望。
近年来,机器学习正逐步被引入到量子信息与量子计算中来。已有的研究成果表明,借助机器学习可以有效地解决量子信息处理中的若干难题。考虑到量子译码算法的重要性,基于神经网络的译码技术正逐步引起人们的关注[2-3]。例如,对于拓扑量子码而言,文献[4]中提出了一种基于全连接神经网络的拓扑量子码的译码策略。在该策略中,通过给定训练样本与标签,可以探测错误之间的相关性,明显缓解 MWPM 算法所固有的译码缺陷。
然而,全连接网络在应用于拓扑量子码的译码时,存在译码复杂度高、耗时相对较长的问题,这对拓扑量子码在实际中的应用十分不利。一方面,卷积神经网络由于所需的参数相对较少,在图像分析和处理领域有广泛应用;另一方面,拓扑量子码是一种基于拓扑结构的量子纠错码,其在平面上的展开就是一个个的二维结构,有着图的结构特点,这给了我们将卷积神经网络应用在拓扑码译码器上的新思路。
为此,在本文中,考虑基于卷积神经网络开展拓扑量子译码算法的设计,并通过实验仿真对构造的卷积神经网络译码器进行测试与验证。实验表明,本文所提的译码器同样可以克服 MWPM 所存在的不能有效识别量子错误的相关性这一问题,译码性能获得明显提升。并且由于相对全连接神经网络所需的参数更少,因而译码时效性也更强。
1 相关背景知识
1.1 量子稳定子码与拓扑量子码
量子稳定子码(Quantum Stabilizer Code)也称加性量子码,是目前量子纠错码的研究主流[5-9],其结构类似于经典线性码,其码字空间是由所有稳定子生成子的本征值为 1 的共同本征态所构成[5-8]。这里所谓的稳定子是由 Pauli 算子的乘积构成,对于量子稳定子码而言,要求所有的生成子彼此间相互对易,其角色相当于经典线性码的校验矩阵[8]。
量子纠错码中的错误种类很多,但 Shor 和 Steane 将复杂的量子态错误简化为单个量子位上的比特翻转错误、相位翻转错误和比特翻转加相位翻转错误,分别对应 X、Y、Z 三个 Pauli 矩阵[5]。随后,Preskill 指出单量子比特上发生的任意错误,都可能被视为以上三种错误的线性组合。这样对量子比特上错误的纠正,演变成对其上发生的 X、Y、Z 这三种错误的识别。
拓扑量子码(Topological Quantum Code)是具有良好抵抗噪声能力的一类稳定子码[9-10],区别于其他稳定子码的显著特点是其稳定子生成子的几何局部性。换句话说,该码的物理比特以规则的拓扑结构相互关联构成,且在某个几何区域内,每个稳定子的生成子都由恒定数量的量子比特支撑,例如 Toric 码。一般而言,该稳定子的非零元素个数相对物理量子比特的个数要小很多,因此也属于量子低密度奇偶校验(Low Density Parity Check)码的一种,常见的拓扑稳定子码包括 Toric 码、Surface 码、Color 码以及它们的高维形式。
1.2 拓扑码的最佳匹配算法
拓扑码的最佳匹配算法的基本思想是在图中求最短路径和[11]。以 Toric 码为例,该算法的匹配过程如图 1 所示。
图 1 中的图(a)和图(d)是 5 5 的 Toric 码,其中以蓝色标识是稳定子测量后得到的错误图样(Syndrome)为-1 的位置。依据编码理论可知,一个码字中发生少量错误的概率是大于发生多个错误的概率的,同样的结论也适用于量子纠错码。MWPM 算法就是找到具有同样错误结果的最短错误链。Toric 码里,经过一个量子比特(图(a)中的空心圆圈)计为一个单位长度,图(a)中任意两个错误之间的最短距离可以表示成图的形式,如图(b)所示。MWPM 算法就是找到图(b)中包含所有错误的最短路径,如图(c)所示,最后再映射回 Toric 码上(如图(d)所示),其中绿色标识就是找到的最短错误链。从这个匹配过程中可以看出,MWPM 算法就是找到能将所有的错误图样串联起来的最短路径。
2 基于卷积神经网络的拓扑量子码的译码设计
对于量子稳定子码,之前提到的 MWPM 译码算法并非是最佳的译码算法,原因在于其无法最佳地检测 Y 错误,即同一量子比特上的比特翻转错误和相位翻转错误的结合,MWPM 译码算法将其视为两个独立的错误[4,9],忽略了两者之间的相关性。虽然可以对该算法进行改进,用来解释错误之间的相关性。但因为在时间开销上较大,它们并不利于实际应用。
幸运的是,这些错误相关性可以用神经网络的模式匹配能力来识别。在文献[4]中,蒋良教授课题组提出一种基于神经网络的量子稳定子码译码器,其中神经网络用的是全连接前馈神经网络,隐藏层中的每个神经元都与前面和后面层中的神经元相连,且有多个隐藏层。该译码器在纠错能力上要优于经典的最小权重最佳匹配译码器。但相应的,因为全连接的前馈神经网络层与层之间是完全关联的,一旦网络深度增加,参数量会非常多,整个网络的计算量将会变得非常大,从而给梯度下降训练全连接网络带来极大困难。
考虑到卷积神经网络所需的参数相对较少,在图像分析和处理领域广泛应用,而拓扑量子码在平面上的展开恰是一个个二维结构,具有图的显著特征。为此,本文基于卷积神经网络设计实现拓扑量子码的译码器,用于识别量子比特上的错误关联,在提高译码性能表现的同时,降低译码时延。基本思路是:以 Toric 码的 X 和 Z 稳定子的测量结果及其对应的错误作为训练数据训练网络,使其具备预测 Toric 码中的每个量子比特上发生 X 和 Z 错误的概率分布的能力,再通过采样和硬判决取出一个预测的错误,验证该错误是否能产生同样的错误图样。如果不能,就重复采样,同时设置最大迭代次数。如果超过最大迭代次数还找不到真正的错误,就放弃迭代,认为此次译码失败。如果成功找到了对应的错误,则认为此次译码是成功的。具体的译码流程如图 2 所示。
这里的卷积神经网络,需要有多个卷积层,这是因为单个卷积层学到的特征一般比较局限。其中的下采样层(池化层)用来完成对特征的筛选,以进一步减少参数量。而 Softmax 层的作用是对全连接层的输出做归一化处理,转换为概率输出。卷积网络的输入是测量所得的错误图样,输出节点数量(输出层的神经元数量)取为 Toric 码量子比特数的 2 倍。
3 仿真实验
此次仿真实验,考虑不同码距的 Toric 码在所设计的卷积神经网络译码器下的表现。对于每个码距的 Toric 码,通过在译码器中输入数量相同的测量错误图样,判断并计算能够成功找到对应错误的比例。训练数据的生成是采用去极化信道,得到相应的错误图样和训练数据。每个噪声下最好的译码性能可能出现在不同的参数设置下,通过网络搜索法进行迭代,并把相应的译码结果和 MWPM 译码器进行了对比,如图 3 所示。
图 3 中横坐标表示信道错误概率,纵坐标表示给定大小相同的验证集,译码器成功译码的比例,d 表示对应 Toric 码的码距。由图 3 可知,CNN 译码器的阈值门限约为 0.162,较 MWPM 译码器有所上升。译码器阈值的提高,也表明 CNN 译码器对噪声的抵抗能力得到相对提升,能够容纳更高的噪声。
当信道错误概率低于阈值门限时,噪声小、影响弱,如果扩大码距,虽然译码器的译码能力是增加的,但是增加的程度会越来越小。因为随着码距的扩大,会使码字的错误空间迅速增长。而当信道错误概率高于阈值门限时,噪声的影响过大,严重干扰译码器的工作,如果再增加码距,反而降低译码器的译码能力。
在相同的噪声环境下,CNN 译码器能够获得更高的译码性能,原因主要是 CNN 译码器在错误相关性上带来的改善。为了说明这一点,图 4 中给出在码距为 7 时,只用 Z 稳定子和同时用 X 和 Z 稳定子的测量结果分别训练卷积神经网络所得到的译码性能图。
在去极化信道下,发生 X 错误和 Z 错误是等概的,Y 错误等价于同时发生 X 错误和 Z 错误;如果 X 和 Z 错误之间没有相关性,则两种错误就可以看作是独立的,图中的 2 条曲线应该重合。图 4 表明,通过卷积神经网络借助其特有的学习能力,能探测出来以上 2 种错误的相关性,改善了译码器性能,提高了纠错能力。
卷积神经网络比起全连接神经网络,一个显著特点就是参数量少,并由于卷积层中的参数可以共享,同时池化也降低了计算量。因此,训练速度相对来说快一些,消耗的时间少。表 1 是 bitch_size=512、d=5 时,全连接神经网络和卷积神经网络在相同大小的训练集下训练一轮(epoch)平均所需的时间,从表中清楚地看出,卷积神经网络的训练速度明显快于全连接神经网络。
4 结束语
本文工作进一步表明,神经网络译码器相比于传统 MWPM 译码器在探测错误相关性上具备更强的能力,有助于提升译码器的纠错能力。卷积神经网络译码器相对于全连接神经网络,参数量更少,在保证译码性能的同时,时间复杂度更低。未来的研究可以注重多元化的神经网络与量子纠错码的编译策略相结合。另外,目前的研究大多假设稳定子的测量过程是准确的,而实际中测量结果本身错误也难以避免,以上问题都将作为我们未来的研究工作。