【摘 要】毫米波大规模多输入多输出技术是提高5G移动通信容量的核心技术之一,其中混合预编码技术作为大规模MIMO系统中最关键的技术而被广泛研究。采用传统的迭代算法解决混合预编码问题通常导致较高的计算复杂度和严重的系统性能损失。机器学习方法由于其具有自适应学习和决策的优势而被应用于混合预编码器的设计工作中。在机器学习的基础理论上提出了一种采用交叉熵优化策略的混合预编码算法,通过迭代更新具有稳健误差的交叉熵损失函数得到最佳的混合预编码器组合,该组合被证明可以实现理想的传输总和速率,可以显著提高系统的能量效率。
【关键词】机器学习;交叉熵;混合预编码;大规模MIMO
《机器人技术与应用》(双月刊)1988年创刊,是公开发行的科技刊物,国际机器人联合会会员单位,在国内自动化领域享有很高的声誉,国外亦有一定的影响。
1 引言
大规模多输入多输出(MIMO)通信技术将在第五代移动通信系统中得到广泛的应用,MIMO天线的数量可以是成千上百个,理论上可以实现无限的通信容量。与此同时,该技术的实现需要理想的低功耗射频组件,并要求所有的复杂处理运算在基站处进行,例如信道估计、预编码和权值计算等。具体而言,基站作为发射端通常包含预编码器,该编码器能够进行复杂的混合预编码,利用信道状态信息(Channel State Information, CSI)生成预编码矩阵,也就是对发射信号进行预处理操作。因此,高效而准确地建模并求解传统的混合预编码问题受到了业界的广泛关注。
机器学习作为自适应学习和决策的人工智能工具之一,已经在图像/音频处理、社会行为分析和项目管理等方面得到广泛应用[1]。近年来,机器学习与无线移动通信领域的结合不仅仅停留在理论的研究阶段,高速和强大计算能力的硬件技术的出现,使得机器学习理论已经成为现实。智能基站和移动终端可以模仿人类的复杂学习和决策能力,对耗时和计算密集的多样化问题迅速做出最优决策。通过对毫米波大规模MIMO系统中的混合预编码问题进行严格建模,可以采用机器学习的方法训练出最优的预编码矩阵。在机器学习领域中的交叉熵[2]方法被應用于解决组合优化问题,这启发了将其应用于毫米波大规模MIMO系统中的复杂混合预编码方法的研究。
交叉熵方法来源于Kulback-Leibler距离,最早是在1997年由Rubinstein在估计随机网络稀有事件概率的自适应方法最小化算法中提出的。交叉熵理论是一种测量两个随机向量之间信息差异的计算方法,本质上是一种基于数学统计的全局随机优化算法。到目前为止,交叉熵方法已经被成功应用于建模为组合优化的各种问题中,包括缓冲区分配、电信系统的排队模型、神经计算、控制和导航、DNA序列比对、信号处理、调度、车辆路线、项目管理和可靠性系统[3]等。
本文在机器学习的基础理论上提出了一种采用交叉熵优化策略的混合预编码算法,通过迭代更新具有稳健误差的交叉熵损失函数得到最佳的混合预编码器组合,可以实现理想的传输总和速率,显著提高系统的能量效率。
2 研究背景
2.1 混合预编码
模数混合预编码是一项目前为止用于毫米波大规模MIMO系统中最有前景的混合预编码技术,旨在设计出低维的数字预编码器和高维的模拟预编码器,从而实现高效节能的混合预编码。混合预编码技术通过在数字预编码部分使用少量的射频链,在模拟预编码部分设计低成本的模拟电路从而实现接近全数字预编码的最优系统性能。
传统的混合预编码器中,模拟预编码部分可以使用移相器网络[6](如图1所示)或者开关选择网络[7](如图2所示),但是这两种方案分别在系统成本和性能上存在明显的缺陷。在大多数现有的文献中,移相器的能量消耗被证明是相对较高的(例如,4位移相器的能耗高达40 mW),而开关的能量消耗是很理想的(开关的能耗低至5 mW),但是图2所示的体系结构不能完全实现毫米波大规模MIMO阵列增益,导致了严重的系统性能损失。现如今,已有在无人机毫米波大规模MIMO场景中采用基于透镜阵列天线的混合预编码方案的研究[8],由此启发本文采用一种折中的混合预编码体系结构,模拟预编码部分由开关和反相器实现(图3所示)。事实证明,該体系结构的能量消耗远远低于移相器网络,同时,随着大规模MIMO中所有天线被使用,该体系结构还可以实现毫米波大规模MIMO阵列增益。
2.2 组合优化问题建模
交叉熵方法可以解决一般性的组合优化问题,其主要思想是通过构造随机序列,使其以一定的概率收敛到最优或次优的结果。设χ是一组有限的状态,S是χ上的实值性函数,实值函数S(x)的定义域为{x|x∈χ},若S(x)的最大值为γ*,则要使得下式取得最大值,本质在于寻找其对应的最佳状态,如公式(1)和(2)所示:
S(x*) γ*=S(x) (1)
其中,x*表示最佳的状态,在集合χ中寻找最佳的状态最大化实值函数S(x)。
首先,定义指示函数I{S(χi)}和参考概率密度函数族{f(.;v),v∈V},对于给定的实数γ,得到下面的关联估计表达式为:
其中,Pu是随机状态X 具有概率密度函数{f(.;v),v∈V}的概率度量,Eu表示相对应的期望算子,u 是某已知初始化概率分布的参数。如公式(2)所示,实值函数的最小化问题就转化为随机优化问题。
实际中应用交叉熵方法的应用主要有两个关键阶段:第一是根据一定的随机性或概率分布构造一个随机序列样本;第二是更新概率分布的参数,从而在下一轮迭代计算中产生更优的随机序列样本。
2.3 交叉熵方法
交叉熵量化信息量之间的“距离”——Kullback-leible距离[9],描述了两个概率分布之间的差异。当两个模型的概率分布保持一致时,交叉熵值更小,并且这两个模型之间的接近程度更大。更直观地讲,交叉熵的表达式为:
D(g,h)=Egln=∫g(x)lnh(x)-∫h(x)lng(x)
∫g(x)dx=1 (5)
∫h(x)dx=1 (6)
交叉熵方法解决了四个基本特征的问题:首先,根据优化目标建立概率密度函数,形成交叉熵目标函数;其次,根据概率分布函数生成样本集,并且参考目标函数的影响更新概率密度函数;然后,新概率分布函数用于生成一组新的样本,迭代重复目标函数;最后,当目标函数达到最优时,概率密度功能也达到了最佳解决方案。
交叉熵算法具有全局优化。它根据参数的概率分布密度函数生成样本解,在已经搭建好的组合优化问题模型中,概率分布和参数的形式决定了样本解决方案的整体质量。与其他智能算法相比,它避免了陷入局部最优和计算速度太慢的缺点。在优化过程中,交叉熵算法不要求每个生成的解决方案都优于样本解决方案的先前迭代的解决方案,但是在整个迭代过程中,预测结果往往越来越靠近理想中的标签样本。
3 基于机器学习的交叉熵混合预编码算法
3.1 混合预编码优化问题建模
本文采用如图3所示的基于开关和反相器的混合预编码架构,优化目标是设计出模拟波束形成器和数字预编码器的最优组合,使得系统可实现的总和速率达到最大,该优化问题可以表示为:
其中,表示满足由于图3的混合预编码体系结构带来的约束的所有模拟预编码器的集合,||FRFFBB||2F=ρ表示功率约束,η n 表示用户n 接收到的信干噪比。
在图3所示的体系结构中,每根射频链通过反相器和开关选择网络连接到天线子集,该连接方式导致模拟预编码矩阵成为块对角矩阵,如公式(8)所示。同时,由于反相器和开关被使用,模拟预编码矩阵中的元素取值有限,如公式(9)所示:
其中,表示第n个天线阵列上的模拟波束形成器。
第n个用户接受到的SINR可以表示为:
其中,hnFRF fBBnFHRFhHn表示用户n接收到的有用信号功率,hnFRF fBBiFHRFhHn表示用户n接收到的来自其他用户的干扰功率,σ2表示噪声功率。
因为公式(8)和(9)的存在,问题(7)成为一个模拟预编码矩阵FRF和数字预编码矩阵FBB的组合优化问题,本文要采用交叉熵方法得到最优的预编码矩阵组合,从而实现最大的系统总和速率。
3.2 具有稳健误差的交叉熵混合预编码算法
将交叉熵方法应用于上述组合优化问题,本文对传统的交叉熵方法加以改进,提出一种具有稳健误差的交叉熵混合预编码算法,与传统交叉熵方法类似,主要关注两个关键问题:第一:根据一定的随机性或概率分布构造一个随机序列样本;第二:更新概率分布的参数,从而在下一轮迭代计算中产生更优的随机序列样本。