摘 要:基于门控循环单元(GRU)的神经网络,构建预测模型的网络拓扑结构,训练和测试了 HL-2A 装置等离子体水平位移系统响应模型。测试结果显示了该模型对 43%的样本数据的拟合度超过 80%。把该网络模型作为被控对象,使用基于径向基函数(RBF)神经网络的模型参考自适应控制(MRAC)算法,设计了一个 HL-2A 等离子体水平位移的 MRAC 系统。仿真结果显示,该控制系统的输出响应能快速地跟踪各种输入参考信号,控制器能够较好地控制等离子体的水平位移并具有强的抗扰动能力。
本文源自付贤飞;杨斌;王世庆;, 核聚变与等离子体物理 发表时间:2021-06-30
关键词:HL-2A 装置;等离子体水平位移控制;位移响应模型;门控循环单元;模型参考自适应控制
1 引言
在托卡马克放电运行过程中,等离子体位置控制是一项极其重要且十分基础的工作[1]。目前,建立面向位移控制的等离子体响应模型方法主要有两种:一种是基于等离子体的刚性电流丝模型假设的机理建模,另一种是基于实验数据进行系统辨识的数据建模。常见电流丝模型的物理模型有 GradShafranov 大环径比近似解模型[2]和 RZIP 模型[3],一般应用上述线性模型与托卡马克各线圈回路联立,得到一多输入多输出(MIMO)的状态方程,用于控制器的分析和设计,此类模型已在 TCV[4]、 JT-60U[5]和 FTU[6]等装置上得到了实验验证。机理建模虽然能很好地反映控制量与等离子体各参数之间的物理关系,但为了满足控制器的设计要求,在建模过程中需要进行大量的理想化假设和线性化的展开,此过程不但复杂,而且将不可避免地导致响应模型与实际系统之间存在偏差。
在数据建模研究中,文献[1]使用线性系统辨识理论获得了 EAST 装置等离子体垂直位移系统的滑动平均自回归(ARMAX)线性模型;文献[7]介绍了如何运用神经网络对等离子体位置模型进行参数辨识。从工程应用的角度出发,利用实验数据建模可以使模型尽可能地贴近实验响应,同时降低建模的难度和模型的复杂度,进而使模型更适于控制器的设计。但目前基于实验数据的系统辨识方法,在辨识过程中对输入信号要求极为严格,即要求输入信号在辨识实验中能够激活系统的所有模态,且这种传统的方法在辨识中,往往只是基于某一次的实验数据计算待辨识参数,这使得数据模型很难反映系统的全部特征。
深度学习中记忆能力较强的循环神经网络 (RNN),适合于处理和预测时间序列中间隔和延迟相对较长的事件。考虑到 HL-2A 装置放电的持续时间,一次放电实验将形成成千上万个等离子体位移采样点,是一组前后依赖紧密的时间序列。因此利用 RNN 网络理论,利用大量的 HL-2A 装置放电的历史实验数据集训练出等离子体水平位移系统的网络响应模型,测试数据集的验证结果显示出了令人满意的预测精度。最后,基于该网络模型设计了一个能够控制 HL-2A 装置等离子体水平位移的模型参考自适应控制器。
2 基于门控循环单元(GRU)的 HL-2A 装置等离子体水平位移系统模型
2.1 基于 GRU 的等离子体水平位移预测模型
针对使用 RNN 对长序列建模时,容易出现梯度消失或梯度爆炸的问题, Hochreiter 和 Schmidhuber[8]通过引入门机制更新信息,提出了长短期记忆网络(LSTM)。但 LSTM 的结构较复杂,训练和预测的时间成本较高。Cho K 等人[9]通过对 LSTM 结构的进一步优化,将门控单元由原来的 3 个改成 2 个,提出了基于门循环(GRU)的神经网络,使模型的构建和训练更为高效简洁。如今,GRU 在许多序列建模任务中广泛应用,包括 Google 的自然语言处理任务[10],序列预测[11, 12]及序列分类[13] 等。在核聚变领域,文献[14]使用 CNN-RNN 对受控核聚变中等离子体的破裂进行了准确预测。
为了实现对等离子体水平位移的准确预测,综合考虑离子体水平位移实验数据与 GRU 网络的特点,设计了以下拓扑结构的深度神经网络。输入的电压时序数据首先流入第 1 层 BiGRU 层(一种双向 GRU 网络),从 BiGRU 层输出的是长度不变且每个时间步记忆状态已经更新的序列;然后该序列流入第 2 层的 GRU 层,输出的是最后一个时间步的新的记忆状态;前两层的神经元数目均为 180 个;为了降低神经元之间连接的复杂性,防止过拟合的出现,第 3 层设置为 Dropout[15]层,图 1 显示了在网络训练过程中,有无 Dropout 层以及不同丢弃率下交叉验证集与训练输出的拟合情况,最终,丢弃率参数设置为 0.2,即随机选择前两层 20%的神经元进行临时删除;为防止 BiGRU 层和 GRU 层叠加的不稳定,第 4 层设置为全连接层进行调节,神经元个数为 180;第 5 层接着设置为全连接层,神经元的数目为 90 个;最后为输出层,输出拟合出的水平位移值。网络的拓扑结构如图 2 所示。网络的核心训练参数列于表 1 中。
2.2 评价指标
由于利用 GRU 深度神经网络建立等离子体水平位移模型本质上属于回归问题,为了更好地评价训练出的网络模型,可从预测值与实验值之间的偏差以及二者的一致性程度来评价该模型的预测效果。用均方根误差(RMSE)和确定系数(R2 ) [16]作为评价指标。RMSE 反映预测精确度,其值越小,表明预测精度越高;R2的值在 0~1 之间,刻画的是预测值与实验值之间拟合程度,其值越接近 1,表明拟合效果越好,公式分别为: 2 P 1 (- ) = n i Y Y RMSE n = ∑ (1) 2 p 2 1 2 1 (- ) =1- (-) n i n i Y Y R Y Y = = ∑ ∑ (2) 其中,Y 和YP 分别表示样本的实测值与预测值;Y 表示实测值的均值。
2.3 数据预处理
HL-2A 装置是带偏滤器的大型磁约束聚变实验装置,其磁场线圈包括:环向场线圈和极向场线圈(欧姆线圈、垂直场线圈、水平场线圈和多极场线圈)等[16]。为了让等离子体正常放电,并考虑到设备的安全性,使用闭环控制的方式进行此次实验。一共收集了 683 次等离子体放电实验数据,这些数据基本包含了 HL-2A 装置等离子体位移的所有信息(偏滤器位形)。HL-2A 装置的等离子体水平位移控制器是一个单输入单输出(SISO)系统,在网络训练时,将施加在垂直场线圈上的电压作为网络训练输入量,将等离子体水平位移作为网络训练输出量,即将一次放电实验中的垂直场电压和水平位移作为一组样本数据,包含等离子体电流上升段和平顶段的 900 个采样点,共 1800 个样本点数据。
683 次放电数据分成两部分,从中选取 80% 组成训练集,剩下的 20%组成测试集,即训练集为 546 次放电,测试集为 137 次放电,另再从测试集抽取 10%作为模型训练时的交叉验证集,以防止过拟合的发生。为了减少网络的训练时间和提高训练精度,将实验数据归一化到−1~1 之间,网络训练完成进行测试集的验证时再反归一化成原值[16]。
2.4 结果分析
使用 MATLAB 2019a 作为模型训练的工具,硬件环境配置为 Intel Core i5-6200U CPU@2.30GHz × 4、4G 内存、64 位处理器,采用 GPU:NVIDIA GeForce 930M 加速运算,模型训练速度是单独使用 CPU 时的 5.2 倍。使用了 683 次放电实验数据训练图 2 所示的 GRU 网络模型。然后,用测试集对训练好的网络模型进行了验证。随机从测试结果中选 10 组样本进行对比分析。基于 LSTM 网络预测与实验实测的水平位移对比如图 3 所示。
从图 3 的 10 组位移对比数据可以看出,基于 GRU 网络的等离子体水平位移模型对等离子体电流在上升段和平顶段的水平位移进行了预测,持续时间 900ms。可以看出,R2值为 0.89~0.95,即拟合度为 89%~95%,表示水平位移的预测值曲线能很好地拟合到实验值曲线。整个测试集的R2 值见图4,拟合度高于 80%的样本占整个测试集的 43%,拟合效果良好;同时,表示预测精确度 RMSE 的值都较小,图 3 所示的 10 组测试样本的 RMSE 值都小于 0.12,整个测试集的 RMSE 值见图 5,可知测试集的 RMSE 指标都在 0.4 以下,表明本文建立的基于 GRU 的等离子体水平位移模型精确度很高。
3 基于径向基函数(RBF)神经网络的模型参考自适应控制
3.1 基于 RBF 神经网络的 HL-2A 装置等离子体水平位移系统的模型参考自适应控制系统
考虑到第一阶段建立的 HL-2A 装置等离子体水平位移模型是一个深度神经网络(net),被控对象不是状态空间方程或传递函数,不便于根据经典控制理论设计出控制器。一个基于神经网络的控制系统设计相对简单,不需要被控对象模型的任何先验知识[18]。根据在自适应非线性控系统广泛应用的径向基函数(RBF)神经网络理论[19],设计了 HL-2A 装置等离子体水平位移的模型参考自适应控制 (MRAC)器[20~22]。
RBF 神经网络是一种输入输出非线性映射的单隐层三层前馈网络[23~26],网络结构如图 6 所示。
其中, [ ]T i x = x 为网络输入; [ ]T j h h = 为隐含层高斯基函数的输出;y 为网络输出; [ ]ij c c = 为隐含层第 j 个神经元高斯基函数中心点的坐标向量;bj 为隐含层第 j 个神经元高斯基函数的宽度;w 为输出层的权值。
基于 RBF 神经网络和 MRAC 理论,设计的 HL-2A 装置等离子体水平位移系统的控制器如图 7 所示。
设理性跟踪指令为 my t( ) ,则定义跟踪误差为: cmp et y t yt () () () = − (5) 网络权值学习误差指标为: 2 c 1 () () 2 Et e t = (6)
控制输入为 RBF 网络的输出: 11 2 2 m m u t hw hw h w ( ) = + ++ " (7) 由梯度下降法,网络的学习算法为: c () () () () ( ) ( ) ( 1) ( ) ( ) j j jj j j Et yt wt et h w ut wt wt wt wt η η α ∂ ∂ Δ =− = ∂ ∂ = − +Δ + Δ (8) 其中,η 为学习速率;α 为动量因子;η ∈[0,1] , α ∈[0,1]。同理可得: c 2 c 3 ( ) ( ) (t) () () ( ) ( ) ( ) ( ) j j j ij j j j Et yt u bt et b ut b y t x c e t wh ut b η η η ∂ ∂∂ Δ =− = ∂ ∂∂ ∂ − = ∂ (9) ( ) ( 1) ( ) ( 1) ( 2) j j jjj b t bt bt bt bt η α = − +Δ + − − − ⎡ ⎤ ⎣ ⎦ (10) c c 2 ( ) ( ) (t) () () ( ) ( ) () ( ) ij ij ij i ij j j j Et yt u ct et c ut c y t x c e t wh ut b η η η ∂ ∂∂ Δ =− = ∂ ∂∂ ∂ − = ∂ (11) ( ) ( 1) ( ) ( 1) ( 2) ij ij ij ij ij c t ct ct ct ct η α = − +Δ + − − − ⎡ ⎤ ⎣ ⎦ (12)
3.2 仿真与结果分析
本次仿真控制实验的步骤如下:
Step1: 选择被控对象 net 与参考模型 m r y t yt () () = ; Step2: 选择输入信号 r y t( ) 和自适应增益 γ=0.25; Step3: 采样当前参考模型输出 my t( ) 和系统实际输出 y t( ) ,计算误差 c e t( ) ; Step4: 根据公式(4)和(5)计算u t( ) ; Step5: t th → + ,返回 step3,继续循环。
单位阶跃响应的仿真输出响应如图 8 所示,仿真结果显示,基于 RBF 神经网络的 HL-2A 装置等离子体水平位移的 MRAC 系统可以快速跟踪到单位阶跃信号,将等离子体控制到期望位置,且超调时间很短,同时控制电压信号较稳定,变化幅值小,表明控制系统对垂直场电源的要求低。
考虑到 HL-2A 装置等离子体水平位移控制系统在实际的操作中,等离子体水平位移除了会受到垂直场线圈磁场的约束控制作用外,还会受到其他极向场线圈磁场和等离子体电流等的干扰,加之实验环境中的其他不确定因素也会对等离子体水平位移产生一定的干扰。因此,在输入的电压控制信号中叠加一定比例的高斯白噪声干扰信号,仿真结果显示,MRAC 控制系统的位移输出信号依然能很好地跟踪到参考信号,与加入干扰信号之前跟踪曲线相比,稳定性良好,说明本文设计的控制系统有很强的抗扰动性,仿真结果如图 9 所示。
目前,HL-2A 装置的等离子体水平位移控制采用的是基于 PD 调节的反馈控制方式[17]。为了更全面评价 MRAC 系统的性能,本文也使用了 PD 反馈控制的方法对等离子水平位移模型进行了仿真实验,两种控制方式的响应结果如图 10 和图 11 所示。可以看出,MRAC 系统的响应速度更快,PD 反馈控制的延迟稍大。在控制电压信号上,MRAC 系统和 PD 反馈控制一样,对垂直线圈控制电源的要求都较低。
4 结论
目前 HL-2A 装置在等离子体位移控制方面,是从物理原理出发建立线性响应模型,不能很好地反映放电实验中等离子体的真实位移。从工程应用出发,等离子体位移数据在时间和空间上具有一定的关联性,而深度神经网络中的 GRU 网络在处理长时间序列具有很大的优越性,不仅能在时间轴上自主关联序列中的信息,还具有较强的记忆学习能力。
结合深度学习框架中的 GRU 网络,利用 HL-2A 装置的历史实验数据,设计一个基于 GRU 的 HL-2A 装置等离子体水平位移模型。通过测试集对训练出的水平位移模型进行验证,并使用 RMSE 和 R2两个指标对模型进行评价,测试集样本的 RMSE 值都在 0.4 以下,表明建立的水平位移模型输出的位移数据序列精确度较高;拟合度高于 80%的样本占比 43%,即 137 组测试样本集中有 59 组样本的拟合度高于 80%,拟合效果最好的可达 97%,表明模型输出的位移曲线与实际的位移曲线拟合度很高,从而验证了从实验数据出发建立等离子体位移模型的可行性、有效性。
RBF 神经网络在非线性系统控制方面有很大的优越性,结合 RBF 神经网络和 MRAC 理论,以训练好的等离子体水平位移预测模型网络为被控对象,设计出了 MRAC 系统。通过施加阶跃响应信号和高斯白噪声,响应曲线表明系统均能很快的跟踪目标信号,且系统能自动地跟踪控制器的参数变化,进行自适应调整。与目前的 PD 反馈控制方法相比,MRAC 系统的响应特性更好,抗扰动性更强,能满足高参数等离子体物理实验对控制器精度要求。