浙江大学学报(工学版), 2024, 58(7): 1336-1345 doi: 10.3785/j.issn.1008-973X.2024.07.003

计算机与控制工程

基于KPCA和数据处理组合方法神经网络的半球谐振陀螺温度建模补偿方法

张晨,, 汪立新,, 孔祥玉

火箭军工程大学 导弹工程学院,陕西 西安 710025

Temperature modeling and compensation method of hemispherical resonator gyro based on KPCA and grouped method of data handling neural network

ZHANG Chen,, WANG Lixin,, KONG Xiangyu

School of Missile Engineering, Rocket Force University of Engineering, Xi’an 710025, China

通讯作者: 汪立新,男,教授. orcid.org/0000-0002-6584-527X. E-mail:wlxxian@sina.com

收稿日期: 2023-06-13  

基金资助: 国防科技创新特区基金资助项目(HHJJ-2022-0402).

Received: 2023-06-13  

Fund supported: 国防科技创新特区基金资助项目(HHJJ-2022-0402).

作者简介 About authors

张晨(1993—),男,博士生,从事惯性系统、大数据处理研究.orcid.org/0009-0001-1310-8390.E-mail:buaa0318@163.com , E-mail:buaa0318@163.com

摘要

针对半球谐振陀螺(HRG)的温度建模与补偿问题,提出基于核主成分分析(KPCA)和数据处理组合方法(GMDH)神经网络的建模补偿方法. 通过分析HRG的温度特性和大数据特征,初步确定网络模型的特征向量. 为了去除HRG输出数据的相关性和冗余性,引入KPCA并降低特征向量维度. 将特征向量代入GMDH神经网络训练,区分训练集和验证集以确定网络权值和网络结构,实现HRG温度漂移的建模与补偿. 实验结果表明,单一样本预测时,所提方法预测效果明显好于传统多项式模型;多样本预测时,在4种不同训练样本下,所提方法相比传统多项式模型精度分别提升了48.5%、54.0%、56.3%、68.4%,相比GMDH模型分别提升了3.6%、5.1%、3.8%、8.8%. 所提方法能够有效提高HRG在变温工况下的测量精度.

关键词: 半球谐振陀螺(HRG) ; 核主成分分析(KPCA) ; 数据处理组合方法(GMDH) ; 温度建模与补偿 ; 测量精度

Abstract

A modeling and compensation method based on kernel principal component analysis (KPCA) and grouped method of data handling (GMDH) neural network was proposed aiming at the temperature modeling and compensation of hemispherical resonator gyro (HRG). By analyzing the temperature characteristics and the big data characteristics of HRG, the eigenvectors of the network were initially selected. To remove the correlation and redundancy of the HRG outputs, KPCA was introduced and the eigenvector dimension was reduced. The eigenvectors were substituted into the GMDH neural network and the training set and the validation set were distinguished to determine the network weight and structure to model and compensate for the HRG temperature drift. Experiment results showed that the proposed method was significantly better than the traditional polynomial model for single-sample predictions; for multiple-sample predictions, under four different training samples, the accuracy of the proposed method was 46.5%, 51.5%, 54.6% and 65.3% higher than that of the traditional polynomial model, also 3.6%, 5.1%, 3.8% and 8.8% higher than that of the GMDH model. The proposed method effectively improved the measurement accuracy of HRG under variable temperature conditions.

Keywords: hemispherical resonator gyro(HRG) ; kernel principal component analysis(KPCA) ; grouped method of data handling(GMDH) ; temperature modeling and compensation ; measurement accuracy

PDF (3323KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张晨, 汪立新, 孔祥玉. 基于KPCA和数据处理组合方法神经网络的半球谐振陀螺温度建模补偿方法. 浙江大学学报(工学版)[J], 2024, 58(7): 1336-1345 doi:10.3785/j.issn.1008-973X.2024.07.003

ZHANG Chen, WANG Lixin, KONG Xiangyu. Temperature modeling and compensation method of hemispherical resonator gyro based on KPCA and grouped method of data handling neural network. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(7): 1336-1345 doi:10.3785/j.issn.1008-973X.2024.07.003

半球谐振陀螺(hemispherical resonator gyro, HRG)是高精度的振动陀螺仪,其敏感器件全部用熔融石英加工而成,包括半球振子、激励罩和读出基座3个元件. 当HRG的敏感轴绕惯性空间转动时,HRG的谐振子在绕中心轴旋转时有哥氏效应产生,在哥氏效应下谐振子振型在环向相对壳体进动[1]. HRG的输出会随着环境温度变化而变化, 进行温度建模补偿分析对提升HRG的输出精度意义重大. 周小刚等[2]采用独立成分分析方法建立陀螺的温度误差补偿模型,并对与温度有关的确定性漂移进行补偿,同时使用Allan方差对不确定性漂移进行分析补偿. 周强等[3]认为HRG谐振子频率随温度变化导致的输出变化是线性的,进而设计新的温度补偿电路,精准测试HRG的输出温度特性,将漂移由0.05°/h提高到0.03°/h. 吴宗收等[4]提出将改进的粒子群优化(particle swarm optimization, PSO)算法和自回归滑动平均(auto-regressive moving average, ARMA)建模方法结合起来,经过HRG升温实验检验,参数寻优能力相比传统方法提高了一倍. 李广胜等[5]将自回归(auto-regressive, AR)多变量模型引入HRG温度漂移模型的时间序列,借助系统辨识的相关理论,建立并分析了漂移和温度的多变量自回归模型. Li等[6]提出基于多元回归的HRG温度误差补偿方法,建立了补偿温度误差的多元回归模型,并通过升温和降温实验验证了该模型的补偿效果. 虽然补偿效果明显,但多元回归模型对原始数据要求较高,需要数据具有较好的可重复性.

HRG的输出数据具有非线性和非平稳性,传统的时间序列分析模型只能捕捉线性关系,不适合HRG预测分析. 核主成分分析法(kernel principal component analysis, KPCA)和数据处理组合方法(group method of data handing, GMDH)是处理非线性数据的常用方法. 汪国新等[7]将KPCA引入火力发电设备状态诊断与分析,提出多元时序分割算法. 实验结果表明,该算法能有效分析模型并准确提取非线性特征,可用于解决火力发电设备的状态诊断问题. 黄泽丰等[8]为了提升光场成像的空间分辨率,通过多尺度潜在低秩分解图像,并引入KPCA对各层特征系数进行融合,使得基础层和显著层的特征信息更加明显,所生成的图像具有更高的分辨率和更好的视觉效果. 高运广等[9]将KPCA模型引入非线性微惯性测量单元传感器故障诊断,在缩短参数选择时间和减少工作量的同时,使故障检测的准确率提高了18.44%. 段伟等[10]将GMDH神经网络引入地震液化场地分析,建立侧向变形的预测模型,该模型的准确度和可靠性都明显高于其他神经网络. 凯立德·艾尔巴兹[11]以盾构机为研究对象,提出集成GMDH神经网络和遗传算法的智能方法,预测了盾构机滚刀寿命;相比经验模型,该智能方法能够提供更高的准确度. Ahmadi等[12]针对一类逆变器,提出攻击弹性模型预测自适应控制器,借助GMDH网络估计系统的不确定性使系统免受脉冲、缩放和随机攻击的影响. Xie等[13]将GMDH神经网络应用于离群值检测模型,在有效消除离群值的同时,提高了训练后分类模型的分类精度. 针对光伏/燃料/电池系统的电压和功率调节问题,Band等[14]设计了基于GMDH神经网络的控制系统, 考虑了可变未知动态、未知温度和辐照以及输出负荷突然变化等运行条件,该系统在几种场景的仿真中相比其他方法表现出较好的性能.

针对HRG温度建模与补偿问题,本研究1)提出基于KPCA-GMDH神经网络的建模补偿方法,分析HRG全寿命数据的大数据特征,初步选取输入特征向量;2)基于KPCA去除初选特征向量之间的冗余性3)将筛选后特征向量代入GMDH网络建立模型;4)进行单一样本和多样本的训练和预测,对比不同模型的预测效果以验证所提方法的性能.

1. 半球谐振陀螺测试大数据分析

1.1. 半球谐振陀螺温度影响分析

在输入角速度为零时,陀螺的输出叫做零偏. 区别于传统机械陀螺,HRG的核心部件半球谐振子通过径向振动产生驻波,再由驻波的进动敏感输入角速度. HRG在工作时,环境温度的变化以及陀螺内部产热会影响谐振子的密度、半径、弹性模量和泊松比等参数,使得谐振子的固有频率发生变化,表现为陀螺的输出产生温度漂移,因此温度是引起陀螺漂移的重要因素之一. 零偏的温度漂移严重制约陀螺的精度,有必要对零偏的温度漂移进行抑制或补偿.

半球谐振子四波腹振动的谐振频率约为

$ f = 1.512\;7\frac{h}{{{r^2}}}\sqrt {\frac{E}{{(1+\mu )\rho }}} . $

式中:h为半球谐振子的厚度,r为半球谐振子的半径,E为弹性模量,μ为谐振子材料的泊松比,ρ为谐振子的材料密度. 上述变量中弹性模量受温度影响较大,该参数随温度变化的表达式为

$ E(T) = {E_0}[1 - {k_E}(T - {T_0})]. $

式中:E0为取常温时谐振子的弹性模量,kE为弹性模量随温度变化的系数,量级约为10−5. 式(2)是线性关系式,且E(T)与E0非常接近,将式(2)带入式(1)后在E0处进行泰勒展开即可获得较好的线性近似关系:

$ \begin{split} f = &\frac{{1.512\;7h}}{{{r^2}}} \sqrt {\frac{{{E_0}}}{{(1+\mu )\rho }}} \left[1 - \frac{1}{2}{k_E}(T - {T_0}) - \right. \\ & \left.\frac{1}{8}k_E^2{(T - {T_0})^2}+ \cdots \right]. \end{split} $

kE数值很小,保留一阶项即可获得理想的精度:

$ f = \frac{{1.512\;7h}}{{{r^2}}} \sqrt {\frac{{{E_0}}}{{(1+\mu )\rho }}} \left[1 - \frac{1}{2}{k_E}(T - {T_0})\right]. $

当保留一阶项时,谐振子谐振频率f与温度T为线性关系,因此,可以选取谐振频率作为HRG的温度漂移补偿模型的自变量特征. 式(4)中,温度T表示谐振子材料的实时温度,而非真实的环境温度. 谐振子从环境吸热的过程类似于热工过程,传递函数用典型一阶惯性环节近似表示为

$ {G_0}(s) = \frac{K}{{Fs+1}}. $

式(5)表明,谐振子谐振频率与环境温度存在非线性关系,在建立HRG温度漂移补偿模型时应当考虑;惯性环节表明谐振频率的导数项(离散变量为差分项或前一周期采样值)应当作为自变量特征.

1.2. 半球谐振陀螺测试大数据

工业大数据是以互联网大数据为基础,结合工业过程背景提出的新概念. 通过在时间上不断存储、积累过程运行数据,在空间上扩展、采集、运输数据,工业过程中遍布着不同尺度的时空间数据,以及散落于各级工业部门的不同来源、不同类别的数据. 工业大数据的主要特性是数据规模大,数据总类多,数据要求处理速度快,数据价值密度低,数据真实性低[15]. 为了处理工业过程中的大数据,解决复杂的控制、优化和故障评估等问题,大数据建模成为热门的研究方向. 王晓军[16]建立基于大数据的风洞试验段马赫数预测模型,提出特征子集集成方法、子模型学习算法和集成修建算法,有效提高了马赫数的预测速度及精度. 王龙晖[17]以调节阀为研究对象,提出基于大数据驱动的调节阀故障诊断方法、调节阀阀后压力预测方法,有效提升了调节阀的智能化水平. 杨小佳[18]将腐蚀大数据技术应用于低合金结构钢,并结合深度学习模型挖掘低合金结构钢内在腐蚀规律,验证了该技术的可靠性.

通过数据管理、分析和挖掘体系,可以得到HRG全寿命全周期测试的数据[19]. HRG测试数据数量巨大,符合“数据规模大”的特性;数据的采集和建模须进行实时处理,符合“数据要求处理速度快”的特性;每组数据中均包含冗余数据且数据价值实现程度低,符合“数据价值密度低”的特性;数据里通常包含有噪声数据,符合“数据真实性低”特性. 因此,可以认定HRG测试数据为工业大数据.

2. 核主成分分析和数据处理组合方法神经网络模型

2.1. 初选特征向量

在神经网络中,特征选择的好坏直接影响预测效果. 根据特征和因变量的相关程度,特征分为无关、弱相关和强相关3种,特征之间可能存在关系的相互重叠,根据特征间的相关程度,分为冗余和非冗余特征. 特征选择的作用是,消除原有集合中嘈杂、冗余和不相关的特征,优化训练模型,提高算法搜索效率,提高分类精度[20].

设定测试采集的${\mathrm{HRG}} $谐振频率为$ {{\boldsymbol{X}}_f} = [{f_1},{f_2},\cdots, {f_{\mathrm{N}}}] \in {{{{\bf{{{R}}}}}}^{N \times 1}} $, 其中$ f_i, i = 1, 2,\cdots, N $${\mathrm{HRG }}$谐振频率,N为样本个数. 一方面,谐振频率${\boldsymbol{X}}_f $数量级较大,而${\mathrm{HRG}} $的温度漂移输出值与谐振频率差分值${\mathrm{d}}{\boldsymbol{X}}_f $数量级都很小,从实际特性分析,各自变量特征阶数不应超过二阶,否则实际系数的量级远小于或大于其他自变量特征的系数,对应的自变量变化值对模型的影响可以忽略. 另一方面,$ X_f \cdot {\mathrm{d}}{\boldsymbol{X}}_f $与温度漂移输出值的数量级相接近,须考虑各自变量特征之间的交叉耦合项. 综合前文的分析,初步考虑以$ {\mathrm{d}}{\boldsymbol{X}}_f $$ \sqrt{{\boldsymbol{X}}_f} $${\boldsymbol{X}}_f $、常值偏置项及其各自的耦合项作为模型的自变量特征,形成12维特征输入向量$ {\boldsymbol{X}}_{12} $

$ \begin{split} {{\boldsymbol{X}}_{12}} = &[1,{\rm{ }}\sqrt {{{\boldsymbol{X}}_f}} ,{\rm{ }}{{\boldsymbol{X}}_f},{\boldsymbol{X}}_f^2{\rm{, }}{\mathrm{d}}{{\boldsymbol{X}}_f},{\rm{ }}\sqrt {{{\boldsymbol{X}}_f}} \cdot {\mathrm{d}}{{\boldsymbol{X}}_f},{\rm{ }}\\&{\rm{ }}{{\boldsymbol{X}}_f} \cdot {\mathrm{d}}{{\boldsymbol{X}}_f},{\rm{ }}{\boldsymbol{X}}_f^2 \cdot {\mathrm{d}}{{\boldsymbol{X}}_f},{\rm{ }}{({\mathrm{d}}{{\boldsymbol{X}}_f})^2},{\rm{ }}\\& {\rm{ }}\sqrt {{{\boldsymbol{X}}_f}} \cdot {({\mathrm{d}}{{\boldsymbol{X}}_f})^2},{\rm{ }}{{\boldsymbol{X}}_f} \cdot {({\mathrm{d}}{{\boldsymbol{X}}_f})^2},{\rm{ }}{{\boldsymbol{X}}_f^2} \cdot {({\mathrm{d}}{{\boldsymbol{X}}_f})^2}].\end{split} $

2.2. 基于核主成分分析的特征向量选择

初选的非线性特征向量之间存在相关性,不利于后续计算,为此,基于KPCA进一步筛选特征向量. 通过非线性映射$ \varPhi (\cdot) $将训练数据${\boldsymbol{X}} \in {{{{{{{{{\bf{R}}}}}}}}}^{N \times M}}$投影到新的高维空间${\boldsymbol{F}}$,其中$N$是样本数量,M为变量数,再对新的数据矩阵$ \varPhi ({\boldsymbol{X}}) \in {{\mathrm{{\bf{R}}}}^N} \times {\boldsymbol{F}} $进行线性主成分分析,得到加载向量${\boldsymbol{p}} \in{\boldsymbol{ F}}$,使得得分向量${\boldsymbol{t}} = \varPhi ({\boldsymbol{X}}){\boldsymbol{p}}$的方差最大化[21]. 优化过程的表达式为

$ {{\mathrm{max}} _{\boldsymbol{p}}}{\text{ }}\frac{{{{\boldsymbol{t}}^{\mathrm{T}}}{\boldsymbol{t}}}}{{N - 1}} = {{\mathrm{max}} _{\boldsymbol{p}}}\frac{{{{\boldsymbol{p}}^{\mathrm{T}}}{\varPhi ^{\mathrm{T}}}({\boldsymbol{X}})\varPhi ({\boldsymbol{X}}){\boldsymbol{p}}}}{{N - 1}}. $

式中:$ {{\boldsymbol{p}}^{\mathrm{T}}}{\boldsymbol{p}} = 1 $, $ {\boldsymbol{X}} = {\left[ {{{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2},\cdots,{{\boldsymbol{x}}_N}} \right]^{\text{T}}} $,存在系数向量${\boldsymbol{\alpha}} = {\left[ {{{{\alpha}} _1}{\text{,}}{\alpha _2}{\text{,}}\cdots{\text{,}}{\alpha _N}} \right]^{\mathrm{T}}} \in {{\bf{R}}^{{N}}}$满足

$ {\boldsymbol{p}} = \sum\limits_{j = 1}^N \varPhi \left( {{{\boldsymbol{x}}_j}} \right){\alpha _j} = {\varPhi ^{\mathrm{T}}}({\boldsymbol{X}}){\boldsymbol{\alpha}} . $

组合式(7)和式(8),KPCA优化变为

$ {{\mathrm{max}} _{\boldsymbol{\alpha }}}\frac{1}{{N - 1}}{{\boldsymbol{\alpha }}^{\mathrm{T}}}\varPhi ({\boldsymbol{X}}){\varPhi ^{\mathrm{T}}}({\boldsymbol{X}})\varPhi ({\boldsymbol{X}}){\varPhi ^{\mathrm{T}}}({\boldsymbol{X}}){\boldsymbol{\alpha }}. $

式中: $ {{\boldsymbol{\alpha }}^{\mathrm{T}}}\varPhi ({\boldsymbol{X}}){\varPhi ^{\mathrm{T}}}({\boldsymbol{X}}){\boldsymbol{\alpha }} = 1 $. 为了避免定义非线性映射$\varPhi ( \cdot )$,引入核矩阵${\boldsymbol{K}} = \varPhi ({\boldsymbol{X}}){\varPhi ^{\mathrm{T}}}({\boldsymbol{X}})$${\boldsymbol{K}}$的第$(i,j)$个元素计算式为

$ {\boldsymbol{K}}(i,j) = {\varPhi ^{\mathrm{T}}}\left( {{{\boldsymbol{x}}_i}} \right)\varPhi \left( {{{\boldsymbol{x}}_j}} \right) = \ker \left( {{{\boldsymbol{x}}_i},{{\boldsymbol{x}}_j}} \right). $

典型的核函数是高斯核$ \ker ( {{{\boldsymbol{x}}_i},{{\boldsymbol{x}}_j}} ) = \exp ( { - {{\| {{{\boldsymbol{x}}_i} - {{\boldsymbol{x}}_{{j}}}} \|}^2}/\sigma } ) $$\sigma > 0$为核宽度;多项式核$ \ker \left( {{{\boldsymbol{x}}_i},{{\boldsymbol{x}}_j}} \right) = = {\left( {{\boldsymbol{x}}_i^{\mathrm{T}}{{\boldsymbol{x}}_j}+{d_0}} \right)^{{d_1}}} $,其中$ {d_0} $$ {d_1} $为多项式核参数. 求解式(9)可以得到特征值分解为

$ {\boldsymbol{K}}{\boldsymbol{\alpha}} = (N - 1)\lambda {\boldsymbol{\alpha}} . $

${\text{ }}\tilde N \leqslant N$时,式(11)的解带来非零特征值${\lambda _1} \geqslant {\lambda _2} \geqslant \cdots{\lambda _{\tilde N}}$和对应的特征向量${{\boldsymbol{\alpha}} _i},1 \leqslant i \leqslant \tilde N$. 所有的特征向量${\boldsymbol{A}} = \left[ {{{\boldsymbol{\alpha }}_1}{\text{,}}{{\boldsymbol{\alpha }}_2}{\text{,}}\cdots{\text{,}}{{\boldsymbol{\alpha }}_{\tilde N}}} \right] \in {{\bf{R}}^{N \times \tilde N}}$被分成2个部分,其中前$K$个特征向量(对应的特征值不小于平均特征值)定义核的主成分子空间(principal component subspace, PCS),其余$\tilde N - K$个特征向量构成核的残差子空间(residual subspace, RS). KPCA模型训练计算内核的PCS,${\boldsymbol{T}} = {\boldsymbol{KA}} \in {{\bf{R}}^{N \times \tilde N}}$$ {\boldsymbol{X}} $的非线性特征. 测试向量${{\boldsymbol{x}}_t} \in {{\bf{R}}^M}$的第$ i $个核得分计算式为

$ {t_{t,i}} = {\varPhi ^{\mathrm{T}}}\left( {{{\boldsymbol{x}}_t}} \right){{\boldsymbol{p}}_i} = {\varPhi ^{\mathrm{T}}}\left( {{{\boldsymbol{x}}_t}} \right){\varPhi ^{\mathrm{T}}}({\boldsymbol{X}}){{\boldsymbol{\alpha }}_i} = {\boldsymbol{k}}_t^{\mathrm{T}}{{\boldsymbol{\alpha }}_i}. $

式中:${{\boldsymbol{k}}_t} = {\left[ {{k_{t,1}},{k_{t,2}},\cdots,{k_{t,N}}} \right]^{\mathrm{T}}} = \varPhi ({\boldsymbol{X}})\varPhi \left( {{{\boldsymbol{x}}_t}} \right) \in {{\bf{R}}^N}$,当${\text{ }}1 \leqslant j \leqslant N$时,${k_{t,j}} = \ker \left( {{{\boldsymbol{x}}_j},{{\boldsymbol{x}}_t}} \right)$. 累计方差贡献率(cumulative percent variance,CPV)准则根据主元方差的累计和百分比来确定主元个数. 把测量向量${\boldsymbol{x}}$协方差矩阵的前A个特征值的和除以所有特征值的和称为前A个主元的累计贡献率[22]. 前A个主元的累计贡献率为

$ {\text{CPV}} = \left.{{\displaystyle\sum\limits_{i = 1}^{{A}} {{\lambda _i}} }} \right/{{\displaystyle\sum\limits_{i = 1}^M {{\lambda _i}} }}. $

式中:$ {\lambda _i},{\text{ }}i = 1,2,\cdots,M $为对应的特征值,通常认为当CPV达到85%时,前A个主元包含了原数据足够多的信息. 初步的特征向量用式(6)表示,再根据KPCA和CPV准则计算,即可得到最终的特征向量.

2.3. 数据处理组合方法网络

GMDH网络是以KPCA-GMDH多项式为基础的复杂非线性系统辨识方法[23]. 假设非线性系统以$ {x_1}, {x_2},\cdots,{x_n} $为输入,$y$为输出,关系为

$ y = g\left( {{x_1},{x_2}, \cdots ,{x_n}} \right). $

函数$g$的离散沃尔泰拉(Volterra)级数展开式(KPCA-GMDH多项式)为

$ \begin{split} y = &{a_0}+\sum\limits_{i = 1}^n {{a_i}} {x_i}+\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{a_{ij}}} } {x_i}{x_j}+ \\& \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {\sum\limits_{k = 1}^n {{a_{ijk}}} } } {x_i}{x_j}{x_k}+ \cdots .\end{split} $

被广泛用于非线性模型的完全描述. 当$n$较大时,多项式的维度很高,因此完全确定$ {a_0},{a_i},{a_{ij}},\cdots $等参数的数值不现实. GMDH通过局部简单模型不断逼近式(15),得到近似模型如图1所示. 图中,部分多项式$G$为2个输入变量的完全多项式;$ {\theta _0},{\theta _1},\cdots,{\theta _m} $分别为每层的模型评价准则;$ {y_{ij}} $为由部分模型计算得到的输出,部分模型由拟合实测数据辨识得到;中间变量$ {x_{ij}} $是从$ {y_{ij}} $中按每层的模型评价准则值选出来的,将作为下一层的输入. 将最终筛选的特征向量带入GMDH神经网络,训练给出的输出值为$ {\hat y_i} $,即

图 1

图 1   数据处理组合方法的网络结构

Fig.1   Network structure of grouped method of data handing


$ {\hat y_i} = \hat g\left( {{x_{i1}},{x_{i2}}, \cdots ,{x_{in}}} \right);\;\;\; i = 1,2, \cdots ,n. $

$ {\hat y_i} $与实际输出${y_i}$往往存在偏差,残差平方和为

$ e = \sum\limits_{i = 1}^N {{{\left[ {\hat g\left( {{x_{i1}},{x_{i2}}, \cdots ,{x_{in}}} \right) - {y_i}} \right]}^2}} . $

$ e $最小化便得到GMDH神经网络结果.

2.4. 完整网络模型

图2所示为基于KPCA-GMDH神经网络模型的建模补偿方法的基本步骤. 1)分析HRG数据的大数据特征,初步考虑以${\mathrm{d}}f$$\sqrt f $$f$、常值偏置项及其各自的耦合项作为模型的自变量特征,形成12维特征输入向量${{\boldsymbol{X}}_{12}}$. 2)基于KPCA去除初选特征向量之间的冗余性,借助累计方差贡献率确定筛选后的特征向量${{\boldsymbol{X}}_A}$, A为筛选后的主元个数. 3)将实验数据分为训练集和验证集. 通过训练集确定网络权值和网络结构,完成完整KPCA-GMDH神经网络模型的构建.

图 2

图 2   主成分分析和数据处理组合方法神经网络模型

Fig.2   Network model of kernel principal component analysis and grouped method of data handling neural network


3. 模型预测分析

3.1. 实验条件设置

以HRG的多次输出数据为分析对象. 数据采集方案:将HRG安装在平台单轴回路中,测量地纬度为${29^ \circ }35'$,如图3所示. 实验输入量为地速竖直分量,输出量为平台框架输出角. 数据采集从陀螺通电瞬间开始,连续采集数据6~10 h,采样频率为0.04 Hz,采集参数包括陀螺转角、半球谐振子谐振频率. 共进行7次数据采集,每次间隔24 h.

图 3

图 3   半球谐振陀螺的实验装置

Fig.3   Experimental device of hemispherical resonator gyro


3.2. 实验数据预处理

3.2.1. 原始数据

实验共测得7组数据,以时间$ t $为横坐标,分别以谐振频率$ f $和陀螺转角$ \theta $为纵坐标,绘制原始数据曲线如图4所示.

图 4

图 4   半球谐振陀螺的参数变化曲线

Fig.4   Parameter variation curves of hemispherical resonator gyro


3.2.2. 扣除转台运动

在测试过程中,陀螺仪静止置于稳定平台上,因此将转台运动从实际测量输出中扣除. 考虑到转台近似以匀角速度转动,以一阶线性模型对输出值进行拟合,再由陀螺输出值减去拟合值获得实际输出值,扣除转台运动前、后HRG输出如图5所示.

图 5

图 5   扣除转台运动前后半球谐振陀螺转动角度

Fig.5   Hemispherical resonator gyro rotation angle before and after deducting turntable movement


3.2.3. 平滑曲线

平滑处理也称模糊处理,是图像处理领域常用的操作. 平滑样条曲线拟合方法是常用的平滑方法之一,它基于样条曲线和平滑系数来拟合曲线,能够最佳适应曲线中的数据点[24]. 如图6所示,原始数据存在“阶梯”和大量震动,推断为量化噪声,可以借助均值滤波函数使数据曲线更加光滑.

图 6

图 6   平滑前后半球谐振陀螺转动角度

Fig.6   Hemispherical resonator gyro rotation angle before and after smoothing


3.2.4. 去除异常样本

扣除转台运动后,将7次陀螺样本输出值依次解析. 查看原始数据发现,样本1存在500 s的未启动状态,其余样本存在40±3 s的未启动状态. 将未启动状态截除后,所有样本的输出统一按0起始时刻依次画出,如图7所示. 此时样本1不仅在输出时长上与其余样本不同,用于分析的初始段数据丢失较多,且整体输出值也明显异于其余样本,存在大量粗糙数据. 为了提高整体数据的处理精度,综合考虑后剔除样本1.

图 7

图 7   去除未启动状态数据后的半球谐振陀螺转动角度

Fig.7   Hemispherical resonator gyro rotation angle after removing data from inactive state


3.2.5. 数据重采样

分析陀螺的角速度$ \omega $. 数据量较大不利于后续处理研究,因此进行数据的重采样. 原始数据采样间隔为40 ms,现将每1 000个点取均值融合成1个点,即对原始数据进行重构. 每个样本的数据长度不一,为了方便后续处理,将末端的数据截断,取前480 min的数据,如图8所示.

图 8

图 8   重采样后的半球谐振陀螺转动角速度

Fig.8   Hemispherical resonator gyro angular velocity after resampling


3.3. 实验数据分析
3.3.1. 单一样本预测

选取样本后,通过初选特征向量和KPCA确定最终特征向量,随机取数据的80%作为训练集,剩余20%作为验证集,带入GMDH网络训练,并与多项式模型进行对比. 以样本2为例,其初选特征向量、经KPCA筛选后的特征向量、HRG的转动角速度的统计特性分别如表1表2表3所示.

表 1   样本初选特征向量的统计特性

Tab.1  Statistical characteristics of primary feature vectors for samples

特征最大值最小值平均值
$ \sqrt f $69.934969.930969.9340
$ f $4890.88814890.33644890.7693
$ {f^2} $2.319 2×1072.391 5×1072.392 0×107
$ {\mathrm{d}}f $0.0042−0.00050.0008
$ \sqrt f \cdot {\mathrm{d}}f $0.2950−0.03290.0540
$ f \cdot {\mathrm{d}}f $20.6294−2.30083.7751
$ {f^2} \cdot {\mathrm{d}}f $1.008 9×105−1.125 3×1041.846 3×104
$ {({\mathrm{d}}f)^2} $1.7795×10−501.6851×10−6
$ \sqrt f \cdot {({\mathrm{d}}f)^2} $0.001201.1785×10−4
$ f \cdot {({\mathrm{d}}f)^2} $0.087000.0082
$ {f^2} \cdot {({\mathrm{d}}f)^2} $425.5719040.3035

新窗口打开| 下载CSV


表 2   样本经核主成分分析筛选后的特征向量统计特性

Tab.2  Statistical characteristics of feature vectors for samples after kernel principal component analysis

特征最大值最小值平均值
${{\boldsymbol{X}}_1}$18.6932−95.12302.600 9×10−14
${{\boldsymbol{X}}_2}$9.5840−14.0542−7.9554×10−13
${{\boldsymbol{X}}_3}$6.1600−10.3414−1.988 5×10−13

新窗口打开| 下载CSV


表 3   样本转动角速度的统计特性

Tab.3  Statistical characteristics of angular velocity for samples

特征最大值最小值平均值
${\boldsymbol{Y}}$18.6932−95.12302.600 9×10−14

新窗口打开| 下载CSV


GMDH网络训练集的输入为

$ {\bf{Tin}} = [{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_2},{{\boldsymbol{X}}_3},{\boldsymbol{Y}}]. $

式中:${\boldsymbol{Y}}$为样本2陀螺的转动角速度. 通过训练确定神经网络模型后,带入验证集数据. GMDH网络验证集的输入为

$ {\bf{Vin}} = [{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_2},{{\boldsymbol{X}}_3}]. $

GMDH网络验证集的输出为

$ {\bf{Vot}} = [\hat {\boldsymbol{Y}}]. $

预测效果的评价指标选择均方根误差RMSE,计算式为

$ {\mathrm{RMSE}} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{(\hat Y_i - Y_i)}^2}} . $

式中:$N$为验证集数据个数. 最终预测结果如图9所示,其中$ \omega $为陀螺的角速度,$ \Delta \omega $为陀螺角速度预测误差,其余单一样本的训练结果如表4所示. 由表可知,不同训练样本下,KPCA-GMDH神经网络预测结果的RMSE均小于多项式预测结果的RMSE,说明前者的预测效果优于后者.

图 9

图 9   样本2的预测曲线及误差曲线

Fig.9   Prediction curve and error curve for sample two


表 4   不同样本预测结果的均方根误差

Tab.4  Root mean squared error of prediction results for different samples

样本RMSE
多项式预测KPCA-GMDH
20.000680.00064
30.003800.00300
40.004400.00290
50.004900.00470
60.004100.00370
70.000600.00050

新窗口打开| 下载CSV


3.3.2. 多样本预测

进一步验证KPCA-GMDH神经网络的鲁棒性,将多样本进行融合,其中样本A由原始样本2、3、5、6、7融合而成,样本B由原始样本3、5、6、7融合而成,样本C由原始样本2、5、6、7融合而成,样本D由原始样本3、5、6融合而成. 从实验数据预处理结果来看,样本2和样本7数据趋势较其余4个样本不同,因此推断,去掉样本2和样本7可以提升网络精度. 分别就融合样本A、B、C和D参与训练的4种情况进行实验,考虑到样本4在样本2、3、4、5、6和7中最为稳定,将样本4作为测试组,将KPCA-GMDH神经网络与多项式、GMDH网络进行对比,评价指标为误差标准差:

$ \sigma = \sqrt {\frac{1}{{N - 1}}\sum {{{({\varDelta _i} - \overline \varDelta )}^2}} } . $

式中:$\varDelta $为预测方法的预测误差. 实验结果如图10~图13表5所示. 由表可知,KPCA-GMDH模型相比传统多项式模型精度分别提升了48.5%、54.0%、56.3%、68.4%,相比GMDH模型分别提升了3.6%、5.1%、3.8%、8.8%,说明所提模型适用于HRG建模补偿,且降噪效果良好.

图 10

图 10   融合样本A拟合样本4的预测曲线及误差曲线

Fig.10   Prediction curve and error curve for fused sample A fitting sample four


图 11

图 11   融合样本B拟合样本4的预测曲线及误差曲线

Fig.11   Prediction curve and error curve for fused sample B fitting sample four


图 12

图 12   融合样本C拟合样本4的预测曲线及误差曲线

Fig.12   Prediction curve and error curve for fused sample C fitting sample four


图 13

图 13   融合样本D拟合样本4的预测曲线及误差曲线

Fig.13   Prediction curve and error curve for fused sample D fitting sample four


表 5   不同建模方法的误差标准差对比

Tab.5  Comparison of error standard deviations for different modeling methods

融合样本$\sigma $
多项式GMDHKPCA-GMDH
A0.02580.01380.0133
B0.03240.01570.0149
C0.02930.01330.0128
D0.03950.01370.0125

新窗口打开| 下载CSV


4. 结 语

以HRG大数据为研究对象,本研究提出基于KPCA-GMDH神经网络的建模补偿方法,实验并分析不同样本不同条件下HRG的输出精度,验证模型的有效性. 基于HRG大样本数据建立KPCA-GMDH神经网络模型. 实验表明,单一样本预测时,所提方法的预测效果明显好于传统多项式;在多样本预测时,所提方法的预测精度相比多项式模型分别提升了48.5%,54.0%,56.3%,68.4%;相比GMDH模型分别提升了3.6%、5.1%、3.8%、8.8%,说明所建模型适用于HRG建模补偿,且降噪效果良好. KPCA-GMDH神经网络模型会受训练样本的输入自变量(频率)的范围影响,测试样本的频率在训练样本的频率范围内就能够预测出较好的结果. 当新输入的测试数据不在训练集的频率范围内时,预测结果会出现较大的偏差,在后续工作中,计划通过补充实验扩大样本的方式,尽可能扩大训练样本的频率范围. 无论在何种训练模式下,KPCA-GMDH神经网络模型预测的HRG数据的标准差均在千分之一量级,基本满足零偏稳定性和快速启动性的要求.

参考文献

汪立新, 周小刚, 刘洁瑜, 等. 半球谐振陀螺惯性系统[M]. 西安: 西北工业大学出版社, 2011: 20–34.

[本文引用: 1]

周小刚, 汪立新, 佘嫱, 等

半球谐振陀螺温度补偿与实验研究

[J]. 宇航学报, 2010, 31 (4): 1083- 1087

[本文引用: 1]

ZHOU Xiaogang, WANG Lixin, SHE Qiang, et al

HRG temperature compensation and experiment research

[J]. Journal of Astronautics, 2010, 31 (4): 1083- 1087

[本文引用: 1]

周强, 覃施甦, 方海斌, 等

半球谐振陀螺温度特性及补偿分析

[J]. 压电与声光, 2015, 37 (5): 818- 820

[本文引用: 1]

ZHOU Qiang, QIN Shisu, FANG Haibin, et al

The temperature characteristic and compensating analysis of HRG

[J]. Piezoelectrics and Acoustooptics, 2015, 37 (5): 818- 820

[本文引用: 1]

吴宗收, 汪立新, 李新三, 等

一种改进PSO-ARMA半球谐振陀螺温度误差建模方法

[J]. 北京航空航天大学学报, 2022, 48 (6): 1050- 1056

[本文引用: 1]

WU Zhongshou, WANG Lixin, LI Xinsan, et al

An improved PSO-ARMA method for temperature error modeling of hemispherical resonator gyroscope

[J]. Journal of Beijing University of Aeronautics and Astronautics, 2022, 48 (6): 1050- 1056

[本文引用: 1]

李广胜, 蒋英杰, 孙志强, 等

基于AR多变量模型的半球谐振陀螺温度漂移建模

[J]. 传感技术学报, 2009, 22 (10): 1442- 1445

[本文引用: 1]

LI Guangsheng, JIANG Yingjie, SUN Zhiqiang, et al

Modeling temperature drift of HRG based on AR multi-variable model

[J]. Chinese Journal of Sensors and Actuators, 2009, 22 (10): 1442- 1445

[本文引用: 1]

LI X S, LI C, SHEN Q, et al

A multiple regression based method for indirect compensation of hemispherical resonator gyro temperature error

[J]. Scientific Reports, 2023, 13: 6019

DOI:10.1038/s41598-023-31868-2      [本文引用: 1]

汪国新, 郝勇生, 苏志刚

基于KPCA-GG的火力发电设备状态诊断方法

[J]. 东南大学学报:自然科学版, 2019, 49 (3): 542- 548

[本文引用: 1]

WANG Guoxin, HAO Yongsheng, SU Zhigang

Condition diagnosis method for thermal power generation equipment based on KPCA-GG

[J]. Journal of Southeast University: Natural Science Edition, 2019, 49 (3): 542- 548

[本文引用: 1]

黄泽丰, 杨莘, 邓慧萍, 等

基于MDLatLRR和KPCA的光场图像全聚焦融合

[J]. 光子学报, 2023, 52 (4): 0410004

DOI:10.3788/gzxb20235204.0410004      [本文引用: 1]

HUANG Zefeng, YANG Shen, DENG Huiping, el al

Light field all-in-focus image fusion based on MDLatLRR and KPCA

[J]. Acta Photonica Sincia, 2023, 52 (4): 0410004

DOI:10.3788/gzxb20235204.0410004      [本文引用: 1]

高运广, 蔡艳平, 盛安

基于模糊AGA-KPCA的MIMU传感器故障诊断方法

[J]. 中国惯性技术学报, 2022, 30 (6): 835- 840

[本文引用: 1]

GAO Yunguang, CAI Yanping, SHENG An

Fault diagnosis method for MIMU sensors based on fuzzy AGA-KPCA

[J]. Journal of Chinese Inertial Technology, 2022, 30 (6): 835- 840

[本文引用: 1]

段伟, 蔡国军, 袁俊, 等

基于GMDH的地震液化场地侧向变形预测模型

[J]. 东南大学学报: 自然科学版, 2021, 51 (2): 306- 311

[本文引用: 1]

DUAN Wei, CAI Guojun, YUAN Jun, et al

Prediction model for liquefaction-induced lateral spread displacement based on GHDH

[J]. Journal of Southeast University: Natural Science Edition, 2021, 51 (2): 306- 311

[本文引用: 1]

凯立德·艾尔巴兹. 基于机器学习技术的隧道掘进机性状的预测模型研究[D]. 上海: 上海交通大学, 2019: 35–46.

[本文引用: 1]

Khalid Elbaz. Performance prediction of tunnel boring machine by using machine learning techniques [D]. Shanghai: Shanghai Jiao Tong University, 2019: 35–46.

[本文引用: 1]

AHMADI A, ASADI Y, AMANI A M, et al

Resilient model predictive adaptive control of networked Z-source inverters using GMDH

[J]. IEEE Transactions on Smart Grid, 2022, 13 (5): 3723- 3734

DOI:10.1109/TSG.2022.3174250      [本文引用: 1]

XIE L, JIA Y, XIAO J, et al

GMDH-based outlier detection model in classification problems

[J]. Journal of Systems Science and Complexity, 2020, 33: 1516- 1532

DOI:10.1007/s11424-020-9002-6      [本文引用: 1]

BAND S S, MOHAMMADZADEH A, CSIBA P, et al

Voltage regulation for photovoltaics-battery-fuel systems using adaptive group method of data handling neural networks (GMDH-NN)

[J]. IEEE Access, 2020, 8: 213748- 213757

DOI:10.1109/ACCESS.2020.3037134      [本文引用: 1]

刘强, 秦泗钊

过程工业大数据建模研究展望

[J]. 自动化学报, 2016, 42 (2): 161- 171

[本文引用: 1]

LIU Qiang, QIN Joe

Perspectives on big data modeling of process industries

[J]. Acta Automatica Sinica, 2016, 42 (2): 161- 171

[本文引用: 1]

王晓军. 基于大数据的风洞马赫数集成建模方法的研究[D]. 沈阳: 东北大学, 2016: 9–15.

[本文引用: 1]

WANG Xiaojun. The research of ensemble methods based on big data for the Mach number prediction in wind tunnel [D]. Shen Yang: Northeastern University, 2016: 9–15.

[本文引用: 1]

王龙晖. 基于并行计算的调节阀大数据智能分析及建模方法研究[D]. 济南: 山东大学, 2019: 81–90.

[本文引用: 1]

WANG Longhui. Research on intelligent analysis and modeling of control valve big data based on parallel computing [D]. Jinan: Shandong University, 2019: 81–90.

[本文引用: 1]

杨小佳. 基于腐蚀大数据技术的含Cr低合金钢耐蚀性能调控研究[D]. 北京: 北京科技大学, 2021: 98–110.

[本文引用: 1]

YANG Xiaojia. Research on the control of corrosion resistance of Cr-containing low-alloy steel based on corrosion big data technology [D]. Beijing: University of Science and Technology Beijing, 2021: 98–110.

[本文引用: 1]

陈效真, 周姣, 董燕琴, 等

大数据理论在高精度惯性导航系统测试技术中的应用

[J]. 导航与控制, 2018, 17 (1): 11- 20

[本文引用: 1]

CHEN Xiaozhen, ZHOU Jiao, DONG Yanqin, et al

Application of big data technology on test technology of high accuracy inertial navigation system

[J]. Navigation and Control, 2018, 17 (1): 11- 20

[本文引用: 1]

王庆杰. 基于特征选择和时频分析的径流预测机器学习模型研究[D]. 乌鲁木齐: 新疆农业大学, 2022: 65–67.

[本文引用: 1]

WANG Qingjie. A machine learning model for runoff prediction based on feature selection and joint time-frequency analysis [D]. Urumqi: Xinjiang Agricultural University, 2022: 65–67.

[本文引用: 1]

DENG X, TIAN X, CHEN S, et al

Deep principal component analysis based on layerwise feature extraction and its application to nonlinear process monitoring

[J]. IEEE Transactions on Control Systems Technology, 2019, 27 (6): 2526- 2540

DOI:10.1109/TCST.2018.2865413      [本文引用: 1]

孔祥玉, 曹泽豪, 安秋生, 等

偏最小二乘线性模型及其非线性动态扩展模型综述

[J]. 控制与决策, 2018, 33 (9): 1537- 1548

[本文引用: 1]

KONG Xiangyu, CAO Zehao, AN Qiusheng, et al

Review of partial least squares linear models and their nonlinear dynamic expansion models

[J]. Control and Decision, 2018, 33 (9): 1537- 1548

[本文引用: 1]

徐田军, 王桂增

改进的GMDH方法及其在参数预报中的应用

[J]. 控制与决策, 1994, (5): 367- 371

[本文引用: 1]

XU Tianjun, WANG Guizeng

Improved GMDH algorithm and its application in parameter prediction

[J]. Control and Decision, 1994, (5): 367- 371

[本文引用: 1]

姚泽楷, 蔡耀仪, 李诗文, 等

基于平滑样条曲线结合离散状态转移算法的拉曼光谱基线校正方法

[J]. 中国激光, 2022, 49 (18): 1811001

DOI:10.3788/CJL202249.1811001      [本文引用: 1]

YAO Zekai, CAI Yaoyi, LI Shiwen, et al

Baseline correction for raman spectroscopy using cubic spline smoothing combined with discrete state transformation algorithm

[J]. Chinese Journal of Lasers, 2022, 49 (18): 1811001

DOI:10.3788/CJL202249.1811001      [本文引用: 1]

/