浙江大学学报(工学版), 2025, 59(7): 1547-1556 doi: 10.3785/j.issn.1008-973X.2025.07.023

航空航天技术

高精度测量装置大气环境参数校准深度学习混合代理模型

袁新博,, 徐兆斌,, 李自茹, 潘健, 金小军, 金仲和

1. 浙江大学 微小卫星研究中心,浙江 杭州 310027

2. 浙江省微纳卫星研究重点实验室,浙江 杭州 310027

3. 浣江实验室,浙江 诸暨 311899

Deep learning hybrid agent model for atmospheric environment parameter calibration in high-precision measurement devices

YUAN Xinbo,, XU Zhaobin,, LI Ziru, PAN Jian, JIN Xiaojun, JIN Zhonghe

1. Micro-Satellite Research Center, Zhejiang University, Hangzhou 310027, China

2. Key Laboratory of Micro-Nano Satellite Research of Zhejiang Province, Hangzhou 310027, China

3. Huanjiang Laboratory, Zhuji 311899, China

通讯作者: 徐兆斌,男,副教授. orcid.org/0000-0003-3059-8974. E-mail:zjuxzb@zju.edu.cn

收稿日期: 2024-06-26  

基金资助: 国家自然科学基金资助项目(U21A20443,62073289).

Received: 2024-06-26  

Fund supported: 国家自然科学基金资助项目(U21A20443,62073289).

作者简介 About authors

袁新博(2000—),男,硕士生,从事高精度测量、卫星路由研究.orcid.org/0009-0000-4802-5408.E-mail:xinbo@zju.edu.cn , E-mail:xinbo@zju.edu.cn

摘要

为了提高测量装置在野外校准时的大气折射率补偿精度,提出基于深度学习理论的高精度物理场混合代理拟合模型. 正逆向时间序列预测扩充传感器阵列,获取高精度的环境参数优化大气折射补偿系统,增加同一时刻传感器阵列观测点位的分布密集程度. 以气象参数中的温度场为例,仿真结果表明,所提模型相较于传统多点法补偿模型具有更高的精度,所提模型使环境参数的精度提高了71.8%,标准差降低了73.1%. 蒙特卡洛仿真分析的结果证明,所提模型相较于传统多点法具有更强的稳定性.

关键词: 测量装置 ; 环境参数 ; 传感器阵列 ; 时间序列分析 ; 径向基函数插值

Abstract

A high-precision physical field hybrid agent fitting model based on deep learning theory was proposed, in order to improve the compensation accuracy of a measurement device for the atmospheric refraction index in-field calibration. The sensor array was expanded by forward and backward time series prediction, the atmospheric refraction compensation system was optimized by obtaining high-accuracy environmental parameters, and the density distribution of sensor array observation points was increased at the same moment. Taking the temperature field among meteorological parameters as an example, simulation results show that the proposed model achieves higher accuracy than traditional multi-point compensation models. The proposed model improved the accuracy of environmental parameters by 71.8% and reduced the standard deviation by 73.1%. Monte Carlo simulation analysis demonstrates that the proposed model exhibits stronger stability compared to traditional multi-point methods.

Keywords: measurement device ; environmental parameter ; sensor array ; time series analysis ; radial basis function interpolation

PDF (1398KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

袁新博, 徐兆斌, 李自茹, 潘健, 金小军, 金仲和. 高精度测量装置大气环境参数校准深度学习混合代理模型. 浙江大学学报(工学版)[J], 2025, 59(7): 1547-1556 doi:10.3785/j.issn.1008-973X.2025.07.023

YUAN Xinbo, XU Zhaobin, LI Ziru, PAN Jian, JIN Xiaojun, JIN Zhonghe. Deep learning hybrid agent model for atmospheric environment parameter calibration in high-precision measurement devices. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(7): 1547-1556 doi:10.3785/j.issn.1008-973X.2025.07.023

随着全站仪、电子测距仪、激光测距仪、微波测距装置等先进测绘技术的迅速发展,传统的测量方法被逐步取代. 先进测量设备显著提升了测量精度,但测量结果对大气环境参数波动的敏感性增加. 如何实现高精度的大气折射率修正是测距装置进行检定校准的关键因素[1].

野外环境获取大气折射率主要依赖大气环境参数测量法,该方法原理简单,精度可达10−8[2],理论上能够满足大部分测量装置的校准精度要求. 由于野外环境的大气参数抖动、参数分布不均匀性及大气参数处理算法不足,该方法在实际应用中的长距离测量不确定度很难达到10−7[3]. 传统的大气折射率补偿方法为两点法[4],即在检测环境两端分别架设环境参数检定装置. 一般情况下,两点法在短距离测距校准时能够满足需求,但随着距离的增加,两点法的测量结果不足以代表该距离段内的平均温度. 为了监测环境场的局部梯度,德国联邦物理技术研究所PTB[5]采用多点法布置60个Pt-100温度传感器以确保环境参数的高采样密度. 该方法距离测量的不确定度为8.2×10−7,误差修正结果较两点法优越. 陈杨等[6]提出基于传感器阵列的环境参数自动测量系统,采用等效面积法处理传感器阵列采集的数据,距离测量不确定度优于3.0×10−7. 刘学德等[7]对1.2 km自动测量系统进行改进升级,在沿线附近布置82个传感器并采用分组并行采集传感器数据的改进方案,大幅降低了传感器采样周期,控制折射率修正误差不超过5×10−8. 谷友艺等[8]提出基于多点法的分段线性插值融合径向基神经网络方法,在保证精度的前提下,提升了温度场曲线整体平滑性和曲率渐变性,比分段线性插值法更符合实际环境参数变化情况.

综上所述,提高物理场测量精度比较简单的方法是增加传感器阵列的密集程度. 野外测量地形影响、高精度传感器和辅助测量设备的成本限制,降低了通过提高传感器精度或数量来提升环境参数测量精度的可行性. 深度学习技术在时序预测、序列分类及信号处理等时间序列分析领域展现出强大的能力[9-11]. 在测量系统进行大气折射率修正时,本研究将传感器在指定时间段的前后时间段置于其他点位,将前后时间段的时间序列预测得出的孪生数据扩充至修正时间段,以扩充传感器阵列观测点位. 这种经深度学习改进的传感器布局模型能够充分利用有限的传感器资源,降低长距离测量时大气折射率补偿的不确定度. 针对当前高精度测量装置的大气环境参数校准模型的需求与现有方法的缺陷,本研究在扩充传感器阵列的基础上,提出径向基插值融合多项式拟合的混合代理模型,结合2种模型的优势并加入正则化分析. 所提模型能够避免函数拟合时的龙格现象和过拟合现象,使环境场的可解释性增强,较好地应用于高精度测量装置的大气折射修正领域.

1. 融合深度学习的高精度物理场拟合模型

基于深度学习的高精度物理场拟合方法充分发挥了深度学习的优势,在使用正逆向时间序列分析的基础上,扩充一维环境场上的传感器阵列,使物理场拟合时的观测点位更为密集;径向基插值融合多项式拟合的混合代理模型在拟合前加入径向基插值处理,增强物理场拟合前的平滑性,避免发生龙格现象;将正则化加入混合代理模型的多项式迭代损失函数中进行最优化处理,选定最佳多项式拟合次数.

1.1. 卷积神经网络扩充传感器阵列

1.1.1. 正向时间序列扩充传感器阵列

卷积神经网络(convolutional neural network,CNN)是深度学习中常用的神经网络架构,广泛应用于计算机视觉、自然语言处理(natural language processing,NLP)中的文本分类、语音识别任务[12-14]. 经典一维CNN架构如图1所示,主要由卷积层、池化层和全连接层组成. 在进行时间序列分析时,时间序列通常作为一维序列信号输入一维卷积神经网络(1DCNN)进行处理. 为了稳定训练效果、加速神经网络收敛速度并缓解梯度爆炸问题,数据输入前须进行归一化处理:

图 1

图 1   典型一维卷积神经网络架构图

Fig.1   Architecture diagram of typical 1D convolutional neural network


$ {\text{BN}}\;(x) = \gamma \times \frac{{x - \mu }}{\sigma }+\beta . $

式中:${\text{BN}}\;(x)$为归一化处理后的数据;$x$为原始输入数据;$\mu $为该段数据的均值;$\sigma $为数据的标准差;$\gamma $$\beta $分别为可学习的缩放和偏置参数,用于调整数据的尺度和偏移量. 对输入卷积层的数据进行局部特征检测,一维卷积的表达式为

$ x[i] = f\left(\sum\limits_0^{K - 1} {w[j] * x[i+j]} +b\right). $

式中:$ x[i] $为输入序列的第$i$个元素;$K$为卷积核大小;$ w[j] $为卷积核的第$ j $个权重;$ x[i+j] $为输入序列的第$ i+j $个元素;$b$为卷积过程中的偏置参数;$ f $(·)为卷积过程的激活函数,常用的激活函数有Sigmoid、tanh、ReLU(rectified linear unit)等.

ReLU激活函数能够引入网络的非线性变换并提高神经网络的计算效率,在神经网络应用中备受关注. ReLU激活函数在输入值为负数时采用直接截断的处理方式可能导致数据丢失[15-16],本研究提出IReLU(index rectified linear unit)激活函数,表达式为

$ f(x) = \left\{ {\begin{array}{*{20}{l}} x, & x > 0; \\ {x{e^x}}, & x \leqslant 0. \\ \end{array}} \right. $

图2所示,IReLU激活函数在负半轴引入指数增长,使负半轴上的非线性剧烈,有利于捕捉数据中的复杂结构,避免一些情况下的梯度消失问题.

图 2

图 2   激活函数性能对比图

Fig.2   Performance comparison for activation functions


池化层主要用于减小特征向量的空间维度并降低计算量. 常见的池化操作有最大池化和平均池化,最大池化选择每个池化窗口中的最大值作为输出,有助于提取时间序列中的主要特性. 本研究采用最大池化法,以保留特征向量中最显著的特征. 结合改进后的一维卷积神经网络,基于深度学习正向时间序列扩充一维空间环境传感器阵列的方法如图3所示. 以三点传感器阵列为例,通过标注传感器1~3的点位,使传感器点位在一维空间中均匀分布,并实时测量${t_1} \sim {t_2}$时刻的数据;在${t_2} \sim {t_3}$时刻,移动传感器至传感器Ⅰ~Ⅲ位置,由一维卷积神经网络对传感器1~3进行时间序列分析,预测${t_1} \sim {t_2}$时刻后一段时间的孪生数据,实现一维空间中传感器阵列扩充,为后续一维空间环境场预测提供理论与数据支撑.

图 3

图 3   基于深度学习的扩充传感器阵列模型

Fig.3   Model for expanding sensor array based on deep learning


1.1.2. 逆向时间序列扩充传感器阵列

提出基于逆向时间序列扩充传感器阵列的方法,通过逆向时间序列分析进一步扩充传感器观测点位. 一组离散时间序列:

$ {{\boldsymbol{X}}_{{t}}} = [{x_0},{x_1},{x_2}, \cdots ,{x_t}];\quad t = 0,1,2, \cdots ,T. $

式中:$ {{\boldsymbol{X}}_{{t}}} $为时刻$t$的时间序列,包含${x_0} \sim {x_t}$的观测值. 将式(4)的时间序列进行逆向处理,即表示为${x_t}$${x_0}$的时间序列:

$ {{\boldsymbol{X}}_{{\text{REV}}}} = [{x_t},{x_{t - 1}},{x_{t - 2}}, \cdots ,{x_0}]. $

式中: $ {{\boldsymbol{X}}_{{\text{REV}}}} $为逆向时间序列. 如图4所示为根据逆向时间序列逆推数据的方法. ${t_s}$为时间划分点,将${t_s}$之后的观测点作为训练集,之前的观测点作为测试集. 经过训练和测试后的深度学习模型可应用于实际集进行时间序列预测实验,训练集和测试集的表达式分别为

图 4

图 4   逆向时间序列分析示意图

Fig.4   Schematic diagram of reverse time series analysis


$ {{\boldsymbol{X}}_{{\text{TR}}}} = [{x_t},{x_{t - 1}},{x_{t - 2}}, \cdots ,{x_s}], $

$ {{\boldsymbol{X}}_{{\text{TE}}}} = [{x_{s - 1}},{x_{s - 2}},{x_{s - 3}}, \cdots ,{x_0}]. $

为了获得较好的训练模型,将均方根误差RMSE作为评估指标,测试集中预测值与实际值之间的偏差:

$ {\text{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({{\hat y}_i} - {y_i})}^2}} } . $

式中:${\hat y_i}$为第$i$个样本的预测值,${y_i}$为第$i$个样本的实际值,$n$为待测数据量. 逆向时间序列划分算法流程如算法1所示. 算法主要分为2个部分:设置测试集和训练集的划分索引${t_s}$,并对整个正向时间序列进行逆向操作;设置窗口宽度并划分测试集和训练集. 算法1的第1~4行是对时间序列进行逆向操作并整体划分,第5~7行是对测试集和训练集进行窗口划分.

算法1  逆向时间序列划分算法

输入:正向时间序列${\boldsymbol{X}}$和序列划分比值$\gamma $

1. 初始化划分时间$ {t}_{s}=\text{floor}\;(\gamma ·T) $

2. 对时间序列进行逆向处理${\boldsymbol{X}} = {\text{reverse}}\;({\boldsymbol{X}})$

3. ${{\boldsymbol{X}}_{{\text{TE}}}}$$\{ {x_n}\} _{n = 0}^{{t_s}}$

4. ${{\boldsymbol{X}}_{{\text{TE}}}}$$\{ {x_n}\} _{n = {t_s}}^T$

5. 设置滑动窗口${\text{slide}} = N$

6. ${{\boldsymbol{X}}_{{\text{TR}}}} = {\text{split}}\;({{\boldsymbol{X}}_{{\text{TR}}}},{\text{len}}\;({{\boldsymbol{X}}_{{\text{TR}}}})/N)$

7. ${{\boldsymbol{X}}_{{\text{TE}}}} = {\text{split}}\;({{\boldsymbol{X}}_{{\text{TE}}}},{\text{len}}\;({{\boldsymbol{X}}_{{\text{TE}}}})/N)$

输出:逆向时间序列的训练集和测试集${{\boldsymbol{X}}_{{\text{TR}}}}$,$ {{\boldsymbol{X}}_{{\text{TE}}}} $.

经过对时间序列的逆向处理及划分,逆向时间序列转化为正向时间序列. 如图5所示为改进后的正逆向时间序列扩充传感器阵列的整体模型. 模型在仅考虑正向时间序列扩充传感器阵列的基础上,于${t_3} \sim {t_4}$时刻扩充了传感器$1'\sim 3'$的时间序列. 实验以${t_2} \sim {t_3}$时间段的数据作为扩充的数据集,因此该时间段的数据属于滞后数据. 基于逆向时间序列分析对滞后数据的前一段时间(${t_2} \sim {t_3}$时间段)的数据进行反演,进一步扩充传感器阵列. 基于深度学习的正逆向时间序列扩充传感器阵列的方法较好地融合了深度学习的优势:1)强大的数据拟合能力. 不同于传统的线性回归方法,该方法能够捕捉时间序列中的复杂非线性关系,有利于处理噪声较多的传感器数据,能够提升传感器数据的预测精度. 2)对不同应用环境适应性强. 该方法可以快速适应不同的环境变化和多种类型的传感器,泛用性强. 深度学习模型的泛化能力和自适应能力可以确保基于深度学习的正逆向时间序列扩充传感器阵列的方法在不同环境下保持良好性能. 3)增加传感器点位密度. 引入正逆向时间序列的概念,增加了模型中的传感器点位数据量,使改进后的传感器阵列扩展至原来的3倍,大大提高了后续物理场预测的精度.

图 5

图 5   基于正逆向时间序列扩充传感器阵列的模型

Fig.5   Model of expanding sensor array based on forward and backward time series


1.2. 融合径向基函数插值的多项式物理场拟合优化

一般而言,多项式拟合时次数越高,对未知区域预测越准确. 在实际应用中,使用高次多项式预测时,拟合函数两端附近有时会出现剧烈的振荡,导致较大的误差,这种现象被称为龙格现象[17](Runge phenomenon).

$ y = \frac{1}{{1+{x^2}}}. $

对式(9)进行多项式拟合,若拟合次数过高,会出现如图6所示的龙格现象. 为了提高物理场拟合的精度,本研究在拟合函数之前引入插值以实现平滑处理. 插值是常用的数值分析方法,广泛应用于计算机图形学、地理信息系统(geographic information system,GIS)、信号处理等领域[18-20]. 传统的插值方法包括多项式插值、拉格朗日插值、最小二乘法插值等. 本研究的应用场景要求高精度的插值,即使插值过程中产生的极小偏差也可能导致拟合的环境场与实际情况存在显著差异,为此提出融合径向基插值与多项式拟合的多物理场拟合方法. 采用径向基插值作为函数拟合前的数据处理模型,径向基函数表达式为

图 6

图 6   高次插值导致的龙格现象

Fig.6   Runge’s phenomenon caused by high-order interpolation


$ f({\boldsymbol{x}}) = \sum\nolimits_{i = 1}^N {{\omega _i}\varphi (\left\| {{\boldsymbol{x - }}{{\boldsymbol{x}}_{{i}}}} \right\|)} . $

式中:$f({\boldsymbol{x}})$为在位置${\boldsymbol{x}}$处的径向基插值结果,${\omega _i}$为各离散点对径向基函数的加权权重,$ \left\| {{\boldsymbol{x}}{\boldsymbol{ - }}{{\boldsymbol{x}}_i}} \right\| $为位置点${\boldsymbol{x}}$处与离散数据点$ {{\boldsymbol{x}}_i} $之间的距离,$N$为离散数据点$({{\boldsymbol{x}}_i},{{\boldsymbol{y}}_i})$的个数,$\varphi (r)$为径向基函数. 径向基函数种类繁多,鉴于本研究对物理场拟合的高精度、平滑性及稳定性要求,选取如常见的平滑性良好的径向基函数分别为1)高斯函数:$\varphi (r) = {\mathrm{exp}}\left({ - 0.5(r/\sigma)^2} \right) $,2)多二次函数:$\varphi (r) = \sqrt {1+{{\left({r}/{\sigma }\right)}^2}} $,3)薄板样条函数:$ \varphi (r) = {r^2}\ln\, (r) $. 其中$ r{{ = }}\left\| {{\boldsymbol{x - }}{{\boldsymbol{x}}_{{i}}}} \right\| $$\sigma $为控制函数宽度的参数. 基于径向基插值扩充传感器阵列的近多项式拟合方法通过径向基插值进行观测点数据扩充,对扩充后的数据进行近多项式拟合迭代优化,融合了径向基插值和多项式拟合的优势,使模拟出的物理场具有良好的平滑性和稳定性.

1.3. 物理场拟合时的最优化

一般而言,在径向基插值融合多项式拟合的多物理场拟合方法中,多项式次数越大,拟合函数与插值后的物理场趋势越接近,对实际物理场的模拟也更精确. 然而,随着多项式次数进一步增加,模型对训练数据的拟合程度会提高,导致过拟合现象出现,即模型对于噪声或随机变化过度敏感,对新数据失去泛化能力. 过拟合对多项式拟合产生的主要负面影响如下:1)不稳定性. 多项式阶数过高时,会扩大噪声对拟合的影响,使拟合出的多项式不具可靠性. 2)解释性差. 高次项几乎没有实际意义,随着拟合阶数的增加,当拟合次数为30时,甚至会产生量级为10−50的多项式系数,这些高阶特征对目标变量的预测贡献极小,使得解释模型结果更加困难. 3)浪费计算资源. 多项式反复迭代优化会增加模型性能的计算负担,在高次多项式拟合中,由于参数数量增加,优化算法可能需要更长时间才能收敛到最优解,增加了训练模型的时间成本.

考虑高阶多项式中的过拟合问题,结合神经网络中的正则化方法进行优化处理:

$ {J_{{\text{L}}1}}(\alpha ) = J(\alpha )+\lambda \sum\nolimits_{i = 1}^n {\left| {{\omega _i}} \right|} , $

$ {J_{{\text{L2}}}}(\alpha ) = J(\alpha )+\frac{\lambda }{2}\sum\nolimits_{i = 1}^n {{\omega _i}^2} . $

式中:$J(\alpha )$为原始损失函数,${\omega _i}$为权重参数,$\lambda $为控制正则化强度的超参数. 通过调整$\lambda $实现原始损失函数和正则化项之间的平衡,引入正则化项旨在减少插值后多项式拟合时冗余和过拟合现象,提高模型的可解释性. 式(11)为L1正则化,即通过在损失函数中加入权重参数的绝对值之和来惩罚模型复杂性的方法;式(12)为L2正则化,即通过在损失函数中加入权重参数的平方值之和来惩罚模型复杂性的方法. 由于多项式拟合中的各多项式系数集合与神经网络的神经元集合存在差异,随着多项式阶数的增加,多项式高阶项数的系数较小,导致正则化效果不佳. 传统神经网络的正则化方法难以直接应用于本研究中的高精度物理场多项式拟合中. 为此基于神经网络中正则化的思路,提出适用于多项式拟合的自适应正则化(adaptive regularization)方法:

$ {\text{Loss}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({{\hat y}_i} - {y_i})}^2}} } +\lambda \sum\nolimits_{i = 1}^d {\frac{{\left| {{\omega _i}} \right|}}{{{{\left| {{{\widehat \omega }_i}} \right|}^i}+\varepsilon }}} .$

式中:${\text{Loss}}$为引入正则化后评估多项式拟合情况的损失函数;${\omega _i}$为权重系数,即多项式的各项系数;$\varepsilon $为避免分母为零的极小正数;$d$为多项式次数. 由于高阶多项式的高阶项系数随阶数增加而减小,为了确保高阶多项式系数惩罚更强,对每个系数施加自适应的权重. 通过平衡$\lambda $来控制原始的损失函数与正则化项的影响,避免超参数选择不当的问题. 融合径向基插值与多项式拟合的整体算法流程框架如图7所示,其中inf为无穷大.

图 7

图 7   融合径向基函数插值与多项式拟合的算法框架

Fig.7   Algorithm framework for combination of radial basis function interpolation and polynomial fitting


2. 仿真环境搭建与实验分析

电磁波测距精度受大气折射率的影响,温度、湿度、气压等因素显著影响大气折射率,从而严重影响测量装置的测距精度. 进行测距结果折射率修正,需要高精度的温度、湿度和气压场数据,本研究提出基于深度学习扩展传感器阵列构建物理场的方法. 以温度场的构建为例,介绍如何根据应用环境建立仿真环境. 建立如图8所示的测距环境仿真模型. 为了满足远距离测量需求,选取仿真时测距的间距$L$=1 000 m,在理想条件下,影响温度的主要因素包括地形起伏、太阳辐射、气流和风向等. 在宏观气候模式中,在测量装置发射端与接收端的距离$L$内的气温波动幅度较小,但对高精度测量装置而言,温度、湿度、气压变化影响较大. 为了构建良好的仿真环境,以地势起伏作为温度变化的主要因素,设海拔每升高1 000 m,温度降低6 ℃. 考虑实际环境因素,在$\Delta L$=1 m的离散化间隔内,一般认为斜面变化倾角$\Delta \alpha \in (0,1^\circ )$. 在每段离散单元内,温度变化满足

图 8

图 8   测距环境仿真模型

Fig.8   Simulation model for range measurement environment


${\theta _{i - 1}} - \frac{{{\theta_0}}}{{{h_0}}} \times \tan\, (\Delta \alpha ) \leqslant {\theta_i} \leqslant {\theta_{i - 1}}+\frac{{{\theta_0}}}{{{h_0}}} \times \tan \,(\Delta \alpha ).$

式中:${\theta_{i - 1}}$为经前一段离散单元地势影响下的温度,代表变化前的温度;${\theta_i}$为该段离散单元经过地势影响下改变后的温度;当离散化单元长度$\Delta L$=1 m时,对应的温度变化量$\Delta \theta$=6×10−3 ℃;$\Delta \alpha $为在该段离散化单元内的地势变化趋势. 尽管单一离散化单元内温度变化很小,但是在整段测距环境中温度的变化幅度会显著影响测距精度.

2.1. 扩充传感器阵列前后的对比分析

采用基于深度学习扩展传感器阵列的方法对比分析2种情况下的仿真实验结果. 如图9所示为直接使用现有5个传感器阵列和通过深度学习扩充传感器阵列扩充至15个观测点后进行物理场拟合的仿真结果,其中$s $为测量装置发射端与基线内传感器的距离. 由图可知,在扩充传感器阵列之前,由于传感器数量的限制,物理场的拟合效果不佳;通过深度学习扩展传感器点位后,观测点位数量增加至原来的3倍. 该结果表明,结合所提插值融合拟合方法,能够更准确地模拟高精度物理场的变化趋势.

图 9

图 9   扩充传感器阵列的仿真对比图

Fig.9   Simulation comparision chart of expanding sensor array


为了验证扩充传感器阵列的普适性,采用蒙特卡洛法模拟1 000组随机温度场,对所有模拟情况进行仿真分析. 以平均温度偏差为参考量,如图10所示为扩充传感器阵列前后各组仿真温度偏差d. 可以看出,扩充传感器阵列后的平均温度更为稳定可靠.

图 10

图 10   扩充传感器阵列前后的平均温度偏差对比

Fig.10   Comparison of average temperature deviation before and after expanding sensor array


2.2. 插值方法对比分析

为了避免龙格现象并证明插值的必要性,基于正逆向时间序列扩充传感器阵列的物理场拟合方法,利用扩充后的15个传感器阵列进行多项式拟合. 由于宏观环境因素的影响,仿真时温度变化缓慢. 为了使实验结果更直观,采用均方根误差的对数形式表述拟合情况:

$ \log \,({\text{RMSE}}) = \ln \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({{\hat y}_i} - {y_i})}^2}} } . $

多次仿真实验得到不同多项式次数的温度场拟合结果对数均方根误差情况如表1所示. 理论上,多项式次数越大,误差越小,但由表可知,在多项式次数较高时,函数发生过拟合. 当多项式次数$d = 13$时,对数均方根误差极大,此时发生了极其严重的龙格现象. 本研究在多项式拟合前加入径向基插值,以使函数拟合过程更加平滑.

表 1   不同多项式次数拟合的对数均方根误差

Tab.1  Logarithmic root mean square error for polynomial fittings of different degrees

dlog (RMSE)dlog (RMSE)
5−3.0411−3.18
7−3.4113−1.39
9−3.47

新窗口打开| 下载CSV


插值后物理场的观测点变得密集,进一步分析不同径向基插值函数的优劣,以确认最佳的径向基插值函数. 在径向基插值中,有多种具有良好平滑性的插值方法. 为了筛选出适用于本研究应用环境的插值方法,以高斯径向基插值、多孔径函数径向基插值和薄板样条径向基插值为例,在保证插值点数相同的情况下进行仿真实验分析,3种方法拟合出的温度场离散点偏差的对数均方根误差分别为−0.70、−0.306和−3.54,拟合结果如图11所示. 高斯插值出现明显的振荡现象,表明高斯插值不适用于高精度物理场拟合;多孔径插值方法比高斯插值的效果好,但在物理场两侧预测效果仍不理想;相比之下薄板样条插值的对数均方根误差小,拟合趋势表现最佳,且优于仅通过多项式拟合函数的情况. 该结果证明了多项式拟合融合径向基插值理论的优越性,本研究最终选择薄板样条插值作为拟合函数前的预处理函数.

图 11

图 11   不同插值方法的物理场

Fig.11   Physical field for different interpolation methods


2.3. 物理场拟合的正则化分析

针对本研究提出的拟合方法,随着多项式次数的增加,函数拟合情况更接近插值后的物理场变化趋势. 多项式次数超过最优阶数后,拟合函数在采样点外的区域震荡剧烈,此时判定为过拟合. 为了避免过拟合现象的发生,引入损失函数对拟合情况进行评估. 如图12所示为均方根误差作为损失函数的情况. 当多项式次数较高时,函数的偏差几乎不变,甚至出现过拟合现象,继续增加多项式阶数不仅会降低函数的解释性,还可能导致拟合情况不佳. 如图13所示,使用自适应正则化方法对模型进行惩罚. 图中,损失函数极小值为1.85×10−2,对应的函数阶次为10. 加入正则化后误差呈现先下降后上升的趋势,表明多项式拟合阶数小会导致欠拟合,阶数大会导致过拟合. 该结果表明,所提拟合方法既提高了拟合精度,又避免了龙格现象和过拟合现象发生,是优良的拟合方法.

图 12

图 12   多项式拟合时的损失函数(以均方根误差为损失函数)

Fig.12   Loss function during polynomial fitting (root mean square error as loss function)


图 13

图 13   经自适应正则化的拟合损失函数

Fig.13   Fitting loss function with adaptive regularization


图14所示,去除部分插值点后,在函数两端未知区域进行仿真,以评估自适应正则化在消除函数过拟合方面的效果. 由图可知,在未加入正则化优化的情况下,多项式次数很高时($d = 34$),在未知区域的拟合情况较差,难以解释拟合物理场的合理性. 引入自适应正则化后,得到最优多项式次数为10,拟合结果与实际温度场更吻合,拟合结果的解释性更强.

图 14

图 14   多项式拟合时正则化的效果图

Fig.14   Regularization effects during polynomial fitting


图15所示为依据中心极限定理改进前后3种方法平均温度偏差的正态分布情况. 图中,$\mu $为拟合温度场的精度,$f(x)$为概率密度,对应正态分布的标准差. 可以看出,改进方法有效提高了物理场拟合精度,优于传统的多点法. 3种方法的均值和标准差数据如表2所示. 由表可知,时间序列预测融合插值拟合方法正态分布标准差更小,结果的离散程度低,拟合结果更密集,具有更高的可靠性和准确性. 仿真实验得出,改进方法的平均温度精度相较传统多点法提升了71.8%,标准差降低了73.1%. 综上所述,基于深度学习的物理场混合代理拟合模型不仅使预测出的环境场具有更好的平滑性,而且相较传统多点法具有更高的精度和更小的偏差浮动.

图 15

图 15   蒙特卡洛法仿真的正态分布分析

Fig.15   Normal distribution analysis of Monte Carlo simulation


表 2   正态分布的均值及标准差

Tab.2  Mean and standard deviation of normal distribution

方法$\mu $$\sigma $
多点法$ 1.71 \times {10^{ - 2}} $$1.31 \times {10^{ - 2}}$
时间序列+多点法$5.44 \times {10^{ - 3}}$$ 4.01 \times {10^{ - 3}} $
时间序列+插值拟合$4.82 \times {10^{ - 3}}$$3.53 \times {10^{ - 3}}$

新窗口打开| 下载CSV


一系列仿真实验证实了基于深度学习扩展传感器阵列并融合插值拟合模型混合的方法能够较好地应用于高精度物理场仿真,有效辅助高精度测量装置在大气折射误差修正中的应用.

3. 实测平台搭建与实验验证

进一步验证基于深度学习的高精度物理场拟合模型的优越性,通过现有的传感器阵列系统进行大气参数的获取实验,结合课题组参考星间通信技术研发的某微波测距系统进行测距实验验证[21].

3.1. 大气参数拟合对比实验

利用如图16所示的传感器补偿系统进行高精度大气环境参数获取实验. 实验在某室内测绘中心进行,室内环境的温度、湿度、气压等大气参数变化趋势稳定,传感器的精度高.

图 16

图 16   传感器补偿系统示意图

Fig.16   Schematic diagram of sensor compensation system


以测距距离10 m的情况为例,对比分析改进前后方法得出的测线内温度、湿度情况,测线场内的实际平均温度、相对湿度分别为25.00 ℃、35.00%. 改进前方法得出的平均温度、相对湿度分别为25.23 ℃、36.15%,改进后方法得出的平均温度、相对湿度分别为25.12 ℃、35.63%. 运用改进后的方法后,平均温度的精度提高了47.8%,平均湿度的精度提高了45.2%.

图17所示为不同测线内的温度、相对湿度的变化情况,其中改进前后方法得出的测线内平均温度、相对湿度情况以虚线形式展示,实际平均温度、相对湿度值由更高精度的传感器数据得出. 可以看出,运用基于深度学习的物理场混合代理拟合模型得出的平均温度、相对湿度情况更接近实际情况. 受限于实验设备和实验条件的影响,实测中难以像仿真实验一样重复多组实验进行验证,并且实测中某些传感器测点数据难免出现异常波动现象,这会对实验的结果产生影响.

图 17

图 17   测线内的温湿度变化监测结果

Fig.17   Monitoring results of temperature and humidity variations in measurement line


3.2. 测距实验验证

设计测距实验,室内测试整体实验平台如图18所示,由微波测距系统、精密可移动导轨及高精度双频激光测距仪组成. 平台上布设高精度传感器,利用纳米级双频激光干涉仪对大气折射修正效果进行检验. 真实距离${d_{{\text{re}}}}$与激光干涉测量距离${d_{{\text{op}}}}$和微波测量距离${d_{{\text{mv}}}}$的关系:

图 18

图 18   室内实验平台

Fig.18   Indoor experimental platform


$ {d_{{\text{re}}}} = {d_{{\text{op}}}}+{\varepsilon _{{\text{op}}}}, $

$ {d_{{\text{re}}}} = {d_{{\text{mv}}}}/n_{\mathrm{a}}+{\varepsilon _{{\text{mv}}}}. $

式中:${\varepsilon _{{\text{op}}}}$${\varepsilon _{{\text{mv}}}}$分别为激光干涉测距和微波测距的不确定度,$n_{\mathrm{a}}$为大气折射指数. 将式(16)、(17)应用基于深度学习的物理场混合代理拟合模型,得出的大气折射指数,再得出大气参数引入的测距误差修正效果,修正前后情况对比如表3所示. 表中,$d_{\mathrm{r}}$为测距距离,$\Delta {d_{{\text{pre}}}}$为修正前测距偏差,$\Delta {d_{{\text{cor}}}}$为修正后测距偏差. 修正后微波测距系统的测距精度从毫米级提升至微米级,说明基于深度学习的高精度物理场拟合模型能够很好地引入大气参数补偿机制并提高测量装置的精度,减小大气折射误差给测量装置带来的不确定性影响,具有较好的实际应用意义.

表 3   修正前后的测距偏差

Tab.3  Range deviations before and after correction

$d_{\mathrm{r}}$/m$\Delta {d_{{\text{pre}}}}$/mm$\Delta {d_{{\text{cor}}}}$/μm
102.986.54
205.996.83
308.938.53
4011.887.02
5014.8711.62

新窗口打开| 下载CSV


4. 结 论

(1)相比传统测距测量大气折射率中常用的多点法,基于深度学习的正逆向时间序列扩充传感器阵列的方法将传感器观测点位扩充至原来的3倍. 改进后的深度学习融合插值拟合的代理模型显著提升了环境参数的测量精度. 以大气环境参数中的温度场为例,根据蒙特卡洛仿真的1 000组温度场模拟数据验证了改进方法的平均温度精度相较传统多点法提升了71.8%.

(2)径向基插值融合多项式拟合的物理场混合代理模型有效避免了单纯多项式拟合时的龙格现象. 蒙特卡洛仿真结果表明,混合代理模型的正态分布标准差更小,相较传统的多点法,改进方法的标准差降低了73.1%,证明本研究模型所得环境参数数据的稳定性和可靠性更高.

(3)分析并提出适用于本实验环境的多项式正则化改进模型,确保最终拟合的物理场模型具有较高的解释性与稳定性,并且优化了计算资源的运用.

(4)基于深度学习的高精度物理场拟合模型能够很好地应用于高精度测量装置的大气补偿修正系统中,应用于课题组研发的某微波测距系统时能够使测距精度从毫米级提升至微米级,具有较好的实际应用意义.

实验结果表明,基于深度学习的高精度物理场拟合模型显著提升了测量装置中大气折射率修正模型的精度,减少了大气折射率误差对高精度测量装置带来的不确定度影响. 该模型在全站仪、电子测距仪、激光测距仪、微波测距装置等先进测量设备的校准中具有极大的应用潜力,已应用于浙江大学研发的某微波测距大气补偿修正系统中. 本研究的传感器阵列扩充倍数主要受限于硬件布设密度与数据耦合机制,下一步将重点针对传感器自身误差建模与传感器阵列拓扑结构优化,突破现有测量精度瓶颈.

参考文献

李萍, 李建双, 赫明钊, 等

基于空气环境参数自动测量系统的全站仪测距精度校准技术

[J]. 计量学报, 2019, 40 (6A): 12- 16

DOI:10.3969/j.issn.1000-1158.2019.z1.03      [本文引用: 1]

LI Ping, LI Jianshuang, HE Mingzhao, et al

Ranging accuracy calibration technology of total station based on automatic measurement system of air environment parameters

[J]. Acta Metrologica Sinica, 2019, 40 (6A): 12- 16

DOI:10.3969/j.issn.1000-1158.2019.z1.03      [本文引用: 1]

叶孝佑, 甘晓川, 常海涛, 等

提高环境参量法测量空气折射率精度的研究

[J]. 计量学报, 2008, 29 (4A): 69- 73

[本文引用: 1]

YE Xiaoyou, GAN Xiaochuan, CHANG Haitao, et al

The improvement of measuring precision for refractive index of air using the method of Edlén equation calculating with environmental parameters of air

[J]. Acta Metrologica Sinica, 2008, 29 (4A): 69- 73

[本文引用: 1]

AZOUIGUI S, BADR T, WALLERAND J P, et al

Transportable distance measurement system based on superheterodyne interferometry using two phase-locked frequency-doubled Nd: YAG lasers

[J]. Review of Scientific Instruments, 2010, 81 (5): 053112

DOI:10.1063/1.3428729      [本文引用: 1]

张海波, 张健, 韩正阳

野外基线温度测量方法探讨

[J]. 工业计量, 2017, 27 (1): 36- 37

[本文引用: 1]

ZHANG Haibo, ZHANG Jian, HAN Zhengyang

Exploration of methods for measuring baseline temperature in the field

[J]. Industrial Metrology, 2017, 27 (1): 36- 37

[本文引用: 1]

POLLINGER F, MEYER T, BEYER J, et al

The upgraded PTB 600 m baseline: a high-accuracy reference for the calibration and the development of long distance measurement devices

[J]. Measurement Science and Technology, 2012, 23 (9): 094018

DOI:10.1088/0957-0233/23/9/094018      [本文引用: 1]

陈杨, 李建双, 缪东晶, 等

基于传感器阵列的野外基线环境参数自动测量系统研制

[J]. 计量学报, 2018, 39 (4): 455- 460

DOI:10.3969/j.issn.1000-1158.2018.04.02      [本文引用: 1]

CHEN Yang, LI Jianshuang, MIAO Dongjing, et al

Development of outdoor baseline environment parameters measurement system based on sensor array

[J]. Acta Metrologica Sinica, 2018, 39 (4): 455- 460

DOI:10.3969/j.issn.1000-1158.2018.04.02      [本文引用: 1]

刘学德, 缪东晶, 张京燕, 等

1.2 km标准基线环境参数自动测量系统研制

[J]. 计量学报, 2020, 41 (8): 897- 902

DOI:10.3969/j.issn.1000-1158.2020.08.01      [本文引用: 1]

LIU Xuede, MIAO Dongjing, ZHANG Jingyan, et al

Development of environmental parameters automatic measurement system for 1.2 km standard baseline

[J]. Acta Metrologica Sinica, 2020, 41 (8): 897- 902

DOI:10.3969/j.issn.1000-1158.2020.08.01      [本文引用: 1]

谷友艺, 蒋理兴, 王力, 等

野外基线测温方法的比较研究

[J]. 测绘与空间地理信息, 2019, 42 (12): 27- 30

[本文引用: 1]

GU Youyi, JIANG Lixing, WANG Li, et al

Comparative study on thermometry methods of outdoor baseline

[J]. Geomatics and Spatial Information Technology, 2019, 42 (12): 27- 30

[本文引用: 1]

LIU G, ZHONG K, LI H, et al

A state of art review on time series forecasting with machine learning for environmental parameters in agricultural greenhouses

[J]. Information Processing in Agriculture, 2024, 11 (2): 143- 162

DOI:10.1016/j.inpa.2022.10.005      [本文引用: 1]

TORRES J F, HADJOUT D, SEBAA A, et al

Deep learning for time series forecasting: a survey

[J]. Big Data, 2021, 9 (1): 3- 21

DOI:10.1089/big.2020.0159     

FIME A A, ASHIKUZZAMAN M, AZIZ A

Audio signal based danger detection using signal processing and deep learning

[J]. Expert Systems with Applications, 2024, 237: 121646

DOI:10.1016/j.eswa.2023.121646      [本文引用: 1]

YANG R, SINGH S K, TAVAKKOLI M, et al

CNN-LSTM deep learning architecture for computer vision-based modal frequency detection

[J]. Mechanical Systems and signal processing, 2020, 144: 106885

DOI:10.1016/j.ymssp.2020.106885      [本文引用: 1]

ZHOU Y, LI J, CHI J, et al

Set-CNN: a text convolutional neural network based on semantic extension for short text classification

[J]. Knowledge-Based Systems, 2022, 257: 109948

DOI:10.1016/j.knosys.2022.109948     

BHATT D, PATEL C, TALSANIA H, et al

CNN variants for computer vision: history, architecture, application, challenges and future scope

[J]. Electronics, 2021, 10 (20): 2470

DOI:10.3390/electronics10202470      [本文引用: 1]

金列俊, 詹建明, 陈俊华, 等

基于一维卷积神经网络的钻杆故障诊断

[J]. 浙江大学学报: 工学版, 2020, 54 (3): 467- 474

[本文引用: 1]

JIN Liejun, ZHAN Jianming, CHEN Junhua, et al

Drill pipe fault diagnosis method based on one-dimensional convolutional neural network

[J]. Journal of Zhejiang University: Engineering Science, 2020, 54 (3): 467- 474

[本文引用: 1]

金海龙, 马吴旭, 孟宗, 等

基于改进1DCNN-GRU的滚动轴承故障诊断

[J]. 计量学报, 2023, 44 (9): 1423- 1428

DOI:10.3969/j.issn.1000-1158.2023.09.16      [本文引用: 1]

JIN Hailong, MA Wuxu, MENG Zong, et al

An improved 1DCNN-GRU for rolling bearing fault diagnosis

[J]. Acta Metrologica Sinica, 2023, 44 (9): 1423- 1428

DOI:10.3969/j.issn.1000-1158.2023.09.16      [本文引用: 1]

SHE J, TAN Y

Research on Runge phenomenon

[J]. Advances in Applied Mathematics, 2019, 8 (8): 1500- 1510

DOI:10.12677/AAM.2019.88175      [本文引用: 1]

MAZARGUIL A, OUDRE L, VAYATIS N

Non-smooth interpolation of graph signals

[J]. Signal Processing, 2022, 196: 108480

DOI:10.1016/j.sigpro.2022.108480      [本文引用: 1]

YU Z, SONG D, SONG Y, et al

Research on a visual thermal landscape model of underground space based on the spatial interpolation method: a case study in Shanghai

[J]. Energy Reports, 2022, 8: 406- 418

CHEN J, CAI Z

Cardinal MK-spline signal processing: spatial interpolation and frequency domain filtering

[J]. Information Sciences, 2019, 495: 116- 135

DOI:10.1016/j.ins.2019.04.056      [本文引用: 1]

郭晓旭, 徐兆斌, 成恒飞, 等

用于星间通信的高灵敏度快捕算法

[J]. 哈尔滨工业大学学报, 2023, 55 (8): 43- 50

DOI:10.11918/202208112      [本文引用: 1]

GUO Xiaoxu, XU Zhaobin, CHENG Hengfei, et al

High sensitivity fast acquisition algorithm for inter-satellite communication

[J]. Journal of Harbin Institute of Technology, 2023, 55 (8): 43- 50

DOI:10.11918/202208112      [本文引用: 1]

/