基于多重分形的改进GRU滑坡位移预测模型
Improved GRU landslide displacement prediction model based on multifractal
通讯作者:
收稿日期: 2023-06-26
基金资助: |
|
Received: 2023-06-26
Fund supported: | 国家自然科学基金联合基金重点支持项目(U1911205);湖北省自然资源厅科技项目(ZRZY2024KJ22). |
作者简介 About authors
徐满(2001—),男,硕士生,从事时序预测研究.orcid.org/0009-0002-9741-8181.E-mail:
门控机制设计难以学习序列变化趋势,导致传统记忆网络模型对滑坡位移非平稳跃变段预测效果较差. 基于多重分形改进门控循环单元(GRU),通过量化序列的变化特征来动态更新门控权重,引入循环神经网络单元的状态融合策略以学习数据的长程相关性特征. 采用变分模态分解算法将滑坡累积位移分解成趋势项、周期项及随机项,利用改进GRU进行位移分量的训练和预测. 选取三峡库区白水河滑坡监测点ZG93、ZG118进行仿真实验. 实验结果表明,相比传统预测模型,新模型的滑坡位移形变趋势特征学习能力更强,预测精度更高.
关键词:
The traditional memory network model has poor prediction accuracy on a non-stationary mutation data segment due to the gate mechanism has difficulty in learning sequence change trends. A multifractal algorithm was introduced to improve the gating control of the gated recurrent unit (GRU), and dynamically update the gating weight by quantifying the change characteristics of the sequence. The state fusion of the recurrent neural network unit was introduced to learn the long-range correlation of data. The landslide cumulative displacement was decomposed into trend term, periodic term and random term through the variational mode decomposition algorithm. The decomposed terms were trained and predicted by using the improved GRU. The monitoring points ZG93 and ZG118 of the Baishuihe landslide in the Three Gorges Reservoir area were selected for simulation experiments. Experimental results show that compared with traditional models, the new model learns the characteristics of the landslide displacement deformation trend better and has a higher prediction accuracy.
Keywords:
本文引用格式
徐满, 张冬梅, 余想, 李江, 吴益平.
XU Man, ZHANG Dongmei, YU Xiang, LI Jiang, WU Yiping.
受自身地质条件、周期性降雨、库水位调度及其他因素影响,滑坡累积位移序列具有不同尺度时序特征. 张俊等[5]利用移动平均法将滑坡累积位移分解成趋势项位移和周期项位移,采用支持向量机(support vector machine, SVM)模型预测周期项位移,由于模型未考虑滑坡演化的动态特征且未能分解出随机项,导致阶跃型滑坡变形期预测误差较大. Xu等[6]提出基于经验模态分解与长短时记忆神经网络(long short-term memory,LSTM)的滑坡位移动态预测模型,进行滑坡位移动态特性和时序数据长期关联特征提取,但经验模态分解会导致位移序列在某些时间步的趋势误差较大. 徐峰等[7]针对经验模态分解和集合经验变分模态分解对滑坡位移序列的分解不可控性问题,使用变分模态分解(variational mode decomposition,VMD)将滑坡位移分解为具有不同尺度特征与实际意义的位移分量. 陈伟等[8]提出基于门控循环单元(gated recurrent unit,GRU)的预测模型,分别预测了基于指数平滑法得到的趋势项和周期项位移分量,该方法在提升预测精度的同时提高了模型的训练效率. 传统指数平滑、移动平均法虽然能分解出物理意义明确的趋势项和周期项,但不能分解出随机项[9-10];小波分解难以确定小波基和阈值[11];经验模态分解、集合经验模态分解无法明确各位移分量与实际物理意义的联系[12-13].
受内外因素影响,阶跃型滑坡在变形演化过程中稳定状态和跃变状态交替出现,位移曲线整体呈非线性、非平稳式变化特征[14]. 深度神经网络作为高度复杂的非线性系统,具有处理非平稳数据的优势[15]. 传统循环神经网络(recurrent neural network,RNN)模型存在长期依赖问题[16], LSTM在RNN基础上增加了细胞状态、输入门、输出门及遗忘门,通过控制信息的传递,LSTM能够较大程度提升长序列处理中信息的表达能力[17]. GRU是在LSTM的基础上将门结构简化,模型的训练效率得到提升[18]. 上述模型的内部门控组件过于简单,门控机制设计难以学习序列变化趋势,对阶跃型滑坡数据台阶状跃变段预测效果较差. 多重分形理论通过计算概率测度求解奇异性指数刻画数据的变化程度,能够较好描述非平稳滑坡位移的变化趋势[19]. 为了自适应学习跃变段数据的变化特征,本研究采用多重分形及状态融合技术对GRU门控机制进行改进,提出新的基于多重分形和状态融合的改进门控循环单元的滑坡位移预测模型(multifractal-statefusion-GRU, MF-SF-GRU),在门控设计中引入多重分形谱宽量化数据的变化程度,设置新的动态调整矩阵代替传统更新门权重矩阵,各隐藏单元将随时间步进行状态融合. 新的设计加强更新门的记忆能力,可根据谱宽自适应调整权重,学习到由库水位调整、季节性降雨引起的滑坡位移跃变特征. 在循环单元中,各时间步不仅记忆前一层的隐藏层状态,还利用卷积神经网络逐步融合隐藏层的状态来学习滑坡位移数据的历史特征. 本研究将以三峡库区库岸堆积层滑坡白水河滑坡为例,在系统分析外界诱发影响因素的基础上,采用VMD将滑坡位移数据分解为具有不同物理意义与尺度的趋势项、周期项和随机项位移分量,利用MF-SF-GRU对分解的累积位移分量分别进行预测.
1. 相关理论
1.1. 变分模态分解
受季节性降雨和库水位调度影响,滑坡累积位移表现为周期性递增的非平稳时间序列. 滑坡内部的地质条件如岩性、地形地貌为趋势性因素,季节性降雨和库水位调度为周期性因素,非季节性降雨、库水临时调度为随机性因素. 如何对多尺度、多因素非平稳时间序列原始数据进行拆分和预测是滑坡位移预测任务研究的关键. VMD是时间-频率信号分解方法,核心思想是构建和求解变分问题,实现非平稳、非线性的信号处理,具体包括以下过程. 1)构建约束变分问题:将输入的原始信号
式中:
引入交替方向乘子法,结合傅里叶等距变换寻求增广拉格朗日函数的解,
1.2. 门控循环单元
GRU将LSTM中的输入门和遗忘门合并为更新门,简化模型内部结构. 如图1所示,GRU网络模型由多个同构的单元组成,利用重置门、更新门更新隐藏层状态实现长程信息记忆. GRU隐含层状态在时刻t的传递过程为
图 1
式中:
1.3. 多重分形
多重分形理论以计算序列区间概率测度求解区间奇异性指数,奇异性指数的分布区间可用于刻画非平稳数据段的变化程度.
1.3.1. 概率测度
对
式中:
1.3.2. 奇异性指数
奇异性指数
式中:
1.3.3. 多重分形谱
对于第
2. 滑坡位移时序预测模型
传统记忆网络模型缺少学习序列变化趋势的门控机制,导致滑坡跃变数据段预测效果较差. 本研究基于多重分形对GRU进行改进,利用多重分形量化数据变化程度,设置新的动态调整矩阵代替传统更新门权重矩阵. 针对传统循环神经网络历史信息的利用率较低问题,本研究提出循环神经网络的状态融合策略.
2.1. 基于多重分形的改进门控循环单元
研究表明GRU门控中更新门对模型性能影响最大[20]. 当前记忆网络模型的门控组件在训练过程中随机性较强,难以学习非平稳突变特征,影响预测效果,为此引入基于多重分形谱谱宽的改进权重矩阵代替传统更新门权重矩阵,设计MF-GRU. MF-GRU将GRU中的更新门权重矩阵拆分为2个新的更新门矩阵,分别与经激活函数处理后的多重分形谱谱宽矩阵
图 2
图 2 基于多重分形的改进门控循环单元结构图
Fig.2 Structure of improved gated recurrent unit based on multifractal
式中:
2.2. 循环神经网络状态融合策略
循环神经网络隐藏层输入不仅与当前时间点输入层的输出有关,还与前一时间点隐藏层的输出有关. 各类循环神经网络设计没有考虑历史时间点状态对当前时间点状态的影响,本研究提出改进的循环神经网络状态融合策略. 如图3所示,状态融合的主要思路是利用卷积神经网络对各时间点隐藏层的状态进行融合,以更好地学习到数据长程相关性. 当前时刻隐藏层状态不仅输出到下一时刻,还与下一时刻隐藏层的输出进行融合,随着时间的迭代逐步输出到下一层,循环神经网络隐藏层状态的融合得以实现. 隐藏状态的更新表达式为
图 3
式中:
2.3. 滑坡位移预测流程
MF-SF-GRU的滑坡位移预测流程如图4所示,主要包括数据预处理、模型训练与预测. VMD将滑坡累积位移数据分解成趋势项、周期项、随机项等位移分量,结合多重分形算法提取各位移分量的变化特征,基于状态融策略逐步融合隐藏层的状态,利用多重分形和状态融合的改进GRU构建滑坡时序预测模型,对各位移分量进行预测并叠加来实现滑坡累积位移预测.
图 4
3. 白水河滑坡位移预测
3.1. 白水河地质概况及滑坡位移分析
三峡库区白水河滑坡位于湖北省宜昌市秭归县沙镇溪镇,白水河滑坡上设置有11个GPS地表位移监测点,自2003年6月份起,采用GPS、雨量计监测技术对滑坡地表累积位移、降雨量进行长期监测,该区域地质概况及具体监测点分布如图5所示. 在这11个监测点中,监测点ZG118、ZG93的监测周期最长、数据较为完整,且位于滑坡中部,能够较好反映整个滑坡位移演变过程,因此主要针对这2个监测点数据开展相关研究.
图 5
3.2. 评价指标
选取判定系数
表 1 不同输入窗口设置下预测结果的均方根误差
Tab.1
序列长度 | RMSE/mm | 序列长度 | RMSE/mm | |
6 | 0.0896 | 14 | 0.1346 | |
8 | 0.0844 | 16 | 0.0852 | |
10 | 0.0836 | 18 | 0.0885 | |
12 | 0.0809 | — | — |
表 2 对比试验参数设置
Tab.2
参数 | 取值 | 参数 | 取值 | |
VMD分量数k | 3 | 迭代次数 | 1200 | |
批处理数量 | 256 | 学习率 | 0.001 | |
隐藏层节点数 | 64 | 隐藏层层数 | 1 |
3.3. 滑坡位移数据分析
3.3.1. 累计位移数据分析
受滑坡自身基础地质构造及工程活动、降雨等外界因素作用,白水河滑坡各监测点位移-时间曲线具有明显阶跃变化特征,ZG93和ZG118的累积位移
图 6
图 6 不同监测点的累积位移-时间曲线图
Fig.6 Cumulative displacement-time curves for different monitoring points
以ZG118为例,研究采用多重分形量化该监测点位移变化,累积位移、谱宽
图 7
图 7 监测点ZG118的累积位移-时间曲线、谱宽-时间曲线
Fig.7 Cumulative displacement-time curve and spectral width-time curve for monitoring point ZG118
3.3.2. 滑坡位移数据分解
如图8所示,基于滑坡累积位移-时间曲线分析,通过VMD将滑坡累积位移分解成3个位移分量,即趋势
图 8
图 8 监测点ZG118的滑坡位移分量-时间曲线
Fig.8 Curves of landslide displacement component-time for monitoring point ZG118
季节性降雨及库水位调度是导致滑坡累积位移周期性阶跃变化的主导因素,位移快速增长往往发生在汛期降雨和库水位调度之后,具有较强的周期性,但库水位变化对滑坡位移变化的影响滞后. 以ZG118为例,库水位P-时间曲线、累积位移周期项-时间曲线如图9所示,每年5月到9月随季节性降雨,库水位调度导致库水位急剧下降,一段时间后滑坡位移周期项发生突变式增长. 如图10(a)所示,累积位移周期项与谱宽变化趋势基本同步,谱宽能较好刻画库水位调度引起的滑坡位移周期变化特征,位移突变数据段谱宽值均较大,趋近于1,变化相对平稳数据段谱宽变化较小,区间为[0, 0.3]. 非季节性降雨是影响随机项位移的主导因素,如图10(b)所示,随机项变化剧烈段谱宽值趋于1,相对平稳数据段谱宽值区间为[0, 0.2],谱宽能够刻画受外界随机因素导致的随机变化特征. 因此将多重分形引入GRU刻画滑坡位移数据的变化特征和趋势,用谱宽控制、更新门控权重的自适应调整,提高预测精度.
图 9
图 9 监测点ZG118的库水位-时间曲线、周期项-时间曲线
Fig.9 Reservoir water level-time curve and periodic term-time curve for monitoring point ZG118
图 10
图 10 监测点ZG118周期项、随机项及对应谱宽随时间变化的曲线
Fig.10 Curves of periodic term, random term and corresponding spectral width with time at monitoring point ZG118
3.4. 滑坡位移预测
以三峡库区白水河库岸堆积层滑坡为研究对象,选取2004年1月到2009年11月ZG93、ZG118的数据作为训练集,2009年12月到2011年10月ZG93、ZG118的数据作为预测集. 为了进一步验证MF-SF-GRU的有效性和实用性,对比分析多重分形改进GRU模型和传统深度学习模型RNN、LSTM、GRU.
3.4.1. 分频位移预测
滑坡位移周期项预测选取库水位和降雨量作为影响因素,随机项预测选取降雨量作为影响因素,ZG93各位移分量预测结果如图11所示. 分别绘制2010年8月到10月的周期项位移曲线、2011年6月到8月的随机项位移曲线如图12所示,受降雨和库水位调度的影响区段滑坡位移变化较为剧烈,各模型预测情况如表3所示. 在周期项的预测方面,RNN、LSTM、GRU的预测效果较差,MF-SF-GRU由于引入多重分形加强了更新门的记忆能力,同时影响因素与预测量强相关,根据谱宽自适应调整权重学习到库水位调整和季节性降雨引起的跃变与时滞特征,突变数据段的预测效果有明显提升. 在随机项预测方面,非季节性降雨是影响预测的主导因素,但随机性较大,干扰了门控单元长时序特征的记忆能力,因此随机项预测效果提升不大.
图 11
图 11 不同模型滑坡位移分量的预测曲线
Fig.11 Prediction curves of different models for landslide displacement components
图 12
图 12 不同模型在突变数据段的周期项、随机项预测曲线
Fig.12 Prediction curves of different models for periodic term and random term in mutation data segment
表 3 不同模型的滑坡位移分量预测精度及误差
Tab.3
模型名称 | 位移分量 | ZG93 | ZG118 | |||||
RMSE/mm | MAPE | RMSE/mm | MAPE | |||||
RNN | 趋势项 | 0.992 79 | 6.287 05 | 0.002 774 | 0.999 93 | 2.133 97 | 0.002 884 | |
周期项 | 0.999 98 | 0.129 22 | 0.011 507 | 0.999 93 | 0.258 55 | 0.020 789 | ||
随机项 | 0.999 94 | 0.083 46 | 0.011 183 | 0.999 72 | 0.179 33 | 0.014 161 | ||
LSTM | 趋势项 | 0.990 28 | 7.302 50 | 0.003 317 | 0.988 83 | 8.230 30 | 0.003 849 | |
周期项 | 0.999 95 | 0.198 84 | 0.011 359 | 0.999 76 | 0.478 83 | 0.040 156 | ||
随机项 | 0.999 58 | 0.229 68 | 0.109 091 | 0.998 18 | 0.460 15 | 0.155 724 | ||
GRU | 趋势项 | 0.989 88 | 7.451 83 | 0.003 246 | 0.991 47 | 7.192 23 | 0.003 231 | |
周期项 | 0.999 98 | 0.121 79 | 0.006 591 | 0.999 53 | 0.667 30 | 0.057 643 | ||
随机项 | 0.999 91 | 0.108 20 | 0.035 721 | 0.999 84 | 0.134 40 | 0.016 579 | ||
MF-SF-GRU | 趋势项 | 0.999 87 | 0.851 84 | 0.000 346 | 0.999 78 | 1.142 17 | 0.000 433 | |
周期项 | 0.999 99 | 0.074 58 | 0.004 757 | 0.999 99 | 0.061 81 | 0.008 133 | ||
随机项 | 0.999 95 | 0.080 11 | 0.023 186 | 0.999 95 | 0.075 12 | 0.009 470 |
3.4.2. 累积位移预测
根据时序加法模型将各位移分量预测值叠加得到滑坡累积位移预测值,ZG93和ZG118累积位移的整体数据段和突变数据段如图13、图14所示. 可以看出,RNN、LSTM、GRU在滑坡变化平稳数据段2010年4月到2010年7月,2011年4月到2011年7月预测较为准确,但在滑坡变化较为剧烈的2010年7月到2011年4月,2011年7月到2011年10月突变数据段预测效果较差,说明传统记忆网络模型对非平稳突变数据预测能力较弱. MF-SF-GRU引入多重分形谱,谱宽自适应调整权重,提高了突变数据段的预测能力,特别在2010年7月到12月预测效果较好. 各模型预测精度如表4所示,部分突变数据段2010年7月到2011年4月预测精度如表5所示. 可以看出,RNN、 LSTM、GRU的预测精度相近. 以ZG118为例,较GRU,MF-SF-GRU在整体数据段上RMSE从7.951 10 mm降到1.175 09 mm,
图 13
图 13 不同模型累积位移整体数据段预测曲线
Fig.13 Prediction curves for overall data segment of cumulative displacement with different models
图 14
图 14 不同模型累积位移突变数据段预测曲线
Fig.14 Prediction curves for mutation data segment of cumulative displacement with different models
表 4 不同模型的累积位移预测精度及误差
Tab.4
模型名称 | ZG93 | ZG118 | |||||
R2 | RMSE/mm | MAPE | R2 | RMSE/mm | MAPE | ||
RNN | 0.995 38 | 6.196 62 | 0.002 723 | 0.995 78 | 6.211 99 | 0.002 776 | |
LSTM | 0.993 52 | 7.335 84 | 0.003 336 | 0.994 11 | 7.339 75 | 0.003 401 | |
GRU | 0.993 36 | 7.427 08 | 0.003 228 | 0.993 08 | 7.951 10 | 0.003 557 | |
MF-SF-GRU | 0.999 91 | 0.856 16 | 0.000 349 | 0.999 85 | 1.175 09 | 0.000 437 |
表 5 不同模型部分突变数据段的累积位移预测精度及误差
Tab.5
模型名称 | ZG93 | ZG118 | |||||
R2 | RMSE/mm | MAPE | R2 | RMSE/mm | MAPE | ||
RNN | 0.772 09 | 5.797 98 | 0.002 690 | 0.715 17 | 5.649 48 | 0.002 697 | |
LSTM | 0.656 66 | 7.116 38 | 0.003 316 | 0.570 33 | 6.938 82 | 0.003 401 | |
GRU | 0.674 73 | 6.926 57 | 0.003 206 | 0.526 95 | 7.280 73 | 0.003 334 | |
MF-SF-GRU | 0.998 11 | 0.528 22 | 0.000 192 | 0.994 88 | 0.757 12 | 0.000 314 |
4. 结 语
受自身地质条件、降雨、库水位调度的影响,三峡库区部分滑坡呈阶跃式非稳态变化. 在系统分析滑坡位移诱发因素的基础上,本研究引入VMD将滑坡位移数据划分为趋势项、周期项和随机项. 针对滑坡位移预测任务中传统网络对跃变数据段预测效果较差的问题,采用多重分形度量滑坡位移的累积位移变化趋势;新设置动态调整矩阵,根据多重分形谱谱宽自适应调整更新门权重学习滑坡位移跃变趋势,改进GRU的更新门控机制. 针对传统循环神经网络历史信息的利用率较低问题,提出循环神经网络状态融合策略. 以三峡库区白水河滑坡监测点ZG93、ZG118为例,多重分形谱谱宽参数能较好刻画由降雨、库水位调度引起的滑坡位移变化趋势,度量滑坡的演变状态. 实验结果表明,与传统模型相比,MF-SF-GRU能够较好地刻画滑坡位移跃变状态时的变化趋势,有效提高预测精度和实用性. MF-SF-GRU通过动态调整更新门权重矩阵学习滑坡累积位移变化趋势,通过循环单元的历史状态融合学习到数据的长程相关性,后续工作计划采用更为简单的模型结构(如最小门控单元)进行模型改进,以提高模型的训练效率.
参考文献
三峡水库运行期地质灾害变形特征及机制分析
[J].
Deformation characteristics and mechanism analysis of geological hazards during operation period of Three Gorges Reservoir
[J].
“阶跃式” 滑坡位移预测及阈值分析的 ARMA-(LASSO-ELM)-Copula模型
[J].
An ARMA-(LASSO-ELM)-Copula farmework for landslide displacement prediction and threshold computing of the displacement of step-like landslides
[J].
滑坡时空演化规律及预警预报研究
[J].DOI:10.3321/j.issn:1000-6915.2008.06.003 [本文引用: 1]
Research on space-timeevolution laws and early warning-prediction of landslides
[J].DOI:10.3321/j.issn:1000-6915.2008.06.003 [本文引用: 1]
基于变分模态分解与 GWO-MIC-SVR 模型的滑坡位移预测研究
[J].
Displacement prediction of landslides based on variational mode decomposition and GWO-MIC-SVR model
[J].
基于时间序列与 PSO-SVR 耦合模型的白水河滑坡位移预测研究
[J].
Displacement prediction of Baishuihe landslide based on time series and PSO-SVR model
[J].
Displacement prediction of Baijiabao landslide based on empirical mode decomposition and long short-term memory neural network in Three Gorges area, China
[J].DOI:10.1016/j.cageo.2017.10.013 [本文引用: 1]
基于变分模态分解和 AMPSO-SVM 耦合模型的滑坡位移预测
[J].
Displacement prediction of landslide based on variational mode decomposition and AMPSO-SVM coupling model
[J].
基于门控循环单元的滑坡位移预测和灾害预警方法
[J].DOI:10.3969/j.issn.1673-1131.2021.05.006 [本文引用: 1]
Landslide displacement prediction and disaster early warning method based on gated recurrent unit
[J].DOI:10.3969/j.issn.1673-1131.2021.05.006 [本文引用: 1]
基于时间序列分解和多变量混沌模型的滑坡阶跃式位移预测
[J].
Step-like displacement prediction of landslide based on time series decomposition and multivariate chaos model
[J].
基于时间序列分析的滑坡位移预测模型研究
[J].
Study of displacement prediction model of landslide based on time series analysis
[J].
小波分析在分形科学中的应用
[J].
Application of wavelet analysis in fractals
[J].
滑坡位移的多模态支持向量机模型预测
[J].
Prediction of landslide displacements through multimode support vector machine model
[J].
考虑变形状态动态切换的阶跃型滑坡位移区间预测方法
[J].
Displacement interval prediction method for step-like landslides considering deformation state dynamic switching
[J].
基于多变量 LSTM 的工业传感器时序数据预测
[J].DOI:10.3969/j.issn.2095-2163.2018.05.003 [本文引用: 1]
Forecasting of industrial sensor time series based on multivariable LSTM
[J].DOI:10.3969/j.issn.2095-2163.2018.05.003 [本文引用: 1]
Long short-term memory
[J].DOI:10.1162/neco.1997.9.8.1735 [本文引用: 1]
基于多重分形理论的农田土壤特性空间变异性分析
[J].DOI:10.3969/j.issn.1005-0930.2011.05.003 [本文引用: 1]
Analysis on spatial variability of soil properties based on multifractal theory
[J].DOI:10.3969/j.issn.1005-0930.2011.05.003 [本文引用: 1]
Minimal gated unit for recurrent neural networks
[J].DOI:10.1007/s11633-016-1006-2 [本文引用: 1]
基于多头自注意力机制的LSTM-MH-SA滑坡位移预测模型研究
[J].
LSTM-MH-SA landslide displacement prediction model based on multi-head self-attention mechanism
[J].
基于经验模态分解和神经网络的滑坡变形预测研究
[J].DOI:10.3969/j.issn.1671-1556.2013.04.004 [本文引用: 1]
Study of landslide deformation prediction based on EMD and neural network
[J].DOI:10.3969/j.issn.1671-1556.2013.04.004 [本文引用: 1]
/
〈 |
|
〉 |
