浙江大学学报(工学版), 2022, 56(4): 683-691 doi: 10.3785/j.issn.1008-973X.2022.04.007

交通工程、土木工程

基于Bi-LSTM的非等时距路基工后沉降滚动预测

陈伟航,, 罗强, 王腾飞,, 蒋良潍, 张良

1. 西南交通大学 土木工程学院,四川 成都 610031

2. 高速铁路线路工程教育部重点实验室,四川 成都 610031

Bi-LSTM based rolling forecast of subgrade post-construction settlement with unevenly spaced time series

CHEN Wei-hang,, LUO Qiang, WANG Teng-fei,, JIANG Liang-wei, ZHANG Liang

1. School of Civil Engineering, Southwest Jiaotong University, Chengdu 610031, China

2. MOE Key Laboratory of High-Speed Railway Engineering, Chengdu 610031, China

通讯作者: 王腾飞,男,助理研究员. orcid.org/0000-0003-4079-0687. E-mail: w@swjtu.edu.cn

收稿日期: 2021-05-22  

基金资助: 国家自然科学基金资助项目(52078435, 41901073);四川省科技计划资助项目(2021YJ0001)

Received: 2021-05-22  

Fund supported: 国家自然科学基金资助项目(52078435,41901073);四川省科技计划资助项目(2021YJ0001)

作者简介 About authors

陈伟航(1997—),男,硕士生,从事路基工程数据挖掘的研究.orcid.org/0000-0003-1380-7631.E-mail:chenweihang@my.swjtu.edu.cn , E-mail:chenweihang@my.swjtu.edu.cn

摘要

为了实现路基工后沉降的早期、精准预测,提出基于双向长短期记忆网络(Bi-LSTM)的路基沉降预测技术. 采用Akima法将观测数据内插为适应时序分析法的等时距序列,提取“填土高度-时间-地基沉降”曲线中的6个影响因素作为变量训练Bi-LSTM模型,结合滚动迭代方法实现沉降预测的后延更新. 研究表明,利用深度学习技术可以有效地利用路基施工期信息,增加训练样本量,提升沉降早期预测的可靠性. Bi-LSTM模型对观测信息进行双向特征提取,同等样本量下的预测效果更精确. 依托6个中等压缩性土地基和1个复合地基监测断面信息,仅利用路堤填筑期及工后3个月数据,沉降预测的均方根误差 (RMSE) 和平均绝对百分误差 (MAPE) 平均值可以控制为1.19 mm、1.04%.

关键词: 双向长短期记忆网络(Bi-LSTM) ; 路基工后沉降 ; 非等时距序列 ; 滚动预测 ; 施工填筑信息

Abstract

A bi-directional long short-term memory (Bi-LSTM)-based technique was proposed for subgrade settlement prediction in order to achieve early and accurate prediction of post-construction settlement of subgrade. The observational data was transformed into equally spaced observations using interpolation, namely the Akima method, for time series analysis. Six contributing factors were extracted from the ‘fill height-time-foundation settlement’ curves, and were used as input variables for training a Bi-LSTM model. Settlement predictions can be sequentially updated by combining with the rolling forecast technique. Results show that deep learning can efficiently use subgrade construction information, increase the sample size, and improve the reliability of early prediction. The Bi-LSTM model achieves bidirectional feature extraction on observational data and makes more accurate predictions in the same sample size conditions. The information during construction and 3-month post-construction period was used based on observations of six subsoil foundations of medium compressibility and one composite foundation. Predicted results with mean values of root mean square error (RMSE) and mean absolute percentage error (MAPE) were 1.19 mm and 1.04%, respectively.

Keywords: bi-directional long short-term memory (Bi-LSTM) ; post-construction settlement for subgrade ; unevenly spaced time series ; rolling forecast ; construction information

PDF (1784KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

陈伟航, 罗强, 王腾飞, 蒋良潍, 张良. 基于Bi-LSTM的非等时距路基工后沉降滚动预测. 浙江大学学报(工学版)[J], 2022, 56(4): 683-691 doi:10.3785/j.issn.1008-973X.2022.04.007

CHEN Wei-hang, LUO Qiang, WANG Teng-fei, JIANG Liang-wei, ZHANG Liang. Bi-LSTM based rolling forecast of subgrade post-construction settlement with unevenly spaced time series. Journal of Zhejiang University(Engineering Science)[J], 2022, 56(4): 683-691 doi:10.3785/j.issn.1008-973X.2022.04.007

充分利用蕴含丰富系统演化信息的路基沉降监测数据进行地基工后沉降预测,可以为路基工程方案设计提供参考,节省工程建设所需的时间与资金投入. 基于工后沉降数据曲线拟合的双曲线法、指数曲线法、Asaoka法等属于单参数模型[1-2],对沉降发展规律的描述不甚全面,预测结果与实测值可能存在较大偏差;多个单参数模型加权的组合模型可以在一定程度上提高预测可靠性[3-4]. 灰色系统法虽然可以弥补贫信息、不确定性的缺点[5],但沉降受多因素影响具有波动性,沉降观测时长对预测结果的精确性影响较大.

机器学习凭借极强的非线性拟合能力被广泛应用于路基沉降预测问题[6-9],路基沉降的预测精度较传统方法有所提升[10],但通常仅以路基工后沉降数据为样本集建模,忽略了信息量丰富的施工期填筑数据. 路基工程多采用分层逐级填土进行路堤填筑施工,具有“分级填筑—填筑间隔”周期性特征,路堤填筑完成后的地基工后沉降阶段可以视为持续时间较长的填筑间隔,将施工期填筑信息加入训练集参与建模,增加训练集样本量,实现地基工后沉降早期、精准预测.

误差反向传播神经网络(back propagation neural network, BPNN)同层间无连接,输入值被相互独立处理,不易学习存在复杂相互关联性的序列问题[6]. 循环神经网络(RNN)具有循环结构的隐藏层,可以将沉降信息按顺序逐次送入网络学习并更新记忆,使得模型更好地理解路堤填筑过程与地基沉降量间复杂的非线性映射关系[10-11]. 长短期记忆网络(long short-term memory,LSTM)通过改进RNN的记忆单元有效避免了梯度消失和爆炸[11],双向长短期记忆网络(bi-directional LSTM, Bi-LSTM)作为LSTM的改进结构,具有较强的处理序列信息的能力,已被广泛应用于滑坡时序位移预测[12]、盾构机稳定掘进参数预测[13]、盾构引发地表最大沉降预测[14]、土体和结构面之间的剪切行为演化[11]等问题.

本文基于Bi-LSTM整合了施工期观测信息进行建模预测. 利用Akima法对“填土高度-时间-地基沉降”进行等时距处理,提取相关的数据特征作为影响因素,组集为符合循环神经网络输入格式的序列样本. 将组集的训练样本送入网络学习,形成地基沉降预测模型. 采用滚动迭代方法进行地基沉降后延更新. 为了体现Bi-LSTM模型的优越性,采用循环网络的LSTM和非循环网络的BPNN,分别与Bi-LSTM模型进行对比.

1. 模型理论

BPNN网络可以实现M-N维的非线性映射,在训练过程中将误差逐层反向传播,以更新各层节点的权值,如图1(a)所示. 输入层节点间相互独立,无法识别存在复杂相互关联性的序列信息[12].

图 1

图 1   神经网络结构的示意图

Fig.1   Schematic of neural network structure


RNN网络(recurrent neural network)用串联结构表达数据间依赖关系,隐藏向量ht包含t时刻以前的序列历史信息,可以对非线性时间序列问题进行有效建模[13],如图1(b)所示. 隐藏层中时间步为t−1的神经元将输出结果作为输入,再次传递给时间步为t的神经元. 根据下式迭代计算得到输出序列y[12]

$ {{\boldsymbol{h}}_t} = {{\varPsi}} \left( {{{\boldsymbol{W}}_{{\rm{xh}}}}{{\boldsymbol{x}}_t} + {{\boldsymbol{W}}_{{\rm{hh}}}}{{\boldsymbol{h}}_{t - 1}} + {{\boldsymbol{b}}_{\rm{h}}}} \right), $

$ {{{\boldsymbol{y}}}_{t}}={{\boldsymbol{W}}_{{{\rm{hy}}}}}{{{\boldsymbol{h}}}_{{{t}}}} + {{\boldsymbol{b}}_{{\rm{y}}}}.$

式中:xtyt为时间步t的输入与输出;htht−1为时间步tt−1的隐藏状态;Wxh为输入和隐藏向量间的权重矩阵;Whh为不同时间步隐藏向量间的权重矩阵;Why为隐藏和输出向量间的权重矩阵;bhbyWhhWhy对应的偏置向量; ${{\varPsi}} $为隐藏层的非线性激活函数.

采用梯度下降法将输出层误差沿网络反向传递的过程中,RNN存在梯度消失和爆炸的问题[14]. Hochreiter等[15]提出更复杂的内部处理结构——LSTM单元,通过输入门it、遗忘门ft和输出门ot来控制信息在每个时间步的传递. 隐藏向量ht可按下式计算:

$ {{\boldsymbol{i}}_t} = \sigma ({{\boldsymbol{W}}_{{\rm{xi}}}}{{\boldsymbol{x}}_t} + {{\boldsymbol{W}}_{{\rm{hi}}}}{{\boldsymbol{h}}_{t - 1}} + {{\boldsymbol{W}}_{{\rm{ci}}}}{{\boldsymbol{c}}_{t - 1}} + {{\boldsymbol{b}}_{\rm{i}}}), $

$ {{\boldsymbol{f}}_t} = \sigma ({{\boldsymbol{W}}_{{\rm{xf}}}}{{\boldsymbol{x}}_t} + {{\boldsymbol{W}}_{{\rm{hf}}}}{{\boldsymbol{h}}_{t - 1}} + {{\boldsymbol{W}}_{{\rm{cf}}}}{{\boldsymbol{c}}_{t - 1}} + {{\boldsymbol{b}}_{\rm{f}}}), $

$ {{\boldsymbol{c}}_t} = {{\boldsymbol{f}}_t}{{\boldsymbol{c}}_{t - 1}} + {{\boldsymbol{i}}_t}\tanh ({{\boldsymbol{W}}_{{\rm{xc}}}}{{\boldsymbol{x}}_t} + {{\boldsymbol{W}}_{{\rm{hc}}}}{{\boldsymbol{h}}_{t - 1}} + {{\boldsymbol{b}}_{\rm{c}}}), $

$ {{\boldsymbol{o}}_t} = \sigma ({{\boldsymbol{W}}_{{\rm{xo}}}}{{\boldsymbol{x}}_t} + {{\boldsymbol{W}}_{{\rm{ho}}}}{{\boldsymbol{h}}_{t - 1}} + {{\boldsymbol{W}}_{{\rm{co}}}}{{\boldsymbol{c}}_t} + {{\boldsymbol{b}}_{\rm{o}}}), $

$ {{\boldsymbol{h}}_t} = {{\boldsymbol{o}}_t}\tanh \;{{\boldsymbol{c}}_t}. $

式中:ct为存储单元在t时刻的信息;bibfbcbo为对应的偏置项;σ为Sigmoid激活函数;WxWhWc分别为输入与隐藏节点、存储与隐藏节点、存储与输出节点之间的权重矩阵.

LSTM网络可以有效地实现较长序列信息的单向特征提取与记忆. 如图1(d)所示,Bi-LSTM网络的一个隐藏层包含2个传递方向相反的LSTM层,实现原始序列数据双向学习,利用后续信息辅助学习先前的信息. 隐藏状态Ht按下式计算[16]

$ \overrightarrow {{{\boldsymbol{h}}_t}} = \overrightarrow {{\text{LSTM}}} ({{\boldsymbol{h}}_{t - 1}},{{\boldsymbol{x}}_t},{{\boldsymbol{c}}_{t - 1}}) , $

$ \overleftarrow {{{\boldsymbol{h}}_t}} = \overleftarrow {{\text{LSTM}}} ({{\boldsymbol{h}}_{t + 1}},{{\boldsymbol{x}}_t},{{\boldsymbol{c}}_{t + 1}}) , $

$ {{\boldsymbol{H}}_t} =\left[ \begin{array}{l} \overrightarrow {{{\boldsymbol{h}}_t}}\\ \overleftarrow {{{\boldsymbol{h}}_t}} \end{array} \right]. $

式中: $\overrightarrow {{{{{\boldsymbol{h}}}}_{{t}}}} $$\overleftarrow {{{{{\boldsymbol{h}}}}_{{t}}}} $分别为LSTM前向和后向学习过程中的隐藏状态.

图1所示为单隐藏层的网络结构. 隐藏层相当于输入信息的特征提取器,对于复杂问题可以堆叠隐藏层以加深网络结构,有利于抽象出更高级的特征,学习到更复杂的非线性关系.

2. 非等时距序列沉降预测方法

基于非等时距路基沉降观测序列的工后沉降预测方法如图2所示,包括数据前处理、模型构建与训练、滚动预测3部分.

图 2

图 2   工后沉降预测方法

Fig.2   Forecasting method for post-construction settlement


2.1. 数据前处理

1) 等时距处理. 路基施工期及工后全过程对应的地基沉降发展速率差异明显,所需的观测频次不同. 如图3所示,路基“填土高度H-时间T-地基沉降S ”是1组分布极不均匀的非等时距序列观测数据,无法满足时序分析法的要求,应先内插等时距处理. Akima插值法仅考虑插值区间前、后各3个点来拟合1条具有连续一阶导数的曲线,任意两数据点间采用三次多项式逼近,所得的曲线更光滑且自然[17]. 采用Akima插值法对H-T-S观测数据进行内插,考虑后续神经网络的训练效率与精度,处理为间隔3 d的等时距序列数据.

图 3

图 3   “填土高度-时间-地基沉降”曲线

Fig.3   Relationship between fill height, time and ground settlement


2) 特征提取. 如图3所示,将等时距后的H-T-S数据分为2个阶段:路堤填筑开始至工后一段时间的数据用于模型训练;除训练数据外的其余工后数据用于预测. 在不显著降低神经网络学习效果的条件下,训练数据应尽可能少,实现地基工后沉降的早期预测.

路堤通常依照设计填筑,预测任意时刻的沉降均可以从H-T曲线上提取对应时刻的数据特征作为确定性影响因素参与预测,如填土高Ht和填土速率vt. 沉降的发展不可以人为设计,如图3所示,对于测试数据部分,预测t+3时刻的沉降时仅能够从T-S曲线上提取到t时刻及以前信息作为影响因素,但t时刻的沉降量须提取t−3时刻及以前信息才能预测,依次反复迭代到沉降信息已知的t0时刻才可以逐步求解t+3时刻的沉降量. 取前3 d沉降速率 $v{'_{t - 3}} $和前3、6、9 d沉降量St−3St−6St−9为迭代的影响因素.

3) 样本组集. 用每一时刻的确定性和迭代影响因素向量Gt表征对应时刻的沉降量St,采用平移窗口法将数据组合为一系列长度相等的时序样本dt,如下所示.

$ {{\boldsymbol{G}}_t} = [{H_t},{v_t},v{'_{t - 3}},{S_{t - 3}},{S_{t - 6}},{S_{t - 9}}]^{\rm{T}} ; $

$ {{\boldsymbol{d}}_t} = [{{\boldsymbol{G}}_{t - l}}, \cdots ,{{\boldsymbol{G}}_{t - 1}},{{\boldsymbol{G}}_t}],\; t \geqslant l; $

$ {\boldsymbol{D}} = \{ {{\boldsymbol{d}}_{t_{\rm{0}} - l}}, \cdots ,{{\boldsymbol{d}}_{t_{\rm{0 }}- 1}},{{\boldsymbol{d}}_{t_{\rm{0}}}}\} . $

式中: $l$为样本序列长度,本文取50;D为总训练样本集;t0为训练数据对应的截止天数.

2.2. 模型构建与训练

1) 模型构建. 如图4所示为本文建立的Bi-LSTM模型,输入层节点具有序列的性质,可以直接将dt中每一时刻的影响因素向量Gt按时间顺序赋给各节点. 数据经2层Bi-LSTM单元组成的隐藏层进行特征提取,再经过1个全连接层输出下一时刻的沉降预测值yt+3. 为了有效地防止模型过拟合的问题,采用Dropout方法在模型训练的过程中随机关闭部分神经元连接,使模型不会因过度依赖某些局部特征而降低泛化性能[18].

图 4

图 4   沉降预测Bi-LSTM模型网络结构

Fig.4   Bi-LSTM network structures of settlement


建立LSTM和BPNN模型,与Bi-LSTM模型进行对比. LSTM模型与Bi-LSTM模型的结构相似,仅将隐藏层Bi-LSTM单元用LSTM结构进行替换. BPNN模型的输入层节点彼此无关联,须将各时刻时序样本dt拆分为独立变量,在去除重复数据后分别赋给输入层各节点.

2) 模型训练. 为了避免神经网络对训练数据产生过拟合而丧失泛化性能,须将数据划分为训练集和验证集2部分. 将验证集样本的误差近似为泛化误差来调整网络超参数,以期望得到泛化性能良好的模型[18]. 如图2(b)所示,采用五折交叉验证的方法划分总训练样本,以充分利用已知数据并提升模型的学习效果. 具体步骤如下:将总训练样本D划分为大小相似的5个互斥子集,即D = D1D2···∪D5D1D2= $\varnothing$(ij);每次用4个子集的并集作为训练集,剩余1个子集作为验证集. 为了保证每个子集的数据分布具有一致性,采用分层抽样法进行子集划分. 用5组不同的训练集和验证集进行网络训练,得到5个独立的平行模型,返回5个模型平均值作为最终的预测结果.

2.3. 滚动预测

路基下一时刻沉降的发展趋势往往与紧邻时刻的沉降密切相关,但随着时间的发展,相关性会逐步降低,很难通过已知时刻的样本对工后较远时刻的沉降进行精准预测. 为了避免该问题,采用单步沉降预测方法,模型每次只须根据前l个时间步预测相关性最高的下一时刻沉降,如图4所示.

为了实现地基沉降的持续性长期预测,须结合滚动迭代手段来实现,如图2所示,具体的操作步骤如下. 1)向训练好的模型输入测试集的第1组时序样本,即t0+3时刻的 ${{{{\boldsymbol{d}}}}_{{{{t}}_{\rm{0}}}{\rm{ + 3}}}} $,得到对应时刻的沉降量预测值 $S_{t_0 + 3}^{'}$. 2)根据 $S_{t_0 + 3}^{'}$计算 $v_{t_0 + 3}^{'}$,将 $S_{t_0 + 3}^{'}$$v_{t_0 + 3}^{'}$赋值给下一时刻的时序样本 ${{{{\boldsymbol{d}}}}_{{{{t}}_{\rm{0}}}{\rm{ + 6}}}} $,再经模型回归得到对应时刻的沉降量预测值 $S_{t_0 + 6}^{'}$. 3)不断重复步骤2),每次向前迭代一个步长,直至沉降量发展趋势稳定或达到规定时间.

3. 案例分析

某重载铁路路基DK1806+729~DK1807+325段的地层组成如下:①为Q4dl+pl淤泥质粉质黏土,②为Q4el+dl粉质黏土,③为细角砾土,④~⑥分别为全风化、强风化、弱风化软质千枚岩. 地基土层①和②的粉质黏土压缩系数a1-2为0.1~0.4 MPa−1,为中低压缩性土. 6个观测断面的路堤高度均大于8 m,在路肩以下8 m处设置宽为3 m的平台,平台以下的边坡坡率为1꞉1.75,以上的边坡坡率为1꞉1.5,如图5所示. 图中,h1~h5为从上至下每层地基土的厚度. 采用量程为200 mm的JMDL-4720A型单点沉降计,开展地基面沉降变形测试. 选取水泥搅拌桩加固某高速铁路深厚软土地基沉降观测数据[19],监测断面(K0+180)周围1 m左右的地基表层黏土下分布着15 m厚的淤泥质粉质黏土. 路堤高5.75 m,路肩和边坡下桩间距分别为1.2和1.4 m,桩排距为1.2 m,桩长为12.5~16.5 m,桩径为0.5 m. 路堤中心线地基面处设置多块沉降板,监测路基沉降.

图 5

图 5   测试路基断面

Fig.5   Profiles of subgrades in test sections


沉降监测频次在填筑施工期间一般为1次/d,沉降量突变时为2~3次/d,2次填筑间隔较长时为1次/3 d. 路基填筑完成后前3个月为1次/周,4~6个月为1次/2周,6个月后为1次/月. 测试区段的路堤填筑过程与地基沉降发展趋势类似,以DK1807+250断面为主进行分析.

3.1. 数据生成

1) 异常值判定与处理. 受工程环境或传感器性能的影响,地基沉降观测数据可能存在一些偏离常规的数据. 如图6所示为图3中DK1807+250断面监测数据的2类偏差. 对于偏差类型Ⅰ,在路堤进行二级填筑前,地基产生16.28 mm的瞬时沉降,估计是降雨或施工影响因素导致,可以通过紧邻时段的沉降发展趋势间接反映该类型数据的异变. 提取前3、6、9 d沉降量St−3St−6St−9作为迭代影响因素,帮助Bi-LSTM模型学习该类变化. 仪器异常或环境干扰会导致数据出现异常凸点,即偏差类型Ⅱ,属于错误数据,应剔除后再进行Akima插值.

图 6

图 6   观测数据的修正与等时距转化

Fig.6   Observational data correction and transformation for equally spaced observations


2) 等时距与标准化. 采用Akima插值法将修正后的非等时距序列观测数据处理为间隔为3 d的等时距序列,DK1807+250断面地基沉降共监测了992 d,将监测数据插值处理为331组数据点. 如图6所示,等时距序列数据与观测数据非常接近. 采用min-max标准化方法对等时距序列数据按式(14)进行处理,使得标准化后的数据 $\varepsilon _t^{'}$落入神经网络中的激活函数梯度敏感区间,加快模型训练.

$ \varepsilon _t^{'} = \frac{{{\varepsilon _t} - {\varepsilon _{\min }}}}{{{\varepsilon _{\max }} - {\varepsilon _{\min }}}}, $

$ \widehat {{\varepsilon _t}} = ({\varepsilon _{\max }} - {\varepsilon _{\min }})\varepsilon _t^{'} + {\varepsilon _{\min }}. $

式中: ${\varepsilon _t}$为等时距序列数据中t时刻的影响因素变量, ${\varepsilon _{\max }}$${\varepsilon _{\min }}$分别为等时距序列数据中的最大值与最小值, $\widehat {{\varepsilon _t}}$为反标准化后的原始数据.

3) 影响因素变量与数据集生成. 采用灰色关联度(GRG),评价确定性和迭代影响因素变量与地基沉降量间的相关程度. GRG为0~1.0,其大于0.6时两者密切相关;当GRG为0.50~0.60时,两者相关;若GRG小于0.5,则两者不相关[12]. 如表1所示为各影响因素变量与地基沉降量的灰色关联度系数分布,St−3St−6St−9与地基沉降量间的相关性非常高,GRG均大于0.98. vt的GRG大于0.87,与地基沉降量密切相关. 路堤填高Ht$v{'_{t - 3}} $的GRG有2个断面达到0.8,与地基沉降量密切相关,其余普遍为0.6,相关性较强,作为变量可以起到正向辅助作用. 综上所述,所选的6个影响因素变量合理.

表 1   各断面的灰色关联度系数分布

Tab.1  Grey correlation degree distribution in test sections

断面 $v{'_{t - 3}} $ vt Ht St−3 St−6 St−9
DK1806+925 0.59 0.96 0.58 0.99 0.99 0.98
DK1806+900 0.60 0.91 0.60 0.99 0.99 0.98
DK1806+800 0.85 0.95 0.85 0.99 0.99 0.98
DK1806+775 0.76 0.87 0.77 1.00 0.99 0.99
DK1807+250 0.57 0.95 0.58 0.99 0.98 0.98
DK1807+150 0.55 0.95 0.55 0.99 0.98 0.98

新窗口打开| 下载CSV


输入数据的序列长度l会影响模型的学习及预测能力. 序列长度过短,会导致序列样本内所含信息不完整,网络难以提取到有效特征. 序列过长会使信息特征复杂而难以识别有效特征,从而耗费更多的资源. 路基沉降观测数据具有“分级填筑-填筑间隔”的周期性特征,序列长度的确定应保证多数序列样本所含的信息完整. 如图6所示,DK1807+250断面路堤第1级填筑用时约为150 d,填筑间隔约为200 d,共350 d. 第2级填筑用时约为60 d,取工后3个月为填筑间隔,共150 d. 考虑两级路堤填筑间隔沉降发展缓慢,各影响因素变化不明显,可以取较短周期组集样本,缩短模型训练时间. 按150 d为依据,选取序列长度l为50.

DK1807+250断面的H-T-S数据经插值处理为331组数据,可以组集序列长度为50的时序样本dt共281个. 为了研究初始样本集大小对模型预测性能的影响,按时间顺序分别取前180, 175, 170, ···, 135, 130共11种初始样本量进行分析. 前 130组时序样本恰好对应路堤从开始填筑到工后3个月的数据,每间隔5组样本对应的时间跨度为半个月.

3.2. 模型训练与评估

1) 模型训练. 将初始样本分层抽样为5个不同的独立样本集,采用5折交叉验证手段分别训练5个独立模型,取均值作为输出结果. 神经网络每次训练须随机给各节点赋初始权值,Dropout层在每次迭代过程中会随机舍弃一定比例的神经元,导致网络每次的结果略有差异,因此重复上述交叉验证步骤20次,用平均值来评价模型性能[20]. 采用均方根误差(RMSE)和平均绝对百分误差(MAPE)作为模型性能的评价指标,如下所示:

$ {\text{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{t = 1}^n {{{(\overline {{S_t}} - {S_t})}^2}} } , $

$ {\text{MAPE}} = \frac{1}{n}\sum\limits_{t = 1}^n {\left| {1 - \frac{{\overline {{S_t}} }}{{{S_t}}}} \right|} . $

式中: $\overline {{S_t}} $t时刻地基沉降的预测值.

采用网格搜索法,对不同神经元个数(16、32、64、128、256)和隐藏层层数(1、2、3)进行寻优. BPNN在层数为2、节点为256时,学习效果最优;循环神经网络在层数为2、节点数为128时,学习效果最佳,如图4所示. 在训练过程中,采用Nadam算法进行参数迭代与更新,批尺寸batch_size设置为8,学习率lr为10−5,Dropout的比例设置为0.4. 在模型对训练集进行1次学习后,在验证集上进行1次测试,采用早停法(early stopping)监测验证集的损失变化,连续30次验证集损失没有降低时停止训练[18].

实验基于Python语言环境下的TensorFlow -GPU 2.3.0版本深度学习框架,硬件环境如下:CPU为AMD Ryzen™ 7-4800H,内存为16 GB,NVIDIA GeForce RTX 2060显卡.

2) 沉降预测模型评估. 以初始样本量为180的样本集为例,展示训练过程. 如图7所示为Bi-LSTM模型在5折交叉验证中不同训练集和验证集上的损失收敛过程. 图中,MSE为均方误差,ep为迭代次数. BPNN、LSTM和Bi-LSTM模型平均须迭代1 200、340和260次. Bi-LSTM对数据进行双向时序特征提取,仅需很少的迭代次数就能达到收敛标准. LSTM的迭代次数稍多,说明单向的特征提取没有充分利用输入信息. BPNN无法对输入信息按时序处理,面对庞大的散乱信息需要成倍的迭代次数才能达到收敛标准.

图 7

图 7   Bi-LSTM模型的训练过程

Fig.7   Training process of Bi-LSTM


图8所示为3种模型分别训练20次,在训练集上的平均预测结果. BPNN模型的大部分预测值超出了±5%的误差限,且RMSE为30.04 mm、MAPE为6.29%,误差较大,说明BPNN网络在面对长序列信息时很难提取到相对正确的特征. 减少BPNN模型的输入信息,只保留HtSt−3St−6St−9St−12St−15共6个影响因素作为输入. 如图8所示,修正BPNN模型的平均RMSE为7.08 mm,MAPE为4.03%,大幅降低了训练样本的预测误差,表达了地基沉降量与6维影响因素间的非线性回归关系. LSTM模型的RMSE为1.59 mm,MAPE为1.25%,相对误差大部分小于5%,较修正后的BPNN模型误差更小. Bi-LSTM模型的RMSE和MAPE仅为1.03 mm和 1.15%,预测精度最高.

图 8

图 8   地基沉降观测值与预测值的对比

Fig.8   Comparision between observed and predicted values of foundation settlement


图8所示,在偏差数据类型Ⅰ部分,各模型的预测精度均小于5%,说明所选取的迭代影响因素能够反映施工和环境因素对沉降的影响.

3.3. 预测分析

1) 工后沉降预测精度分析. 如图9所示,传统双曲线法无法考虑施工期信息,基于工后240 d内的沉降数据预测发现,825 d后相对误差均超出1%, RMSE为1.91 mm,MAPE为1.10%. 修正BPNN模型可以考虑施工期信息,采用工后240 d以前的沉降观测数据共180组样本进行训练,获得的预测值相对误差<1%,RMSE仅为0. 60 mm,MAPE仅为0.62%,预测效果优于双曲线法. 修正BPNN模型的精度随着滚动迭代而不断降低,主要是因为误差累积导致的.

图 9

图 9   修正BP神经网络模型与双曲线模型的预测结果

Fig.9   Predicted values derived from modified BP neural network model and hyperbolic function model


图10所示,每个点均为对应训练样本集下5个独立交叉验证模型的均值. 图中,Nt为训练集样本组数. 其中,LSTM模型在180组训练样本下,经20次重复训练后平均预测值的RMSE为0.39 mm,MAPE为0.29%,较修正BPNN模型的预测精度有所提高. Bi-LSTM模型平均预测结果的RMSE仅为0.37 mm,MAPE为0.28%,预测精度进一步提升.

图 10

图 10   不同训练集样本下Bi-LSTM模型预测结果

Fig.10   Bi-LSTM based prediction with different training samples


2) 预测精度与初始样本量的关系. 如图10所示,分别对比11组不同训练集样本下模型平均预测值的RMSE和MAPE变化趋势. 可知,2个模型预测值的误差均随样本数量的增加而减小. 因为样本量增加有助于模型学习到更多有益的附加特征,从而不断地改进预测结果. 图10中,上下25%分位点构成的箱体长度随着样本量的增加而减小,说明增大训练样本量有助于提高预测的可靠性. 从图10可知,多数情况下Bi-LSTM模型的箱体长度略小于LSTM模型,说明Bi-LSTM模型预测结果的分布更加稳定.

图11所示为不同训练集样本量下Bi-LSTM模型的绝对误差η. 模型预测误差在450~600 d(路堤填筑完成初期)较大,考虑模型为时序模型,在路堤填筑完成时地基沉降模式发生突变, Bi-LSTM模型受先前信息的影响无法快速转变,随着预测的后延逐步接近观测值. 当样本量大于155组时,相对误差<0.5%,130组时相对误差未超过1%. 对于一般工程和传统预测方法而言,1%的相对误差通常可接受,因此推荐使用工后3个月数据 (130组样本)作为训练样本.

图 11

图 11   不同训练集样本下Bi-LSTM模型的预测绝对误差

Fig.11   Absolute errors of Bi-LSTM model with different training samples


3) 模型适应性评估. 将Bi-LSTM模型应用于其余6个监测断面,训练样本均采用路堤开始填筑至工后3个月数据,预测结果如图12所示. 监测断面测试集的RMSE和MAPE分别为0.44~2.65 mm、0.41%~2.71%,平均值仅为1.19 mm和1.04%,预测精度较高. 其中,DK1806+800断面第2级路堤填筑完成一段时间内(500~600 d)沉降监测信息出现较多的第Ⅱ类数据偏差,Akima法在该部分插值误差较大,导致模型缺失地基沉降模式转变的精确关键信息. 综上所述,Bi-LSTM模型仅利用填筑期及工后3个月信息,可以对工后沉降进行具有较高精度与稳定性的预测.

图 12

图 12   其他断面地基沉降Bi-LSTM模型的预测结果

Fig.12   Bi-LSTM based predictions for foundation settlements in remaining test sections


4. 结 论

(1) 路堤填筑施工具有“分级填筑-填筑间隔”周期性特征,工后沉降可以视为较长的填筑间隔. 采用平移窗口法,将施工填筑数据组集为训练样本;在较短的工后观测时长下可以获得更多的样本,开展神经网络模型训练,有效提升了路基沉降早期预测的可靠性.

(2) 从“填土高度-时间-地基沉降”观测信息中提取全面反映填筑与沉降信息的6维影响因素,采用Bi-LSTM模型按时序进行双向学习. 与样本数据无关联性的BPNN和仅具有单向学习的LSTM模型相比,在更少的迭代次数下Bi-LSTM具有更高精度、更好稳定性的路基沉降量预测效果.

(3) 利用6个中等压缩性土地基和1个水泥搅拌桩加固深厚软土地基的沉降观测数据. 基于Bi-LSTM模型开展路基工后沉降滚动预测,以填筑期及工后3个月的早期信息为训练数据,沉降预测值的RMSE和MAPE分别为1.19 mm、1.04%,多数断面的RMSE和MAPE小于1 mm和1%,具有较高的精度,可以在类似工程中推广应用.

(4) 在突发灾害、极端温度或冻融循环作用下,路基易发生危害较大的不均匀沉降. 本文未考虑该类条件对路基沉降的影响,主要针对地基承载力足够时路基变形收敛的工况,后续工作可以增加温度、降雨、动荷载等因素参与建模和预测.

参考文献

TAN S A

Hyperbolic method for settlements in clays with vertical drains

[J]. Canadian Geotechnical Journal, 1994, 31 (31): 125- 131

[本文引用: 1]

ASAOKA A

Observational procedure of settlement prediction

[J]. Soils and Foundations, 1978, 18 (4): 30- 34

[本文引用: 1]

冷伍明, 杨奇, 聂如松, 等

高速铁路桥梁桩基工后沉降组合预测研究

[J]. 岩土力学, 2011, 32 (11): 3341- 3348

DOI:10.3969/j.issn.1000-7598.2011.11.023      [本文引用: 1]

LENG Wu-ming, YANG Qi, NIE Ru-song, et al

Study of post-construction settlement combination forecast method of high-speed railway bridge pile foundation

[J]. Rock and Soil Mechanics, 2011, 32 (11): 3341- 3348

DOI:10.3969/j.issn.1000-7598.2011.11.023      [本文引用: 1]

BATES J M, GRANGER C W J

The combination of forecasts

[J]. Operational Research Quarterly, 1969, 20 (4): 451- 468

DOI:10.1057/jors.1969.103      [本文引用: 1]

曹文贵, 谭涛

考虑数据异常及新旧程度影响有界性的地基沉降预测方法

[J]. 湖南大学学报:自然科学版, 2020, 47 (3): 37- 43

[本文引用: 1]

CAO Wen-gui, TAN Tao

A prediction method of foundation settlement considering anomaly and newness-oldness degree influence boundedness of measured data

[J]. Journal of Hunan University: Natural Sciences, 2020, 47 (3): 37- 43

[本文引用: 1]

ZHANG P, WU H N, CHEN R P, et al

Hybrid meta-heuristic and machine learning algorithms for tunneling-induced settlement prediction: a comparative study

[J]. Tunnelling and Underground Space Technology, 2020, 99 (6): 103383

[本文引用: 2]

HUANG C F, LI Q, WU S C, et al

Application of the Richards model for settlement prediction based on a bidirectional difference-weighted least-squares method

[J]. Arabian Journal for Science and Engineering, 2018, 43 (10): 5057- 5065

DOI:10.1007/s13369-017-2909-0     

LV Y, LIU T T, WEI S D, et al

Study on settlement prediction model of deep foundation pit in sand and pebble strata based on grey theory and BP neural network

[J]. Arabian Journal of Geosciences, 2020, 13 (23): 1238

DOI:10.1007/s12517-020-06232-7     

PARK H I, KIM K S, KIM H Y

Field performance of a genetic algorithm in the settlement prediction of a thick soft clay deposit in the southern part of the Korean peninsula

[J]. Engineering Geology, 2015, 196 (1): 150- 157

[本文引用: 1]

刘文豪, 黎曦, 胡伍生

基于神经网络和双曲线混合模型的高速公路沉降预测

[J]. 东南大学学报:自然科学版, 2013, 43 (Supple.2): 380- 383

[本文引用: 2]

LIU Wen-hao, LI Xi, HU Wu-sheng

Highway subsidence prediction based on neural network and hyperbolic hybrid model

[J]. Journal of Southeast University: Natural Science Edition, 2013, 43 (Supple.2): 380- 383

[本文引用: 2]

ZHANG P, YANG Y, YIN Z Y

BiLSTM-based soil–structure interface modeling

[J]. International Journal of Geomechanics, 2021, 21 (7): 1- 9

[本文引用: 3]

YANG B B, YIN K L, LACASSE S, et al

Time series analysis and long short-term memory neural network to predict landslide displacement

[J]. Landslides, 2019, 16 (1): 677- 694

[本文引用: 4]

周小雄, 龚秋明, 殷丽君, 等

基于BLSTM-AM模型的TBM稳定段掘进参数预测

[J]. 岩石力学与工程学报, 2020, 39 (Supple.2): 3505- 3515

[本文引用: 2]

ZHOU Xiao-xiong, GONG Qiu-ming, YIN Li-jun, et al

Predicting boring parameters of TBM stable stage based on BLSTM networks combined with attention mechanism

[J]. Chinese Journal of Rock Mechanics and Engineering, 2020, 39 (Supple.2): 3505- 3515

[本文引用: 2]

李洛宾, 龚晓南, 甘晓露, 等

基于循环神经网络的盾构隧道引发地面最大沉降预测

[J]. 土木工程学报, 2020, 51 (Supple.1): 13- 19

[本文引用: 2]

LI Luo-bin, GONG Xiao-nan, GAN Xiao-lu, et al

Prediction of maximum ground settlement induced by shield tunneling based on recurrent neural network

[J]. China Civil Engineering Journal, 2020, 51 (Supple.1): 13- 19

[本文引用: 2]

HOCHREITER S, SCHMIDHUBER J

Long short-term memory

[J]. Neural Computation, 1997, 9 (8): 1735- 1780

DOI:10.1162/neco.1997.9.8.1735      [本文引用: 1]

YIN J, DENG Z, INES A V M, et al

Forecast of short-term daily reference evapotranspiration under limited meteorological variables using a hybrid bi-directional long short-term memory model (Bi-LSTM)

[J]. Agricultural Water Management, 2020, 242: 106386

DOI:10.1016/j.agwat.2020.106386      [本文引用: 1]

AKIMA H

A new method of interpolation and smooth curve fitting based on local procedures

[J]. Journal of Association for Computing Machinery, 1970, 17 (4): 589- 602

DOI:10.1145/321607.321609      [本文引用: 1]

WANG Z Z, XIAO C L, GOH S H, et al

Metamodel-based reliability analysis in spatially variable soils using convolutional neural networks

[J]. Journal of Geotechnical and Geoenvironmental Engineering, 2021, 147 (3): 04021003

DOI:10.1061/(ASCE)GT.1943-5606.0002486      [本文引用: 3]

罗强, 魏永幸. 高速铁路路基[M]. 北京: 中国铁道出版社有限公司, 2021: 192–199.

[本文引用: 1]

ZHANG P, JIN Y F, YIN Z Y

Machine learning–based uncertainty modelling of mechanical properties of soft clays relating to time-dependent behavior and its application

[J]. International Journal for Numerical and Analytical Methods in Geomechanics, 2021, 45 (11): 1- 15

[本文引用: 1]

/