基于互信息与支持向量回归的盾构掘进载荷预测方法研究
Research on prediction method of driving load of shield machine based on mutual information and support vector regression
通讯作者:
收稿日期: 2019-12-19 修回日期: 2021-09-03
基金资助: |
|
Received: 2019-12-19 Revised: 2021-09-03
作者简介 About authors
周皓(1997—),男,湖北黄冈人,硕士生,从事工程数据分析研究,E-mail:
关键词:
Keywords:
本文引用格式
周皓, 刘尚林, 杨凯弘, 周思阳, 张茜.
ZHOU Hao, LIU Shang-lin, YANG Kai-hong, ZHOU Si-yang, ZHANG Qian.
盾构的掘进是机械装备与周围地质不断作用的过程,受到地质条件、操作参数等众多因素的耦合影响[4],这给掘进载荷的分析造成了一定的困难。在施工过程中所记录的工程实测数据包含了大量运行信息[5],是分析盾构掘进规律的重要信息基础[6]。许多学者利用工程实测数据建立反演回归模型对掘进参数进行了分析。例如:Zhang等[7]利用工程实测数据建立了掘进比能的反演识别模型;郑峥[8]基于工程实测数据进行残差分析,并通过时序分析方法对残差建模,以修正掘进推力的预测模型;褚东升[9]在分析掘进参数相关性的基础上,以掘进速度、总推力、土仓压力和刀盘转速为自变量,建立了刀盘扭矩的经验模型;Song等[10]综合考虑了地质参数、掘进参数和刀盘结构参数对刀盘扭矩的影响,结合实测数据,采用多元非线性回归方法建立了刀盘扭矩的预测模型,并通过对实测数据的统计分析,提出了基于马尔科夫决策的载荷规划;张志奇等[11]统计了不同地质分段的盾构掘进参数,开展了针对盾构掘进速率和刀盘扭矩的多元回归分析,得到了适用于复杂地层的掘进参数回归模型,而胡祥涛等[12]基于实测数据验证了该回归模型的准确性,并对刀盘扭矩进行预测;Avunduk等[13]基于积累的现场实测数据,利用多元回归分析了各种软土参数对掘进总推力和刀盘扭矩的影响;Sun等[14]利用随机森林方法,根据地质参数和掘进参数来预测盾构掘进的动态载荷;Gao等[15]利用时序神经网络建立了对推力、扭矩等关键参数的实时预测模型。综上可知,目前利用工程实测数据对掘进载荷进行分析和建模预测的相关工作主要是基于工程经验考虑掘进速度、刀盘转速、土仓压力等若干核心参数对掘进载荷的影响。然而在盾构掘进过程中影响掘进载荷的因素种类繁多,因此,有效地挖掘工程实测数据,分析众多影响参数对载荷的敏感度,建立适用于盾构数据特征的机器学习模型,是掘进载荷分析与预测的重要研究内容。
本文建立了一种基于工程实测数据分析的掘进载荷特征选择及预测方法。首先,对原始工程实测数据进行极值归一化预处理,以降低不同参数间量纲和量级的差异带来的支配性影响;其次,对在掘进过程中实时记录的众多影响因素进行分析和筛选,并采用互信息算法选择对掘进载荷影响较大的若干主要参数作为输入;接着,采用支持向量回归(support vector regression, SVR)方法提取掘进参数间的非线性耦合关系,对掘进载荷进行预测建模;最后,以采用土压平衡式盾构施工的天津地铁9号线工程为例,对本文建立的方法进行讨论和验证,比较并分析掘进载荷特征选择方式对模型预测表现的影响。
1 基于工程实测数据分析的掘进载荷特征选择及预测建模
本文提出的掘进载荷的分析和预测建模方法主要包括以下3步:1)为了降低盾构工程实测数据中不同参数间量纲和量级的差异带来的支配性影响,对数据进行极值归一化预处理;2)采用非参数检验方法中的互信息算法筛选出对掘进载荷较为敏感的关键参数作为输入特征;3)采用SVR方法对掘进载荷进行预测建模。
1.1 数据预处理
在盾构掘进过程中实时记录有关机器运行的众多信息,如油缸推力、刀盘转速、掘进速率、导向姿态和密封舱压力等。这些不同类别的工程参数的量纲各异,且数值量级差距也十分悬殊。例如,掘进总推力可达上万kN,而掘进速率往往仅为几十mm/min,而它们都是表征机器运行状态的重要因素。
考虑到大多数特征选择及机器学习算法并不具有伸缩不变性,为了防止在数据挖掘时由于数值量级上的差异而可能使某些参数起到支配性的作用,在进行数据分析前须对所有参数进行极值归一化处理,即:
式中:xpre为归一化处理后的无量纲参数;x为归一化处理前的原始数据;xmin为该参数原始数据中的最小值;xmax为该参数原始数据中的最大值。
极值归一化处理可以将有量纲的参量无量纲化,并将值映射至0~1的区间,使得在后续分析中不同量纲和量级的参数能够尽可能地被平等对待,此外,在实际求解时还有利于提升收敛速度及效果。
1.2 特征选择
工程数据往往不服从已知常见的数据分布形式,且它们通过组合的方式对目标变量产生影响[18]。因此,本文采用互信息算法进行特征选择。
式中:p(x, y)为自变量X和因变量Y的联合概率密度函数;p(x)和p(y)分别为X和Y的边缘概率密度函数。
如果2个变量完全独立,则它们的互信息值为0;互信息值越大,2个变量越不独立,则自变量X更可以作为因变量Y的特征[21]。相较于相关系数等相关性评价指标,互信息的优势在于非参数检验,不要求数据服从特定的已知分布,能更加普适地度量2个变量之间的相关程度,因此适合对关系复杂、分布不明的盾构掘进参数进行特征选择。
1.3 SVR方法
在盾构掘进过程中影响掘进载荷的参数众多,并且参数间的影响呈现复杂的非线性关系。对于此类高维非线性的数据分析问题,为了达到较高的模型精度,学习模型所需要的样本量与特征维度呈指数增长关系,因而对于特征维度高的数据,样本量往往显得不足[22]。SVR作为一种基于统计学理论的机器学习方法,在处理样本量少的非线性数据回归问题时有独特的优势[23-24]。该方法的计算复杂度取决于支持向量的数目,在一定程度上避免了高维样本带来的维数灾难,而灵活的核函数技巧使得该方法能够较为优秀地解决盾构掘进参数间的非线性关系问题。同时,工程实测数据由于在采集时受到工作环境和数据传输的影响,不可避免地含有噪声和离群值[25-26],而采用SVR方法建模时无须依赖整个训练集,仅需少数样本点作为支持向量即可确定预测模型,对噪声和离群值具有一定的鲁棒性[27]。
图1
因此,SVR算法的优化依据即为通过
式中:
将经过极值归一化预处理并通过互信息方法筛选出的参数作为输入,利用SVR方法构建掘进载荷预测模型,对掘进总推力和刀盘扭矩进行预测。其预测流程如图2所示。
图2
2 工程实例
利用所构建的盾构掘进载荷预测方法,对在天津地铁9号线隧道某标段约960环(每环约1.2 m)施工区间所采集的工程实测数据进行分析。该施工区间的地质主要为黏土和粉土等软土,记录的原始数据包含334个参数。对原始数据进行类别及特征分析,首先剔除对掘进载荷预测无明显关联的参数,包括开关类状态参数,常数类参量及与掘进载荷明显不相干的参数如记录时刻、环号、千斤顶选择时间等。获得初步约简后的特征子集,其包含90个特征参数。盾构施工中的部分主要参数如表1所示。
表1 盾构施工中的部分主要参数
Table 1
参数 | 最大值 | 最小值 | 均值 | 标准差 |
---|---|---|---|---|
掘进速度/(mm/min) | 55.68 | 16.84 | 35.23 | 10.04 |
掘进总推力/kN | 24 878.50 | 10 944.41 | 16 063.76 | 2 920.61 |
刀盘扭矩/kNm | 1735.17 | 810.46 | 1281.44 | 152.04 |
刀盘转速/(r/min) | 1.10 | 0.40 | 0.95 | 0.14 |
原始数据初筛后的子集仍包含较多特征,因此进一步采用互信息方法进行特征选择。在高维特征的分析中,须综合考虑训练精度、计算成本及可能的过拟合等问题,选取适当个数的特征作为回归模型训练的有效输入。因此,首先就不同特征选取数对掘进载荷预测效果的影响进行讨论。
回归问题的常见评价指标有决定系数R2、平均绝对误差MAE和均方误差MSE,其计算表达式分别如
式中:
通过R2随特征数的变化情况来选取最终的特征个数,然后按照互信息计算得到的排序结果依次添加特征参数作为输入。同时考虑计算和特征获取的成本、算法训练复杂程度等因素,确定最优输入特征。
采用互信息方法对特征排序后,R2随特征数的变化曲线如图3所示。由图可知,掘进总推力和刀盘扭矩训练模型的R2均基本逐步上升,最终达到稳定的状态,具有较好的预测表现。当输入特征数达到15个左右时,R2均达到0.8以上,预测效果较优。此后,随着输入特征数的增多,R2虽有增大但增长缓慢。当输入特征数达到55个时,R2已经接近最大值,约为0.9。
图3
表2 掘进载荷与各特征参数之间的互信息分析结果
Table 2
序号 | 掘进总推力 | 互信息值 | 刀盘扭矩 | 互信息值 | ||
---|---|---|---|---|---|---|
1 | 注浆上限 | 0.570 5 | 2号高压变压器二次电流 | 0.640 6 | ||
2 | 掘进速度 | 0.564 5 | 1号高压变压器二次电流 | 0.355 6 | ||
3 | 垂直偏差(铰接) | 0.557 5 | 注浆累计平均值 | 0.272 5 | ||
4 | 垂直偏差(前端) | 0.557 5 | 注浆上限 | 0.252 6 | ||
5 | 目标水准偏差 | 0.557 4 | 注浆下限 | 0.238 9 | ||
6 | 垂直偏差(后端) | 0.557 2 | 掘进速度 | 0.206 5 | ||
7 | 测边差 | 0.556 8 | 土压平均值 | 0.197 4 | ||
8 | Robotec方位偏差 | 0.556 8 | 注浆累计加权平均值 | 0.195 7 | ||
9 | 水平偏差(前端) | 0.556 8 | 土压上限 | 0.185 7 | ||
10 | 水平偏差(铰接) | 0.556 8 | 加泥上限 | 0.173 0 | ||
11 | 水平偏差(后端) | 0.556 8 | 俯仰角 | 0.153 9 | ||
12 | 方位位移量 | 0.556 8 | 目标俯仰角偏差 | 0.152 7 | ||
13 | 开始时累计水准 | 0.551 1 | 俯仰角差 | 0.152 5 | ||
14 | 注浆下限 | 0.542 0 | 右千斤顶速度 | 0.135 6 | ||
15 | 俯仰角差 | 0.523 4 | 土压下限 | 0.135 6 |
图4
图4
掘进总推力实测值与预测值的对比
Fig.4
Comparison between measured value and predicted value of total driving thrust
图5
图5
刀盘扭矩实测值与预测值的对比
Fig.5
Comparison between measured value and predicted value of cutter head torque
上述研究表明,所建立的基于互信息的特征选择与SVR相结合的盾构掘进载荷预测方法能够从工程实测数据的众多特征中筛选出对掘进总推力和刀盘扭矩较为敏感的参数作为输入特征,来对掘进总推力和刀盘扭矩进行合理、准确的预测。
3 总 结
本文围绕盾构施工工程中实测数据分析与掘进载荷预测问题,建立了一种基于互信息的特征选择与SVR相结合的掘进载荷预测方法。对实测数据进行极值归一化预处理,基于互信息计算分析各类参数对掘进载荷影响的敏感度,确定适当的输入特征子集,并通过SVR方法对掘进总推力和刀盘扭矩进行建模预测。结合天津地铁9号线盾构施工工程的实测数据进行了掘进载荷的计算与分析,验证了所提出预测方法的合理性和有效性,并分析了特征数变化对掘进总推力和刀盘扭矩预测表现的影响。结果表明,通过互信息方法选取的少量特征可以建立相对较优的SVR回归模型,当输入特征数逐渐增多时,预测性能逐步上升并达到稳定状态。研究结果为盾构掘进载荷的预测提供了一种思路,也为具有高维、多参量非线性耦合等特点的工程实测数据的分析提供了参考。
参考文献
Application of several optimization techniques for estimating TBM advance rate in granitic rocks
[J].
The performance of a TBM in a squeezing ground at Uluabat, Turkey
[J].
复合式土压平衡盾构盘形滚刀布置规律
[J].
Disc cutter layout law for composite EPB shield
[J].
TBM刀盘驱动系统分层次建模及动力学特性研究
[J].
Hierarchical modeling and dynamic analysis of cutterhead driving system in TBM
[J].DOI:10.3901/jme.2018.01.044 [本文引用: 1]
Cutter force measurement on tunnel boring machines: Implementation at Koralm tunnel
[J].
Comprehensive ahead prospecting for hard rock TBM tunneling in complex limestone geology: A case study in Jilin, China
[J].
Identification and optimization of energy consumption by shield tunnel machines using a combined mechanical and regression analysis
[J].
盾构掘进载荷的力学分析与反演识别
[D].
Mechanical analysis and inverse identification on load of shield tunneling machine
[D].DOI:10.3901/jme.2014.21.031 [本文引用: 1]
长沙地铁下穿湘江土压平衡盾构隧道掘进参数研究
[D].
Study of EPB shield tunnelling parameters of Changsha metro passing beneath Xiangjiang River
[D].
A cutter head torque forecast model based on multivariate nonlinear regression for EPB shield tunneling
[C]//
复杂地层盾构掘进速率和刀盘扭矩预测模型及其地层适应性研究
[J].
Prediction models of advancing speed and cutterhead torque of shield tunneling in complex strata and its adaptability to strata
[J].DOI:10.3973/j.issn.1672-741X.2016.12.007 [本文引用: 1]
基于部分可观测Markov决策过程理论的盾构推进载荷规划
[J].
POMDP-based planning model of driving force during shield tunneling
[J].DOI:10.3901/jme.2014.21.084 [本文引用: 1]
Empirical modeling for predicting excavation performance of EPB TBM based on soil properties
[J].
Dynamic load prediction of tunnel boring machine (TBM) based on heterogeneous in-situ data
[J].
Recurrent neural networks for real-time prediction of TBM operating parameters
[J].
An overview of ahead geological prospecting in tunneling
[J].
Evaluation of the geological condition ahead of the tunnel face by geostatistical techniques using TBM driving data
[J].
Data based complex network modeling and analysis of shield tunneling performance in metro construction
[J].
Mutual information-based feature selection for intrusion detection systems
[J].
A review of feature selection methods based on mutual information
[J].
机器学习面临的挑战
[J].
Challenges in machine learning
[J].DOI:10.1360/n112013-00074 [本文引用: 1]
支持向量机在地下工程中的应用研究
[D].
Application and study of support vector machine in the underground engineering
[D].DOI:10.7666/d.Y671299 [本文引用: 1]
基于机器学习的TBM掘进性能预测与岩体参数表征方法研究
[D].
Research on TBM performance prediction and rock mass parameters characterization method based on machine learning
[D].
Structural health monitoring and analysis of an underwater TBM tunnel
[J].
Stability evaluation of deep-buried TBM construction tunnel based on microseismic monitoring technology
[J].
A training algorithm for optimal margin classifier
[C]//
DOI:10.21436/inbom.12382432 [本文引用: 1]
/
〈 |
|
〉 |
