浙江大学学报(工学版), 2025, 59(11): 2352-2360 doi: 10.3785/j.issn.1008-973X.2025.11.014

交通工程、土木工程

基于高斯过程回归的锈蚀RC梁抗剪承载力概率模型

王冲,, 戴理朝,, 陈斌

1. 中铁桥隧技术有限公司,江苏 南京 210061

2. 长沙理工大学 土木工程学院,湖南 长沙 410114

Probabilistic model for shear capacity of corroded RC beams based on Gaussian process regression

WANG Chong,, DAI Lizhao,, CHEN Bin

1. China Rail Bridge and Tunnel Technologies Limited Company, Nanjing 210061, China

2. School of Civil Engineering, Changsha University of Science and Technology, Changsha 410114, China

通讯作者: 戴理朝,男,副教授. orcid.org/0000-0003-2598-0837. E-mail: lizhaod@csust.edu.cn

收稿日期: 2024-11-4  

基金资助: 国家自然科学基金资助项目(52278140);湖南省科技创新计划资助项目(2023RC3142).

Received: 2024-11-4  

Fund supported: 国家自然科学基金资助项目(52278140);湖南省科技创新计划资助项目(2023RC3142).

作者简介 About authors

王冲(1998—),男,硕士,工程师,从事桥梁耐久性的研究.orcid.org/0009-0008-6458-0354.E-mail:1135128340@qq.com , E-mail:1135128340@qq.com

摘要

针对确定性数据驱动方法难以考虑输入参数的客观不确定性与超参数拟定的主观不确定性导致预测精度较低的问题,提出基于混合树形分层贝叶斯估计和优先内存BFGS(TEP-L-BFGS)优化高斯过程回归(GPR)的锈蚀RC梁抗剪承载力预测概率模型,探讨数据维度和尺度对预测精度的影响. 通过与传统机理驱动方法和其他数据驱动方法进行比较,验证了所提模型的预测精度和泛化性能. 结果表明,该方法可以同时考虑锈蚀RC梁几何参数、退化程度的客观不确定性和超参数先验分布的主观不确定性影响,具有较高的泛化能力. 输入特征的维度及尺度显著影响模型的预测精度,有必要对输入特征进行预处理. 相较于确定性模型,GPR可以量化预测值的不确定性,显著提高了锈蚀RC梁抗剪承载力的预测精度.

关键词: 钢筋混凝土梁 ; 锈蚀 ; 抗剪承载力 ; 机器学习 ; 特征选择

Abstract

A probability model for predicting the shear capacity of corroded RC beams based on hybrid tree-structured hierarchical Bayesian estimation and priority memory BFGS (TEP-L-BFGS) optimized Gaussian process regression (GPR) was proposed aiming at the problem that the objective uncertainty of the input parameters and the subjective uncertainty of the hyperparameter formulation were difficult to be considered in deterministic data-driven methods, resulting in low prediction accuracy. The influence of data dimensionality and scale on prediction accuracy was analyzed. The predictive accuracy and generalization performance of the proposed model were validated by comparing with traditional mechanism-driven methods and other data-driven methods. Results indicate that the proposed method can consider the objective uncertainties related to the geometric parameters and degradation levels of corroded RC beams, as well as the subjective uncertainties associated with the prior distributions of hyperparameters, demonstrating high generalization capability. The dimensionality and scale of input features significantly impact the prediction accuracy of model, making the preprocessing of input features essential. GPR quantifies the uncertainty of predicted values compared to deterministic models, significantly improving the prediction accuracy of shear capacity for corroded RC beams.

Keywords: reinforced concrete beam ; corrosion ; shear capacity ; machine learning ; feature selection

PDF (1564KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王冲, 戴理朝, 陈斌. 基于高斯过程回归的锈蚀RC梁抗剪承载力概率模型. 浙江大学学报(工学版)[J], 2025, 59(11): 2352-2360 doi:10.3785/j.issn.1008-973X.2025.11.014

WANG Chong, DAI Lizhao, CHEN Bin. Probabilistic model for shear capacity of corroded RC beams based on Gaussian process regression. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(11): 2352-2360 doi:10.3785/j.issn.1008-973X.2025.11.014

施工质量、几何参数、材料强度等因素会导致RC梁抗剪承载力的不确定性,而锈蚀引起的力学性能退化会加剧这一问题. 受侵蚀介质的影响,箍筋比纵筋更易锈蚀,导致RC梁的剪切性能退化,破坏模式可能由延性弯曲破坏演变为脆性剪切破坏[1],使RC梁的抗剪承载力呈现高离散性和不确定性. 准确评估锈蚀RC梁的抗剪承载力对保证其服役安全具有重要意义.

目前,预测方法主要包括机理驱动与数据驱动2类. 一些学者基于机理模型,如极限平衡理论[1-2]、“桁架-拱”理论[3]、“修正压力场”理论[4]、“等效桁架”理论[5]等,建立确定性预测方法. 余波等[6]结合修正压力场理论和临界斜裂缝倾角模型,建立概率模型. 该类方法的计算复杂,依赖多种假定与简化,难以适应锈蚀RC梁本身的高离散性. 为了提升实用性,一些学者通过试验回归分析引入经验参数,推导了经验实用方程[3, 7],但存在精度不足的问题.

数据驱动方法可以精确捕捉输入特征与输出值间的复杂映射关系,具有预测精度高、建模效率快的优点,已被广泛应用于结构强度[8-13]、破坏模式[14]、决策分析[15]等方面的预测. 上述数据驱动方法的输出结果是唯一确定性的,难以考虑锈蚀RC梁的自身力学性能客观不确定性和超参数拟定主观不确定性的影响. 有必要建立数据驱动的概率模型,以考虑不确定性对锈蚀RC梁抗剪承载力的影响.

高斯过程回归(GPR)是概率机器学习方法,具有灵活的核函数,可以量化输入特征的不确定性. Liu等[16-17]利用GPR分别建立锈蚀PC梁承载力概率模型和RC梁柱接头剪切强度概率模型,但已有模型未考虑输入特征尺度和维度的影响,且超参数拟定未利用先验知识,限制了预测性能.

为了解决上述问题,本文提出结合混合树形分层贝叶斯估计与优先内存BFGS(TEP-L-BFGS)优化的GPR概率模型,有效考虑建模过程中的不确定性. 构建锈蚀RC梁的抗剪承载力数据库,采用Johnson变换对输入特征标准化,结合特征相关性分析与递归特征消除(RFE)降低维度. 通过TEP-L-BFGS优化GPR超参数,建立预测模型,与机理和数据驱动方法对比,验证了本文方法的合理性.

1. TEP-L-BFGS优化锈蚀RC梁抗剪承载力概率模型

1.1. 高斯过程回归

高斯过程回归(GPR)是基于贝叶斯理论和统计学习理论发展的非参数回归方法,目标是建立有限子集的联合概率分布[18]. GPR不仅可以给出点预测,还可以给出预测值的不确定性即置信区间,记为

$ f(X)\sim {\mathrm{GP}}(\mu ({\boldsymbol{X}}),k({\boldsymbol{X}},{\boldsymbol{X}}')), $

$ \mu ({\boldsymbol{X}}) = E(f({\boldsymbol{X}})), $

$ k({\boldsymbol{X}},{\boldsymbol{X}}') = {{\mathrm{cov}}} (f({\boldsymbol{X}}),f({\boldsymbol{X}}')). $

式中:$\mu ({\boldsymbol{X}})$为高斯过程中的均值函数,通常假设均值函数为0;$k({\boldsymbol{X}},{\boldsymbol{X}}')$为核函数.

假设训练数据为$ \left\{({{\boldsymbol{X}}}_{i},{y}_{i})|i=1,2,\cdots ,n\right\} $,输入特征与输出的关系表示为

$ {y_i} = f({{\boldsymbol{X}}_i})+\varepsilon . $

式中:${y_i}$为带有噪声的观测值;$f({{\boldsymbol{X}}_i})$为相应输入向量${{\boldsymbol{X}}_i}$的观测值;$\varepsilon $为高斯噪声,$\varepsilon \sim {\mathrm{N}}(0,{\sigma ^2})$.

当利用GPR建模时,假设均值函数$\mu ({\boldsymbol{X}})$=0,选择合适的核函数$\theta $. $\theta $通常包含某些控制参数(超参数),这些参数通过最小化负对数似然(negative log-likelihood, NLL)求解. NLL表示为

$\begin{split} - \ln p({\boldsymbol{Y}}|{\boldsymbol{X}},\theta ) = &\frac{1}{2}{{\boldsymbol{Y}}^{\mathrm{T}}}{\left[ {k({\boldsymbol{X}},{\boldsymbol{X}})} \right]^{ - 1}}{\boldsymbol{Y}}+ \\ &\frac{1}{2}\ln\; (\det\; (k({\boldsymbol{X}},{\boldsymbol{X}})))+\frac{n}{2}\ln 2{\text{π}} . \end{split} $

式中:${\boldsymbol{X}} = [{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_2}, \cdots ,{{\boldsymbol{X}}_n}]$${\boldsymbol{Y}} = {[{y_1},{y_2}, \cdots ,{y_n}]^{\mathrm{T}}}$.

在选择恰当的核函数后,若给定训练数据,则训练集和测试集的联合分布均符合高斯分布,根据贝叶斯方法计算输入为${{\boldsymbol{X}}^*}$时的输出${y^*}$的概率分布$P({y^*}|{{\boldsymbol{X}}^*},\theta )$,表示为

$ {y^*}|{\boldsymbol{X}},{\boldsymbol{Y}},{{\boldsymbol{X}}^*}\sim {\mathrm{N}}({\mu ^*},{\Sigma ^*}), $

$ {\mu ^*} = k({{\boldsymbol{X}}^*},{\boldsymbol{X}}){[k({\boldsymbol{X}},{\boldsymbol{X}})]^{ - 1}}{\boldsymbol{Y}}, $

$ {\Sigma} ^* = k({{\boldsymbol{X}}^*},{{\boldsymbol{X}}^*}) - k({{\boldsymbol{X}}^*},{\boldsymbol{X}}){[k({\boldsymbol{X}},{\boldsymbol{X}})]^{ - 1}}k({\boldsymbol{X}},{{\boldsymbol{X}}^*}). $

根据求得的均值函数${\mu ^*}$和方差${\Sigma ^*}$,对预测点${y^*}$进行点预测和区间估计.

1.2. 超参数优化

GPR超参数拟定主要通过最大化边缘似然函数来实现. 贝叶斯优化对选择的先验分布较敏感,人的先验知识必然会带来主观不确定性误差,因此,有必要开发不依赖先验知识的超参数拟定方法,提高模型的预测精度与泛化性能.

BFGS(Broyden-Fletcher-Goldfarb-Shanno)算法是拟牛顿法,用于寻找可微标量函数的局部最小值[19]. 优先内存BFGS(L-BFGS)仅存储有限的历史信息逼近逆Hessian矩阵,显著减少了内存需求,提高了求解效率[20].

在L-BFGS中,给定超参数的初始猜测值X0X0表示优化问题中需要优化的参数初始估计值,在每次迭代k中,计算当前点的目标函数$f({{\boldsymbol{X}}_k})$和梯度$ \nabla f({{\boldsymbol{X}}_k}) $,基于当前梯度和逆矩阵${{\boldsymbol{H}}_k}$的低秩近似,计算搜索方向${{\boldsymbol{P}}_k}$,直到满足收敛条件为止. 由于锈蚀RC梁的抗剪承载力与输入特征间存在较大的离散性,L-BFGS算法在给定初始猜测值下容易陷入局部极值.

RC梁的抗剪承载力与材料的几何尺寸、力学性能息息相关,且这些特征间存在相关性,在锈蚀的影响下,这些特征之间的层次结构更复杂. 传统的贝叶斯优化生成连续的超参数配置,没有明确的探索和开发步骤,难以精确考虑这些特征间的复杂依赖关系. 树形分层贝叶斯估计(TPE)[21]是贝叶斯优化的变体,引入树形结构和探索-开发策略,以更加高效地探索超参数空间.

虽然L-BFGS算法提供的解可能并非全局最优,但提供了灵活的方式逐步优化先验分布,即反复运用L-BFGS. 基于不同猜测值获取多个局部最优解,确定超参数的先验分布范围,为TPE提供了较准确的初始条件. 利用L-BFGS的灵活性和TPE的鲁棒性,更有效地实现超参数优化. 基于TEP-L-BFGS优化GPR锈蚀RC梁抗剪承载力预测模型的执行步骤如图1所示.

图 1

图 1   TEP-L-BFGS优化GPR模型的执行步骤

Fig.1   Execution step of TEP-L-BFGS optimized GPR model


2. 锈蚀RC梁抗剪承载力数据的构建及预处理

2.1. 数据库构建

研究人员更关注材料和性能的相对变化规律,传统的RC梁抗剪强度设计理论都是参考小尺寸梁的试验结果得到的,尚未有专门针对尺寸效应RC梁剪切强度的试验数据库,因此本文在Fu等[11]建立的数据库基础上,增加了李冰等[22]、杨晓明等[23]及霍艳华[3]的试验梁样本,共计190组,用于模型的训练与测试. 其中,70%的数据用于训练(133组),30%的数据用于测试(57组). 引入22组独立数据[24-25],用于测试模型的泛化性能. 数据库具有14个结构的基本特征:混凝土轴心抗压强度设计值${f_{\mathrm{c}}}$、梁截面有效高度${h_0}$、剪跨比$\lambda $、箍筋锈蚀率${\eta _{\text{w}}}$、纵筋配筋率${\rho _{\mathrm{l}}}$、箍筋配筋率${\rho _{\mathrm{v}}}$、同一截面箍筋各肢截面积${A_{{\mathrm{sv}}}}$、梁宽$b$、纵筋锈蚀率${\eta _{\mathrm{l}}}$、箍筋屈服强度${f_{{\mathrm{yv}}}}$、箍筋间距$s$、箍筋直径${d_{\mathrm{v}}}$、纵筋屈服强度${f_{\mathrm{y}}}$、梁高$h$,这些数据的取值范围见表1. 根据文献[26],设计使用年限为50 a的RC梁,混凝土等级通常为C20~C40(9.6~19.1 MPa),实际结构通常使用C30~C40混凝土,训练集的${f_{\mathrm{c}}}$(12.09~26.85 MPa)对应C30~C60混凝土,钢筋屈服强度通常为300~500 MPa,训练集的${f_{{\mathrm{yv}}}}$为275~626 MPa,箍筋最大间距通常为150~300 mm,训练集的$s$为80~350 mm. 根据文献[27]可知,对于C20~C40混凝土,纵筋最大${\rho _{\mathrm{l}}}$通常为1.381%~3.502%,训练集${\rho _{\mathrm{l}}}$为1.22%~3.27%,${\rho _{\mathrm{v}}}$通常为0.013%~0.905%,训练集${\rho _{\mathrm{v}}}$为0.14%~0.90%. 李士斌等[7]对服役28 a的屋顶花架梁钢筋锈蚀率进行测定,锈蚀率最大为29.4%,训练集${\eta _{\mathrm{w}}}$为0%~97.2%,${\eta _{\mathrm{l}}}$为0%~26%,这些数据可以反映实际锈蚀RC梁的性能.

表 1   输入特征范围的统计表

Tab.1  Statistics table of input feature range

数据集极值${f_{\mathrm{c}}}$/MPa${h_0}$/mm$\lambda $${\eta _{\mathrm{w}}}$/%${\rho _{\mathrm{l}}}$/%${\rho _{\mathrm{v}}}$/%${A_{{\mathrm{sv}}}}$/mm2$b$/mm${\eta _{\mathrm{l}}}$/%${f_{{\mathrm{yv}}}}$/MPa$s$/mm${d_{\mathrm{v}}}$/mm${f_{\mathrm{y}}}$/MPa$h$/mm
训练集
(133组)
max26.855214.797.23.270.90265.46254.026.0626.035013.0706.0610.0
min12.091301.001.220.1456.55120.00.0275.0806.0210.0180.0
测试集
(57组)
max26.615214.793.82.792.90265.46254.030.24626.030513.0706.0610.0
min9.731301.001.220.1456.5595.00275.0806.0210.0180.0
验证集
(22组)
max14.571502.9469.43.600.4487.1315069.43601806.0490300
min14.471001.1702.400.2356.551000300706.0300200

新窗口打开| 下载CSV


由于该数据库中的混凝土强度采用的是圆柱体抗压强度标准值,而我国规范采用的是轴心抗压强度设计值${f_{\mathrm{c}}}$,根据文献[26]换算混凝土强度,换算公式如下:

$ f'_{\mathrm{c}} = 0.79{f_{{\mathrm{cu}},{\mathrm{k}}}}, $

$ {f_{{\mathrm{ck}}}} = 0.88{\alpha _{{\mathrm{c}}1}}{\alpha _{{\mathrm{c}}2}}{f_{{\mathrm{cu}},{\mathrm{k}}}}, $

$ {f_{\mathrm{c}}} = {f_{{\mathrm{ck}}}}/1.4. $

式中:$f'_{\mathrm{c}}$为圆柱体抗压强度标准值;${f_{{\mathrm{ck}}}}$为轴心抗压强度标准值;${f_{{\mathrm{cu}},{\mathrm{k}}}}$为立方体抗压强度标准值;${\alpha _{{\mathrm{c1}}}}$为强度换算系数,该参数在混凝土强度小于C50时取0.76,在C50~C80区间取0.76~0.82,中间值可以采用线性插值方法获得;${\alpha _{{\mathrm{c}}2}}$为脆性折减系数,对于C40以下取1.0,C40~C80取1.0~0.87.

2.2. 特征映射

试验数据的分布与质量可以决定数据驱动方法所能达到的上限,而输入特征的分布具有偏态、长尾、多峰等特点,且特征间存在尺度差异. 数据特征的不同尺度与分布形态可能会对GPR的性能产生负面影响,因此本文通过Yeo-Johnson变换[28]将严重偏态分布的数据尽可能映射到接近正态分布,提高模型的稳定性与预测精度. 通过最大化特征的对数似然计算最优$\lambda $,根据式(13)对偏态特征进行变换,将数据缩放为均值为0、标准差为1的分布,以消除尺度带来的影响.

$ {x_i}^{(\lambda )} = \left\{ \begin{array}{*{20}{l}} [{({x_i}+1)^\lambda } - 1]/\lambda, &\lambda \ne 0,{x_i} \geqslant 0 ; \\ \ln\; ({x_i}+1),&\lambda = 0,{x_i} \geqslant 0; \\ - [{( - {x_i}+1)^{2 - \lambda }} - 1]/(2 - \lambda ),&\lambda \ne 2,{x_i} < 0; \\ - \ln\; ( - {x_i}+1),&\lambda = 2,{x_i} < 0. \\ \end{array} \right. $

$ Z_i=\frac{{x_i}^{(\lambda )}-u}{s}. $

式中:$Z_i $为特征变换后的值,u为特征变换后的均值,s为特征变换后的标准差.

采用决定系数R2、平均绝对误差(MAE)与均方根误差(RMSE)作为GPR的模型评估指标,如表2所示. 其中,R2反映模型拟合数据的准确程度,其值越接近1表明模型拟合能力越强;MAE表示预测值与真实值间的绝对误差;RMSE表示预测值与真实值间的平均偏差程度,RMSE对预测误差的敏感度较高.

表 2   特征映射前、后的预测性能指标

Tab.2  Predictive performance metrics before and after feature mapping

映射方法训练集测试集
R2RMSEMAER2RMSEMAE
原始特征0.97515.25010.6370.89623.26217.441
Johnson变换0.9965.8573.4970.19564.60129.330
标准化0.9919.1985.4060.91720.68912.404
Johnson变换标准化0.98910.1596.3780.93618.21812.661

新窗口打开| 下载CSV


图2中,Vp为预测值,Vt为试验值. 在特征进行Johnson变换后,训练集评估指标(R2、RMSE、MAE)较原始特征分别提升了2.1%、61.5%、67.1%,但测试集表现较差,存在一些预测异常点. 这是由于偏态特征中,${A_{{\mathrm{sv}}}}$${\eta _{\mathrm{w}}}$${\eta _{\mathrm{l}}}$Vt的尺度差异较大,未能有效地学习特征权重,导致模型过拟合. 在对特征进行标准化后,训练集评估指标分别提高了1.6%、39.7%、49.2%,测试集评估指标分别提高了2.1%、11.1%、28.9%,但受偏态分布特征的影响,未能有效地捕捉映射关系,导致部分样本预测值大致呈水平线. 在对特征进行Johnson变换标准化后,训练集评估指标分别提高了1.4%、33.4%、40.0%,测试集评估指标分别提高了4%、21.7%、27.4%.

图 2

图 2   不同映射特征方法的模型预测精度对比

Fig.2   Comparison of model prediction accuracy of different mapping feature methods


以上结果表明,Johnson变换可以有效地提高模型训练集的预测精度,但变换后的数据受尺度影响,未正确学习到权重,训练存在过拟合. 标准化后的数据虽然消除了尺度差异,但偏态分布对其影响较大,对Johnson变换后的特征进行标准化,可以结合二者的优点,显著提高模型质量.

2.3. 特征相关性分析

当利用数据驱动方法选择输入特征时,若输入特征存在共线性,则会导致模型出现过拟合、超参数估计不准确的问题. 为了验证特征的合理性,通常对数据库进行特征相关性分析. 用于描述连续变量的相关系数主要有Pearson和Spearman相关系数[29],Spearman相关系数用于度量2个变量间的单调关系,对于非线性关系也能较好地描述且不要求变量连续. 选择Spearman相关系数对本数据库进行相关性分析,Spearman相关系数可以采用以下近似公式计算:

$ \rho = 1 - \frac{{6\displaystyle \sum d_i^2}}{{n\left( {{n^2} - 1} \right)}}. $

式中${d_i}$为对应变量的秩之差,即2个变量分别排序后成对的变量位置(等级)差;$n$为观测对象数量; $\rho $为相关性描述,绝对值越接近1则越相关.

图3所示为特征间的相关性,一般认为高度相关($|\rho | \geqslant 0.8$)的变量不适合作为输入变量[30]. $h$${h_0}$显著相关,由于${h_0}$代表的物理量更明确,理论模型将${h_0}$作为重要参数之一. 由于$ {\rho }_{{\mathrm{v}}}={A}_{{\mathrm{sv}}}/(b s) $${\rho _{\mathrm{v}}}$${A_{{\mathrm{sv}}}}$$b$$s$间存在一定的相关性,${\rho _{\mathrm{v}}}$$s$的相关性最大,为−0.69. 其他变量大部分相关性为低度相关,但存在某些变量中度相关,存在一定的共线性.

图 3

图 3   特征相关性的分析

Fig.3   Feature correlation analysis


2.4. 特征递归消除

输入特征维度的增加需要更多的数据对空间进行充分覆盖,否则难以保证模型的泛化性能. 从2.3节可知,数据库存在共线冗余的特征,因此通过特征递归消除(RFE)对输入特征进行降维. 特征递归消除(RFE)是以置换特征重要性(PFI)[31]为特征重要性的判别手段,通过反复训练模型并剔除最不重要的特征,直至达到设定的特征数量或某个停止准则. 设定保留的特征数量为7,每一轮特征递归消除的特征分别为$h$${f_{\mathrm{y}}}$${d_{\mathrm{v}}}$$s$${f_{{\mathrm{yv}}}}$${\eta _{\mathrm{l}}}$$b$${A_{{\mathrm{sv}}}}$,模型的评估指标采用对预测误差敏感性更高的均方根误差(RMSE).

模型优化过程的本质是在提高模型泛化能力的同时保证预测性能,使得训练集曲线与测试集曲线间的差值最小. 如图4所示为不同核函数的特征数量与预测精度间的关系. 其中,N为特征个数. 从图4可知,3种核函数下,模型测试集的RMSE随着特征数量的增多先降低后提高,当特征数量为10 (${f_{\mathrm{c}}}$${h_0}$$\lambda $${\eta _{\mathrm{w}}}$${\rho _{\mathrm{l}}}$${\rho _{\mathrm{v}}}$${A_{{\mathrm{sv}}}}$$b$${\eta _{\mathrm{l}}}$${f_{{\mathrm{yv}}}}$)时,RBF核GPR模型拥有最佳的泛化性能. 上述结果表明,当特征维度较大时模型存在过拟合的风险,存在冗余特征;当特征维度较小时无法捕捉输入输出间的映射关系,降低模型的预测精度与泛化能力.

图 4

图 4   特征数量与预测精度的关系

Fig.4   Relationship between number of feature and prediction accuracy


3. 模型验证与讨论

3.1. GPR模型的有效性验证

基于RFE与TEP-L-BFGS优化算法,建立锈蚀RC梁抗剪承载力预测GPR模型. 在该模型中,最优核函数为RBF,噪声方差为182.15,长度尺度为5.03,方差为42 757.8. 如图5所示为文献[32]的A3试件预测结果. 其中,P为预测概率密度,Vp为预测值. 该样本的预测均值为110.9 kN,试验值为119.8 kN,95%置信预测区间的上、下限分别为144.2和77.62 kN.

图 5

图 5   A3试件抗剪承载力的预测概率密度

Fig.5   Predicted probability density of shear capacity of A3 specimen


图6(a)所示为133组训练集与57组测试集的预测均值与试验值的对比分析结果. 其中,N为梁编号,Vt为试验值. 在133组训练样本中,仅3个样本在95%置信区间外,26个样本位于50%~95%置信区间内,104个样本位于50%置信区间内. 在57组测试集样本中,仅有1个样本在95%置信区间外,17个样本位于50%~95%置信区间内,39个样本位于50%置信区间内. 如图6(b)所示为22组独立验证集的预测效果. A1~A3样本在50%置信区间外且置信区间较大,这是由于文献[24]中A1~A5样本的配筋率(3.6%)在训练参数范围外,而训练参数范围内的其他样本预测较好.

图 6

图 6   GPR模型的预测结果及置信区间

Fig.6   Prediction result and confidence interval of GPR model


上述分析表明,所建立的GPR模型可以较好地描述训练参数范围内的样本,对于训练参数范围外的样本预测较保守,置信区间较大. 数据驱动模型的性能上限取决于数据本身,未来可以通过扩充数据库,增加偏态、长尾、多峰等特征的区分度,提升预测效果.

3.2. 敏感性分析

为了探究${\eta _{\mathrm{l}}}$${\eta _{\mathrm{w}}}$$\lambda $在GPR中的作用和影响,通过特征扰动即保持其他特征不变,仅改变关注特征的范围,观察该特征对输出变化的影响. 为了反映数据的常规波动,将观察特征的变化范围设定为2倍标准(横坐标为Yeo-Johnson变换标准化后的映射值,分析时括号内的值为实际值). 如图7(a)所示为${\eta _{\mathrm{l}}}$为0~6%的情况. 当${\eta _{\mathrm{l}}}$小于均值0(3.9%)时,Vp随着锈蚀率的增加而增加,其置信区间随着锈蚀率的增加而减小. 这是由于样本中存在仅箍筋锈蚀梁、箍筋和纵筋均锈蚀梁、仅纵筋锈蚀梁3种,当纵筋锈蚀率较小时,95%置信区间范围较大. 当${\eta _{\mathrm{l}}}$= 0.5~1.0(5%)时,95%置信区间的范围逐渐缩小,之后则随着锈蚀率的增加而降低,区间缩小的趋势放缓. 如图7(b)所示为${\eta _{\mathrm{w}}}$= 0~45%的情况(均值为21.9%),当${\eta _{\mathrm{w}}}$< −1.25(8%)时Vp随着锈蚀率的增加而增加,当${\eta _{\mathrm{w}}}$> −1.25时出现反弯点且降低趋势随着锈蚀率的增加而增加. 如图7(c)所示为$\lambda $= 1.0~4.7的情况(均值为2.3). 可以发现,Vp随着$\lambda $的增加而减小,当$\lambda $> 0.5(3)时,这一趋势减缓. 上述现象与文献[5, 33, 34]的描述较一致,表明利用GPR模型,可以较好地捕捉特征与预测结果间的映射关系.

图 7

图 7   特征敏感性的分析

Fig.7   Analysis of feature sensitivity


3.3. 不同预测方法的对比分析

为了验证所建GPR模型的预测性能,对徐善华等[2-3,7]建立的经验模型进行比较,如表3所示.

表 3   RC梁抗剪承载力计算的经验模型

Tab.3  Empirical model for calculating shear capacity of RC beam

模型模型公式
文献[2]模型${V_{\mathrm{p}}} = \xi (\lambda ,{\eta _{\mathrm{w}}})\dfrac{{0.08+4{\rho _{\mathrm{l}}}}}{{\lambda - 0.3}}{f_{\mathrm{c}}}b{h_0}+\alpha ({\eta _{\mathrm{w}}})\dfrac{{0.25+0.4\lambda }}{s}{A_{{\mathrm{vc}}}}{f_{{\mathrm{yv}}}}{h_0}.$ $\alpha ({\eta _{\mathrm{w}}}) = 1 - 0.077{\eta _{\mathrm{w}}},\;{A_{{\mathrm{vc}}}} = {A_{\mathrm{v}}}(1 - {\eta _{\mathrm{w}}}).$
$ \xi (\lambda ,{\eta _{\mathrm{w}}}) = \left\{ \begin{gathered} {\text{ }}1,\qquad\qquad\qquad\;\;{\eta _{\mathrm{w}}} \leqslant {\eta _{{\mathrm{cr}}}} ; \\ {({\eta _{\mathrm{w}}}/{\eta _{{\mathrm{cr}}}})^{0.069\lambda - 0.43}},{\eta _{\mathrm{w}}} > {\eta _{{\mathrm{cr}}}} . \\ \end{gathered} \right.\;\;{\eta _{{\mathrm{cr}}}} = 10.4(c/{d_{\mathrm{v}}}^2)+{f_{{\mathrm{cu}},{\mathrm{k}}}}/{d_{\mathrm{v}}}. $
文献[7]模型${V_{\mathrm{p}}} = 1.75\dfrac{{{f_{\mathrm{t}}}{b_{\mathrm{c}}}{h_0}_{\mathrm{c}}}}{{\lambda +1}}+\dfrac{{{f_{{\mathrm{yvc}}}}{A_{{\mathrm{vc}}}}{h_0}}}{s}.$${f_{{\mathrm{yvc}}}} = {f_{{\mathrm{yv}}}}\dfrac{{1 - 1.121\;9{\eta _{\mathrm{w}}}}}{{1 - {\eta _{\mathrm{w}}}}} \geqslant 0.$
文献[3]模型${V_{\mathrm{p}}} = \psi {f_{\mathrm{c}}}b{h_0}\left[\dfrac{{0.08}}{{\lambda - 0.3}}+\dfrac{{100{\rho _{\mathrm{l}}}}}{{\lambda {f_{\mathrm{c}}}}}\right]+\alpha \dfrac{{(0.4+0.3\lambda )}}{s}{A_{\mathrm{v}}}{f_{{\mathrm{yv}}}}{h_0}.$
$\psi = \left\{ \begin{gathered} {\text{ }}1,{\text{ }}{\eta _{\mathrm{l}}} \leqslant 5\text{%} ; \\ 1.098 - 1.96\eta_{\mathrm{l}},{\eta _{\mathrm{l}}} > 5\text{%} . \\ \end{gathered} \right.\;\;{\text{ }}\alpha = 1 - 1.059{\eta _{\mathrm{w}}} \geqslant 0.$

新窗口打开| 下载CSV


基于随机森林(RF)、极端梯度提升树(Xgboost)及多层感知器(MLP),建立锈蚀RC梁抗剪承载力的确定性预测模型.

表4所示为机理模型与数据驱动模型的预测指标. 为了表示GPR模型的适用性,将GPR模型的50%置信区间与95%置信区间放置在这些模型中,如图8所示. 结果表明,相较于机理模型,数据驱动模型具有显著优势,数据驱动模型均拥有较高的预测精度与稳定性. 在数据驱动模型中,GPR模型不仅具有最高的性能指标,而且可以输出预测值的概率区间,50%置信区间几乎包含了所有数据驱动模型的预测值,这表明GPR的置信区间具有代表性. 在3个经验模型中,文献[3]的模型考虑箍筋和纵筋各自锈蚀,在真实情况下箍筋先锈蚀,因此当样本纵筋锈蚀率较小时,该模型容易高估承载力. 文献[2,7]的模型仅考虑箍筋锈蚀,忽略了纵筋锈蚀的影响,这两位学者提出的方法预测结果偏于保守,更利于工程实际应用. 总体而言,GPR模型具有最强的预测性能,与经验模型与数据驱动确定性模型相比,具有较好的适用性,可以为锈蚀RC梁的概率安全性评估和概率极限状态评估提供依据.

表 4   不同模型的预测指标对比表

Tab.4  Comparison of predictive indicator of different model

模型训练集测试集
R2RMSEMAER2RMSEMAE
RF0.97814.1018.3110.91620.81312.765
Xgboost0.9947.3594.8330.94416.95211.859
MLP0.98611.6587.0730.94417.08011.451
GPR0.98710.9387.0040.94716.63211.462
文献[2]模型0.78047.46024.5400.57747.89735.182
文献[3]模型0.87434.70028.4200.84428.48223.882
文献[7]模型0.64266.12153.2100.43062.02352.141

新窗口打开| 下载CSV


图 8

图 8   不同模型的预测精度对比

Fig.8   Comparison of prediction accuracy of different model


4. 结 论

(1) 与机理模型及其他数据驱动模型相比,利用提出的方法,不仅可以输出准确的预测值,而且可以输出预测值的概率区间,具有较强的适用性,可以为锈蚀RC梁的概率安全性评估和承载力概率极限状态评估提供依据.

(2) 基于Johnson-标准化对输入特征进行映射,有效提高了GPR模型的稳定性与预测精度,相较于原始特征,测试集的R2由0.916提升至0.936(提升了4.5%),RMSE由23.262降低至18.218(降低了21.7%),MAE由17.441降低至12.661(降低了27.4%).

(3) 基于特征相关性分析与特征递归消除,对特征映射后的输入特征进行降维. 结果表明,对于存在共线性的输入特征降维,可以有效提升GPR模型的泛化性能.

(4)对于其他类型的损伤(如裂缝、剥落)或其他荷载形式(如弯曲、拉伸)的因素考虑较少,未来将扩展到更多种类的结构损伤和荷载条件,以增强模型的适用性和普适性.

参考文献

叶见曙, 李国平. 结构设计原理[M]. 4版. 北京: 人民交通出版社, 2018: 95-97.

[本文引用: 1]

戴明江, 杨鸥, 肖岩

纵筋锈蚀对钢筋混凝土梁抗剪性能影响

[J]. 工业建筑, 2016, 46 (11): 74- 79

[本文引用: 1]

JUAREZ C A, GUEVARA B, FAJARDO G, et al

Ultimate and nominal shear strength in reinforced concrete beams deteriorated by corrosion

[J]. Engineering Structures, 2011, 33 (12): 3189- 3196

DOI:10.1016/j.engstruct.2011.08.014      [本文引用: 2]

徐善华, 牛荻涛

锈蚀钢筋混凝土简支梁斜截面抗剪性能研究

[J]. 建筑结构学报, 2004, 25 (5): 98- 104

DOI:10.3321/j.issn:1000-6869.2004.05.016      [本文引用: 5]

XU Shanhua, NIU Ditao

The shear behavior of corroded simply supported reinforced concrete beam

[J]. Journal of Building Structures, 2004, 25 (5): 98- 104

DOI:10.3321/j.issn:1000-6869.2004.05.016      [本文引用: 5]

霍艳华. 锈蚀钢筋混凝土简支梁受剪承载力研究[D]. 南昌: 南昌大学, 2007.

[本文引用: 7]

HUO Yanhua. Research on shear capacity of simply supported concrete beam with corroded reinforcement [D]. Nanchang: Nanchang University, 2007.

[本文引用: 7]

ALASKAR A. Shear behaviour of slender RC beams with corroded web reinforcement [D]. Waterloo: University of Waterloo, 2013.

[本文引用: 1]

赵羽习, 金伟良

锈蚀箍筋混凝土梁的抗剪承载力分析

[J]. 浙江大学学报: 工学版, 2008, 42 (1): 19- 24

[本文引用: 2]

ZHAO Yuxi, JIN Weiliang

Analysis on shearing capacity of concrete beams with corroded stirrups

[J]. Journal of Zhejiang University: Engineering Science, 2008, 42 (1): 19- 24

[本文引用: 2]

余波, 陈冰

锈蚀钢筋混凝土梁抗剪承载力计算的概率模型

[J]. 工程力学, 2018, 35 (11): 115- 124

DOI:10.6052/j.issn.1000-4750.2017.06.0479      [本文引用: 1]

YU Bo, CHEN Bing

Probabilistic model for shear strength of corroded reinforced concrete beams

[J]. Engineering Mechanics, 2018, 35 (11): 115- 124

DOI:10.6052/j.issn.1000-4750.2017.06.0479      [本文引用: 1]

李士彬, 张鑫, 贾留东, 等

箍筋锈蚀钢筋混凝土梁的抗剪承载力分析

[J]. 工程力学, 2011, 28 (Suppl.1): 60- 63

[本文引用: 6]

LI Shibin, ZHANG Xin, JIA Liudong, et al

Analysis for shear capacity of reinforced concrete beams with corrosion stirrups

[J]. Engineering Mechanics, 2011, 28 (Suppl.1): 60- 63

[本文引用: 6]

FENG D C, LIU Z T, WANG X D, et al

Failure mode classification and bearing capacity prediction for reinforced concrete columns based on ensemble machine learning algorithm

[J]. Advanced Engineering Informatics, 2020, 45: 101126

DOI:10.1016/j.aei.2020.101126      [本文引用: 1]

张玉平, 马超, 李传习, 等

基于改进BP算法的混凝土热学参数反演与预测

[J]. 交通科学与工程, 2021, 37 (1): 42- 50

DOI:10.3969/j.issn.1674-599X.2021.01.007     

ZHANG Yuping, MA Chao, LI Chuanxi, et al

Back analysis and prediction of thermal parameters of concrete based on improved BP algorithm

[J]. Journal of Transport Science and Engineering, 2021, 37 (1): 42- 50

DOI:10.3969/j.issn.1674-599X.2021.01.007     

KUMAR A, ARORA H C, KAPOOR N R, et al

Machine learning intelligence to assess the shear capacity of corroded reinforced concrete beams

[J]. Scientific Reports, 2023, 13 (1): 2857

DOI:10.1038/s41598-023-30037-9     

FU B, FENG D C

A machine learning-based time-dependent shear strength model for corroded reinforced concrete beams

[J]. Journal of Building Engineering, 2021, 36: 102118

DOI:10.1016/j.jobe.2020.102118      [本文引用: 1]

NGUYEN T H, NGUYEN D T, NGUYEN D H, et al

Evaluation of residual strength of corroded reinforced concrete beams using machine learning models

[J]. Arabian Journal for Science and Engineering, 2022, 47 (8): 9985- 10002

DOI:10.1007/s13369-021-06493-8     

戴理朝, 王冲, 袁平, 等

基于可解释机器学习的锈蚀RC构件抗剪承载力预测模型

[J]. 吉林大学学报: 工学版, 2024, 54 (11): 3231- 3243

[本文引用: 1]

DAI Lizhao, WANG Chong, YUAN Ping, et al

Prediction model for shear capacity of corroded RC beams based on interpretable machine learning

[J]. Journal of Jilin University: Engineering and Technology Edition, 2024, 54 (11): 3231- 3243

[本文引用: 1]

于晓辉, 王猛, 宁超列

基于机器学习的钢筋混凝土柱失效模式两阶段判别方法

[J]. 建筑结构学报, 2022, 43 (8): 220- 231

[本文引用: 1]

YU Xiaohui, WANG Meng, NING Chaolie

A machine-leaning-based two-step method for failure mode classification of reinforced concrete columns

[J]. Journal of Building Structures, 2022, 43 (8): 220- 231

[本文引用: 1]

GUAN X, SUN H, HOU R, et al

A deep reinforcement learning method for structural dominant failure modes searching based on self-play strategy

[J]. Reliability Engineering and System Safety, 2023, 233: 109093

DOI:10.1016/j.ress.2023.109093      [本文引用: 1]

LIU J, ALEXANDER J, GU Q, et al

Gaussian process regression-based load-carrying capacity models of corroded prestressed concrete bridge girders for fast-screening and reliability-based evaluation

[J]. Engineering Structures, 2023, 285: 116040

DOI:10.1016/j.engstruct.2023.116040      [本文引用: 1]

YU Z, XIE W, YU B, et al

Probabilistic prediction of joint shear strength using Gaussian process regression with anisotropic compound kernel

[J]. Engineering Structures, 2023, 277: 115413

DOI:10.1016/j.engstruct.2022.115413      [本文引用: 1]

SCHULZ E, SPEEKENBRINK M, KRAUSE A

A tutorial on Gaussian process regression: modelling, exploring, and exploiting functions

[J]. Journal of Mathematical Psychology, 2018, 85: 1- 16

DOI:10.1016/j.jmp.2018.03.001      [本文引用: 1]

HEAD J D, ZERNER M C

A Broyden-Fletcher-Goldfarb-Shanno optimization procedure for molecular geometries

[J]. Chemical Physics Letters, 1985, 122 (3): 264- 270

DOI:10.1016/0009-2614(85)80574-1      [本文引用: 1]

ZHU C, BYRD R H, LU P, et al

Algorithm 778: L-BFGS-B: Fortran subroutines for large-scale bound-constrained optimization

[J]. ACM Transactions on Mathematical Software, 1997, 23 (4): 550- 560

DOI:10.1145/279232.279236      [本文引用: 1]

BERGSTRA J, BARDENET R, BENGIO Y, et al. Algorithms for hyper-parameter optimization [C]//Proceedings of the 24th International Conference on Neural Information Processing Systems. Granada: Curran Associates Inc. 2011, 2546–2554.

[本文引用: 1]

李冰, 高向华, 王小惠, 等

局部区段锈蚀的钢筋混凝土梁抗剪承载力试验研究

[J]. 混凝土与水泥制品, 2010, (6): 60- 65

DOI:10.3969/j.issn.1000-4637.2010.06.016      [本文引用: 1]

LI Bing, GAO Xianghua, WANG Xiaohui, et al

Experimental study on shear capacity of reinforced concrete beam with partial section corrosion

[J]. China Concrete and Cement Products, 2010, (6): 60- 65

DOI:10.3969/j.issn.1000-4637.2010.06.016      [本文引用: 1]

杨晓明, 吴桐, 王耀耀

小剪跨比锈蚀钢筋混凝土梁受剪性能试验研究

[J]. 建筑结构学报, 2019, 40 (12): 147- 154

[本文引用: 1]

YANG Xiaoming, WU Tong, WANG Yaoyao

Experimental study on shear behavior of corroded reinforced concrete beams with low shear span ratio

[J]. Journal of Building Structures, 2019, 40 (12): 147- 154

[本文引用: 1]

陈正. 钢筋锈蚀后RC梁抗剪性能的试验研究与分析[D]. 扬州: 扬州大学, 2022.

[本文引用: 2]

CHEN Zheng. Experimental study and analysis of shear strength of RC beams due to reinforcement corrosion [D]. Yangzhou: Yangzhou University, 2022.

[本文引用: 2]

FU C, HUANG J, DONG Z, et al

Shear behavior of reinforced concrete beams subjected to accelerated non-uniform corrosion

[J]. Engineering Structures, 2023, 286: 116081

DOI:10.1016/j.engstruct.2023.116081      [本文引用: 1]

中华人民共和国住房和城乡建设部. 混凝土结构设计规范: GB50010-2010 [S]. 北京: 中国建筑工业出版社, 2015.

[本文引用: 2]

国振喜. 简明钢筋混凝土结构计算手册[M]. 3版. 北京: 机械工业出版社, 2017: 41-58.

[本文引用: 1]

HE Y, ZHENG Y

Short-term power load probability density forecasting based on Yeo-Johnson transformation quantile regression and Gaussian kernel function

[J]. Energy, 2018, 154: 143- 156

DOI:10.1016/j.energy.2018.04.072      [本文引用: 1]

HAUKE J, KOSSOWSKI T

Comparison of values of Pearson's and Spearman's correlation coefficients on the same sets of data

[J]. Quaestiones Geographicae, 2011, 30 (2): 87- 93

DOI:10.2478/v10117-011-0021-1      [本文引用: 1]

赵丽, 胡翮. 统计学基础[M]. 南京: 南京大学出版社, 2017: 213-216.

[本文引用: 1]

CHEN X, JEONG J C. Enhanced recursive feature elimination [C]//Proceedings of the 6th International Conference on Machine Learning and Applications. Cincinnati: IEEE, 2007: 429−435.

[本文引用: 1]

柳世涛. 受腐蚀钢筋混凝土梁抗剪性能研究[D]. 长沙: 中南大学, 2013.

[本文引用: 1]

LIU Shitao. Research on shear behavior of corroded RC beams [D]. Changsha: Central South University, 2013.

[本文引用: 1]

DAI Mingjiang, YANG Ou, XIAO Yan

Influence of longitudinal bar corrosion on shear behavior of RC beams

[J]. Industrial Construction, 2016, 46 (11): 74- 79

[本文引用: 1]

/