浙江大学学报(工学版), 2025, 59(12): 2576-2584 doi: 10.3785/j.issn.1008-973X.2025.12.012

交通工程、土木工程

空间异质性下共享单车出行量的非线性影响

路庆昌,, 袁康洁

长安大学 电子与控制工程学院,陕西 西安 710064

Nonlinear effects of bike-sharing demands considering spatial heterogeneity

LU Qingchang,, YUAN Kangjie

School of Electronics and Control Engineering, Chang’an University, Xi’an 710064, China

收稿日期: 2024-12-27  

基金资助: 国家自然科学基金资助项目(72471035).

Received: 2024-12-27  

Fund supported: 国家自然科学基金资助项目(72471035).

作者简介 About authors

路庆昌(1984—),男,教授,博士,从事智能交通系统分析、交通行为与环境研究.orcid.org/0000-0001-9616-2271.E-mail:qclu@chd.edu.cn , E-mail:qclu@chd.edu.cn

摘要

为了探究空间异质性对建成环境与共享单车出行量之间非线性关系的影响,构建考虑空间异质性的GW-XGBoost模型,采用SHAP模型解释建成环境因素的作用程度和空间差异. 相较于地理加权回归和极端梯度提升树模型,模型GW-XGBoost通过引入地理空间加权和自适应带宽显著提升了模型解释力和预测力,整体拟合优度平均提高15.59%,同时能够揭示建成环境对单车出行量非线性影响的强度方向和局部差异. 结果显示,建成环境因素对单车出行量呈现非线性影响. 在人口密度增加到20 000 人/km2后,影响由负转正;离CBD的距离位于15~20 km时,由中心向外围影响效应由正转负随后趋于平稳;在容积率增加到1.8后,影响效应由负转正. 研究结果为城市共享单车系统的资源优化提供科学依据和方法支撑.

关键词: 共享单车 ; 建成环境 ; 机器学习 ; 空间异质性 ; 非线性影响

Abstract

A GW-XGBoost model considering spatial heterogeneity was constructed, and the SHAP model was used to explain the extent and spatial differences in the role of built environment factors, in order to explore the influence of spatial heterogeneity on the nonlinear relationship between the built environment and bike-sharing trips. Compared with the geographically weighted regression and extreme gradient boosting tree models, the GW-XGBoost model significantly improved the explanatory and predictive power of the model by introducing geospatial weighting and adaptive bandwidth, with the overall goodness-of-fit increased by 15.59% on average, and it could reveal the intensity, direction and local differences of the built environment on the nonlinear impact of bike-sharing trips. The results showed that the built environment factors had a nonlinear impact on bike-sharing trips. When the population density reached 20000 persons per km2, the impact turned from negative to positive. When the distance from CBD factor was between 15 and 20 km, its effect shifted from positive to negative, and then became stabilized when moving outward from the city center. When the floor area ratio reached 1.8, the impact effect turned from negative to positive. The research results provide a scientific basis and methodological support for the resource optimization of the urban bike-sharing system.

Keywords: bike-sharing ; built environment ; machine learning ; spatial heterogeneity ; nonlinear effect

PDF (1820KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

路庆昌, 袁康洁. 空间异质性下共享单车出行量的非线性影响. 浙江大学学报(工学版)[J], 2025, 59(12): 2576-2584 doi:10.3785/j.issn.1008-973X.2025.12.012

LU Qingchang, YUAN Kangjie. Nonlinear effects of bike-sharing demands considering spatial heterogeneity. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(12): 2576-2584 doi:10.3785/j.issn.1008-973X.2025.12.012

在我国持续倡导绿色低碳发展的背景下,共享单车市场得到不断发展. 共享单车不仅是新型绿色环保共享经济的重要体现,也能够为投资者带来可观的收益,促进经济发展. 共享单车的成功运营和发展并非仅仅依赖于其绿色环保的特性,建成环境的布局和道路条件都直接影响共享单车系统的运营效率[1-2]. 因此,深入研究建成环境与共享单车出行量之间的关系,不仅能够有效促进绿色低碳出行,推动共享单车行业的可持续发展,也有助于单车企业优化运营策略实现投资收益的最大化.

目前,关于建成环境与共享单车使用关系的研究,学者们多采用传统最小二乘回归[3]、多元线性回归[4]方法. 考虑到空间异质性,有学者利用地理加权模型揭示建成环境对单车使用需求的影响. 例如,Wu等[5]使用地理加权回归模型(geographically weighted regression, GWR)检验建成环境对单车使用需求的局部影响,发现人口密度和公共交通可达性对市中心周边地区的单车出行量有正向影响,而在市中心的影响较弱. Sun等[6]采用多尺度地理加权回归模型同样证明了建成环境对共享单车使用量的空间异质性影响. 徐标等[7]构建以骑行距离为约束的多尺度时空地理加权回归模型,研究建成环境对单车停车需求的时空异质性,并发现内环中心区位条件的负向影响呈现较显著的局部异质性.

上述研究表明建成环境对共享单车的使用需求具有明显的空间异质性影响,然而,多数研究仅针对选定的因素和变量开展建模和结果讨论,较明显地受限于模型假设,结果具有一定的局限性. 这主要是因为统计学或空间回归模型预先假定了变量和因子之间的线性关系[8],难以反映建成环境与单车使用之间潜在的更复杂的非线性关系[9-10]. 机器学习技术不预先定义变量之间的关系,可以灵活处理变量之间复杂的非线性关联[11]. 近年来,机器学习方法已被广泛用于分析共享单车出行的影响因素相关研究. 例如,Lv等[12]采用轻量级梯度提升模型探讨影响共享单车竞争力的因素,发现自行车道长度超过一定阈值对单车需求有促进作用,交叉口数量超过一定阈值对单车需求具有抑制作用. Wang等[13]使用随机森林模型探究影响因素对单车骑行量的非线性影响,发现政府机构数量和公交车站距离对单车使用表现出显著的非线性影响,而自行车道长度对骑行量的影响不显著. Zhou等[14]构建梯度提升模型分析多尺度城市建成环境特征对单车使用的影响,发现湿度、人口密度和自行车道密度与单车使用量呈U形的非线性关系. Zhu等[15]精准识别共享单车在综合公共交通系统中的通勤需求,基于极端梯度提升模型(extreme gradient boosting, XGBoost)分析其关键驱动因素,发现骑行缓冲区内自行车密度和地铁客流量两参数超出一定阈值会对单车需求产生促进作用. 上述研究采用不同的机器学习模型揭示了多维因素对共享单车出行需求的非线性影响,但传统的机器学习方法通常假设变量影响在空间上是均匀的,难以反映建成环境的空间异质性影响. 这会影响不同区域的模型解释力,且无法反映不同地理空间的影响机制.

综上所述,传统回归模型受限于线性假设难以捕捉复杂的非线性关系,而现有机器学习方法又无法有效刻画变量影响的空间异质性. 本研究通过引入地理加权改进现有的机器学习模型,采用局部建模刻画建成环境对共享单车出行量的空间异质性影响,构建GW-XGBoost模型解决机器学习建模中忽略的空间异质性问题,进而有效解析空间异质性下建成环境对共享单车出行量的非线性影响.

1. 研究区域及数据描述

1.1. 研究区域概况

深圳位于中国南部海滨,地处广东省南部,是中国经济中心城市,也是中国大陆经济发展最好的城市之一. 深圳市是中国活跃的共享单车市场之一,其共享单车行业得到了快速发展. 根据交通管理部门数据统计,截止至2021年5月底,深圳市互联网租赁自行车运营车辆共37.72万辆,每车日均使用次数为3.71次[16]. 研究所用数据为2021年1月1日—4月15日包含工作日和周末全天0∶00—24∶00共15周的3 825万条共享单车骑行数据. 根据共享单车原始订单数据,对数据进行清洗,筛除掉异常数据,包括查询并删除空值和重复值,并依据计算得到的骑行时长移除小于1 min和大于90 min的数据以及移除掉骑行距离OD小于100 m与大于10000 m的异常数据. 对数据预处理之后,有效订单数据超过3 600万条,数据字段信息包含骑行开始和结束时间、骑行起始点和终点经纬度、单车编号.

为了保证数据具有代表性,选择共享单车集聚分布的区域作为主要研究范围,涵盖罗湖区、福田区、南山区、宝安区、龙岗区、盐田区和光明区7个主要行政区,面积约为1 535.78 km2. 交通分析小区 (traffic analysis zone, TAZ) 是分析具有相似人口统计和出行特征的一种典型尺度划分方法[17]. 与规则网格划分方法相比,TAZ划分考虑到实际的城市功能区分布和道路网络,能够有效地适应区域间的差异,反映更真实的交通需求,在共享单车及其他相关交通研究中已有广泛应用[18-20]. 本研究根据Yao等[21]的研究考虑地块发展实际格局,沿着主要道路或边界进行有序分裂,将研究区域共划分为741个交通小区作为基本研究单元. 根据数据清洗之后的共享单车订单数据和TAZ数据进行空间匹配,对每个TAZ内的共享单车出行起点进行集计,得到各个区域内的共享单车出行量. 如图1所示展示了研究区域内共享单车出行量y的空间分布情况.

图 1

图 1   研究区域及共享单车出行量分布图

Fig.1   Study area and distribution of bike-sharing trips


1.2. 变量描述性统计及检验

基于现有共享单车出行与建成环境关系的研究[22-24],根据Ewing等[25]提出的“5Ds”理论框架,选取反映建成环境特征的变量. “5Ds”维度包括密度、多样性、道路设计、区位条件以及公共交通可达性. 交通网络数据来自Openstreetmap提供的路网数据,人口数据来源于第7次全国人口普查,兴趣点POI数据获取自高德地图. 由于各TAZ单元面积存在差异,直接比较不同区域的共享单车出行量可能产生偏差. 为了保证不同空间单元结果的可比性,将各TAZ的共享单车出行量标准化为每平方千米的出行量作为研究的因变量. 各变量的描述性统计和检验结果如表1所示. 其中,容积率为$ \sum\nolimits_{q = 1}^Q {{S_q}{L_q}/S} $$Q$为区域内建筑物数量,$ {S_q} $$ {L_q} $分别为区域内第$q$个建筑物的占地面积和楼层数目,$S$为该区域地块面积;土地利用混合度为$ - \sum\nolimits_{k = 1}^K {A_k}/ \left(A\ln \;({A_k}/A)\right) $$ {A_k} $为第$k$种用地类型的面积,$A$为所有用地类型的面积,$K$为用地类型总数. 为了检验数据的有效性,对变量进行共线性检验和莫兰指数(Moran’s I)检验. 其中,共线性检验利用方差膨胀因子(VIF)衡量,表达式如下:

表 1   变量描述性统计及检验结果

Tab.1  Descriptive statistics and test results of variables

变量类别变量名平均值标准差最小值最大值VIFMoran’s Iz得分
1)注:*表示p值小于0.05,**表示p值小于0.01.
共享单车出行量/万4.7560.815043.997/0.785**1)31.9116
密度容积率0.9850.90004.6768.5170.589*24.273
人口密度/(人·km−211 704.79810 131.176042 209.8425.4610.687**28.609
多样性土地利用混合度0.7510.52702.0241.7290.408*16.852
餐饮类POI密度/(个·km−2175.322244.34801 595.0844.8220.409*16.498
工作类POI密度/(个·km−2188.802321.09305 991.5261.9010.378*16.442
住宅类POI密度/(个·km−238.12045.0660298.1716.7990.528**21.363
休闲类POI密度/(个·km−224.14933.1090229.6353.8730.518*21.278
道路设计支路密度/(km·km−23.7513.074022.7941.5250.313*13.042
自行车道密度/(km·km−20.5531.289012.1151.0390.366*15.456
区位条件到CBD的距离/km20.3079.5460.60039.7121.4530.991**40.149
公共交通可达性公交站点密度/(个·km−24.3723.994024.1473.4160.424*18.036
地铁站点密度/(个·km−20.2030.46802.9931.7410.334*14.376

新窗口打开| 下载CSV


$ {{\mathrm{VIF}}_k} = {1}/{{\left( {1 - {R_k}^2} \right)}}. $

式中:${R_k}$表示第$k$个自变量${x_k}$与其余自变量之间的判定系数,即自变量${x_k}$与其他自变量的回归系数的平方和${R_k}^2$的算术平方根. 通常VIF>10表明因素之间存在多重共线. 莫兰指数的表达式如下:

$ I = \dfrac{n}{{\displaystyle \sum\limits_{i = 1}^n {\displaystyle \sum\limits_{j = 1}^n {{w_{ij}}} } }} \cdot \dfrac{{\displaystyle \sum\limits_{i = 1}^n {\displaystyle \sum\limits_{j = 1}^n {{w_{ij}}} } \left( {{s_i} - \bar s } \right)\left( {{s_j} - \bar s } \right)}}{{\displaystyle \sum\limits_{i = 1}^n {\left( {{s_i} - \bar s } \right)} }}. $

式中:$I$表示莫兰指数,取值范围为$\left[ { - 1.0,1.0} \right]$$n$为空间单元的数量;$ {w_{ij}} $表示空间单元$i$$j$之间的空间权重;$ {s_i} $$ {s_j} $分别表示第$i$个空间单元和第$j$个空间单元待分析的空间要素属性值;$ \bar s $为所有空间要素属性值的均值. 若莫兰指数的值接近0,说明变量之间不存在显著的空间关系. 从表1可以看出,建成环境变量的VIF<10,均通过了共线性检验. 此外,Moran’s I的值均大于0,z得分均大于1.96且p值小于0.05,表明在95%的置信水平下,共享单车出行量及建成环境因素存在显著的空间自相关性,且变量呈现较显著的空间正相关关系.

2. 研究方法

2.1. XGBoost模型

在定义GW-XGBoost模型之前,引入XGBoost模型[26]的理论方法,有助于进一步讨论GW-XGBoost模型的构建. XGBoost基于梯度提升树,通过构建多个决策树拟合数据,在前向迭代过程中会训练多棵树,样本在模型中的最终预测值是每棵树对样本的预测结果之和,函数定义如下:

$ \hat y_i^{\left( n \right)} =\displaystyle \sum\limits_{k = 1}^n {{f_k}\left( {{x_i}} \right)} = \hat y_i^{\left( {n - 1} \right)}+{f_n}\left( {{x_i}} \right). $

式中:$ \hat y_i^{\left( n \right)} $为第$n$次迭代后第$i$个区域内单车出行量的预测值,$ \hat y_i^{\left( {n - 1} \right)} $为第$n - 1$次迭代后第$i$个区域内单车出行量的预测值,$ {f_n}\left( {{x_i}} \right) $为第$n$棵树的模型预测值,$ {x_i} $为第$i$个区域内的建成环境变量.

该模型的训练核心是通过优化目标函数进而最小化模型误差,目标函数通常由损失函数和正则化项构成,表达式如下:

$ L = \displaystyle \sum\limits_{i = 1}^m {\ell \left( {{y_i},{{\hat y}_i}} \right)} +\displaystyle \sum\limits_{k = 1}^n {\varOmega \left( {{f_k}} \right)} . $

式中:$m$为研究区域的TAZ数量;$\ell \left( {{y_i},{{\hat y}_i}} \right)$为损失函数,度量真实值${y_i}$与模型预测值${\hat y_i}$之间的差距;$ \varOmega \left( {{f_k}} \right) $衡量模型中第$k$棵树的复杂度,为用于防止模型过度拟合的正则化项, $ \varOmega \left( {{f_k}} \right) = \mu {T_k}+0.5\gamma $$ {\left\| {{w_k}} \right\|^2} $. 其中,$ {T_k} $为第$k$棵树的叶子节点数量;$ {\left\| {{w_k}} \right\|^2} $为第$k$棵树叶子节点权重向量的L2范数;$ \mu $$ \gamma $为权重系数,分别控制每棵树的叶子节点数量和每个叶子节点的权重,使模型具有较好的泛化能力.

每轮迭代XGBoost通过添加新的函数$f$来修正当前模型的误差,对每个样本计算损失函数关于模型输出的梯度和海森矩阵,分别刻画损失函数的变化方向与幅度. 第$k$轮迭代的目标函数具体表达式如下:

$ {L^k} = \displaystyle \sum\limits_{i = 1}^m {\left[ {\ell \left( {{y_i},{{\hat y}_i}^{\left( {k - 1} \right)}} \right)+{g_i}{f_k}\left( {{x_i}} \right)+\dfrac{1}{2}{h_i}{f_k}^2\left( {{x_i}} \right)} \right]} +\varOmega \left( {{f_k}} \right). $

式中:$ {g_i} $为损失函数的一阶导数,$ {g_i} = \partial \ell \left( {{y_i},{{\hat y}_i}^{\left( {k - 1} \right)}} \right)/ \partial {\hat y_i}^{\left( {k - 1} \right)} $$ {h_i} $为损失函数的二阶导数,$ {h_i} = {\partial ^2}\ell \left( {{y_i},{{\hat y}_i}^{\left( {k - 1} \right)}} \right)/ \partial {\left[ {{{\hat y}_i}^{\left( {k - 1} \right)}} \right]^2} $. 迭代过程反复进行,直到模型精度和迭代次数满足设定值则完成训练,输出结果.

2.2. GW-XGBoost模型

XGBoost模型被广泛应用于非线性的相关研究,该算法假设所有数据点的特征对目标变量的影响是相同的,因而无法揭示空间异质性问题. 因此,本研究对传统XGBoost模型进行改进,充分考虑变量在地理空间上的差异,引入空间加权解决地理空间中的异质性问题,基于TAZ层面构建GW-XGBoost模型. 改进模型的具体实现步骤如下.

1) 明确空间权重矩阵$ {\boldsymbol{W}} $$ = [ {w_{ij}}|i,j = 1,2, \cdots , m,i \ne j ]$. 其中,${w_{ij}}$表示第$i$个TAZ与第$j$个TAZ之间距离的权重. 双平方加权核函数因其有界性更适合体现出空间异质效应,本研究利用自适应核函数来确定带宽,以及双平方加权核函数构造空间权重矩阵${\boldsymbol{W}}$来校准局部XGBoost模型,${w_{ij}}$的表达式如下:

$ {w_{ij}} = \left\{ {\begin{array}{*{20}{c}} {{{\left[ {1 - {{\left( {{{{d_{ij}}}}/{B}} \right)}^2}} \right]}^2}},&{{d_{ij}} \leqslant B;} \\ 0,&{{d_{ij}} > B.} \end{array}} \right. $

式中:$ {d_{ij}} $表示交通小区$i$$j$质心之间的距离;$B$为自适应带宽参数,表示权重作用的距离,只有距离小于带宽$B$的区域才会被赋予权重且权重随着距离的增加而快速下降. 这会使模型集中于空间距离较近的数据区域而避免较远数据点的影响.

2) 构建并训练局部模型GW-XGBoost. 基于每个TAZ及其相邻的加权特征训练模型,相邻的TAZ区域即$ {w_{ij}} \ne 0 $的区域. GW-XGBoost模型的预测函数表达式如下:

$ {\hat Y_i} = \sum\limits_{i = 1}^n {{f_{\left( {{u_i},{v_i}} \right)}}\left( {x_i^{\mathrm{w}}} \right)} . $

式中:$ {\hat Y_i} $表示GW-XGBoost模型对第$i$个TAZ区域的预测结果;${u_i}$${v_i}$分别表示区域$i$形心的经纬度坐标;$ x_i^{\mathrm{w}} $表示第$i$个TAZ加权后的建成环境自变量. 模型训练目标同XGBoost模型,GW-XGBoost的训练目标如下:

$ {L_{{\mathrm{GWX}}}} = \displaystyle \sum\limits_{i = 1}^m {\ell \left( {{Y_i},{{\hat Y}_i}} \right)} +\displaystyle \sum\limits_{k = 1}^n {\varOmega \left( {f_k^{\mathrm{w}}} \right)} . $

式中:$ {L_{{\mathrm{GWX}}}} $表示GW-XGBoost模型的真实值$ {Y_i} $与预测值$ {\hat Y_i} $之间的差异;$ f_k^{\mathrm{w}} $表示加权后的第$k$棵树的模型结果;其余符号的含义及后续模型训练步骤同XGBoost模型.

3) 鉴于SHAP(shapley additive explanati-ons)能够量化每个样本及样本间交互对预测结果的影响,并揭示影响的正负方向[27],本研究采用SHAP模型解释GW-XGBoost模型训练得到的各建成环境变量的相对重要性及其非线性作用关系和阈值效应. 为了衡量各变量的相对贡献度,引入无量纲的相对重要性(relative importance, RI)[28]. 本研究以每个自变量的SHAP与所有变量SHAP绝对值总和的比率计算建成环境变量的相对重要性,表达式如下:

$ \left.\begin{split} &{\mathrm{R I}}_i={\left|\psi_i\right|}\bigg/{\displaystyle {\sum}_{i=1}^N\left|\psi_i\right|} ,\\&\psi = \displaystyle \sum_{S \subseteq N} \dfrac{|S|!(|N| - |S| - 1)!}{|N|!} \cdot[f(S \cup\{i\}) - f(S)] .\end{split}\right\} $

式中:$ {{\mathrm{RI}}_i} $表示第$i$个特征的相对重要性;$ {\psi _i} $表示特征$i$的SHAP;$N$为所有特征的集合;$S$为从$N$中抽取出来的子集,其维度表示为$ \left| S \right| $$ f\left( {S \cup \left\{ i \right\}} \right) $$ f\left( S \right) $分别表示具有和不具有特征$i$的模型结果.

3. 模型结果及分析

3.1. 模型性能

采用GWR和XGBoost作为基准模型,与改进的GW-XGBoost模型进行比较. 应用网格搜索法确定模型的最优参数,以及十折交叉验证评估模型的性能,采用决定系数R2、均方误差MSE以及平均绝对误差MAE作为评估模型的性能指标. 最终设定机器学习模型的最佳生成树的数量为600,树的最大深度为3,学习率为0.01,行采样比例为0.8,列采样比例为0.9. 模型性能如表2所示. 其中,$ {R^2} = 1 - {\sum\nolimits_{i = 1}^n {\left( {{y_i} - {{\hat y_i}}} \right)} ^2}/{\sum\nolimits_{i = 1}^n {\left( {{y_i} - {{\bar y_i}} } \right)} ^2} $,均方误差$ {\mathrm{MSE}} = \left( {1/n} \right){\sum\nolimits_{i = 1}^n {\left( {{y_i} - {{\hat y_i}}} \right)} ^2} $,平均绝对误差${\mathrm{MAE}} = \left( {1/n} \right) \times \sum\nolimits_{i = 1}^n {\left| {{y_i} - {{\hat y_i}}} \right|} $$n$表示样本数,${y_i}$为真实值,${\hat y_i}$表示模型的预测值,$ \bar {{y_i}} $表示真实值的平均值. 如表2所示,非线性模型XGBoost的拟合优度较线性模型GWR的拟合优度有所提升,且MSE和MAE均有所下降. GW-XGBoost模型在不同区域的模型性能不同,R2的范围为0.611~0.786,平均值为0.722,较基准模型的R2有明显提高.

表 2   模型性能比较

Tab.2  Model performance comparison

模型名称R2MSEMAE
GWR0.58227.1084.216
XGBoost0.6748.7582.230
GW-XGBoost最小值0.6116.9041.244
最大值0.7868.6492.579
平均值0.7227.6281.850

新窗口打开| 下载CSV


R2的局部空间分布图如图2所示,R2较高的区域集中分布在中南部,而东北部地区的R2相对较低. 这种空间分布特征反映了模型在不同区域对共享单车出行量的解释能力存在差异. 中南部涵盖福田、罗湖、南山区等核心城区,人口密度高且经济活动频繁,从图1可以看出这些区域整体共享单车出行量较大,模型能够更好地捕捉出行需求的空间分布特征,因而拟合效果更优. 相反,东北部区域包含部分山区和城乡结合部,从图1可以看出这些区域共享单车的出行量相对更低. 该区域的共享单车出行可能受基础设施供给和居民出行需求碎片化因素的影响,导致区域内的共享单车数据分布较为稀疏. 此外,由于部分区域距离核心城区较远,居民出行需求更具随机性和多样性,从而增加了模型拟合的难度.

图 2

图 2   GW-XGBoost模型R2的分布

Fig.2   Distribution of R2 in GW-XGBoost model


R2的空间分布差异表明了共享单车的出行量在不同区域具有不同的特性,同时验证了模型GW-XGBoost对区域特征的敏感性. 在城市中心区域,模型能够较好地捕捉建成环境和共享单车出行量之间的关系. 而在偏远或非核心区域,模型的解释能力受到制约,可能与区域内共享单车出行量较低且数据稀疏有关. 从图1可看出北部和东北部的单车出行量较低,但这并不意味着居民对共享单车的需求小,可能存在潜在出行需求尚未被充分满足[29]或骑行基础设施不完善的情况,有必要通过实地调研之类的方式进一步验证这部分区域居民对共享单车的实际需求及制约因素.

3.2. 变量影响的空间异质性

采用SHAP模型解释GW-XGBoost模型的预测结果,评估建成环境的特征重要性. 如图3所示展示了基于SHAP模型计算的全局特征重要性分布,将各变量的平均影响程度转化为百分比形式.可以看出,人口密度、到CBD距离和容积率是对共享单车出行量影响最大的3个建成环境变量,分别占总重要性的27.40%、21.60%和17.68%. 全局特征重要性反映的是变量对共享单车出行量的总体平均贡献.

图 3

图 3   影响变量的相对重要性

Fig.3   Relative importance of influencing variables


为了进一步分析变量影响的空间异质性,计算GW-XGBoost模型结果的局部特征重要性. 在表3中对局部SHAP进行描述性统计,包括最小值、最大值、平均值和标准差. 可以看出,各变量在局部特征重要性上表现出显著的空间异质性. 尤其是人口密度、到CBD距离和容积率具有较大的标准差,表示具有显著空间波动性. 同时,从图3可以看出这3个变量的全局重要性排名前列,具有较高的平均影响力. 因此,为了进一步明确建成环境对共享单车出行量的影响机制,选择3个影响显著的典型因素进一步具体分析. 如图4~6所示分别展示了各TAZ人口密度、到CBD的距离和容积率对共享单车出行量的影响程度及正负影响方向.

表 3   GW-XGBoost模型的局部SHAP

Tab.3  Local SHAP values for GW-XGBoost model

变量SHAP
最小值最大值平均值标准差
容积率−1.07613.569−0.0291.547
人口密度−1.26310.999−0.0401.920
土地利用混合度−0.7051.3610.0310.145
餐饮类POI密度−0.7262.793−0.0500.304
工作类POI密度−0.4140.7600.0280.137
住宅类POI密度−0.8224.3190.0560.843
休闲类POI密度−0.4761.6680.0140.323
支路密度−0.8300.9900.0420.244
自行车道密度−0.3413.078−0.0110.343
到CBD的距离−2.8666.111−0.0751.379
公交站点密度−1.1412.4130.0150.215
地铁站点密度−1.2260.682−0.0060.133

新窗口打开| 下载CSV


图 4

图 4   人口密度SHAP分布

Fig.4   SHAP value distribution of population density


图 5

图 5   到CBD的距离SHAP分布

Fig.5   SHAP value distribution of distance to CBD


图 6

图 6   容积率SHAP分布

Fig.6   SHAP value distribution of floor area ratio


图4所示展示了人口密度重要度的空间分布. 高SHAP(大于0.7)集中分布在研究区域的中部和南部地区,表明人口密度在这些区域对共享单车出行量具有显著的正向影响. 中部和南部地区人口密集,商业和交通网络发达,居民对共享单车的出行需求较高. 相较之下,低SHAP(小于−0.9)的区域多位于高SHAP区域的外围,表现为负向影响,即人口密度对共享单车出行量产生抑制作用. 这些区域多分布在城市扩展区或新开发区域,人口密度较低、区域功能分散,且居民的出行目的地较远而公共交通系统的覆盖不足,可能导致共享单车出行吸引力较弱. 与Wang等[30]采用的全局回归模型相比,本研究构建的GW-XGBoost模型通过为不同区域构建局部模型,避免整体线性关系或全局非线性关系的限制,揭示了不同区域的人口密度在空间上影响的异质性. 现有研究发现人口密度对共享单车出行需求在整体上具有促进作用,但本研究发现人口密度的影响在不同区域表现出显著的空间差异. 在城市核心区域,人口密度的增加显著促进了共享单车的出行量,而在核心区域的部分外围区域,人口密度对共享单车出行量具有抑制作用.

图5所示,到CBD距离的影响程度在空间上明显呈现梯度变化,自市中心向城市外围逐渐递减. 城市中心区域的SHAP最高,随着到CBD距离的增加,SHAP逐渐降低. 此外,部分区域即使距离CBD较近,到CBD距离影响因素的SHAP仍然较低,这表明共享单车出行量未受到明显促进. 这些区域的功能可能以居住为主,较完善的小区内部道路和步行环境使短途步行成为更优选择. 且住宅区居民的通勤需求相对固定,出行目的较为分散,居民更倾向于选择其他长距离的交通工具,进一步降低了居民对共享单车的依赖. 该结论反映了到CBD的距离与共享单车出行量之间的负相关性以及空间异质性. 这与Bi等[31]采用机器学习模型XGBoost发现到CBD距离超过一定范围后,共享单车需求量显著增加并趋于稳定的结论不同. 机器学习模型仅揭示全局变化,未能充分考虑到局部区域的异质性. 相比之下,本研究构建的GW-XGBoost模型通过双平方加权核函数构造空间权重矩阵,能够为不同区域赋予空间加权. 这一特点使本研究能够精确捕捉到局部特征与共享单车出行量之间的细微变化. 此外,深圳市的CBD区域集中在南部地区使其核心作用更加集中,高密度的商业、办公区域以及完善的交通和基础设施促使共享单车成为居民出行的主要选择. 而在远离CBD的外围区域,共享单车出行量受其他因素的影响较大.

图6所示显示了容积率对不同地区的共享单车出行量的影响程度. 容积率的SHAP为正且较高的区域分布在深圳市的南部地区,表明这些区域的容积率与共享单车出行量之间呈现较强的正相关性. 高容积率通常伴随较高的土地利用强度,带来更多的职住融合混合功能区域,增加了短距离出行需求,从而促进了共享单车的出行. 相较之下,在中南部交界处的区域SHAP较低且呈现负向影响,表明容积率的提升未能有效促进共享单车的出行量. 这反映了交界区域针对共享单车的基础设施建设不足问题,例如骑行网络不完善或停车点布局欠优化,进而降低了共享单车的使用率. 此外,部分高容积率区域以工业用途为主,职住分离明显,居民通勤需求较远,使得共享单车的适用性较低. Zhou等[14]在不同尺度上研究,发现建筑密度与共享单车出行无显著关联,但其采用的梯度提升决策树方法难以从局部的角度反映影响关系的区域变化. 而 GW-XGBoost 模型能够识别局部区域的特征变化,从而进一步揭示容积率对单车出行量的影响模式.

3.3. 非线性关系

虽然上述结果揭示了建成环境特征对共享单车出行量影响的重要度在空间上存在显著异质性,但其具体的非线性作用机制仍不清晰. 为了进一步探讨建成环境因素与共享单车出行量之间的非线性关系,本研究利用SHAP依赖图对各变量的作用特征进行分析. SHAP依赖图能够直观地展示不同建成环境特征对共享单车出行量影响的方向与强度变化,从而揭示其更复杂的非线性响应规律. 各变量与共享单车出行量之间的非线性关系如图7~9所示.

图 7

图 7   人口密度对共享单车出行量的影响

Fig.7   Impact of population density on bike-sharing trips


图 8

图 8   到CBD的距离对共享单车出行量的影响

Fig.8   Impact of distance to CBD on bike-sharing trips


图 9

图 9   容积率对共享单车出行量的影响

Fig.9   Impact of floor area ratio on bike-sharing trips


图7所示展示了人口密度a1对共享单车出行量的影响. 结果显示,人口密度对共享单车出行量的影响呈现出明显的阶段性变化. 当人口密度超过 38 000 人/km2时,SHAP显著增加,表明此时共享单车的出行量受到了较强的正向促进作用. 这一增加由多种因素驱动,包括短途高频出行需求的增加、步行替代效应、公共交通接驳需求的增强等. 当人口密度为20 000~38 000 人/km2时,SHAP由负转正且逐渐趋于平稳,这表明在人口密度达到20 000 人/km2时,对共享单车的出行量的影响开始转为正向促进作用,且此时人口密度对单车出行量的边际影响趋于稳定. 虽然以往研究揭示了人口密度与单车出行量之间的非线性关系,但受限于全局模型建模假设相同的特征在不同区域产生的影响是相同的,所揭示的非线性关系整体呈现正相关性[9,14]. 本研究采用自适应核函数选择带宽使GW-XGBoost模型能够捕捉不同区域的人口密度对单车出行量的局部影响. 从图中还可以看出,在人口密度小于20 000 人/km2的区域,SHAP为负且变化较平稳,这表明人口密度对共享单车出行量产生一定的抑制作用,可能由于低人口密度区的共享单车基础设施不足或居民出行模式更多依赖其他交通方式.

图8所示描绘了到CBD的距离a2对共享单车出行量的影响,整体表现为随距离增加而逐渐减弱的下降趋势. 这与Yang等[8]基于PDP图对整体趋势分析所得的结论一致. 相比之下,本研究结合SHAP解释方法,构建了GW-XGBoost模型,以更直观的方式展示特征对模型输出的贡献,并揭示变量影响的方向与强度. GW-XGBoost 模型与 SHAP 分析的结合,不仅验证了到CBD的距离对共享单车出行量的空间约束效应,也揭示了过渡区域和远郊区域共享单车出行量的独特模式. 具体而言,距离市中心5 km以内,SHAP显著为正,表明共享单车需求较高. 这与CBD 区域集中分布的办公场所和高人口流动性有关,短途出行需求旺盛. 在距离市中心5~10 km,SHAP表现出轻微的上升趋势,这反映了郊区与中心城区之间存在一定的交通衔接需求,而这一特性在以往PDP方法中往往被忽略. 随着到CBD距离增加至超过15 km,SHAP转为负值并在15~20 km区间呈现下降趋势,这一趋势反映了共享单车对短途出行的适用性以及距离的空间约束效应,离CBD距离超过15 km后共享单车的出行量受到抑制. 在距离CBD超过20 km的区域,SHAP逐渐趋于稳定. 这表明共享单车的出行量在此范围已达到最低点并保持平稳,反映了该区域超出了共享单车的核心服务半径,共享单车出行量受到长距离模式、区域功能特性、基础设施条件等多方面的综合限制.

图9所示展示了容积率a3与共享单车出行量之间的关系. 可以看出,在容积率低于1.8的区间,SHAP为负且变化较平稳. 这反映了在低容积率区域,共享单车出行量受到抑制. 由于低密度区域的居民更倾向于其他交通方式[27]以满足长距离出行需求,且低容积率区域通常人口密度较低、土地混合利用有限以及共享单车基础设施不足,进而抑制了共享单车出行量.当容积率达到1.8时,SHAP从负值跃升为正值,表明此时容积率对共享单车出行量的影响由抑制转为促进作用. 这一变化反映了随容积率增加,人口密度和混合土地利用程度的提高带来更多的短途出行需求和更舒适的骑行环境,此时共享单车出行需求开始被激发. 当容积率超过1.8之后,SHAP呈现持续上升趋势,表明共享单车出行量随容积率增加而不断增长. 可能是因为高容积率区域通常具有更紧凑的城市结构和更完善的自行车道网络,共享单车成为居民短途出行和接驳公共交通的重要方式. 这与严亚磊等[32]发现高容积率地区促进共享单车出行的结论一致,但本研究进一步揭示了容积率对共享单车出行量提升的非线性规律.

4. 结 论

所构建的GW-XGBoost模型,解决了传统机器学习模型忽略的空间异质性问题. 通过融合地理加权和机器学习的优势,在兼顾空间效应和非线性特征的基础上,解析了不同建成环境因素对共享单车出行量的影响. 此外,采用SHAP模型揭示特征重要度以及建成环境因素与共享单车出行量之间的非线性关系. 主要结论如下.

(1) 相比于基准模型GWR和XGBoost,GW-XGBoost模型在平均拟合优度上分别提高了24.05%和7.12%. 地理空间加权机制和自适应带宽的引入使GW-XGBoost模型能够为不同区域分配动态权重,并根据不同区域的数据密度灵活调整最佳权重范围. 不仅能够更准确地捕捉建成环境与共享单车出行量之间的非线性关系,也能够揭示不同地理区域中共享单车出行模式的局部差异.

(2) 建成环境影响因素对共享单车出行量的影响方向和程度从城市中心区域到外围区域呈现显著差异. 其中,人口密度、到CBD的距离和容积率是主要驱动因素,且这些驱动因素在不同区域对共享单车出行量的影响存在梯度变化. 人口密度在市中心区对单车出行量的影响较强且呈现稳定的正向关系,而在低密度区域(人口密度小于20 000人/km2),单车出行受到抑制,当人口密度增加到20 000~38000人/km2时,影响作用由负转正且边际效应趋于稳定. 到CBD的距离影响呈现明显的空间约束效应,在15~20 km的过渡区域,到CBD距离的影响作用由正向转为负向并迅速减弱,在远郊区趋于平稳. 容积率的影响同样呈现非线性效应,当容积率达到1.8时,影响效应由负转正且在1.8~4.0之间持续增强.

(3) 基于上述结果,建议共享单车运营企业在高人口密度(>20 000 人/km2)、距离CBD在15 km以内和适中容积率(1.8~4.0)区域优先增加共享单车投放量以满足较高的需求. 此外,距离CBD 5~10 km的区域应考虑交通衔接需求,建议结合公共交通站点布局共享单车投放点以提高接驳效率. 城市规划者应进一步完善非机动车道网络,提高骑行可达性. 对于单车出行量受到抑制的区域,建议共享单车运营商避免过度投放,结合需求特征实行差异化投放策略. 此外,为了鼓励绿色出行,城市规划者或政府可适当增加非机动车道完善骑行基础设施建设,以及鼓励办公居住功能混合发展增加短途出行需求,进一步提高绿色出行比例.

(4) 未来研究可以进一步聚焦于城市功能区内部需求特征,构建引入时间维度的模型探讨共享单车出行的动态变化规律. 同时,在考虑可塑性面积单元问题基础上,深入挖掘建成环境因素之间的交互效应,探索多因素交互、时空异质和非线性对共享单车出行的综合作用,为精细化管理策略提供更具针对性的理论支持和实践依据.

参考文献

EREN E, UZ V E

A review on bike-sharing: the factors affecting bike-sharing demand

[J]. Sustainable Cities and Society, 2020, 54: 101882

DOI:10.1016/j.scs.2019.101882      [本文引用: 1]

CHEN Z, VAN LIEROP D, ETTEMA D

Dockless bike-sharing systems: what are the implications?

[J]. Transport Reviews, 2020, 40 (3): 333- 353

DOI:10.1080/01441647.2019.1710306      [本文引用: 1]

WANG X, LINDSEY G, SCHONER J E, et al

Modeling bike share station activity: effects of nearby businesses and jobs on trips to and from stations

[J]. Journal of Urban Planning and Development, 2016, 142: 04015001

DOI:10.1061/(ASCE)UP.1943-5444.0000273      [本文引用: 1]

ALCORN L G, JIAO J

Bike-sharing station usage and the surrounding built environments in major Texas Cities

[J]. Journal of Planning Education and Research, 2023, 43 (1): 122- 135

DOI:10.1177/0739456X19862854      [本文引用: 1]

WU C, KIM I, CHUNG H

The effects of built environment spatial variation on bike-sharing usage: a case study of Suzhou, China

[J]. Cities, 2021, 110: 103063

DOI:10.1016/j.cities.2020.103063      [本文引用: 1]

SUN Y, WANG Y, WU H

How does the urban built environment affect dockless bikesharing-metro integration cycling? Analysis from a nonlinear comprehensive perspective

[J]. Journal of Cleaner Production, 2024, 449: 141770

DOI:10.1016/j.jclepro.2024.141770      [本文引用: 1]

徐标, 路庆昌

共享单车停车需求的多尺度时空影响因素

[J]. 浙江大学学报: 工学版, 2023, 57 (2): 380- 391

[本文引用: 1]

XU Biao, LU Qingchang

Multi-scale spatiotemporal influencing factors of bike-sharing parking demand

[J]. Journal of Zhejiang University: Engineering Science, 2023, 57 (2): 380- 391

[本文引用: 1]

YANG L, YU B, LIANG Y, et al

Time-varying and non-linear associations between metro ridership and the built environment

[J]. Tunnelling and Underground Space Technology, 2023, 132: 104931

DOI:10.1016/j.tust.2022.104931      [本文引用: 2]

DING C, CAO X, WANG Y

Synergistic effects of the built environment and commuting programs on commute mode choice

[J]. Transportation Research Part A: Policy and Practice, 2018, 118: 104- 118

DOI:10.1016/j.tra.2018.08.041      [本文引用: 2]

HATAMI F, RAHMAN M M, NIKPARVAR B, et al

Non-linear associations between the urban built environment and commuting modal split: a random forest approach and SHAP evaluation

[J]. IEEE Access, 2023, 11: 12649- 12662

DOI:10.1109/ACCESS.2023.3241627      [本文引用: 1]

WANG S, GAO K, ZHANG L, et al

Geographically weighted machine learning for modeling spatial heterogeneity in traffic crash frequency and determinants in US

[J]. Accident Analysis and Prevention, 2024, 199: 107528

DOI:10.1016/j.aap.2024.107528      [本文引用: 1]

LV H, LI H, CHEN Y, et al

An origin-destination level analysis on the competitiveness of bike-sharing to underground using explainable machine learning

[J]. Journal of Transport Geography, 2023, 113: 103716

DOI:10.1016/j.jtrangeo.2023.103716      [本文引用: 1]

WANG Y, ZHAN Z, MI Y, et al

Nonlinear effects of factors on dockless bike-sharing usage considering grid-based spatiotemporal heterogeneity

[J]. Transportation Research Part D: Transport and Environment, 2022, 104: 103194

DOI:10.1016/j.trd.2022.103194      [本文引用: 1]

ZHOU T, FENG T, KEMPERMAN A

Assessing the effects of the built environment and microclimate on cycling volume

[J]. Transportation Research Part D: Transport and Environment, 2023, 124: 103936

DOI:10.1016/j.trd.2023.103936      [本文引用: 3]

ZHU B, HU S, KAPARIAS I, et al

Revealing the driving factors and mobility patterns of bike-sharing commuting demands for integrated public transport systems

[J]. Sustainable Cities and Society, 2024, 104: 105323

DOI:10.1016/j.scs.2024.105323      [本文引用: 1]

深圳市人大常委会. 深圳经济特区互联网租赁自行车管理若干规定[EB/OL]. (2021−07−06) [2024−12−20]. https://www.szrd.gov.cn/v2/zx/szfg/content/post_966176.html.

[本文引用: 1]

WU J, TA N, SONG Y, et al

Urban form breeds neighborhood vibrancy: a case study using a GPS-based activity survey in suburban Beijing

[J]. Cities, 2018, 74: 100- 108

DOI:10.1016/j.cities.2017.11.008      [本文引用: 1]

仝德, 高静, 龚咏喜

城中村对深圳市职住空间融合的影响: 基于手机信令数据的研究

[J]. 北京大学学报: 自然科学版, 2020, 56 (6): 1091- 1101

[本文引用: 1]

TONG De, GAO Jing, GONG Yongxi

Impact of urban village on job-housing balance in Shenzhen: a study using mobile phone signaling data

[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56 (6): 1091- 1101

[本文引用: 1]

LI M, TU W, TONG H, et al

Quantifying the nighttime economy–housing separation from a human activity standpoint: a case study in Shenzhen, China

[J]. Cities, 2024, 148: 104894

DOI:10.1016/j.cities.2024.104894     

朱岑远, 郑乐, 张毅萌

基于MGWR的共享单车空间异质性分析

[J]. 物流科技, 2024, 47 (24): 72- 77

[本文引用: 1]

ZHU Cenyuan, ZHENG Yue, ZHANG Yimeng

Spatial heterogeneity analysis of bikesharing based on MGWR

[J]. Logistics Sci-Tech, 2024, 47 (24): 72- 77

[本文引用: 1]

YAO Y, LIU X, LI X, et al

Simulating urban land-use changes at a large scale by integrating dynamic land parcel subdivision and vector-based cellular automata

[J]. International Journal of Geographical Information Science, 2017, 31 (12): 2452- 2479

DOI:10.1080/13658816.2017.1360494      [本文引用: 1]

GUO Y, YANG L, CHEN Y

Bike share usage and the built environment: a review

[J]. Frontiers in Public Health, 2022, 10: 848169

DOI:10.3389/fpubh.2022.848169      [本文引用: 1]

孙艺玲, 仝德, 曹超

城市建成环境对公共自行车使用的影响机制研究: 以深圳市南山区为例

[J]. 北京大学学报: 自然科学版, 2018, 54 (6): 1325- 1331

SUN Yiling, TONG De, CAO Chao

How urban built environment affects the use of public bicycles: a case study of Nanshan District of Shenzhen

[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54 (6): 1325- 1331

关昊天, 戢晓峰, 李武, 等

建成环境对共享单车与地铁组合出行的影响关系

[J]. 交通运输系统工程与信息, 2024, 24 (4): 200- 211

[本文引用: 1]

GUAN Haotian, JI Xiaofeng, LI Wu, et al

Influence of built environment on integrated use of bike sharing and metro

[J]. Journal of Transportation Systems Engineering and Information Technology, 2024, 24 (4): 200- 211

[本文引用: 1]

EWING R, CERVERO R

Travel and the built environment: a synthesis

[J]. Transportation Research Record: Journal of the Transportation Research Board, 2001, 1780 (1): 87- 114

DOI:10.3141/1780-10      [本文引用: 1]

CHEN T, GUESTRIN C. XGBoost: a scalable tree boosting system [C]// 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016: 785−794.

[本文引用: 1]

XIAO L, LO S, LIU J, et al

Nonlinear and synergistic effects of TOD on urban vibrancy: applying local explanations for gradient boosting decision tree

[J]. Sustainable Cities and Society, 2021, 72: 103063

DOI:10.1016/j.scs.2021.103063      [本文引用: 2]

YANG W, LI Y, LIU Y, et al

Environmental factors for outdoor jogging in Beijing: insights from using explainable spatial machine learning and massive trajectory data

[J]. Landscape and Urban Planning, 2024, 243: 104969

DOI:10.1016/j.landurbplan.2023.104969      [本文引用: 1]

成骋, 陈文栋, 马洪生, 等

基于Leiden算法的共享单车活动社区识别方法: 南京案例分析

[J]. 交通信息与安全, 2023, 41 (2): 103- 111,156

[本文引用: 1]

CHENG Cheng, CHEN Wendong, MA Hongsheng, et al

A method for identifying operation zones of free-floating shared bikes based on leiden algorithm: a case study of the city of Nanjing

[J]. Journal of Transport Information and Safety, 2023, 41 (2): 103- 111,156

[本文引用: 1]

WANG J, WANG Z, WANG Z, et al

Exploring the effect of neighbouring built and demographic environment on station-level bike-sharing trips under COVID-19

[J]. Journal of Transport and Health, 2024, 36: 101818

[本文引用: 1]

BI H, LI A, HUA M, et al

Examining the varying influences of built environment on bike-sharing commuting: empirical evidence from Shanghai

[J]. Transport Policy, 2022, 129: 51- 65

DOI:10.1016/j.tranpol.2022.10.004      [本文引用: 1]

严亚磊, 于涛, 沈丽珍

共享单车出行的建成环境影响机制: 以上海市为例

[J]. 上海城市规划, 2020, (6): 85- 91

[本文引用: 1]

YAN Yalei, YU Tao, SHEN Lizhen

The impact mechanism of built environment on shared bikes travel: a case study of Shanghai

[J]. Shanghai Urban Planning Review, 2020, (6): 85- 91

[本文引用: 1]

/