道路开口对临近交叉口交通安全的影响
Effect of roadway access on traffic safety at adjacent intersection
通讯作者:
收稿日期: 2020-03-28
基金资助: |
|
Received: 2020-03-28
Fund supported: | 国家重点研发计划资助项目(2017YFC0803906) |
作者简介 About authors
张琦(1992—),男,博士生,从事交通安全的研究.orcid.org/0000-0002-7943-3989.E-mail:
为了弥补道路开口对临近交叉口交通安全定量影响研究的不足,补充目前有关道路开口影响邻近交叉口的事故修正系数(CMF)评估的缺失,基于宁波市鄞州区事故坐标点云数据对道路开口影响邻近交叉口的CMF值进行有效评估. 提出高效的CMF值评估方法,包括用于建立事故、交叉口及临近交叉口的道路开口三者相关性、适用于从规模事故点云数据中准确识别事故黑点的两阶段聚类算法(TSCA)和针对影响因素分析的零膨胀负二项分布回归(ZINB)模型. 结果显示,TSCA算法能够根据60、70及80三种事故频数阈值,准确识别出24、16及10个交叉口事故黑点;利用ZINB模型对识别出的24、16及10个交叉口事故黑点的主要影响因素建模,计算出道路开口的CMF值分别达到1.17、1.19和1.20. 研究表明,道路开口对临近交叉口安全的影响较明显,对高事故率黑点的影响更显著.
关键词:
Roadway access CMF-values were effectively estimated based on the point cloud data of the accident coordinates in Yinzhou District, Ningbo in order to fill the gap in the quantitative assessment of the effect of the roadway access on the traffic safety at the adjacent intersection and complement the crash modification factor (CMF) of roadway access impacted on the adjacent intersection. An efficient method was presented, including a two-stage clustering approach (TSCA) for developing relationship among accidents, intersections, and roadway access close to the intersections, which is applicable for accurate identification of accident hotspots from large-scale point cloud data and the zero-inflated negative binomial model (ZINB) for influencing factor analysis. Results showed that TSCA accurately identified 24, 16 and 10 intersection accident hotspots according to 60, 70 and 80 accident frequency threshold, respectively. ZINB was applied to model the main influencing factors of the 24, 16 and 10 black factors identified by TSCA, respectively. CMF-values were estimated by 1.17, 1.19, and 1.20, respectively. Roadway access has a significant impact on the safety of the adjacent intersection and a more significant effect on the intersection with a higher accident rate.
Keywords:
本文引用格式
张琦, 陈红, 周继彪, 张敏, 郭璘, 杨仁法.
ZHANG Qi, CHEN Hong, ZHOU Ji-biao, ZHANG Min, GUO Lin, YANG Ren-fa.
对道路开口与邻近交叉口事故多发相关性的研究极具价值. 尽管诸如《民用建筑设计通则》和《停车场规划设计规则》等规范明确规定了建筑物道路接入口与临近交叉口的最小距离,但实际上国内城市普遍存在众多交叉口范围内的不合理开口,以至于埋下不可忽视的交通安全隐患. 在缺乏事故数据条件下的潜在事故黑点预测是目前交通安全研究的难点. 定量研究道路开口与邻近交叉口事故多发的相关性,既有利于评估交通安全现状,改善区域交通运行,又有利于提高对潜在事故黑点的预测精度.
事故修正系数(crash modification factor,CMF)是目前国际广泛采用的定量评估在路段或交叉口实施某种安全措施或发生某种改变之后影响效果的指标. Haleem等[10]的研究表明,增加路肩宽度可以在一定程度上减少事故发生,如路肩宽度从10 ft(约3.05 m)增加到12 ft(约3.66 m),CMF值为0.77,含义为增加路肩宽度后期望事故数降低为原来的77%. Li等[11]评估安装超速监测摄像机后的CMF值为0.725~0.815. Xie等[12]发现城市高架会增大下方交叉口事故发生概率,CMF为1.58. Kwigizile等[13]发现安装行人过街计时器可以有效地减少行人交通事故,CMF为0.85. 查阅美国联邦公路管理局所提供的各种条件下的CMF值,目前对道路开口影响邻近交叉口交通安全的CMF评估未受到足够的重视.
本文旨在定量评估道路开口对临近交叉口的影响,弥补目前有关道路开口影响邻近交叉口区域的CMF评估的缺失. 本文提出完整、高效的CMF评估方法. 从规模事故坐标点云数据中准确识别事故黑点的两阶段聚类算法,用于建立事故、道路开口及交叉口三者之间的空间相关性. 针对影响因素分析的零膨胀负二项分布回归模型,用于建立影响因素与事故频率的广义线性关系. 研究基于该方法及宁波市鄞州区事故坐标点云数据,对道路开口影响临近交叉口的CMF值进行有效评估.
1. 道路开口CMF值评估方法
以往研究易忽视道路开口影响的重要原因在于难以建立事故、交叉口及道路开口三者之间的空间相关性. 采用的事故GPS坐标点云为挖掘三者关系提供了可能. 评估道路开口CMF值过程中的首要任务是提出针对处理规模事故坐标点云数据的算法,目的是通过空间聚类算法准确识别出交叉口事故黑点,统计黑点影响范围内的开口数量,建立三者的联系. 现有的聚类算法,如K-means、层级聚类法、密度聚类法等算法都存在不同程度的缺陷,难以满足研究的需要. 提出改进聚类算法,即两阶段聚类算法,适用于从规模事故点云数据中准确挖掘事故黑点.
1.1. 两阶段聚类算法TSCA
两阶段聚类算法(two-stage clustering approach,TSCA)是为快速处理规模事故坐标点云数据、同时满足小范围精确聚类事故黑点要求而提出的改良算法. 该算法包括第1阶段的DBSCAN(density-based spatial clustering of applications with noise)算法[14]、第2阶段的K-means算法[15]以及确定K值的关联阶段. TSCA算法的基本原理是利用DBSCAN算法粗略聚类以排除绝大部分噪点,因为粗略聚类能够在很大程度上弥补该算法对搜索半径及阈值敏感的缺陷. 利用K-means算法只依赖聚类个数K值的优点,对粗略聚类结果进行缩小范围的精确聚类,由于初步聚类所获各簇内数据点量有限,降低了K-means算法中的K值选取难度. 该算法整合了2种算法的优势并最大程度上规避各自的缺点,同时加入快速关联阶段使得2种算法结合更加紧密. 如图1所示为TSCA的具体算法流程.
图 1
第1阶段的DBSCAN算法逻辑如下.
1)将数据集D中的每个点x标记为未识别
2)For x in D
3) 计算点x搜索半径R范围内数据点数N
4) If N≥下限阈值,则标记此x点为核心点x′
5) End if
6)End for
7)For x in D(不包括已被标记为核心点的x)
8) 计算在点x搜索半径R范围内是否存在已被标记的核心点x′
9) If 存在核心点x′,则标记点x为边缘点x′′
10) Else 标记其余点x为噪点
11) End if
12)End for
13)合并相互距离在搜索半径R范围内的所有核心点
14)分配每个边缘点x′′到最近的核心点x′
15)删除所有噪点
从算法逻辑中可以看出,DBSCAN算法主要根据最小搜索半径和下限阈值进行聚类,具有对噪点不敏感的特点.
第2阶段K-means的算法逻辑如下.
1)确定K值,随机选取数据集D中K个点x作为中心点
2)For x in D
3) 依次计算点x到K个中心点的欧拉距离d1,d2,···,dk
4) If di < d1 < ··· < dk,i=1,2,···,k,则将点x划分为第i类
5) End if
6)End for
7)根据式(1),(2)计算距离和J1,更新中心点u
8)根据更新后的中心点u,重新计算距离和J2
9)If | J1−J2|<预设阈值,则认为收敛终止迭代
10)Else 重新返回步骤2)
11)End if
K-means算法依靠更新各类中心点坐标使距离和最小来确定分类,距离和及中心点的更新方法如下:
式中:J为距离和;K为总聚类数,即K值;Cn为第n个聚类簇;un为第n个聚类簇中心点的坐标向量;Sn为第n个聚类中点的总数.
1.2. 零膨胀负二项回归模型ZINB
零膨胀负二项回归模型(zero inflated negative binomial model,ZINB)是目前针对解决“零膨胀”现象的流行算法. 事故计数统计是典型的零膨胀数据. 一方面,交通事故始终是小概率事件,即使是事故多发区域也会存在众多的零统计;另一方面,实际中存在大量事故瞒报的现象容易导致“非真零”统计的存在,使得零膨胀现象更加明显. ZINB模型已被许多事故研究所采用. Carson等[16]利用ZINB研究路面湿滑警告标志对事故发生频率的影响,发现安装湿滑警告标志不能显著地降低事故率. Lee等[17]利用ZINB评估道路特征对冲出道路事故的影响,发现增加边坡、减少路边孤立树木等可以降低此类事故的出现. Weng等[18-19]采用ZINB进行研究. 目前,基于ZINB模型的交通事故计数建模已成为交通事故研究的主流建模方法之一[20-21].
本质上,ZINB模型是对传统计数回归模型的一种扩展,它由逻辑回归与负二项回归组合而成,属于广义线性回归的范畴. 该模型通过增加逻辑回归部分,使得该模型具有对零膨胀现象更好的解释能力,且计数部分使用负二项分布相较于另一种常用计数模型泊松分布(方差等于期望的约束)具有更宽松的约束条件,即方差大于期望. 此外,ZINB拥有向下兼容的能力,可以根据参数退化成非零膨胀模型或零膨胀泊松模型.
ZINB模型的基本表达式如下.
式中:
ZINB模型的均值
式中:当
1.3. 赤池信息准则
赤池信息准则(Akaike information criterion,AIC)被广泛应用于评估拟合模型优良性的标准,通常认为AIC值最小时模型最优. 由于可选择的解释变量数量众多,该准则被用来确定最优的解释变量个数,计算公式为
式中:
1.4. 事故修正系数CMF计算方法
式中:
2. 交叉口事故黑点识别结果
2.1. 事故数据
该研究采用的事故坐标点云数据由宁波市鄞州区交警大队提供,包含自2016-10-01—2017-01-02和2018-03-01—2018-03-31的鄞州区交通事故完整记录. 采集方式为交警现场通过鄞州交警APP记录. 采集内容主要包括:事故编号、事故地点GPS坐标、事故地点描述(如交叉口、路段、停车场等)、事故类型(如机动车与机动车机、动车与行人等)、事故原因(如机动车追尾、变道碰撞等)、天气(如晴天、雨天等)、周围环境(如正常环境、黑夜照明不佳等). 数据总量达43187条,经过剔除重复、空缺及错误数据后,最终有效数据为41 308条. 全部有效数据的GPS坐标点云与地图匹配效果如图2所示.
图 2
2.2. 交叉口事故黑点识别
交叉口黑点识别将根据研究方法中的TSCA聚类进行识别. 需要特殊说明的是事故黑点定义的选取. 目前广泛认可的定义由Elvik[24]总结提出,即“任一地点的期望事故发生率高于与其类似地点的事故率即为事故黑点”. 尽管该定义考虑非常全面,但更偏重于指导而非实践. 基于该定义识别的关键在于先验信息的掌握,然而这些先验信息往往是缺失的,例如类似地点的事故率先验信息. 目前对类似地点的界定比较困难,缺乏统一标准. 以上这些直接导致了该定义难以进行实操. 为了利于实际应用,采用另一种简化定义,即“任一地点的事故数高于某一阈值,即认定为事故黑点”. 下限阈值的确定缺乏标准,且以往研究采用的阈值不一定适用于新的城市. 参照文献[1]中的研究成果,对比选择60、70和80共3种事故数作为黑点定义下限阈值进行研究. 对于交叉口影响范围的定义,参考《停车场规划设计规则》中的最小80 m间距,考虑到研究区域存在众多临界满足最低要求的开口,这些开口存在潜在影响;若严格按照规范距离进行开口数量统计,则会使得样本量严重不足,从而无法获得显著结果. 研究遵从不利原则,将交叉口影响范围半径扩展为100 m,统计该范围内的道路开口数量. 特别地,道路开口对邻近交叉口的影响可能随着距离的不同而存在差异. 统计所有有效开口间距后发现,绝大多数开口都集中在距交叉口80~100 m. 如此稳定且较小的差异使得在该研究中开口距离因素对道路开口CMF值评估的影响十分有限. 因目前缺少有效定量该差异的算法,暂未考虑开口距离因素的影响.
如图3所示为经过TSCA算法从41 308个事故点中识别的事故黑点区域,其中DBSCAN搜索半径及事故频数阈值分别为100 m和80个(结果为图3中的所有点),K-means最优K值为5(结果为图3中的5个聚类). 经过第一步DBSCAN聚类后只能识别出一个较大区域,这显然不能满足研究需要. 经过K-means进一步聚类后,得到更精确的小范围事故区域. 排除非交叉口区域(事故黑点聚类2和3)以及非主要道路区域事故,统计剩余交叉口事故数量,判断是否满足黑点定义. 事故黑点聚类1由于事故频数不足而被排除,事故聚类点4满足条件,但影响范围内道路开口为0. 识别出事故黑点聚类5满足条件且交叉口范围内道路开口数量为1(如箭头所指位置).
图 3
图 3 嵩江路与钱湖路区域事故黑点识别示例
Fig.3 Determined hotspot example in intersection area-Qianhu Road @ Songjiang Road
表 1 变量选取及统计描述
Tab.1
变量 | 变量解释 | T=60 | T=70 | T=80 | |||||||||||
均值 | 方差 | 最大 | 最小 | 均值 | 方差 | 最大 | 最小 | 均值 | 方差 | 最大 | 最小 | ||||
事故计数 | 交叉口影响范围内每日事故发生数 | 1.32 | 2.02 | 9 | 0 | 1.39 | 1.97 | 9 | 0 | 1.51 | 1.91 | 9 | 0 | ||
道路开口数量 | 交叉口影响范围内开口数量 | 1.96 | 1.43 | 4 | 0 | 2.38 | 1.30 | 4 | 0 | 2.80 | 1.07 | 4 | 1 | ||
主要道路流量 | 取常用对数,无量纲 | 4.28 | 0.04 | 4.48 | 4.01 | 4.30 | 0.02 | 4.48 | 4.02 | 4.34 | 0.01 | 4.48 | 4.07 | ||
次要道路流量 | 取常用对数,无量纲 | 4.10 | 0.03 | 4.43 | 3.62 | 4.15 | 0.02 | 4.43 | 3.68 | 4.19 | 0.02 | 4.43 | 3.73 | ||
主要道路车道数 | − | 9.04 | 4.92 | 14 | 6 | 9.25 | 4.88 | 14 | 6 | 9.40 | 4.84 | 14 | 6 | ||
次要道路车道数 | − | 7.11 | 3.55 | 12 | 3 | 7.13 | 3.46 | 10 | 3 | 7.20 | 3.36 | 10 | 3 | ||
天气 | 二元分类变量,正常(0)降雨(1) | − | − | − | − | − | − | − | − | − | − | − | − | ||
星期 | 7个哑变量表示 | − | − | − | − | − | − | − | − | − | − | − | − | ||
交叉口上方是否有高架通过 | 二元分类变量,无(0)有(1) | − | − | − | − | − | − | − | − | − | − | − | − | ||
交叉口区域是否有商业中心 | 二元分类变量,无(0)有(1) | − | − | − | − | − | − | − | − | − | − | − | − |
从表1可以看出,事故计数作为反应变量,在不同下限阈值条件下都表现出方差大于均值的特点,不符合泊松分布的假设条件,即期望等于方差,相反符合负二项分布假设条件,即方差大于均值.
3. 道路开口的CMF评估结果分析
表 2 主要解释变量事故修正系数表
Tab.2
变量 | T = 60 | T = 70 | T = 80 | ||||||||
系数 | CMF | 95%置信区间 | 系数 | CMF | 95%置信区间 | 系数 | CMF | 95%置信区间 | |||
道路开口数量 | 0.16 | 1.17 | 1.07~1.28 | 0.18 | 1.19 | 1.11~1.29 | 0.18 | 1.20 | 1.14~1.25 | ||
主要道路流量 | 0.77 | 2.16 | 1.36~3.42 | 0.64 | 1.90 | 1.26~2.86 | 0.61 | 1.84 | 1.24~2.73 | ||
次要道路流量 | 0.46 | 1.58 | 1.14~2.21 | 0.51 | 1.66 | 1.24~2.24 | 0.52 | 1.67 | 1.29~2.19 | ||
主要道路车道数 | −0.20 | 0.79 | 0.76~0.89 | −0.21 | 0.81 | 0.76~0.87 | −0.21 | 0.81 | 0.75~0.87 | ||
次要道路车道数 | −0.32 | 0.73 | 0.68~0.77 | −0.28 | 0.76 | 0.71~0.80 | −0.26 | 0.77 | 0.73~0.82 | ||
交叉口上方是否有高架通过 | 0.15 | 1.16 | 1.08~1.25 | 0.19 | 1.21 | 1.13~1.29 | 0.21 | 1.23 | 1.15~1.32 | ||
交叉口区域是否有商业中心 | 0.10 | 1.11 | 1.05~1.16 | 0.08 | 1.08 | 1.05~1.13 | 0.08 | 1.08 | 1.04~1.13 |
总体而言,表2中7个解释变量的CMF评估值所展现出的对道路安全的影响均符合直观认识. 例如车流量增大会增加事故发生风险,因此主次流量的CMF均大于1. 同理,车道数增加会缓解交通压力而降低事故发生概率. 交叉口范围内的商业中心会增加流量、出租车停靠频率等,从而增大事故发生概率等. 此外,主要道路流量系数估计值(0.77、0.64和0.61)及次要道路流量系数估计值(0.46、0.51和0.52)与Raihan等[4]对主要道路流量系数的估计值(0.533~0.734)和次要道路系数的估计值(0.357~0.502)基本保持一致,表明了研究结果的可靠性. 城市高架道路对事故的影响由于宁波鄞州区范围内高架数量有限,导致影响遭到了稀释,小于文献[11]中基于高架众多的上海市CMF(1.58);尽管削弱了影响,但显示出高架对交通安全的不利,这与文献[11]的结论是一致的.
针对道路开口影响临近交叉口CMF的评估,如表2所示,道路开口数量在60、70及80阈值所识别事故黑点结果中的系数分别为0.16、0.18和0.18,对应的CMF分别为1.17、1.19和1.20. 从较小的95%置信区间可以看出道路开口CMF评估值变化的稳定性,也突显出道路开口CMF计算结果的可靠性. 计算结果表明,道路开口对临近交叉口安全的影响较显著,同时道路开口对更高事故率黑点的影响更显著,且随着开口数量的增加对临近交叉口安全的影响更显著. 以交叉口范围内道路开口数量最多的2个事故黑点为例. 沧海路与环城南路交叉口、宁南北路与四明路交叉口的影响范围道路内开口数量均为4个,事故风险按CMF为1.17、1.19和1.20计算将分别扩大为零开口时的1.90、2.02和2.05倍. 将识别的交叉口事故黑点按事故发生数量降序排列,可以发现在全部3种所识别的交叉口事故黑点集合中,这2个交叉口的事故数量均排在第2和第5位,从而进一步体现了道路开口对临近交叉口安全的重要影响及本文对道路开口CMF估计的可靠性.
4. 结 语
道路开口对临近交叉口的交通安全影响不能被忽视,定量估计道路开口对临近交叉口交通安全的影响程度有利于对潜在事故黑点的预测以及新建开口对周边影响的安全评估. CMF是国际上广泛采用的定量评估变量影响程度的参数,然而目前缺乏对道路开口影响临近交叉口安全的CMF评估. 本文研究道路开口对临近交叉口的安全影响,有效评估了道路开口影响临近交叉口的CMF. CMF参考值(1.17、1.19和1.20)印证了道路开口对临近交叉口存在显著影响. 研究成果有望为现状交叉口(影响范围存在道路开口)及新建开口对邻近交叉口的交通安全评估提供重要参考,为潜在交叉口事故黑点预测及已知交叉口事故黑点的成因查找等提供有效帮助. 所提出的CMF评估方法能够为快速从规模事故点云数据(如GPS坐标数据)中挖掘各种因素(如开口因素、左转车道因素等)对事故多发区域交通安全影响程度的相关研究提供重要参考.
未来进一步研究将聚焦于扩展更多研究区域,以提高现有研究成果的广泛性和一致性. 由于开口间距特征差异较小以及缺乏有效定量该差异的算法,研究未考虑道路开口与邻近交叉口间距对事故修正系数的影响,未来在扩展更多数据的同时将重点挖掘该方向.
参考文献
基于改进K-means算法的城市道路交通事故分析
[J].DOI:10.3969/j.issn.1001-7372.2018.04.028 [本文引用: 2]
Analysis of urban road traffic based on improved K-means algorithm
[J].DOI:10.3969/j.issn.1001-7372.2018.04.028 [本文引用: 2]
基于GIS的道路热区鉴别方法
[J].
Identification method of road hot zone based on GIS
[J].
Applying public participation approach to black spot identification process
[J].DOI:10.1016/S0386-1112(14)60158-8 [本文引用: 2]
Estimation of bicycle crash modification factors (CMFs) on urban facilities using zero inflated negative binomial models
[J].DOI:10.1016/j.aap.2018.12.009 [本文引用: 2]
Multivariate random-parameters zero-inflated negative binomial regression model: an application to estimate crash frequencies at intersections
[J].
基于模糊逻辑的交通事故预测及影响因素分析
[J].DOI:10.3969/j.issn.1009-6744.2009.02.014 [本文引用: 1]
Traffic accidents prediction and prominent influence factors analysis based on fuzzy logic
[J].DOI:10.3969/j.issn.1009-6744.2009.02.014 [本文引用: 1]
基于仿真的城市道路交叉口最小安全间距研究
[J].DOI:10.3963/j.issn.2095-3844.2012.03.017 [本文引用: 1]
Study on the minimal safety intersection spacing of city road based on simulation
[J].DOI:10.3963/j.issn.2095-3844.2012.03.017 [本文引用: 1]
城市干道信控交叉口最小间距计算
[J].DOI:10.3969/j.issn.1009-6744.2014.05.012 [本文引用: 1]
Minimum spacing calculation for signalized intersections on the urban arterial
[J].DOI:10.3969/j.issn.1009-6744.2014.05.012 [本文引用: 1]
Access spacing based on turning-vehicle acceleration
[J].
Using multivariate adaptive regression splines (MARS) to develop crash modification factors for urban freeway interchange influence areas
[J].DOI:10.1016/j.aap.2013.02.018 [本文引用: 1]
The impacts of speed cameras on road accidents: an application of propensity score matching methods
[J].
Corridor-level signalized intersection safety analysis in Shanghai, China using Bayesian hierarchical models
[J].DOI:10.1016/j.aap.2012.10.003 [本文引用: 1]
Research and application of DBSCAN clustering algorithm based on density
[J].
Algorithm AS 136: a k-means clustering algorithm
[J].
The effect of ice warning signs on ice-accident frequencies and severities
[J].DOI:10.1016/S0001-4575(00)00020-8 [本文引用: 1]
Impact of roadside features on the frequency and severity of run-off-roadway accidents: an empirical analysis
[J].DOI:10.1016/S0001-4575(01)00009-4 [本文引用: 1]
Evaluation of shipping accident casualties using zero-inflated negative binomial regression technique
[J].DOI:10.1017/S0373463315000788 [本文引用: 1]
Prediction of vehicle crashes by drivers' characteristics and past traffic violations in Korea using a zero-inflated negative binomial model
[J].DOI:10.1080/15389588.2015.1033689 [本文引用: 1]
Analytic methods in accident research: methodological frontier and future directions
[J].DOI:10.1016/j.amar.2013.09.001 [本文引用: 1]
The statistical analysis of crash-frequency data: a review and assessment of methodological alternatives
[J].
Development of accident modification factors for rural frontage road segments in Texas
[J].
/
〈 |
|
〉 |
