浙江大学学报(工学版), 2023, 57(8): 1607-1617 doi: 10.3785/j.issn.1008-973X.2023.08.013

土木工程、交通工程

基于最优汇集时间间隔的城市间断交通流预测

王殿海,, 谢瑞, 蔡正义,

浙江大学 智能交通研究所,浙江 杭州 310058

Prediction of urban interrupted traffic flow based on optimal convergence time interval

WANG Dian-hai,, XIE Rui, CAI Zheng-yi,

Intelligent Transportation Research Institute, Zhejiang University, Hangzhou 310058, China

通讯作者: 蔡正义,男,助理研究员. orcid.org/0000-0001-9178-9809. E-mail: caizhengyi@zju.edu.cn

收稿日期: 2022-12-3  

基金资助: 国家自然科学基金资助项目(52131202, 71901193, 52072340); 浙江省"尖兵""领雁"研发攻关计划资助项目(2023C01240, 2023C03155)

Received: 2022-12-3  

Fund supported: 国家自然科学基金资助项目(52131202,71901193,52072340);浙江省"尖兵""领雁"研发攻关计划资助项目(2023C01240,2023C03155)

作者简介 About authors

王殿海(1962—),男,教授,博导,从事交通控制研究.orcid.org/0000-0001-6066-2274.E-mail:wangdianhai@zju.edu.cn , E-mail:wangdianhai@zju.edu.cn

摘要

针对城市交通流受信号控制的影响而呈现出间断性、周期性和随机性的特点,提出基于最优汇集时间间隔的城市间断交流预测方法. 该方法首先基于傅里叶变换和自相关分析获取城市间断交通流的信号控制周期,再利用交叉验证均方差模型确定最优汇集时间间隔与信号周期的关系,在此基础上提出融合贝叶斯神经网络和深度学习模型的LSTM-BConv预测模型. 基于实测数据的实验结果表明:1)基于最优汇集时间间隔统计交通流数据能有效提升城市间断交通流预测模型的预测精度;2)城市间断交通流数据的最优汇集时间间隔为交通信号控制周期的倍数;3)对比试验结果表明,LSTM-BConv预测模型优于常见的预测模型,平均绝对百分比误差提升了4.57%. 预测结果可以为信号控制方案的优化提供参考依据.

关键词: 城市间断流 ; 最优汇集时间间隔 ; 信号控制周期 ; 短时交通流预测 ; 贝叶斯卷积神经网络

Abstract

An urban discontinuous traffic flow prediction method based on optimal convergence time interval was proposed, aiming at the discontinuity, periodicity and randomness of urban traffic flow affected by signal control. Firstly, the signal control period of urban discontinuous traffic flow was obtained based on Fourier transform and autocorrelation analysis, and then cross validation mean square error model was used to determine the relationship between optimal convergence time interval and signal period. A LSTM_BConv prediction model combining Bayesian neural network and deep learning model was proposed based on the previous analysis. Experimental results show that: 1) Traffic flow data statistics based on optimal convergence time interval can effectively improve the prediction accuracy of urban discontinuous traffic flow prediction model; 2) The optimal convergence time interval of urban discontinuous traffic flow data is a multiple of the traffic signal control cycle; 3) Comparison test results show that LSTM_BConv model is superior to common benchmark models, and the average absolute percentage error is increased by 4.57%. The prediction results can provide reference for the optimization of signal control scheme.

Keywords: urban interrupted flow ; optimal convergence time interval ; signal control cycle ; short term traffic flow prediction ; Bayesian convolutional neural network

PDF (2168KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王殿海, 谢瑞, 蔡正义. 基于最优汇集时间间隔的城市间断交通流预测. 浙江大学学报(工学版)[J], 2023, 57(8): 1607-1617 doi:10.3785/j.issn.1008-973X.2023.08.013

WANG Dian-hai, XIE Rui, CAI Zheng-yi. Prediction of urban interrupted traffic flow based on optimal convergence time interval. Journal of Zhejiang University(Engineering Science)[J], 2023, 57(8): 1607-1617 doi:10.3785/j.issn.1008-973X.2023.08.013

目前大多数城市短时交通流预测常常将交通流数据汇集成5 、10 、15 min等固定的统计间隔时间序列,采用统计学模型、机器学习模型、深度学习模型预测未来时间段的交通流数据. 基于统计学的模型主要包括:历史平均模型[1]、卡尔曼滤波模型[2-3]和自回归综合移动平均模型[4]等. 例如,王均等[2]以2 min作为采样间隔统计每个检测点的交通流量、速度和占有率,提出利用卡尔曼滤波来预测未来2 min的速度和流量数据. Giraka等[5]将交通流汇集成5 min的时间间隔,建立了季节性自回归综合移动平均模型来进行预测. 基于机器学习的预测模型主要包括支持向量回归[6]、K近邻模型[7]. 傅贵等[6]将交通流汇集成5 min的时间间隔,利用支持向量回归模型进行交通流预测. Cheng等[7]将交通流汇集成5 min的时间间隔,提出自适应时空K最近邻模型. 基于深度学习的预测模型主要利用循环神经网络(recurrent neural networks,RNN)[8]、卷积神经网络(convolutional neural network,CNN)[9-11]和图卷积神经网络(graph convolutional networks,GCN)[12-15]等对交通流进行预测,Zhao等[8]使用单一的长短期记忆网络(long short-term memory,LSTM)模型对15、30、45、60 min的交通流量进行预测. Tang等[12]基于车牌识别记录,将原始数据汇集成5 min的统计间隔时间序列,提出STGGAT模型.

上述各模型在原始交通流数据统计处理时并没有考虑间断流数据的周期性对汇集时间间隔的影响,而是直接选择一个或多个固定的汇集时间间隔,这可能会导致间断交通流时间序列的统计波动. 目前已有学者针对数据的汇集时间间隔对数据结构的影响进行分析. Zellner等[16]通过对计量经济学数据的研究,发现时间聚合会导致较低的预测精度,降低测试的能力,使得模型无法做出短期预测并且降低其发现真实短期数据异常的概率. Rossana等[17]研究了时间聚合对数据的影响,通过对月度、季度、年度数据的研究发现时间聚合通过消除低频变化,导致数据聚合过程中大量信息丢失. Vlahogianni等[18]通过对城市交叉口交通流数据的研究发现,时间聚合会消除交通流数据中的时间变化特征,导致重要性信息丢失,一些线性模型如ARIMA无法捕捉交通流数据中的时间变化特性. 因此,为了最大程度保留交通流数据的重要性信息,在进行预测之前尤其是在对复杂的城市间断流进行预测时,须确定数据的最优汇集时间间隔.

目前关于最优汇集时间间隔的分析主要有交叉验证均方差法[19]、基于图表的统计方法[20]、小波分析法[21]等. Byron等[19]等提出采用交叉验证均方差模型来寻找交通流数据的最优汇集时间间隔,将原始交通流数据汇集成不同的时间间隔,统计交通流的交叉验证均方差,交叉验证均方差最小的汇集时间间隔即为最优汇集时间间隔. 于雷等[22]基于小波分解的方法,通过对智能运输系统(intellgent traffic system,ITS)数据进行分层、相似性分析得出数据的最佳集成度,完成对数据的集成. 陆振波等[23]在传统的交叉验证均方差估计的基础上,利用交通流量、时间平均速度、占有率等3个交通流基本参数,提出改进的基于交通状态矢量的交叉验证均方差模型来估计城市主干道、次干道和支路不同汇集时间间隔交通流数据的波动性,并利用t检验方法寻找交叉验证均方差变化的拐点,以确定最优汇集时间间隔,但论文并没有分析最优汇集时间间隔与信号周期的关系.

针对现有研究的不足,本研究提出基于最优汇集时间间隔的城市间断交通流预测模型,该模型首先基于傅里叶变换(Fourier transform,FT)和自相关性分析估计交叉口的信号控制周期,然后利用交叉验证均方差模型确定交叉口的最优汇集时间间隔,最后基于得到的最优汇集时间间隔统计数据,提出LSTM_BConv交通流预测模型. 该模型采用LSTM来提取交通流的时间变化特性,采用CNN来提取交通流的空间变化特性,采用贝叶斯神经网络的权重分布特性来捕捉交通流的随机性.

1. 交叉口信号控制周期估计与最优汇集时间间隔分析

交通流预测模型中的大多数时间序列都是基于汇集数据,即将交通流原始数据按照一定时间间隔汇集,如求和、平均、加权等处理. 汇集时间间隔是影响交通流统计数据表征交通状况的关键参数,汇集时间间隔过小,会导致交通流数据包含较多的噪声而干扰交通状态的识别,汇集时间过大,则会造成交通流变化的过程被平滑,无法反映交通流时变特性,故在进行预测时选择合适的汇集时间间隔至关重要. 此外,由于交叉口的信号控制的周期性,城市路网中的交通流受到阻断,并表现出间断性特征,如图1所示. 图中,Q为直行交通流量,C为信号控制周期. 因此,在进行城市短时交通流预测时,不能忽略信号控制与汇集时间间隔的影响. 鉴于现有大多数交通流数据集中并未包含信号控制周期数据,本研究提出了一种基于傅里叶变换和自相关性分析获取城市间断交通流信号控制周期的方法,并利用交叉验证均方差模型分析交通流的最优汇集时间间隔.

图 1

图 1   直行交通流随时间的变化图

Fig.1   Change of through traffic flow with time


1.1. 交叉口信号控制周期估计

城市交通流受信号控制的影响呈现出明显的周期性. 在无法获取周期的情况下,须先基于交通流数据进行信号控制周期估计. 傅里叶变换是检测时间序列周期性较常用的一种方法,该方法快速且计算效率高,但在存在多季节性模式时效果不佳. 考虑到所划分的时间段内可能会存在2个或多个信号周期,并且相邻时段的2个信号周期之间存在过渡阶段,本研究综合利用傅里叶变换和自相关性分析方法估计交叉口的信号控制周期.

1.1.1. 傅里叶变换

傅里叶变换是一种将信号从时域转换到频域的变换形式,它能将满足一定条件的某个函数表示成三角函数或者它们积分的线性组合. 在不同的研究领域,傅里叶变换具有多种不同的变体形式,如连续傅里叶变换和离散傅里叶变换.

由于交通流数据并不是连续数据,因此采用离散傅里叶变换(discrete Fourier transform,DFT)来检测交通流数据的信号周期,离散傅里叶变换表达式如下:

$ {\text{ }}F(u) = \sum\limits_{n = 0}^{N - 1} {f(n){\text{exp}}\left( - 2{\text{π j}}{n}u/{N}\right). } $

式中:N表示傅里叶变换的点数, $ u $表示傅里叶变换的第 $ u $个频谱, $ f(n) $为时域函数, $ F(u) $$ f(n) $的傅里叶变换结果.

利用傅里叶变换求交叉口信号周期的具体步骤如下.

1)利用式(1),求解傅里叶变换结果 $ F(u) $.

2)计算步骤1)中傅里叶变换的幅值(amplitude,AMP).

3)获取步骤2)中傅里叶幅值的峰值,幅值越大的区域,周期性越明显.

4)假设峰值出现在 $ u = k $处,对应的频率为 $ k/N $,那么相应的周期为 $ N/k $.

本研究采用离散傅里叶变换前3个峰值对应的周期{T1, T2, T3}(T1T2T3)作为该交叉口的候选信号控制周期,利用自相关性分析确定该交叉口的最终信号控制周期.

1.1.2. 自相关分析

自相关性(auto correlation functions,ACF)指的是同一事件在不同时期的相关程度,当序列存在周期性时,遍历足够多的滞后数Lags,一定可以找到至少一个足够大的自相关系数,而它对应的滞后数就是该序列的周期. 对于检测时序数据的周期来说,只须找到2个自相关系数高于一定阈值的子序列,它们起始时间的差值就是时间序列的周期. 通过分析时间序列与不同滞后数的相关性,可以识别数据的周期性.

1.1.3. 交叉口信号控制周期估计

本研究综合利用离散傅里叶变换和自相关性分析估计交叉口的信号周期,具体步骤如下:首先对交通流进行离散傅里叶变换,选取最大的3个幅值对应的周期{T1T2T3}(T1T2T3)作为候选信号周期,再利用自相关性计算滞后数为[T1−5,T3+5]的自相关性,即在计算自相关性时在最大、最小候选周期范围内波动5个时间序列,选取自相关性最大的滞后项作为最终的信号周期.

1.2. 最优汇集时间间隔分析

统计交通流数据最优汇集时间间隔的本质是分析基于不同汇集时间间隔得到的交通流数据的离散程度,刻画这种度量的理想统计量是方差,因此交叉验证均方差法是较常用的方法. 交叉验证均方差最小时,说明交通流的离散程度最低,交通流的波动性最小,因此交叉验证均方差最小时所对应的汇集时间间隔即为最优汇集时间间隔. 本研究采用交叉验证均方差法对交通控制影响下的城市间断流最优汇集时间间隔进行研究,分析并判断最优汇集时间间隔与信号周期之间的联系.

交叉验证均方差(cross validation mean square error,CVMSE)是指从一组序列中依次取出一个数据,计算剩余数据均值的差值,取差值的二次方,交叉验证重复多次,得到的差值平方和,具体表达式如下:

$ S_n^T = \sum\limits_{m = 1}^{T/t} {{{({q_{mn}} - \overline {q_n^{(m)}} )}^2}} . $

式中: $ S_n^T $表示汇集时间间隔为 $ T $时,第 $ n $组数据序列的交叉验证均方差; $ {q_{mn}} $表示第 $ n $组数据序列内第 $ m $个原始流量数据, $ \overline {q_n^{(m)}} $表示第 $ n $组数据序列内去除第 $ m $个原始流量后的剩余数据的均值, $ t $表示原始数据的统计间隔.

在计算不同时段交通流的CVMSE时,滑动窗口的大小设置为1(如图2所示,假设4个时间序列划分为一组,N为分析时间段的数据总量). 因此,当汇集时间间隔为T时,单位小时的交通流数据的CVMSE表达式如下:

图 2

图 2   交叉验证均方差(CVMSE)计算过程

Fig.2   Calculation process of cross validation mean square error (CVMSE)


$ {S_T} = \sum\limits_{n = 1}^{(3\;600 - T)/t+1} {S_n^T} . $

2. LSTM_BConv预测模型构建

交通流预测旨在利用历史观测到的交通流量数据来预测未来的交通流量变化. 城市交通流会随着时间、空间的变化而变化. 在时间层面上,交通流以某一时间间隔为分界点重复呈现出一定的规律性,例如工作日早晚高峰的交通状况相似;在空间层面上,空间拓扑相连的交通流一般具有相似的变化规律. 此外,在城市信号控制交叉口,同一相位控制下的交通流呈现出较强的相关性,如图3所示. 可以分别利用LSTM[24]网络和CNN网络提取交通流的时间变化特性和空间变化特性来得到这些时空相关性.

图 3

图 3   交叉口不同转向交通流的相关性

Fig.3   Correlation of different turning traffic flow at intersections


城市交通流尤其是短时交通流受信号控制的影响呈现出较大的波动性. 这种波动性可以利用贝叶斯神经网络(Bayesian neural network,BNN)的权重分布特性来捕捉. 在传统神经网络(见图4)中,模型的参数 $ w $是固定的,即存在一个最优的参数 $ {w}^{*} $使得模型的性能最优,而贝叶斯神经网络(见图5)把每个参数均看成是服从均值为 $ \mu $,方差为 $ \sigma $的高斯分布,传统的反向传播神经网络优化的是参数,而贝叶斯神经网络优化的是每个参数的均值和方差[25]. 将贝叶斯神经网络与卷积神经网络(Bayesian convolutional neural network,BConv)结合,而BConv模型对交通流数据进行概率建模并预测的难点在于高效近似概率推断,本研究采用变分推断来模拟交通流数据的真实后验概率分布. 在进行模型训练时,贝叶斯卷积神经网络优化的是每个参数的均值和方差,如图6所示.

图 4

图 4   传统神经网络结构

Fig.4   Traditional neural network structure


图 5

图 5   贝叶斯神经网络结构

Fig.5   Bayesian neural network structure


图 6

图 6   贝叶斯卷积神经网络卷积过程

Fig.6   Convolution process of Bayesian convolution neural network


基于以上分析,本研究提出了一种融合贝叶斯神经网络和深度学习模型的LSTM-BConv预测模型,该模型利用LSTM提取交通流的时间变化特性,利用CNN提取交通流的空间变化特性,BNN提取交通流的不确定性. LSTM-BConv预测模型的框架如图7所示. 该模型将交通流数据分为3个模块,分别提取交通流的临近特性、日周期性和周期性. 对每一模块,利用LSTM网络提取交通流的时间变化特性,利用BConv来获取同一相位交通流之间的相关性和交通流的不确定性.

图 7

图 7   LSTM_BConv预测模型框架

Fig.7   LSTM_ BConv forecasting model framework


本研究在考虑城市交通流间断性、周期性和随机性的基础上,提出基于最优汇集时间间隔的城市间断交通流预测方法,本研究的整体框架图如图8所示.

图 8

图 8   基于最优汇集时间间隔的城市间断交通流预测模型框架图

Fig.8   Framework diagram of urban interrupted traffic flow prediction based on optimal convergence time interval


3. 实验与分析

3.1. 数据集及处理

研究所用数据集为浙江省杭州市萧山区车牌识别数据集,采集时间为2019年4月1日到7月31日共4个月. 原始的车牌识别数据的每条记录包含车辆ID、卡口/电警ID、卡口/电警经纬度、拍摄时间等,对车牌识别数据进行预处理后,统计原始车牌识别数据每5 s通过的交通流量作为最小汇集时间窗,选取市心路与建设四路交叉口(交叉口1)、市心路与皓月路(交叉口2)2个交叉口作为目标交叉口进行研究(见图9). 文中所使用的这2个交叉口为独立交叉口,并不存在上下游关系. 此外,本研究所有研究均是基于车牌识别数据集进行的,并未对传统的固定式车辆检测器采集的集计交通流数据进行验证.

图 9

图 9   目标交叉口真实地理位置分布

Fig.9   Real geographical location distribution of target intersections


3.2. 交叉口的信号控制周期估计

以2019年4月1日—2019年4月7日连续一周早高峰时段07:30—09:30的交通流数据为例,估计交叉口的信号控制周期. 目标交叉口傅里叶变换得到的频谱图如图10所示,选择前3个最大的幅值对应的周期作为候选信号周期,得到2个交叉口的候选信号周期分别为{35, 35, 36}、{23, 24, 25},利用自相关系数法分别计算目标交叉口滞后30~41、18~30阶的相关性,如图11所示. 由图11可知,交叉口1在滞后数为36时相关性最强,交叉口2在滞后数为24时相关性最强,因此目标交叉口在该时间段的信号控制周期分别为180 、120 s.

图 10

图 10   目标交叉口傅里叶变换幅值图

Fig.10   Fourier transform amplitude of target intersection


图 11

图 11   目标交叉口与不同滞后阶数的相关性

Fig.11   Auto correlation of target intersection at different lags


通过实地观测可知,目标交叉口在该时段的信号控制周期分别为180 、120 s,证明了该方法的有效性. 其他时间段的信号控制周期如图12所示.

图 12

图 12   目标交叉口不同时段实际信号控制周期

Fig.12   Actual signal control cycle of target intersection in different periods


3.3. 最优汇集时间间隔统计

以目标交叉口2019年4月1日—2019年4月7日连续7 d的07:30—09:30时间段的交通流数据为例,计算不同转向的CVMSE,结果如图13所示. 如图13(a)所示为交叉口1南进口道直行车流的CVMSE,如图13(b)所示为交叉口2南进口道直行车流的CVMSE. 根据3.2节可知,交叉口1的信号控制周期为180 s,交叉口2的信号控制周期为120 s,故当汇集时间间隔为信号周期的倍数时,交叉口的CVMSE最小,此时交通流波动性较小.

图 13

图 13   目标交叉口不同汇集时间间隔的交叉验证均方差

Fig.13   CVMSE of target intersection at different convergence intervals


3.4. 预测结果分析

3.4.1. 数据处理

在预测时,选择目标交叉口早、晚高峰(07:30—09:30、17:30—19:30)时间段进行研究,将原始数据集分别汇集成1~7 min的统计间隔时间序列,其中80%为训练集,20%为测试集.

3.4.2. 对比基准方法

HA[1]:历史平均法(historical average, HA),是一种较为经典的时间序列预测方法,该模型利用历史数据的平均值来预测未来的数据.

ARIMA[4]差分整合移动平均自回归模型(autoregressive integrated moving average model ,ARIMA),是时间序列预测分析方法之一.

SVR[6]:支持向量回归(support vector regression ,SVR),是另一种经典的时间序列分析模型,它使用线性支持向量机进行回归任务.

KNN[7]:K近邻(K nearest neighbor,KNN)是一种既可用于分类又可用于回归的机器学习算法. 对于给定测试样本,基于距离度量找出训练集中与其最靠近的K个训练样本,然后基于这K个“邻居”的信息来进行预测.

LSTM[8]:长短时记忆网络(long short-term memory,LSTM)是一种特殊的RNNs,可以较好地解决长时依赖问题,是时间序列预测中常用的一种模型.

CapsNet[10]:胶囊网络(capsule network,CapsNet),利用CapsNet网络从交通状态图像中提取高层特征并获取各个节点之间的空间依赖性.

GRU:门控循环单元(gated recurrent unit,GRU),一种特殊的RNN神经网络,也是时间序列预测中常用的一种模型.

STAWnet[11]:时空注意力波网络(spatial-temporal attention wavenet,STAWnet),该模型使用时间卷积捕捉交通流的时间依赖性,使用自注意力网络捕捉不同节点之间的动态空间相关性.

LSTM_BConv:本研究提出的模型,融合贝叶斯神经网络与深度学习模型,同时捕捉交通流的时空特性及随机性.

3.4.3. 评价指标

本研究使用回归预测中常用的3个指标来评估所有基准方法的性能,包括平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error, RMSE)和平均绝对百分比误差(mean absolute percentage error, MAPE). 表达式如下:

$ {\text{MAE}} = \frac{1}{n}\sum\limits_{i = 0}^n {|{y_i} - \overline {{y_i}} } |,{\text{ }} $

$ {\text{RMSE}} = \frac{1}{n}\sum\limits_{i = 0}^n {\sqrt {{{({y_i} - \overline{y_i})}^2}} } {\text{, }} $

$ {\text{MAPE}} = \frac{1}{n}\sum\limits_{i = 0}^n {\left|\frac{{{y_i} - \overline {{y_i}} }}{{{y_i}}} \right|}.{\text{ }} $

式中: $ {y_i} $表示真实值, $ \overline {{y_i}} $表示预测值.

3.4.4. 参数设置

本研究采用单步预测,利用历史时间序列的交通流数据来预测下一个时间序列的交通流数据,其中Xh=5,Xd=1,Xw=1,表示在进行预测时同时考虑与预测时间点相邻的前5个时间序列数据、前一天同一时间点的交通流数据,前一周同一时间点的交通流数据. 在LSTM_BConv模型中,LSTM网络中的隐藏层状态的维数为16,即hidden_size=16,LSTM的堆叠层数设置为1,即layers=1. 在BConv网络中的隐藏层状态的维数设置为16,即hidden_size=16,填充大小设置为1,即padding=1,卷积核大小为3,即kernel_size=3,每个参数的初始值服从均值为0、方差为1的标准正态分布N(0,1).

3.4.5. 预测结果分析

本研究统计了目标交叉口不同转向交通流在不同汇集时间间隔下LSTM_BConv模型的预测结果,如图14所示为交叉口1在早、晚高峰时间段不同汇集时间间隔下LSTM_BConv模型的MAPE预测精度. 结果表明,在大多数情况下,当汇集时间间隔为3 min时,交叉口的MAPE比汇集时间间隔为2、4 min时的MAPE要低,同理,当汇集时间间隔为6 min时,交叉口的MAPE比汇集时间间隔为5 、7 min时的MAPE要低. 由图12可以看出,交叉口1在早、晚高峰时段的信号控制周期为3 min,故当该交叉口的汇集时间间隔为信号控制周期的倍数时,交通流的预测效果最好.

图 14

图 14   交叉口1 LSTM_BConv模型预测精度MAPE

Fig.14   Prediction accuracy MAPE of LSTM_BConv model at intersection 1


图15所示为交叉口2在早、晚高峰时间段不同汇集时间间隔下LSTM_BConv模型的均值绝对百分比误差. 由图12可知,交叉口2在早、晚高峰时间段的信号控制周期为2 min,由图15可知,在大多数情况下,当汇集时间间隔为信号周期的倍数时,该交叉口的预测效果较好. 综合分析图1415可知,基于最优汇集时间间隔统计交通流数据能有效提升城市间断交通流预测模型的预测精度.

图 15

图 15   交叉口2 LSTM_BConv模型预测精度MAPE

Fig.15   Prediction accuracy MAPE of LSTM_BConv model at intersection 2


在交叉口1数据集上对比不同汇集时间间隔对各基准模型预测的影响,结果如图16所示. 可以看出,对于常见的统计学模型、机器学习模型和深度学习模型,当交通流的汇集时间间隔为信号控制周期的倍数时,预测效果均最优,说明基于最优汇集时间间隔统计交通流数据能提升城市间断流预测精度.

图 16

图 16   预测模型在不同汇集时间间隔下的预测MAPE对比

Fig.16   Comparison of prediction MAPE values of prediction model under different collection intervals


表1~3所示分别为交通流汇集时间间隔为一个信号周期时,交叉口1在不同预测模型下的MAE、RMSE和MAPE. 可以看出,与其他常见预测模型相比,LSTM_BConv模型具有最优的预测精度.

表 1   不同预测模型在交叉口1的预测MAE对比

Tab.1  Comparison of MAE predicted by different prediction models at intersection 1

转向 统计学 机器学习 深度学习
HA ARIMA SVR KNN CapsNet GRU STAWnet LSTM_BConv
S_L 3.35 3.97 3.24 3.30 3.36 3.12 3.04 3.06
S_S 7.81 11.35 7.54 8.06 9.87 7.30 7.92 7.23
N_L 3.08 3.53 2.98 3.09 3.01 2.93 2.89 2.87
N_S 9.59 13.75 9.26 9.53 12.43 8.65 9.48 8.61
W_L 3.10 4.25 3.20 3.30 4.05 3.06 3.02 3.01
W_S 1.72 1.92 1.69 1.74 1.81 1.60 1.64 1.58
E_L 2.23 2.26 2.15 2.19 2.14 2.05 2.07 2.03
E_S 3.91 3.87 3.60 3.72 3.69 3.48 3.62 3.41
Mean 4.35 5.61 4.21 4.37 5.05 4.02 4.21 3.98

新窗口打开| 下载CSV


表 2   不同预测模型在交叉口1的预测RMSE对比

Tab.2  Comparison of RMSE predicted by different prediction models at intersection 1

转向 统计学 机器学习 深度学习
HA ARIMA SVR KNN CapsNet GRU STAWnet LSTM_BConv
S_L 4.24 4.91 4.09 4.15 4.21 3.91 3.84 3.82
S_S 10.25 14.24 9.85 10.37 12.20 9.47 10.09 9.36
N_L 3.85 4.37 3.71 3.83 3.71 3.64 3.62 3.57
N_S 12.27 16.74 11.84 12.09 15.04 11.21 12.23 11.19
W_L 3.98 5.26 4.07 4.20 5.16 3.94 3.89 3.88
W_S 2.09 2.39 2.04 2.10 2.17 1.99 2.00 1.94
E_L 2.76 2.83 2.63 2.70 2.62 2.51 2.53 2.48
E_S 4.75 4.80 4.39 4.55 4.49 4.23 4.41 4.17
Mean 5.52 6.94 5.33 5.50 6.20 5.11 5.33 5.05

新窗口打开| 下载CSV


表 3   不同预测模型在交叉口1的预测MAPE对比

Tab.3  Comparison of MAPE predicted by different prediction models at intersection 1

转向 统计学 机器学习 深度学习
HA ARIMA SVR KNN CapsNet GRU STAWnet LSTM_BConv
S_L 26.17 32.36 25.63 26.17 24.09 24.50 24.17 21.61
S_S 15.83 26.23 13.65 14.63 18.63 13.14 14.23 12.67
N_L 32.72 38.89 35.06 36.10 31.72 33.14 34.10 28.45
N_S 19.57 30.61 17.47 17.87 24.16 16.61 17.59 15.54
W_L 29.64 43.02 36.63 38.32 43.90 32.73 34.00 29.18
W_S 41.02 44.29 60.60 64.07 45.96 54.29 39.59 36.88
E_L 36.77 36.24 42.46 44.31 33.03 39.78 42.65 30.56
E_S 31.27 33.64 30.12 31.45 26.99 28.77 30.44 25.34
Mean 29.12 35.66 32.70 34.12 31.06 30.37 29.60 25.03

新窗口打开| 下载CSV


3.4.6. 消融试验设置

为了评估预测模型中各个组件的有效性,以本研究所提出的LSTM_BConv模型为基础,设置了只考虑时间依赖性的LSTM模型、只考虑空间依赖性的CNN模型、同时考虑空间依赖性和交通流随机性的BConv模型,各个模型的参数设置与LSTM_BConv模型保持一致. 各个消融实验在交叉口1的MAPE如图17所示. 可以看出,同时考虑交通流数据的时空依赖性及随机性特征能够提高交通流预测的准确性.

图 17

图 17   消融实验对比结果

Fig.17   Comparison results of ablation experiment


4. 结 语

本研究提出了考虑最优汇集时间间隔的城市间断交流预测方法并基于车牌识别数据进行了验证. 结果表明,在城市信号控制交叉口,当交通流的汇集时间间隔为信号控制周期的倍数时,交通流的交叉验证均方差较小,此时交通流数据的统计波动较小;基于上述统计到的最优汇集时间间隔对城市间断交通流数据进行汇集处理可以有效提升不同预测模型的预测精度;本研究提出的LSTM_BConv预测模型考虑了交通流的时空关联和不确定性,预测结果优于常见的统计学模型、机器学习模型、深度学习模型,提高了预测精度. 预测结果可以为信号控制方案的优化提供参考依据,具有较好的实用性.

本研究以单交叉口不同转向车流的交通流量为对象探讨考虑最优汇集时间间隔的城市间断交流预测,未分析路段速度、密度以及路网级别的交通流量、速度、密度等交通参数是否具有相同的规律. 此外,本研究案例的信号控制方案是多时段控制方案,对于动态、实时变化的信号控制方案的相关研究还须进一步试验验证.

参考文献

郭敏, 肖翔, 蓝金辉

道路交通流短时预测方法综述

[J]. 自动化技术与应用, 2009, 28 (6): 8- 9

DOI:10.3969/j.issn.1003-7241.2009.06.003      [本文引用: 2]

GUO Min, XIAO Xiang, LAN Jin-hui

Summary of short-term prediction methods for road traffic flow

[J]. Automation Technology and Application, 2009, 28 (6): 8- 9

DOI:10.3969/j.issn.1003-7241.2009.06.003      [本文引用: 2]

王均, 关伟

基于Kalman滤波的城市环路交通流短时预测研究

[J]. 交通信息与安全, 2006, 24 (5): 16- 19

DOI:10.3963/j.issn.1674-4861.2006.05.005      [本文引用: 2]

WANG Jun, GUAN Wei

Research on short-term prediction on of urban ring road traffic flow based on Kalman filtering

[J]. Traffic Information and Safety, 2006, 24 (5): 16- 19

DOI:10.3963/j.issn.1674-4861.2006.05.005      [本文引用: 2]

EMAMI A, SARVI M, BAGLOEE S A

Short-term traffic flow prediction based on faded memory Kalman Filter fusing data from connected vehicles and Bluetooth sensors

[J]. Simulation Modelling Practice and Theory, 2020, 102: 1- 17

[本文引用: 1]

KUMAR S V, VANAJAKSHI L

Short-term traffic flow prediction using seasonal ARIMA model with limited input data

[J]. European Transport Research Review, 2015, 7 (3): 1- 9

[本文引用: 2]

GIRAKA O, SELVARAJ V K

Short-term prediction of intersection turning volume using seasonal ARIMA model

[J]. Transportation Letters, 2020, 12 (7): 483- 490

DOI:10.1080/19427867.2019.1645476      [本文引用: 1]

傅贵, 韩国强, 逯峰, 等

基于支持向量回归的短时交通流预模型

[J]. 华南理工大学学报: 自然科学版, 2013, 41 (9): 71- 76

[本文引用: 3]

FU Gui, HAN Guo-qiang, LU Feng, et al

Short term traffic flow prediction model based on support vector machine regression

[J]. Journal of South China University of Technology: Natural Science Edition, 2013, 41 (9): 71- 76

[本文引用: 3]

CHENG S F, LU F, PENG P, et al

Short-term traffic forecasting: an adaptive ST-KNN model that considers spatial heterogeneity

[J]. Computers Environment and Urban Systems, 2018, 71: 186- 198

DOI:10.1016/j.compenvurbsys.2018.05.009      [本文引用: 3]

ZHAO Z, CHEN W H, WU X M, et al

LSTM network: a deep learning approach for short-term traffic forecast

[J]. IET Intelligent Transport Systems, 2017, 11 (2): 68- 75

DOI:10.1049/iet-its.2016.0208      [本文引用: 3]

殷齐, 丁飞, 朱跃, 等

基于CNN与多尺度特征融合城市交通流预测模型

[J]. 计算机技术与发展, 2022, 32 (10): 175- 181

DOI:10.3969/j.issn.1673-629X.2022.10.029      [本文引用: 1]

YIN Qi, DING Fei, ZHU Yue, et al

An urban traffic flow prediction model based on CNN and Multi-scale feature fusion

[J]. Computer Technology and Development, 2022, 32 (10): 175- 181

DOI:10.3969/j.issn.1673-629X.2022.10.029      [本文引用: 1]

KIM Y, WANG P, ZHU Y F, et al. A capsule network for traffic speed prediction in complex road networks [C]// 2018 Sensor Data Fusion: Trends, Solutions, Applications (SDF). Bonn: IEEE, 2018: 1–6

[本文引用: 1]

TIAN C Y, CHAN W K

Spatial-temporal attention wavenet: a deep learning framework for traffic prediction considering spatial-temporal dependencies

[J]. IET Intelligent Transport Systems, 2021, 1 (4): 549- 561

[本文引用: 2]

TANG J J, ZENG J

Spatiotemporal gated graph attention. network for urban traffic flow prediction based on license plate recognition data

[J]. Computer-aided Civil and Infrastructure Engineering, 2022, 37: 3- 23

DOI:10.1111/mice.12688      [本文引用: 2]

路佳玲, 魏志成, 田多. 基于时空图卷积网络的城市交通流预测模型 [J]. 武汉理工大学学报: 交通科学与版, 2023, 47(2): 234–238.

LU Jia-ling, WEI Zhi-cheng, TIAN Duo. Urban traffic flow prediction model based on spatio-temporal graph convolutional network [J]. Journal of Wuhan University of Technology: Transportation Science and Engineering, 2023, 47(2): 234–238.

LI F X, FENG J, YAN H, et al. Dynamic graph convolutional recurrent network for traffic prediction: benchmark and solution [EB/OL]. [2021-05-03]. https://arxiv.org/abs/2104.14917v2.

ZHENG C P, FAN X L, WANG C, et al

GMAN: a graph multi-attention network for traffic prediction

[J]. Association for the Advancement of Artificial Intelligence, 2020, 34 (1): 1234- 1241

[本文引用: 1]

ZELLNER A, MONTMARQUETTE C

A study of some aspects of temporal aggregation problems in econometric analyses

[J]. The Review of Economics and Statistics, 1971, 53 (4): 335- 342

DOI:10.2307/1928734      [本文引用: 1]

ROSSANA R J, SEATER J J

Temporal aggregation and economic time series

[J]. Journal of Business and Economic Statistics, 1995, 13: 441- 451

[本文引用: 1]

VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C

Statistical methods for detecting nonlinearity and nonstationarity in univariate short-term time-series of traffic volume

[J]. Transportation Research Part C, 2006, 14 (5): 351- 367

DOI:10.1016/j.trc.2006.09.002      [本文引用: 1]

BYRON J, SHAWN M T, WILLIAM L E, et al. Intelligent transportation system data archiving: statistical techniques for determining optimal aggregation widths for inductance loop detectors[J]. Transportation Research Record, 2000: 85-93.

[本文引用: 2]

PARK D, RILETT L R, GAJEWSKI B J, et al

Identifying optimal data aggregation interval sizes for link and corridor travel time estimation and forecasting

[J]. Transportation, 2009, 36 (1): 77- 95

DOI:10.1007/s11116-008-9180-x      [本文引用: 1]

SMITH B L, ULMER J M

Freeway traffic flow rate measurement: investigation into impact of measurement time interval

[J]. Journal of Transportation Engineering, 2003, 129 (3): 223- 229

DOI:10.1061/(ASCE)0733-947X(2003)129:3(223)      [本文引用: 1]

于雷, 陈旭梅, 耿彦斌, 等

基于小波分解的智能交通系统数据集成方法

[J]. 清华大学学报: 自然科学版, 2004, 44 (6): 793- 796

[本文引用: 1]

YU Lei, CHEN Xu-mei, GENG Yan-bin, et al

Data integration method of intelligent transportation system based on wavenet decomposition

[J]. Journal of Tsinghua University: Natural Science Edition, 2004, 44 (6): 793- 796

[本文引用: 1]

陆振波, 夏井新, 焦恬恬, 等

城市道路交通流监测数据最优汇集时间间隔分析

[J]. 东南大学学报: 自然科学版, 2012, 42 (5): 1000- 1005

[本文引用: 1]

LU Zhen-bo, XIA Jing-xin, JIAO Tian-tian, et al

Analysis of optimal collection time interval of urban road traffic flow monitoring data

[J]. Journal of Southeast University: Natural Scienc Edition, 2012, 42 (5): 1000- 1005

[本文引用: 1]

HOCHREITER S, SCHMIDHUBER J

Long short-term memory

[J]. Neural Computation, 1997, 9 (8): 1735- 1780

DOI:10.1162/neco.1997.9.8.1735      [本文引用: 1]

GOAN E, FOOKES C. Bayesian neural networks: an intro- duction and survey[G]// Case studies in applied bayesian data science. Charm: Springer, 2020: 45-87.

[本文引用: 1]

/