基于图卷积神经网络的城市交通态势预测算法
Urban traffic flow prediction algorithm based on graph convolutional neural networks
通讯作者:
收稿日期: 2020-01-3
Received: 2020-01-3
作者简介 About authors
闫旭(1997—),女,硕士生,从事智能交通系统研究.orcid.org/0000-0001-6072-069X.E-mail:
为了实时准确地预测城市交通流量,提高城市交通态势感知和预测准确度,提出一种改进的时空图卷积深度神经网络算法:基于自由流动可达矩阵的时空图卷积深度神经网络(FAST-GCN). 利用图卷积神经网络有效表达城市复杂路网的结构特性,引入自由流动可达矩阵来挖掘复杂路网的时空依赖性,从而提高交通态势预测准确度;对交通流速及站点地理位置数据进行数据预处理;在现有的时空图卷积深度神经网络算法的基础上,增加基于自由流动可达矩阵的图卷积模块,以有效挖掘城市交通路网的独特空间特征;通过一个全连接的输出层输出交通流预测结果;在真实世界数据集PeMS上对算法效果进行验证. 结果表明,采用提出的FAST-GCN算法能够有效获取交通路网独特的物理特性,从而捕获交通数据的时空依赖性,优于时空图卷积(STGCN)等基线算法,其在45 min的预测准确率最好可提高5.656%;相比基线模型,所提算法能够适应大规模路网的交通流预测,且具有可扩展性.
关键词:
An improved spatio-temporal graph convolutional networks traffic prediction algorithm, named free-flow reachable matrix-based spatio-temporal graph convolutional networks (FAST-GCN), was proposed, in order to predict real-time traffic flows accurately and improve the sensing and prediction of citywide traffic situation. The characteristics of urban complex road network structure were expressed effectively by the graph convolutional neural network, and the spatio-temporal dependency in complex road networks was explored by introducing free-flow reachable matrices. Thus the accuracy of traffic situation prediction was improved. First, preprocess traffic speeds and sensors location data. Second, with the existing spatio-temporal graph convolutional networks, the graph convolution module based on free flow reachable matrix was integrated to effectively capture the unique spatial characteristics of the urban traffic road networks. Finally, the prediction results were generated through a fully connected output layer. The proposed model was evaluated on a real-world traffic dataset PeMS. The experimental results show that this model could capture physical characteristics of road network and spatio-temporal dependency, and outperform the baselines such as spatio-temporal graph convolutional networks (STGCN), and the prediction accuracy in 45 minutes was improved by up to 5.656%. In addition, compared with baselines, the proposed model can adapt to traffic flow prediction in large-scale road networks and has superior scalability.
Keywords:
本文引用格式
闫旭, 范晓亮, 郑传潘, 臧彧, 王程, 程明, 陈龙彪.
YAN Xu, FAN Xiao-liang, ZHENG Chuan-pan, ZANG Yu, WANG Cheng, CHENG Ming, CHEN Long-biao.
为了解决交通拥堵与交通事故、城市敏感区的人群聚集风险以及发生自然灾害后的人群出行等一系列交通问题,世界各国研究者纷纷对智能交通系统(intelligent transportation system,ITS)展开了研究. ITS的核心是交通控制与诱导系统,而实现交通控制与诱导系统的核心工作是实时准确地进行交通流预测,即有效地融合历史交通规律和实时交通数据来预测城市交通系统的运行态势[1].
精准地感知和预测城市交通态势是ITS领域的一项重要内容[2-3],相关研究工作对缓解交通拥堵、减少交通事故及预防人群异常聚集事件等均具有重要应用价值. 现今的交通态势感知和预测研究主要面临以下挑战. 1)交通数据的复杂时空依赖性导致交通态势预测面临实时性困难. 随着时间变化,2个不同地点的空间相关性亦发生变化. 例如,从工作日到周末:在工作日,家庭住所与公司的相关性较强;而在周末,家庭住所与公司的相关性较弱. 此外,对于相同的2个地点,不同时段的时间相关性并不是线性的,即与当前时段最相关的很可能是距离该时段很远的时段. 例如,工作日早高峰时段与其前后平峰时段的相关性较弱,而往往与工作日晚高峰时段的时间相关性更强. 2)交通流量感知设备采集的数据存在缺失、错误等问题. 当前道路状况检测的检测设备(如环形感应线圈、雷达、摄像头等)[4-6]已经可以获得较高准确度的交通状况数据,但仍存在使用寿命有限及设备故障等问题. 此外,对于检测设备自身的信息(如传感器的邻接信息等)部分,相关数据也难以完全统计.
为了有效应对上述挑战,本文提出一种改进的时空图卷积深度神经网络算法,基于自由流动可达矩阵的时空图卷积深度神经网络(free-flow reachable matrix-based spatio-temporal graph convolutional networks,FAST-GCN). 一方面利用图卷积神经网络有效表达城市复杂路网结构的特性,另一方面引入自由流动可达矩阵来挖掘复杂路网的时空依赖性,从而有效提高交通态势预测准确度. 首先,对交通流速及站点地理位置数据进行数据预处理,清理交通流速数据并根据地理位置数据计算自由流动可达矩阵. 其次,在现有的时空图卷积深度神经网络算法的基础上,增加基于自由流动可达矩阵的图卷积模块,以有效挖掘城市交通路网的独特空间特征. 最后,通过一个全连接的输出层输出交通流预测结果.
1. 相关工作
1.1. 早期交通流预测算法
交通流预测是ITS最具挑战性的问题之一,其目标为根据给定的一系列历史观测数据对接下来一段时间的交通状况进行预测.
交通流预测方法主要分为2类,分别是动态建模方法和数据挖掘方法. 动态建模方法主要使用数学工具与物理方法,模拟交通系统的动态变化,从而生成预测交通流的公式[7]. 数据挖掘方法主要是在交通状况的历史数据中挖掘数据规律,从而对未来的数据走势进行预判. 数据挖掘方法受到更多的关注,逐渐发展成为交通流预测的主流方法.
将深度信念网络(deep belief nets,DBN)应用至交通流预测[11],能够有效挖掘交通数据的高维特征,从而一定程度地降低预测误差,但其难以从输入数据中提取具体的时空特征. 循环神经网络(recurrent neural network,RNN)、长短期记忆网络(long short-term memory,LSTM)[12]以及门控循环单元(gated recurrent unit,GRU)[13]等基于RNN的模型能够为相邻时刻的交通数据建立联系,并通过门控等方式保存记忆,以学得交通流序列的长期依赖关系,因而在交通流预测问题上表现出强大的优势与潜力[14]. 然而这些模型只能从噪声中捕捉复杂的时间特征,并不能够模拟真实世界中的交通路网空间结构. 为了进一步捕捉空间特征,Ma等[15-16]使用卷积神经网络(CNN)[17]学习交通路网的空间结构. 然而,传统的CNN更适合用于捕捉欧拉数据的空间关系,交通路网属于图结构的非欧拉数据,因此使用CNN学习空间特征并不是学习交通路网结构的最优方法. 可见,早期的交通流预测算法存在局限性,早期算法大多结合基于RNN的模型与基于CNN的模型,将二者分别用于捕捉交通数据的时空特征,然而,基于CNN的方法并不完全适用于捕获图结构的路网空间特征.于捕获图结构的路网空间特征.
可见,早期的交通流预测算法存在局限性,早期算法大多结合基于RNN的模型与基于CNN的模型,将两者分别用于捕捉交通数据的时空特征,然而,基于CNN的方法并不完全适用于捕获图结构的路网空间特征.
1.2. 基于图神经网络的交通流预测算法
利用GCN进行图卷积的方法主要有2类. 第一类方法为图谱卷积,即利用图谱理论,通过设计基于图拉普拉斯矩阵的图谱滤波器完成卷积. Li等[20]融合图谱卷积、Seq2seq体系与预定抽样等技术捕捉交通流的时空依赖性,获得了较高的预测准确率,但时间复杂度较高. Yu等[21]将2个捕捉时间特征的门控卷积层与1个捕捉空间特征的图谱图卷积层结合,组装成时空卷积块进行交通流预测,打造了准确率更高的模型并降低了时间复杂度. 虽然两者均将卷积应用于图结构数据以捕获图的空间特征并取得了良好的效果,但图谱卷积不能完全适应交通网络的物理特性. 第二类图卷积方法是直接在图上定义卷积,从邻居结点中获取信息. Cui等[22]使用自由流动速度计算自由流动可达矩阵,结合关系矩阵、邻接矩阵与自流矩阵,构造图卷积核捕获交通路网的物理特性. 然而,这种方法要求数据集提供传感器的邻接信息,对数据集信息的要求过多,缺乏普适性.
以上研究在有效捕获交通数据的时空依赖性以及充分利用城市复杂路网的特性这两方面均存在不足. 因此,本文提出一种改进的时空图卷积深度神经网络算法,一方面利用图卷积神经网络能够有效表达城市复杂路网结构的特性,另一方面引入自由流动可达矩阵来挖掘复杂路网的时空依赖性,从而有效提高交通态势预测准确度.
2. 理论基础
2.1. 交通流预测问题定义
交通流预测是典型的时间序列预测问题,即,给定
式中:
由于交通流预测为结构化时间序列预测,将图结构应用于交通网络,即在图上定义交通路网. 本文定义交通网络为
2.2. 基于自由流动矩阵的图卷积
2.2.1. 自由流动矩阵
为了定义图卷积,首先在图上定义邻接矩阵
为了展示更清晰的邻居关系,为每个结点
式中:
式中:
考虑真实交通路网中车辆的物理特性,某路段对相邻路段的影响与当前交通状况、路段特征、驾驶员性格和车辆特征均相关,结点
式中:
其中,
2.2.2. 图谱卷积
图谱卷积(spectral graph convolution,SGC)[28]为基于图的拉普拉斯算子的傅里叶域中的卷积运算,定义如下:
式中:
式中:
Defferrard等[29]提出了局部图谱卷积(localized spectral graph convolution,LSGC),其使用多项式滤波器,定义如下:
式中:
此处,Yu等[21]提出的STGCN算法所使用的图卷积方法为LSGC,所用多项式
2.2.3. 与图谱卷积的区别
基于自由流动可达矩阵的非图谱卷积FAST-GC与SGC和LSGC的区别与联系如表1所示. 与LSGC相比,在参数数量与时间复杂度2个方面,FAST-GC的参数更多,但由于图卷积的时间复杂度均来源于矩阵乘法,三者的时间复杂度相同. 在是否能够提取空间特征这一方面,SGC由于没有限制滤波器的空间,不能提取局部特征;LSGC通过k阶多项式,将卷积限制在一个以k为半径的球空间内,能够提取k阶局部特征;FAST-GC结合了自由流动可达矩阵Fm,提取m阶局部特征,同时可以表示交通路网的物理特性. 在提取路网物理特性这一维度,FAST-GC优于LSGC. 综上,提出的基于自由流动矩阵的非图谱卷积在交通流预测方面优于SGC与LSGC.
表 1 FAST-GC、SGC与LSGC的性质比较
Tab.1
模型 | 定义公式 | 参数数量 | 时间复杂度 |
FAST-GC | | | |
SGC | | N | |
LSGC | | K | |
3. FAST-GCN算法
3.1. 算法框架
图 1
图 1 基于自由流动可达矩阵的时空图卷积深度神经网络(FAST-GCN)算法总体框架
Fig.1 Overall framework of free-flow reachable matrix-based spatio-temporal graph convolutional networks (FAST-GCN) algorithm
式中:
3.2. 空间特征提取模块
式中:
3.3. 时间特征提取模块
式中:
3.4. 预测模块
整个时空卷积块的计算公式如下:
式中:
为了获得预测结果,将时空卷积模块与输出层连接,如图1(a)所示. 其中,输出层由1个门控卷积神经网络、1个卷积神经网络和1个全连接层连接组成.
3.5. 算法伪代码
算法一:基于自由流动可达矩阵的时空图卷积算法
输入:
输出:FAST-GCN训练模型。
1. 根据第4.3.4节设置模型训练参数
2. 输入数据标准化
3. 将交通流速数据按7∶2∶1划分成训练集、测试集和验证集
4.
5. For每个epoch:
6.
7.
8. 计算损失函数,更新模型参数
9. 保存模型
10. Functionst_conv (
11. 时间门控卷积层:激活函数=GLU
12. 空间图卷积层:激活函数=ReLU
13. 时间门控卷积层:激活函数=ReLU
14. Function output_ful (
15. 时间门控卷积层:激活函数=GLU
16. 时间门控卷积层:激活函数=Sigmoid.
4. 实验设计与验证
4.1. 数据集描述
PeMS项目[6]在加利福尼亚州主要大城市的州际公路上部署了超过39 000个传感器站点,由Caltrans绩效测量系统(PeMS)实时收集数据. 本文所用数据为PeMS项目从2012年5月至同年6月在加利福尼亚州第7区(D7区)以5 min为时间间隔获取的站点流速数据集,共有80 619 552条数据. 同时,该数据集还包括每个站点的地理位置信息,共4 589条数据. 因此,数据可分为两部分:交通流速数据和站点地理位置数据. 本文在D7区随机选择一个包括181个站点的小型数据集和一个包括1 045个站点的大型数据集,分别命名为PeMSD7(S)和PeMSD7(L).
4.2. 数据预处理
交通流速数据的预处理步骤如下:1)提取交通流速数据;2)清理交通流速数据,即将数据字段均为空值且存在数据异常的站点剔除;3)使用线性插值方法填充缺失数据;4)使用z-score方法对交通流速数据进行标准化处理并筛选站点,生成PeMSD7(S)与PeMSD7(L)两个数据集,并将每个数据集的工作日数据与周末数据分开作为数据输入.
站点地理位置数据的预处理步骤如下:1)提取站点地理位置数据. 2)利用站点地理位置数据中的经纬度,计算2个数据集各自的近似路网距离矩阵D. 3)参照式(4),计算2个数据集各自的自由流动可达矩阵
4.3. 实验设置
4.3.1. 实验环境
本实验使用Python 3.6.7基于TensorFlow 1.9.0 实现,实验的编译和测试均在Linux服务器上进行,服务器配置信息如下:CPU为Intel(R) Xeon(R) CPU @ 2.30 GHz,GPU为Tesla T4,内存为15 079 MB,操作系统为Ubuntu 18.04.2.
4.3.2. 评价指标
本研究引入3个评价指标:平均绝对误差(mean absolute error,MAE)、平均绝对百分误差(mean absolute percentage error,MAPE)和均方根误差(rooted mean square error,RMSE).
4.3.3. 基线模型
4.3.4. 参数设置
本文算法在进行多次调参的对比实验后,最终确定的实验参数设置如下:所有CNN卷积核数量均为1,时空卷积块中的第1个时间门控卷积网络输入通道数量为1,输出通道数量为32,激励函数为
模型输入的历史时间窗格为60 min,即有12个交通流速数据观测值(p=12),预测的未来时间窗格为15、30、45 min,即有3、6、9个交通流速数据观测值(q=3, 6, 9).
4.4. 实验结果和分析
4.4.1. 模型确定
图 2
图 2 基于PEMSD7(S)周末数据的FAST-GC中不同阶数下的训练模型的平均绝对误差比较
Fig.2 MAE comparison of FAST-GC with different orders based on data on weekends of PEMSD7(S)
图 3
图 3 基于PEMSD7(S)周末数据的FAST-GC中不同阶数下的训练效率比较
Fig.3 Training efficiency comparison of FAST-GC with different orders based on data on weekends of PEMSD7(S)
观察图2与3发现,当
4.4.2. 实验结果和分析讨论
(1)FAST-GCN的预测精确度分析.
观察表2、3的实验结果(加粗部分)可知,FAST-GCN算法的准确率在所有评价指标上远优于经典算法ARIMA、SVR、CNN和LSTM;FAST-GCN算法的预测准确率较STGCN有了明显的提升,其在15、30和45 min的预测准确率比STGCN分别提高了2.524%、4.413%和5.656%. 分别观察模型在短时预测与中、长时预测的实验结果,发现在短时交通流预测(15 min)上,FAST-GCN的预测效果均优于STGCN;在中、长时交通流预测(即30和45 min)方面,FAST-GCN的部分指标略低于STGCN,主要原因是中、长时交通流预测存在显著的扰动因素(如:交通事故)及误差累积等问题,因此,中、长时交通流预测结果的参考价值有限.
表 2 基于PEMSD7(S)和PEMSD7(L)的工作日数据采用不同方法训练模型的交通流预测准确度结果
Tab.2
算法 | MAE(15/30/45 min) | MAPE(15/30/45 min) | RMSE(15/30/45 min) | |||||
PeMSD7(S) | PeMSD7(L) | PeMSD7(S) | PeMSD7(L) | PeMSD7(S) | PeMSD7(L) | |||
ARIMA | 3.635/4.069/4.462 | 3.398/3.793/4.147 | 9.486/10.438/11.302 | 8.703/9.553/10.338 | 8.594/9.158/9.704 | 8.133/8.632/9.131 | ||
SVR | 4.026/4.628/5.090 | 3.830/4.433/4.864 | 12.373/13.992/15.193 | 11.873/13.272/14.264 | 8.605/9.388/10.007 | 8.344/9.142/9.709 | ||
CNN | 3.256/3.721/3.876 | 3.292/3.417/3.436 | 7.995/9.350/10.084 | 8.182/8.652/8.814 | 5.618/6.524/6.858 | 5.928/6.254/6.294 | ||
LSTM | 3.091/3.240/3.383 | 3.202/3.238/3.289 | 7.510/7.925/8.315 | 8.037/8.132/8.258 | 5.742/6.124/6.473 | 6.088/6.171/6.283 | ||
STGCN | 1.878/2.564/3.052 | 1.742/2.434/2.953 | 4.359/6.233/7.560 | 4.095/5.842/7.043 | 3.839/5.440/6.454 | 3.669/5.293/6.410 | ||
FFR-STGCN | 1.842/2.574/3.094 | 1.745/2.387/2.850 | 4.306/6.279/7.731 | 4.098/5.828/6.999 | 3.780/5.391/6.460 | 3.631/5.130/6.092 |
表 3 基于PEMSD7(S)和PEMSD7(L)的周末数据采用不同方法训练模型的交通流预测准确度结果
Tab.3
算法 | MAE(15/30/45 min) | MAPE(15/30/45 min) | RMSE(15/30/45 min) | |||||
PeMSD7(L) | PeMSD7(S) | PeMSD7(L) | PeMSD7(L) | PeMSD7(S) | PeMSD7(L) | |||
ARIMA | 2.511/2.778/3.019 | 2.124/2.350/2.546 | 5.773/6.285/6.761 | 4.824/5.259/5.646 | 6.498/6.861/7.212 | 5.768/6.075/6.361 | ||
SVR | 4.157/4.562/4.825 | 3.536/3.890/4.135 | 11.289/12.053/12.542 | 8.832/9.442/9.862 | 8.984/9.395/9.662 | 7.829/8.239/8.516 | ||
CNN | 3.502/3.863/3.976 | 2.863/2.930/3.093 | 8.040/9.133/9.663 | 6.652/6.807/7.295 | 6.506/7.391/7.694 | 5.727/5.887/6.216 | ||
LSTM | 3.254/3.359/3.457 | 2.743/2.753/2.768 | 7.522/7.794/8.036 | 6.373/6.417/6.478 | 6.460/6.725/6.958 | 5.854/5.900/5.960 | ||
STGCN | 1.530/2.122/2.527 | 1.322/1.759/2.057 | 3.185/4.577/5.486 | 2.896/4.077/4.787 | 3.249/4.691/5.569 | 3.006/4.271/5.011 | ||
FFR-STGCN | 1.486/2.045/2.428 | 1.310/1.741/2.029 | 3.108/4.469/5.339 | 2.855/4.119/4.919 | 3.167/4.484/5.254 | 2.992/4.214/4.891 |
(2)FAST-GCN的可扩展性分析.
4.4.3. 训练效率分析
比较STGCN与FAST-GCN的训练效率. 观察记录模型训练过程中每轮的训练时间,STGCN每轮的训练时间为8.526 s,FAST-GCN为5.554 s,FAST-GCN比STGCN降低了34.858%. 总体上,FAST-GCN训练效率更高. 因此,FAST-GCN在训练效率上优于STGCN.
5. 结 语
本研究针对城市交通态势预测问题,提出了一种改进的时空图卷积深度神经网络(FAST-GCN)算法. 该算法在现有的时空图卷积算法中,引入了自由流动可达矩阵,有效挖掘出交通路网独特的物理特性与复杂路网的时空依赖性. 本研究在PeMS数据集上开展了大规模的实验和验证工作,结果表明,相比于其他经典算法,FAST-GCN在预测准确度、路网规模的可扩展性以及训练效率方面均具有一定优势,所提模型预测准确率在15、30和45 min的预测上,最多比STGCN提高了2.524%、4.413%和5.656%,并且在PeMSD7(L)(1 045个站点)上的预测准确率高于在PeMSD7(S)(181个站点)上的预测准确率. 此外,由于模块的缩减,每轮的训练时间也缩减了34.858%.
未来改进工作主要如下:一是继续探索如何改善深度学习算法的可解释性,并尝试发现模型具有良好预测准确度的因果关系;二是将本文模型扩展到其他时空数据场景,如:水资源消耗、空气质量预测等.
参考文献
交通流预测方法综述
[J].DOI:10.3969/j.issn.1002-0268.2004.03.022 [本文引用: 1]
Overview of traffic flow prediction methods
[J].DOI:10.3969/j.issn.1002-0268.2004.03.022 [本文引用: 1]
智慧城市中的大数据
[J].
Big data in smart cities
[J].
城市智能交通系统的发展现状与趋势
[J].
Development status and trends of urban intelligent transportation systems
[J].
Robust vehicle tracking algorithm for nighttime videos captured by fixed cameras in highly reflective environments
[J].
Freeway performance measurement system: mining loop detector data
[J].
ARMA models and the Box–Jenkins methodology
[J].
Short-term prediction of traffic volume in urban arterials
[J].
A tutorial on support vector regression
[J].
Deep architecture for traffic flow prediction: Deep belief networks with multitask learning
[J].DOI:10.1109/TITS.2014.2311123 [本文引用: 1]
Long short-term memory
[J].DOI:10.1162/neco.1997.9.8.1735 [本文引用: 2]
Backpropagation applied to handwritten zip code recognition
[J].
Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction
[J].
The graph neural network model
[J].
Traffic graph convolutional recurrent neural network: A deep learning framework for network-scale traffic learning and forecasting
[J].
The emerging field of signal processing on graphs: Extending high-dimensional data analysis to networks and other irregular domains
[J].DOI:10.1109/MSP.2012.2235192 [本文引用: 1]
/
〈 |
|
〉 |
