浙江大学学报(工学版), 2022, 56(7): 1394-1403 doi: 10.3785/j.issn.1008-973X.2022.07.015

土木工程、水利工程、交通工程

基于时空融合图卷积的交通流数据修复方法

侯越,, 韩成艳, 郑鑫, 邓志远

兰州交通大学 电子与信息工程学院,甘肃 兰州 730070

Traffic flow data repair method based on spatial-temporal fusion graph convolution

HOU Yue,, HAN Cheng-yan, ZHENG Xin, DENG Zhi-yuan

School of Electronics and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China

收稿日期: 2021-10-25  

基金资助: 国家自然科学基金资助项目(62063014);甘肃省自然基金资助项目(20JR5RA407);甘肃省教育科技创新项目(2021CYZC-04);兰州交通大学“百名青年优秀人才培养计划”基金资助项目(1520220227)

Received: 2021-10-25  

Fund supported: 国家自然科学基金资助项目(62063014);甘肃省自然基金资助项目(20JR5RA407);甘肃省教育科技创新项目(2021CYZC-04);兰州交通大学“百名青年优秀人才培养计划”基金资助项目(1520220227)

作者简介 About authors

侯越(1979—),女,教授,从事交通大数据挖掘、神经网络的研究.orcid.org/0000-0002-8289-329X.E-mail:houyue@mail.lzjtu.cn , E-mail:houyue@mail.lzjtu.cn

摘要

为了解决现有时空相关修复法挖掘交通流特性不充分的问题,提出基于时空融合图卷积网络的缺失数据修复方法. 该方法在分析交通流时空特性的基础上,采用2类函数分别计算交通流数据的时间自相关系数和空间关联度系数. 将交通检测器的部署位置作为节点构成几何拓扑图,通过线性融合规则构建时空融合矩阵,替代图卷积输入层的邻接矩阵,捕获交通流细粒化的时空关系. 利用轻量级一维卷积层学习多通道时序向量的时间特征,加快模型的收敛速度. 利用图卷积层学习交通流数据的空间特征,构建时空融合图卷积网络修复模型. 实验结果表明,与其他修复方法相比,该方法在多检测器场景中的修复精度和模型收敛速度均有所提升,可以有效地修复交通流缺失数据.

关键词: 交通工程 ; 时空融合 ; 交通流数据修复 ; 图卷积网络 ; 一维卷积

Abstract

A missing data repair method based on spatio-temporal fusion graph convolutional network was proposed in order to solve the problem of insufficient traffic flow characteristics mining by existing spatio-temporal correlation repair method. Two types of functions were used to respectively calculate the temporal autocorrelation coefficient and spatial correlation coefficient of traffic flow data by analyzing the spatio-temporal characteristics of traffic flow. The deployment position of the traffic detector was used as a node to form a geometric topology graph, and a spatio-temporal fusion matrix was constructed by linear fusion rules, which replaced the adjacency matrix of the graph convolution input layer to capture the fine-grained spatio-temporal relationship of the traffic flow. The lightweight one-dimensional convolution layer was used to learn the temporal characteristics of multi-channel time series vectors in order to speed up the convergence speed of the model. The graph convolutional layer was used to learn the spatial characteristics of traffic flow data. A spatio-temporal fusion graph convolution network repair model was constructed. The experimental results show that the repair accuracy and model convergence speed of the method in multi-detector scenarios were improved compared with other repair methods, which can effectively repair the missing traffic flow data.

Keywords: traffic engineering ; spatio-temporal fusion ; traffic flow data repair ; graph convolutional network ; one-dimensional convolution

PDF (2624KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

侯越, 韩成艳, 郑鑫, 邓志远. 基于时空融合图卷积的交通流数据修复方法. 浙江大学学报(工学版)[J], 2022, 56(7): 1394-1403 doi:10.3785/j.issn.1008-973X.2022.07.015

HOU Yue, HAN Cheng-yan, ZHENG Xin, DENG Zhi-yuan. Traffic flow data repair method based on spatial-temporal fusion graph convolution. Journal of Zhejiang University(Engineering Science)[J], 2022, 56(7): 1394-1403 doi:10.3785/j.issn.1008-973X.2022.07.015

受交通检测器自身故障、通讯异常及外部环境等一系列不确定因素的影响,采集的交通数据会出现不同程度的缺失问题. 交通数据质量决定后续数据分析与预测的准确性,影响交管部门对交通运行状况的合理诱导,因此有效的修复方法对交通数据的处理极其必要.

交通流数据缺失类型有完全随机缺失、随机缺失及非随机缺失[1]. 对于前2类缺失模式,主要有插补修复法和预测修复法. 前者常在限定时间范围内根据相邻点估计待插补点,该方法对插补点及相邻点间的关联关系考虑不足[1-4]. 后者以历史数据及其关联性为依据修复缺失值,主要方法有时间相关、空间相关和时空相关修复法. 时间相关修复法通过挖掘交通流时序规律,修复缺失数据[5-7]. 空间相关修复法依据不同位置检测器的数据,修复缺失值[8-10]. 单一的时间、空间修复法无法体现交通流完整的时空特性,目前该领域以时空相关修复法为研究热点. 陆百川等[11]建立神经网络模型,学习交通流时空关系,预测缺失值. 王薇等[12]依据3D形函数插值理论,利用交通流时空特性修复缺失值. 鉴于图卷积网络在空间特征提取方面的优势,Wang等[13]将路网结构嵌入图卷积层,捕获图节点间的空间关系. 张伟斌等[14]以路段为节点构建图序列,利用图卷积层提取相邻车道间的空间关系. 上述方法虽然较有效地修复了缺失数据,但对交通流潜在的时空关系刻画欠充分,如交通流时间自相关性、路网节点间的权连接关系.

本文提出时空融合图卷积网络(spatio-temporal fusion graph convolutional network,STF_GCN),修复交通流缺失数据. STF_GCN分别采用自相关函数和关联函数,计算交通流时间自相关系数和空间关联度系数. 依据交通检测器的部署位置构建拓扑图,将拓扑图与关联系数构成的时间、空间矩阵进行融合,得到时空融合矩阵,用时空融合矩阵替代图卷积层的邻接矩阵,挖掘交通流细粒化的时空关系. 模型利用轻量级一维卷积学习原始多通道时序向量的时间特征,利用图卷积层,将时间特征和时空融合矩阵进行特征级融合,通过全连接得到缺失点的预测修复值.

1. 交通流时空特性分析

1.1. 交通流时间自相关性分析

交通流的时序特性主要表现为同一路段的交通流数据按照一定的趋势随时间变化[15]. 一方面,历史时刻的交通状态与当前时刻的交通状态具有自相关特性;另一方面,居民行程的规律性使得交通流变化趋势呈现一定程度的相似性和周期性. 对于检测器 $ i $采集的交通流序列 ${{\boldsymbol{X}}_{{i}}}$在历史时刻和当前时刻的交通状态 $ (X_i^{t - h},X_i^t) $,可以用自相关函数 $ r $表示自相关程度:

$ r(X_i^{t - h},X_i^t) = \frac{{\displaystyle\sum\nolimits_{t = 1}^{T - h} {(X_i^{t - h} - \mu )(X_i^t - \mu )} }}{{\displaystyle\sum\nolimits_{t = 1}^T {{{(X_i^{t - h} - \mu )}^2}} }} .$

式中: $ X_i^{t - h} $$ {X_i}^t $分别为断面检测器 $ i $$ t - h $$ t $时刻的交通状态; $ h $为时间间隔阶数; $ T $$ \mu $分别为交通流序列 ${{\boldsymbol{X}}_{{i}}}$的序列长度和序列平均值; $ r $越大,说明交通流数据的自相关程度越高. 对于检测器 $ i $在不同工作日 $ A、B $的交通流序列 $({{\boldsymbol{A}}_{{i}}}{{,}}{{{{\boldsymbol{B}}}}_{{i}}})$,可以用关联函数R表示两者间的关联关系:

$ \begin{split} R\left( {{{\boldsymbol{A}}_{{i}}}{{,}}{{\boldsymbol{B}}_{{i}}}} \right) = \frac{{{{\rm{cov}}} \left( {{{\boldsymbol{A}}_{{i}}}{{,}}{{\boldsymbol{B}}_{{i}}}} \right)}}{{\sqrt {{{\rm{var}}} \left( {{{\boldsymbol{A}}_{{i}}}} \right){{\rm{var}}} \left( {{{\boldsymbol{B}}_{{i}}}} \right)} }} = \\ \frac{{\displaystyle\sum\nolimits_{t = 1}^T {\left( {A_i^t - {{\bar A}_i}} \right)} \left( {B_i^t - {{\bar B}_i}} \right)}}{{\sqrt {{{\displaystyle\sum\nolimits_{t = 1}^T {{{\left( {A_i^t - {{\bar A}_i}} \right)}^2}\displaystyle\sum\nolimits_{t = 1}^T {\left( {B_i^t - {{\bar B}_i}} \right)} } }^2}} }} . \end{split}$

式中: ${{\rm{cov}}} \left( {{{\boldsymbol{A}}_{{i}}}{{,}}{{\boldsymbol{B}}_{{i}}}} \right)$为序列 ${\boldsymbol{A}}_{i}、{\boldsymbol{B}}_{i}$之间的协方差, $\mathrm{var} \left({{\boldsymbol{A}}}_{{{i}}}\right)、 \mathrm{var}\left({{\boldsymbol{B}}}_{{{i}}}\right)$分别为 ${{\boldsymbol{A}}_{{i}}}$${{\boldsymbol{B}}_{{i}}}$的方差; $i(i = 1,2, \cdots ,m)$为检测器编号; $ T $为时间序列长度. $R\left( {{{\boldsymbol{A}}_{{i}}}{{,}}{{\boldsymbol{B}}_{{i}}}} \right)$越大,说明 ${{\boldsymbol{A}}_{{i}}}$${{\boldsymbol{B}}_{{i}}}$之间的关联度越大. 通常情况下, $ \left|r\right|、 \left|R\right|=0 $表示变量间完全不相关, $\left|r\right|、\left|R\right|=1.0$表示变量间完全相关, $ 0 < \left|r\right|、\left|R\right| < 1.0 $表示变量间的相关关系度量, $ \left|r\right|、\left|R\right| < 0.3 $时为低度相关, $0.3\leqslant \left|r\right|、\left|R\right|\leqslant 0.8$时为中度相关, $ \left|r\right|、\left|R\right| > 0.8 $时为高度相关[16].

以PeMS08数据集中检测器detect_0采集的交通流数据为研究对象,选取该检测器某一周工作日的流量序列进行时间自相关性分析. 如图1所示为交通流量随时间的关系图. 图中, ${F_{\rm{f}}}$为交通检测器采集的流量数据; $ t $为时间片,以5 min为时间间隔. 从图1可知,同一检测器每天的流量变化趋势呈明显的早晚高峰特点,每个工作日间的交通流序列呈一定的周期性和相似性.

图 1

图 1   detect_0工作日交通流量的时间相关性分析

Fig.1   Time correlation analysis of traffic flow of detect_0 in working days


依据式(1)、(2)分别计算每个工作日流量序列的时间关联关系,结果如表12所示. 从表1可知,每个工作日历史时刻与下一时刻断面流量的自相关程度大于80%,属于高度相关,即当前时刻的交通状态对历史时刻的交通状态依赖性强. 从表2可知,每个工作日间的断面流量呈不同程度的中高度相关.

表 1   detect_0工作日交通流量的自相关性分析结果

Tab.1  Autocorrelation analysis results of traffic flow of detect_0 on working days

检测器 $ r $ 检测器 $r $
detect_0 0.87 detect_3 0.88
detect_1 0.88 detect_4 0.86
detect_2 0.85

新窗口打开| 下载CSV


表 2   detect_0工作日交通流量的相关性分析结果

Tab.2  Correlation analysis results of traffic flow of detect_0 on working days

时间点 周一 周二 周三 周四 周五
周一 1.00 0.90 0.66 0.75 0.77
周二 0.90 1.00 0.41 0.50 0.53
周三 0.66 0.41 1.00 0.90 0.89
周四 0.75 0.50 0.90 1.00 0.97
周五 0.77 0.53 0.89 0.97 1.00

新窗口打开| 下载CSV


1.2. 交通流空间权连接特性分析

交通流数据的空间关联性不仅表现为不同路段、相同路段上的不同检测器或上下游与研究路段间基本的空间位置关系,而且表现为路网节点的空间权连接关系. 现有研究大多通过表示节点间基本连接状态的邻接矩阵描述交通流的空间特性,较少考虑路网节点间的权连接关系[17],节点间的权连接是量化交通流空间内部特性的重要手段,因此以交通检测器的部署位置为节点,通过关联函数量化节点间的几何关联关系,挖掘交通流细粒化的空间特性.

选取PeMS08数据集中任意5个检测器的流量数据,开展空间权连接特性分析. 如图2所示为这5个检测器的流量序列随时间变化的趋势图. 从图2可知,不同检测器间的流量变化趋势存在一定程度的相似性.

图 2

图 2   多检测器交通流量空间关联性分析

Fig.2   Spatial correlation analysis of traffic flow of multi-detector


依据式(2)计算检测器 $i、j$的流量序列 ${{\boldsymbol{X}}}_{{{i}}}、{{\boldsymbol{X}}}_{{{j}}}$间的关联程度. 从表3可知,检测器detect_0、detect_3间交通流数据的关联度大于90%,检测器detect_1、detect_2、detect_4间的交通流数据呈80%左右的高度相关. 基于交通检测器的部署拓扑图,将关联函数计算得到的关联度系数作为权重,量化拓扑图中节点间的几何关联关系. 依据权重,结合邻居检测器的交通流填充目标检测器的缺失数据.

表 3   多检测器交通流量的空间关联度系数

Tab.3  Spatial correlation coefficient of traffic flow of multi-detector

检测器 detect_0 detect_1 detect_2 detect_3 detect_4
detect_0 1.00 0.85 0.78 0.94 0.85
detect_1 0.85 1.00 0.87 0.87 0.93
detect_2 0.78 0.87 1.00 0.81 0.85
detect_3 0.94 0.87 0.81 1.00 0.86
detect_4 0.85 0.93 0.85 0.86 1.00

新窗口打开| 下载CSV


为了充分刻画交通流细粒化的时空关系,图3结合交通流时空特性及交通检测器的部署位置,构建时空融合权连接关系图. 图中,节点 $ {v_i}(i = 1, 2, \cdots , m) $表示交通检测器 $ i $,图节点历史时刻交通状态对当前时刻交通状态的影响用自相关函数量化,刻画交通流的时间自相关特性;图节点间基本的几何关联关系用空间关联函数量化,刻画交通流的空间内部特性. 从图3可知,节点 $ {v_1} $的交通流不仅受当前 $ t $时刻邻居节点 $ {v_2},{v_3}, \cdots ,{v_5} $交通流的影响,还受 $ t - 1 $时刻邻居节点及自身节点交通状态的影响. 图中, $ {r_1} $表示节点 $ {v_1} $历史时刻与当前时刻交通流数据间的关联程度, ${R_{1,2}}、{R_{1,3}}$表示邻居节点 ${v_2}、{v_3}$与节点 $ {v_1} $间交通流数据的空间权连接关系. 从图3可知,单纯依赖时间或空间不能准确地描述交通流真实状态,因此综合考虑交通流数据的时间自相关特性和路网节点的空间权连接特性,挖掘交通流潜在的细粒化时空关系,修复交通流的缺失数据.

图 3

图 3   时空融合权连接关系图

Fig.3   Connection diagram of spatial-temporal fusion weight


2. 时空融合图卷积网络修复模型

区别于传统的图卷积网络,将多检测器节点的时空序列组织为图结构数据,构建可提取细粒化时空特性的时空融合图卷积网络修复模型STF_GCN. 考虑到图卷积网络(graph convolutional network, GCN)共享节点信息的特性会导致模型训练过程中易出现节点特征丢失的问题[18],图卷积中表示节点间连接状态的邻接矩阵仅能反映交通流最基本的空间位置关系,因此模型采用关联函数分别计算交通流时空维度的关联系数,构建时空融合矩阵,替代GCN的邻接矩阵,学习交通流细粒化的时空关系. 由于图卷积在处理多节点交通流序列时花费的时间代价较高,一维卷积网络(one-dimensional convolutional neural network,1D-CNN)被广泛应用于提取时序数据的关联信息,训练速度比循环神经网络更快[19].模型构建时在主要组件图卷积网络的前端加入一维卷积层,在数据降维的同时,保证了多节点交通流数据的细粒化时空特征提取,以满足实际场景中数据修复任务的精度和实时性要求.

2.1. 时空融合矩阵

为了描述交通流时间特性和空间特性所刻画的内在关联关系,依据图3时空融合权连接关系图的结构,通过线性融合规则构建时空融合矩阵 ${\boldsymbol{F}} \in {{{\bf{R}}}^{m \times m}}$,学习交通流数据的内部时空关系,提升缺失数据的修复精度. 利用自相关函数 $r({{\boldsymbol{X}}_i})$和关联函数 $R({{\boldsymbol{X}}_i},{{\boldsymbol{X}}_j})$,对多个检测器采集到的交通流数据进行时空关联分析,分别得到由时空维度相关系数构成的时间相关矩阵 ${\boldsymbol{T}} \in {{{\bf{R}}}^{m \times m}}$和空间相关矩阵 ${\boldsymbol{S}} \in {{{{\bf{R}}}}^{m \times m}}$,定义如下:

$ {\boldsymbol{T}} = \left[ {\begin{array}{*{20}{c}} {r\left( {{{{{\boldsymbol{X}}}}_1}} \right)}&{}&{}&{}&{} \\ {}& \ddots &{}&{{\boldsymbol{0}}}&{} \\ {}&{}&{r\left( {{{{{\boldsymbol{X}}}}_i}} \right)}&{}&{} \\ {}&{{\boldsymbol{0}}}&{}& \ddots &{} \\ {}&{}&{}&{}&{r\left( {{{\boldsymbol{X}}_m}} \right)} \end{array}} \right]. $

式中: $r\left( {{{\boldsymbol{X}}_i}} \right)$ $ \left( {i = 1,2, \cdots ,m} \right) $为检测器 $ i $采集的交通流数据在时间层面的自相关系数.

$ {\boldsymbol{S}} = \left[ {\begin{array}{*{20}{c}} {R\left( {{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_1}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_j}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_m}} \right)} \\ \vdots & & \vdots & & \vdots \\ {R\left( {{{\boldsymbol{X}}_i},{{\boldsymbol{X}}_1}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_i},{{\boldsymbol{X}}_j}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_i},{{\boldsymbol{X}}_m}} \right)} \\ \vdots & & \vdots & & \vdots \\ {R\left( {{{\boldsymbol{X}}_m},{{\boldsymbol{X}}_1}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_m},{{\boldsymbol{X}}_j}} \right)}& \cdots &{R\left( {{{\boldsymbol{X}}_m},{{\boldsymbol{X}}_m}} \right)} \end{array}} \right]. $

式中: $R({{\boldsymbol{X}}_i},{{{{\boldsymbol{X}}}}_j})$为检测器 $i、j\left(i、j=1,2,\cdots ,m\right)$采集的交通流序列XiXj在空间层面的关联度系数. 利用下式聚合空间相关矩阵 ${\boldsymbol{S}}$和检测器部署拓扑图的邻接矩阵 $\tilde{\boldsymbol{A}}$,得到描述路网节点间权连接关系的空间相关矩阵 $\tilde {\boldsymbol{S}}$.

$ {\tilde{\boldsymbol{S}}} = {\boldsymbol{S}} \odot {\tilde{\boldsymbol A}} . $

式中: $ \odot $表示哈达玛积, ${\tilde{\boldsymbol A}}$为加入了各节点自身连接关系的邻接矩阵,1表示节点间有连接,0表示节点间无连接. 时空融合矩阵 ${\boldsymbol{F}} \in {{{{\bf{R}}}}^{m \times m}}$定义为

$ {{{\boldsymbol{F}} = {\tilde {\boldsymbol{S}}} - {\boldsymbol{I}} + {\boldsymbol{T}}}}. $

式中:矩阵 ${\boldsymbol{I}}$为以检测器个数 $ m $为阶数的单位矩阵, ${\boldsymbol{I}} \in {{{{\bf{R}}}}^{m \times m}}$. 式(6)通过各类矩阵间的分量级线性运算融合规则,利用节点间的空间权连接关系 ${\tilde{\boldsymbol S}}$和自身的时间自相关关系 ${\boldsymbol{T}}$得到量化的时空融合矩阵 ${\boldsymbol{F}}$,用 ${\boldsymbol{F}}$替代传统图卷积网络中的邻接矩阵,达到挖掘数据层面细粒化时空关系的目的.

2.2. STF_GCN修复模型

在时间层面上,交通流数据表现为随时间变化的一维向量. 提取时间特征传统的方法有循环神经网络(recurrent neural network, RNN)、长短时记忆神经网络(long-short term memory, LSTM)及变体,虽然RNN、LSTM及变体的时间特征提取模型在时序数据上表现良好,但模型训练所需要的时间复杂度较高,而一维卷积组件具有局部感知、权值共享、平移不变三方面的优势,可以大大缩减模型训练的参数量,使其在不改变输入数据结构的前提下,减少数据冗余,提取关键的时间变化特征,以降维的方式提高模型的训练效率. 1D-CNN网络结构如图4所示.

图 4

图 4   1D-CNN网络结构图

Fig.4   Structure diagram of 1D-CNN network


$ t $时刻下检测器 $ i $待修复的交通流数据为 $ x_i^t $图4中,输入时序数据 ${\boldsymbol{X}}_{{i}}^{{t},{H}}$为检测器 $ i\left( {i = 1,2, \cdots ,m} \right) $$ H $个时间片内采集的历史交通流时序向量, $ H $为对应 $ t $时刻下输入时序数据的序列长度. 输入多检测器的交通流时序向量可以表示为

$ {\boldsymbol{X}}_1^{t,H} = \left[ {x_1^{t - H},x_1^{t - H + 1}, \cdots ,x_1^{t - 1}} \right], $

$ {\boldsymbol{X}}_2^{t,H} = \left[ {x_2^{t{{ - }}H},x_2^{t - H + 1}, \cdots ,x_2^{t - 1}} \right], $

$ {\boldsymbol{X}}_m^{t,H} = \left[ {x_m^{t - H},x_m^{t - H + 1}, \cdots ,x_m^{t - 1}} \right] .$

$ H $个时间片内检测器 $ i $的历史交通流时序向量 ${\boldsymbol{X}}_{{i}}^{{t},{H}}$输入到1D-CNN网络结构中,与大小为 $ \left( {c,1 \times k} \right) $的卷积核进行卷积操作. 其中, $ c $为通道数,与文中的检测器个数一致; $ k $为卷积核大小. 卷积核均沿着时间序列增加的方向移动,移动步长定义为1. 经过一系列的卷积操作之后,1D-CNN可以学习到各个检测器交通流数据的时间特征,输出含有时间依赖特性的交通流数据 ${{\hat {\boldsymbol{X}}}}_{{i}}^{{t},{H}}$,卷积的计算过程为

$ {{\hat {\boldsymbol{X}}}}_{{i}}^{t,H} = f\left( {{{\boldsymbol{W}}^{(l)}} \cdot {\boldsymbol{X}}_{{i}}^{{t,H}} + {{\boldsymbol{b}}^{(l)}}} \right) .$

式中:·表示点积运算, $ f $为非线性激活函数, ${{\boldsymbol{W}}^{(l)}}$为第 $ l $层的卷积核权重, ${{\boldsymbol{b}}^{(l)}}$为第 $ l $层的偏置向量.

在空间层面上,提取空间特征的传统方法CNN无法处理欧式空间之外的非欧式空间数据,图卷积神经网络能够同时对节点特征信息与图结构信息进行端到端的学习,是对图数据进行处理建模的很好选择[20-21]. 目前,利用图卷积神经网络进行图卷积的方法主要有以下2类:第1类方法为图谱卷积,利用图谱理论,通过设计基于图拉普拉斯矩阵的图谱滤波器完成卷积;第2类方法是直接在图上定义卷积,从邻居结点中获取信息[22-23]. 传统的图卷积网络计算过程如下:

$ {{\boldsymbol{H}}^{\left( {{{l + 1}}} \right)}}{\text{ = }}\sigma ({\tilde{\boldsymbol A}}{{\boldsymbol{H}}^{\left( {{l}} \right)}}{{\boldsymbol{W}}^{\left( {{l}} \right)}}) ,$

$ {{\tilde {\boldsymbol{A}} = {\boldsymbol{A}} + {\boldsymbol{I}}}} .$

式中: $ \sigma $为激活函数; ${{\boldsymbol{H}}^{\left( {{l}} \right)}}$为节点在 $ l $层的特征向量; ${{\boldsymbol{W}}^{\left( {{l}} \right)}}$为第 $ l $层卷积的参数矩阵; ${\boldsymbol{A}}$为节点间连接状态的邻接矩阵; ${\boldsymbol{I}}$为单位阵; ${{\tilde {\boldsymbol{A}}}}$为加入节点自身连接状态后的邻接矩阵. 利用图卷积神经网络处理图结构数据的优势,采用第2类方法在路段检测器的部署拓扑图上定义卷积捕获交通流数据的空间特征信息. 用 $ {v_i} $表示检测器 $ i\left( {i = 1,2, \cdots ,m} \right) $的图节点,构建空间拓扑图 $ G $. 空间拓扑图 $ G $反映了路网中基本的空间位置关系,即节点间的连接关系. 图 $ G $定义为 $G = \left({{{{\boldsymbol{V}},{\boldsymbol{E}},{\boldsymbol{W}}}}} \right)$,其中 ${\boldsymbol{V}} \in {{{{\bf{R}}}}^m}$为节点集合,即路段中部署的检测器个数; ${\boldsymbol{E}} \in {{{{\bf{R}}}}^m}$为节点间边的集合; ${\boldsymbol{W}} \in {{{{\bf{R}}}}^{m \times m}}$为待学习的权重参数矩阵. 时空融合图卷积修复模型的框架如图5所示.

图 5

图 5   STF_GCN修复模型的框架图

Fig.5   Frame diagram of STF_GCN repair model


图5中,GCN的输入层包括2个部分:1D-CNN输出的含有时间特征信息的交通流数据 ${\hat{\boldsymbol X}}_{{i}}^{{t,H}}$和构建的时空融合矩阵 ${\boldsymbol{F}}$. 经一系列卷积操作之后,GCN输出 $ H $个时间段内具有时空特征的交通流向量 ${\tilde{\boldsymbol X}}_{{i}}^{{t,H}}$,经全连接层(fully connected layer, FC)输出检测器 $ i $$ t $时刻的交通流数据 $ x_i^t $. 其中卷积操作定义为

$ {\tilde{\boldsymbol X}}_{{i}}^{{t,H}} = \sigma \left( {{\boldsymbol{F}}{{{\hat {{{{\boldsymbol{X}}}}}}}}_{{i}}^{{t,H}}{\boldsymbol{W}}} \right) .$

式中: $\sigma$为非线性激活函数; ${\boldsymbol{W}}$为可学习的权重参数矩阵;与式(11)中的邻接矩阵 ${\tilde{\boldsymbol A}}$相比, ${\boldsymbol{F}}$分别利用自相关函数和关联函数量化了图节点的自身关联度及不同节点间的空间关联度,通过路网间的权连接充分挖掘交通流细粒化时空特性; ${\hat{\boldsymbol X}}_{{i}}^{{t,H}}$为经过1D-CNN提取到的具有时间特征的交通流数据,即式(11)中的输入特征向量 ${{\boldsymbol{H}}^{\left( {{l}} \right)}}$,则经STF_GCN模型修复的交通流缺失数据为

$ x_i^t = f\left( {{\hat{\boldsymbol W}}}{{{\tilde {\boldsymbol{X}}}}_{{i}}^{{t,H}} + b} \right) . $

式中: $f$为全连接层的激活函数, $\hat{{\boldsymbol{W}}}、b$分别为全连接层待学习的权重矩阵和偏置. 全连接层最终输出检测器 $ i $$ t $时刻的预测修复值 $ x_i^t $.

3. 实验验证

3.1. 数据集描述

以2016年7月至8月收集于San Bernaridino的PeMS08公共数据集为研究对象,PeMS08数据集共有170个检测器,采集的时间间隔为5 min,即1小时有12个时间片,可以将一天24小时划分为288个时间片,共计17 856个时间片,数据缺失比率为0.696%,属于连续时间序列中的部分随机缺失情况. 提出的STF_GCN模型可以修复连续时间序列上的任何缺失点数据,各个缺失点的修复相互独立. 实验以6∶2∶2的比例将数据集划分为训练集、验证集和测试集,其中验证集用来评价模型的泛化能力. 利用最大最小归一化,将交通流数据归一化为[0, 1.0]. 模型使用Adam优化器和均方损失函数,训练轮数ep为100,学习率lr和批次大小bt的设置如表4所示. 从表4可知,当lr = l0−3bt = 64时,模型效果最优. 针对连续交通流数据中的随机缺失情况,将一小时12个时间片下的历史交通流作为输入时序向量,预测修复下一个时间片的交通流量,构建STF_GCN模型修复检测器 $ i $的交通流量缺失值.

表 4   STF_GCN模型参数

Tab.4  STF_ GCN model parameters

lr bt MAE RMSE
8×l0−4 32 31.517 35.689
8×l0−4 64 25.926 30.926
8×l0−4 128 25.935 32.121
l0−3 32 30.438 34.633
l0−3 64 24.981 29.952
l0−3 128 26.505 32.489
1.2×l0−3 32 25.542 31.490
1.2×l0−3 64 25.520 30.561
1.2×l0−3 128 25.542 31.490

新窗口打开| 下载CSV


3.2. 结果分析

利用2.1节的时空融合矩阵构建方法,分别计算路网检测器的时间自相关系数和空间关联度系数. 依据检测器的部署位置构建拓扑图,得到邻接矩阵 ${\tilde{\boldsymbol A}}$;基于邻接矩阵 ${\tilde{\boldsymbol A}}$、时间相关矩阵 ${\boldsymbol{T}}$和空间相关矩阵 ${\tilde{\boldsymbol S}}$,得到时空融合矩阵 ${\boldsymbol{F}}$.表5所示为PeMS08数据集中路网检测器的时空融合矩阵关联度分析结果.

表 5   时空融合矩阵的关联度分析结果

Tab.5  Correlation analysis results of spatial-temporal fusion matrix

检测器 detect_0 detect_1 detect_2 ··· detect_m-1 detect_m
detect_0 0.8742 0 0 ··· 0 0
detect_1 0 0.8827 0.8712 ··· 0 0
detect_2 0 0 0.8523 ··· 0 0
$\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $
detect_m-1 0 0 0 ··· 0.8677 0
detect_m 0 0 0 ··· 0 0.7901

新窗口打开| 下载CSV


选取图卷积网络(GCN)修复模型、基于拉普拉斯矩阵的图卷积网络(LGCN)修复模型、基于时空相关的1D-CNN_GCN修复模型、基于时空相关的LSTM_GCN修复模型,与本文所提的修复模型进行对比. LGCN将归一化的拉普拉斯矩阵作为GCN的输入. 1D-CNN_GCN修复模型将1D-CNN学习到的时间特征与拓扑图 $ G $的邻接矩阵 ${\tilde{\boldsymbol A}}$作为GCN的输入,邻接矩阵 ${\tilde{\boldsymbol A}} \in {{{{\bf{R}}}}^{m \times m}}$

$ \tilde {\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} 1&0&0& \cdots &0 \\ 0&1&1& \cdots &0 \\ 0&0&1& \cdots &0 \\ \vdots & \vdots & \vdots & & \vdots \\ 0&0&0& \cdots &1 \end{array}} \right] .$

GCN在地理位置相关的空间特征提取方面具有优势,常用于非欧空间的特征提取[24]. LSTM能够有效地解决时间特征提取过程中梯度消失的问题,常用于提取时间特征. LSTM和GCN的组合(LSTM_GCN)可以有效地挖掘交通流数据的时空特性[25],选取LSTM_GCN作为实验对比的模型之一.

为了验证本文模型的性能,选择平均绝对值误差(MAE)和均方根误差(RMSE)作为评价指标,验证模型的修复效果. MAE反映模型修复值与真实值间的绝对误差平均值,RMSE反映模型修复值与真实值间的偏离程度,即两者残差的标准偏差. 计算表达式如下:

$ {\rm{MAE}} = \frac{1}{T}\displaystyle\sum\nolimits_{t = 1}^T {\left| {{{\hat y}_t} - {y_t}} \right|} ,$

$ {\rm{RMSE}} = \sqrt {\frac{1}{T}\displaystyle\sum\nolimits_{t = 1}^T {{{\left( {{{\hat y}_t} - {y_t}} \right)}^2}} } .$

式中: $ {\hat y_t} $为模型修复的流量值, $ {y_t} $为流量真实值, $ T $为检测器采集到的交通流量序列长度.

以PeMS08数据集中的部分检测器detect_28、detect_50、detect_55、detect_62为例,说明模型的修复效果. 如图6所示为不同修复方法在多个检测器上的修复结果. 为了更清晰地展示修复效果,随机选取4个检测器中连续300个时间片的修复流量值,与真实值进行可视化对比. 图6中, ${{S}}$为所选取流量序列的数据序号.

图 6

图 6   不同方法在多个检测器上的修复结果

Fig.6   Repair results of different methods on multiple detectors


图6可以看出,比较不同方法修复的交通流量值与真实值间的偏离程度可知,偏离程度最小的是STF_GCN修复模型. LSTM_GCN修复模型在高峰期的修复流量值和真实值间的偏离程度比其他模型大,高峰时段LGCN修复模型在多个检测器上的修复误差高于GCN,在低峰时段的修复误差低于GCN修复模型. 1D-CNN_GCN模型的修复效果在整体上优于GCN和LGCN修复模型.

图7所示为多个检测器经不同方法修复的流量值与真实值间的平均绝对值误差和均方根误差. 如表6所示为PeMS08数据集中部分检测器在不同修复方法中的误差对比结果以及PeMS08所有检测器在不同修复模型下的平均MAE、RMSE.

图 7

图 7   不同方法在多个检测器上的修复误差对比

Fig.7   Comparison of repair errors of different methods on multiple detectors


图7可知,STF_GCN修复方法在多检测器场景中的修复精度和稳定性均优于其他方法. 从表6可知,经修复的detect_28、detect_50、detect_55、detect_62检测器的MAE分别为12.38、8.61、12.89、4.30,RMSE分别为14.77、10.74、16.08、5.36. STF_GCN修复模型在PeMS08数据集中的平均MAE和RMSE均低于其他修复模型, MAE和RMSE分别为24.98、29.95. 单一的空间相关修复模型GCN、LGCN虽然不是最优,但能够粗略地预测个别检测器的部分缺失流量. 交通流数据的本质是时间序列,单纯考虑空间相关的修复方法忽略了交通流数据的时序规律. 从整体上看,时空相关修复模型1D-CNN_GCN和LSTM_GCN的修复效果均优于GCN、LGCN,但MAE和RMSE值均高于STF_GCN. 1D-CNN_GCN和LSTM_GCN中表示节点间连接关系的邻接矩阵 ${\tilde{\boldsymbol A}}$仅能学习到交通流数据中基本的空间位置关系,对交通流时空特性的挖掘不充分.

STF_GCN通过线性融合规则建立的时空融合矩阵可以避免GCN训练过程中出现节点特征丢失的问题,捕获交通流更细粒化的时空特性. STF_GCN使用轻量级1D-CNN学习多通道时序向量的时间特征,使用GCN学习交通流数据的空间特征,可以保证在充分挖掘交通流时空特性的同时加快模型收敛速度. 如表7所示为不同修复模型收敛速度的测试结果. 表中,tc为模型计算时间. 可以看出,STF_GCN模型收敛最快. 1D-CNN_GCN模型的收敛速度与STF_GCN相当,但MAE和RMSE均高于STF_GCN. LSTM_GCN的时间复杂度最高,约为STF_GCN的3倍,与LSTM_GCN相比,所提的STF_GCN模型可以通过多通道时序向量降维的方式,加快模型的收敛速度.

表 6   不同方法的修复误差对比

Tab.6  Comparison of repair errors of different methods

检测器 GCN LGCN 1D-CNN_GCN LSTM_GCN STF_GCN
MAE RMSE MAE RMSE MAE RMSE MAE RMSE MAE RMSE
detect_28 19.42 21.97 18.26 20.93 17.46 20.56 19.54 22.13 12.38 14.77
detect_50 11.54 13.59 11.31 13.27 13.16 15.11 12.29 14.47 8.61 10.74
detect_55 17.50 20.58 17.12 20.05 19.76 22.7 18.45 21.72 12.89 16.08
detect_62 5.80 6.84 5.69 6.66 6.65 7.63 6.17 7.26 4.30 5.36
$\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $
PeMS08 26.77 31.69 28.38 33.40 28.72 33.85 25.65 30.52 24.98 29.95

新窗口打开| 下载CSV


表 7   模型收敛速度的对比

Tab.7  Comparison of convergence speed of model s

模型 tc 模型 tc
GCN 207.6 LSTM_GCN 589.1
LCGN 191.3 STF_GCN 162.3
ID-GNN_GCN 162.6

新窗口打开| 下载CSV


4. 结 语

为了解决时空修复法挖掘交通流时空信息粗粒化的问题,本文提出基于时空融合图卷积网络的交通流缺失数据修复模型STF_GCN. 该模型结合多检测器的部署位置建立空间拓扑图,通过线性融合规则构建时空融合矩阵,作为图卷积层的邻接矩阵. 在提取多节点交通流时间自相关性的同时挖掘图节点的空间权连接信息,利用轻量级一维卷积学习多通道时序向量的时间特征,减少后续输入GCN的参数量. 利用图卷积学习交通流数据的空间特征,在满足精度要求的前提下达到加快模型收敛速度的目的. 经实验例证分析可知,相较于其他修复法,STF_GCN在多检测器场景中的修复精度和模型收敛速度均优于其他方法,可以为交管部门后续的控制决策相关工作提供较可靠的数据保障. 限于计算量的原因,本文暂未考虑复杂路网和数据波动程度大的交通流缺失情况,未来将进一步探索多车道、多数据场景路网间的数据修复问题.

参考文献

TANG J, ZHANG G, WANG Y, et al

A hybrid approach to integrate fuzzy C-means based imputation method with genetic algorithm for missing traffic volume data estimation

[J]. Transportation Research Part C: Emerging Technologies, 2015, 51: 29- 40

DOI:10.1016/j.trc.2014.11.003      [本文引用: 2]

QU L, ZHANG Y, HU J, et al. A BPCA based missing value imputing method for traffic flow volume data [C]//2008 IEEE Intelligent Vehicles Symposium. Netherlands: IEEE, 2008: 985-990.

QU L, LI L, ZHANG Y, et al

PPCA-based missing data imputation for traffic flow volume: a systematical approach

[J]. IEEE Transactions on Intelligent Transportation Systems, 2009, 10 (3): 512- 522

DOI:10.1109/TITS.2009.2026312     

陆文琦, 周天, 谷远利, 等

基于张量分解理论的车道级交通流数据修复算法

[J]. 吉林大学学报: 工学版, 2021, 51 (5): 1708- 1715

[本文引用: 1]

LU Wen-qi, ZHOU Tian, GU Yuan-li, et al

Lane-level traffic flow data restoration algorithm based on tensor decomposition theory

[J]. Journal of Jilin University: Engineering and Technology Edition, 2021, 51 (5): 1708- 1715

[本文引用: 1]

陆化普, 屈闻聪, 孙智源

基于S-G滤波的交通流故障数据识别与修复算法

[J]. 土木工程学报, 2015, 48 (5): 123- 128

[本文引用: 1]

LU Hua-pu, QU Wen-cong, SUN Zhi-yuan

Traffic flow fault data identification and repair algorithm based on S-G filtering

[J]. Journal of Civil Engineering, 2015, 48 (5): 123- 128

[本文引用: 1]

邵毅明, 甘元艺, 侯雨彤, 等

基于交通流数据修复的GA-RF方法研究

[J]. 重庆理工大学学报:自然科学, 2021, 35 (6): 29- 36

SHAO Yi-ming, GAN Yuan-yi, HOU Yu-tong, et al

Research on GA-RF method based on traffic flow data restoration

[J]. Journal of Chongqing University of Technology: Natural Science, 2021, 35 (6): 29- 36

姜桂艳, 冮龙晖, 张晓东, 等

动态交通数据故障识别与修复方法

[J]. 交通运输工程学报, 2004, (1): 121- 125

DOI:10.3321/j.issn:1671-1637.2004.01.030      [本文引用: 1]

JIANG Gui-yan, YU long-hui, ZHANG Xiao-dong, et al

Fault identification and repair methods of dynamic traffic data

[J]. Journal of Transportation Engineering, 2004, (1): 121- 125

DOI:10.3321/j.issn:1671-1637.2004.01.030      [本文引用: 1]

徐程, 曲昭伟, 陶鹏飞, 等

动态交通数据异常值的实时筛选与恢复方法

[J]. 哈尔滨工程大学学报, 2016, 37 (2): 211- 217

[本文引用: 1]

XU Cheng, QU Zhao-wei, TAO Peng-fei, et al

Real time screening and recovery method of outliers of dynamic traffic data

[J]. Journal of Harbin Engineering University, 2016, 37 (2): 211- 217

[本文引用: 1]

孟鸿程, 陈淑燕

交通流缺失数据处理方法比较分析

[J]. 交通信息与安全, 2018, 36 (2): 61- 67

DOI:10.3963/j.issn.1674-4861.2018.02.009     

MENG Hong-cheng, CHEN Shu-yan

Comparative analysis of missing data processing methods in traffic flow

[J]. Traffic Information and Safety, 2018, 36 (2): 61- 67

DOI:10.3963/j.issn.1674-4861.2018.02.009     

郭敏, 蓝金辉, 李娟娟, 等

基于灰色残差GM(1, N)模型的交通流数据恢复算法

[J]. 交通运输系统工程与信息, 2012, 12 (1): 42- 47

DOI:10.3969/j.issn.1009-6744.2012.01.008      [本文引用: 1]

GUO Min, LAN Jin-hui, LI Juan-juan, et al

Traffic flow data recovery algorithm based on grey residual GM(1, N) model

[J]. Transportation System Engineering and Information, 2012, 12 (1): 42- 47

DOI:10.3969/j.issn.1009-6744.2012.01.008      [本文引用: 1]

陆百川, 张冬梅, 舒芹, 等

基于时空特性和灰色残差的交通故障数据诊断与修复

[J]. 重庆交通大学学报:自然科学版, 2020, 39 (9): 8- 16

[本文引用: 1]

LU Bai-chuan, ZHANG Dong-mei, SHU Qin, et al

Traffic fault data diagnosis and repair based on temporal and spatial characteristics and grey residual

[J]. Journal of Chongqing Jiaotong University: Natural Science Edition, 2020, 39 (9): 8- 16

[本文引用: 1]

王薇, 程泽阳, 刘梦依, 等

基于时空相关性的交通流故障数据修复方法

[J]. 浙江大学学报:工学版, 2017, 51 (9): 1727- 1734

[本文引用: 1]

WANG Wei, CHENG Ze-yang, LIU Meng-yi, et al

Traffic flow fault data repair method based on spatio-temporal correlation

[J]. Journal of Zhejiang University: Engineering Science, 2017, 51 (9): 1727- 1734

[本文引用: 1]

WANG X, MA Y, WANG Y, et al. Traffic flow prediction via spatial temporal graph neural network [C]// Proceedings of the Web Conference. Taiwan: [s. n. ], 2020: 1082-1092.

[本文引用: 1]

张伟斌, 张蒲璘, 苏子毅, 等

基于自注意力机制与图自编码器的路网交通流数据修复模型

[J]. 交通运输系统工程与信息, 2021, 21 (4): 90- 98

[本文引用: 1]

ZHANG Wei-bin, ZHANG Pu-lin, SU Zi-yi, et al

Road network traffic flow data restoration model based on self-attention mechanism and graph autoencoder

[J]. Transportation System Engineering and Information, 2021, 21 (4): 90- 98

[本文引用: 1]

陆化普, 孙智源, 屈闻聪

基于时空模型的交通流故障数据修正方法

[J]. 交通运输工程学报, 2015, 15 (6): 92- 100

DOI:10.3969/j.issn.1671-1637.2015.06.012      [本文引用: 1]

LU Hua-pu, SUN Zhi-yuan, QU Wen-cong

Traffic flow fault data correction method based on spatio-temporal model

[J]. Journal of Transportation Engineering, 2015, 15 (6): 92- 100

DOI:10.3969/j.issn.1671-1637.2015.06.012      [本文引用: 1]

张程瀚. 城市快速路交通流数据质量评价及修复方法研究[D]. 北京: 北京交通大学, 2019.

[本文引用: 1]

ZHANG Cheng-han. Research on data quality evaluation and restoration methods of urban expressway traffic flow [D]. Beijing: Beijing Jiaotong University, 2019.

[本文引用: 1]

ZHAO L, SONG Y, ZHANG C, et al

T-GCN: a temporal graph convolutional network for traffic prediction

[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 21 (9): 3848- 3858

[本文引用: 1]

ZHANG Z, CUI P, ZHU W

Deep learning on graphs: a survey

[J]. IEEE Transactions on Knowledge and Data Engineering, 2020, 34 (1): 249- 270

[本文引用: 1]

赵康宁, 蒲天骄, 王新迎, 等

基于改进贝叶斯神经网络的光伏出力概率预测

[J]. 电网技术, 2019, 43 (12): 4377- 4386

[本文引用: 1]

ZHAO Kang-ning, PU Tian-jiao, WANG Xin-ying, et al

Forecast of photovoltaic output probability based on improved Bayesian neural network

[J]. Power System Technology, 2019, 43 (12): 4377- 4386

[本文引用: 1]

陈喜群, 周凌霄, 曹震

基于图卷积网络的路网短时交通流预测研究

[J]. 交通运输系统工程与信息, 2020, 20 (4): 49- 55

[本文引用: 1]

CHEN Xi-qun, ZHOU Ling-xiao, CAO Zhen

Research on short-term traffic flow prediction of road network based on graph convolution network

[J]. Transportation System Engineering and Information, 2020, 20 (4): 49- 55

[本文引用: 1]

陈丹蕾, 陈红, 任安虎

考虑时空影响下的图卷积网络短时交通流预测

[J]. 计算机工程与应用, 2021, 57 (13): 269- 275

DOI:10.3778/j.issn.1002-8331.2006-0175      [本文引用: 1]

CHEN Dan-lei, CHEN Hong, REN An-hu

Short-term traffic flow prediction of graph convolutional network considering the influence of time and space

[J]. Computer Engineering and Applications, 2021, 57 (13): 269- 275

DOI:10.3778/j.issn.1002-8331.2006-0175      [本文引用: 1]

闫旭, 范晓亮, 郑传潘, 等

基于图卷积神经网络的城市交通态势预测算法

[J]. 浙江大学学报: 工学版, 2020, 54 (6): 1147- 1155

[本文引用: 1]

YAN Xu, FAN Xiao-liang, ZHENG Chuan-pan, et al

Urban traffic situation prediction algorithm based on graph convolution neural network

[J]. Journal of Zhejiang University: Engineering Science, 2020, 54 (6): 1147- 1155

[本文引用: 1]

DANEL T, SPUREK P, TABOR J, et al. Spatial graph convolutional networks [C]// International Conference on Neural Information Processing. Cham: Springer, 2020: 668-675.

[本文引用: 1]

BRONSTEIN M M, BRUNA J, LECUN Y, et al

Geometric deep learning: going beyond Euclidean data

[J]. IEEE Signal Processing Magazine, 2017, 34 (4): 18- 42

DOI:10.1109/MSP.2017.2693418      [本文引用: 1]

陈华伟, 邵毅明, 敖谷昌, 等

面向在线地图的GCN-LSTM神经网络速度预测

[J]. 交通运输工程学报, 2021, 21 (4): 183- 196

[本文引用: 1]

CHEN Hua-wei, SHAO Yi-ming, AO Gu-chang, et al

GCN-LSTM neural network speed prediction for online maps

[J]. Journal of Traffic and Transportation Engineering, 2021, 21 (4): 183- 196

[本文引用: 1]

/