浙江大学学报(工学版), 2020, 54(8): 1613-1619 doi: 10.3785/j.issn.1008-973X.2020.08.021

土木工程、交通工程

基于双尺度长短期记忆网络的交通事故量预测模型

李文书,, 邹涛涛, 王洪雁, 黄海

Traffic accident quantity prediction model based on dual-scale long short-term memory network

LI Wen-shu,, ZOU Tao-tao, WANG Hong-yan, HUANG Hai

收稿日期: 2019-06-23  

Received: 2019-06-23  

作者简介 About authors

李文书(1975—),男,教授,从事图像处理、认知建模研究.orcid.org/0000-0001-8339-8824.E-mail:charlie@zstu.edu.cn , E-mail:charlie@zstu.edu.cn

摘要

为了降低交通事故的发生、减少财产损失,建立新型交通事故量预测模型. 该模型利用双尺度分解方程将原始交通事故时间序列分解为多个子层,并利用长短期记忆(LSTM)网络对得到的低频子层进行预测;利用双尺度重构方程将低频子层的预测结果进行重构. 分别构建LSTM预测模型、门控循环单元(GRU)预测模型、自编码(SAEs)预测模型和双尺度长短期记忆网络(DS-LSTM)预测模型,利用这4个预测模型对2个数据集进行预测. 结果表明,本研究模型相较其他模型能够有效预测交通事故时间序列,且具有较强的鲁棒性. 对于2个数据集,相较于原始的LSTM模型,DS_LSTM预测模型预测准确度分别提高6%、28%;对2个不同数据库(利兹和UK)的测试表明本研究模型具有较好的泛化性能.

关键词: 交通事故 ; 预测模型 ; 长短期记忆网络 ; 双尺度分解 ; 双尺度重构

Abstract

A novel traffic accident prediction model was proposed, in order to reduce the occurrence of traffic accidents and property losses. The dual-scale decomposition equations are utilized to decompose the original traffic accident time series into a number of sub-layers, and the long short-term memory (LSTM) network is adopted to complete the forecasting of the low-frequency sub-layer. The double scale reconstruction equations are adopted to complete the predicted value reconstruction of the low-frequency sub-layer. LSTM, gate recurrent unit (GRU), stacked autoencoders (SAEs) and dual-scale LSTM (DS-LSTM) prediciton models were constructed, and the four models were used to predict the two data sets. Results show that compared with other models, the proposed model is robust and more effective in predicting the traffic accident time series. Compared with the original LSTM model, the prediction accuracy of model DS_LSTM is improved by 6% and 28% respectively in the two data sets. Testing on two different databases (Leeds and UK) shows that the proposed model has better generalization performance than the other models involved.

Keywords: traffic accident ; prediction model ; long short-term memory network ; dual-scale decomposition ; dual-scale reconstruction

PDF (974KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李文书, 邹涛涛, 王洪雁, 黄海. 基于双尺度长短期记忆网络的交通事故量预测模型. 浙江大学学报(工学版)[J], 2020, 54(8): 1613-1619 doi:10.3785/j.issn.1008-973X.2020.08.021

LI Wen-shu, ZOU Tao-tao, WANG Hong-yan, HUANG Hai. Traffic accident quantity prediction model based on dual-scale long short-term memory network. Journal of Zhejiang University(Engineering Science)[J], 2020, 54(8): 1613-1619 doi:10.3785/j.issn.1008-973X.2020.08.021

随着道路和车辆的增加,交通事故越来越多,人们生命财产安全受到较大威胁. 据统计,全球每年交通事故导致大约120万人死亡、5 000万人受伤,交通事故已然成为全球“第一杀手”[1]. 随着科技的发展,准确预测交通事故的发生已成为人们关注的焦点. 及时预测交通事故,可以显著降低财产损失,保障人类生命安全. 基于此,交通事故预测模型的构建受到越来越多学者的关注[2]. 主要预测方法包括传统的预测方法和当前主流的深度学习方法. 传统的预测方法通过单个或者多个数据来预测交通事故,这些方式通常适用于交通事故数据具有明显趋势的情况,有差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA)和灰度模型[3-4]. 张艳艳等[5]利用ARIAM建立水上交通事故预测模型;Becker等[6-7]利用灰度模型建立交通事故预测模型. 随着数据科学的蓬勃发展,深度学习方法在解决分类和回归问题中得到广泛应用. 与浅层方法相比[8],深度学习方法在提取数据隐藏的自然结构和固有的抽象特征方面具有更好的性能. 因此,深度学习方法在交通事故预测领域具有广阔的应用前景. 近几年受深度学习的启发,采用深度学习方法如长短期记忆(long short-term memory,LSTM)网络和反向传播神经(back propagation,BP)网络来建立交通事故预测模型. Wang等[9-14]利用神经网络建立交通事故预测模型. 陈海龙等[15]利用BP网络构建预测模型对交通事故进行预测;Zhao等[16-17]利用LSTM网络进行交通事故预测. BP网络和LSTM神经网络能够实现交通事故的预测,但交通事故的影响因素较多,具有较强的不确定性、非线性、动态性和时变特性[18],无论是传统的机器学习方法还是深度学习方法对于预测大规模、非线性动态时变性的数据都较困难.

本研究提出双尺度长短期记忆网络的交通事故量预测模型. 双尺度方程是有效的数据处理方式,LSTM网络是深度学习领域的主流神经网络. 利用LSTM网络的非线性处理能力可以获得较好的预测结果. 本研究的创新之处在于将双尺度方程和LSTM网络在交通事故预测中进行结合,提高预测性能. 研究详细框架如下:1)利用双尺度分解方程将原始交通事故时间序列分解成若干子层,目的是降低原始交通事故数据的非平稳性,为深度学习预测提供更多稳定的子层数据;2)利用LSTM网络完成对低频子层数据的预测;3)利用双尺度重构方程对LSTM网络预测结果进行重构得到最终预测值.

1. 基于双尺度长短期记忆网络的交通事故量预测模型

双尺度长短期记忆(dual scale-LSTM,DS-LSTM)网络的交通事故数量预测模型框架如图1所示. 图中, ${L_j}\left( k \right)$为原始数据分解得到的各低频子层数据, $j = 1,2, \cdots ,n$${D_n}\left( k \right)$为原始数据分解得到的高频数据; ${y_j}$为低频子层数据预测值; $\tilde y$为最终预测值;ydn为最后一项的高频数据预测值. 整个过程的详细描述如下:1)利用双尺度分解方程分解原始交通事故时间序列数据到数个子层;2)利用长短期记忆网络预测低频子层数据;3)利用双尺度重构方程对步骤2)预测到的结果进行重构,输出最终值.

图 1

图 1   交通事故预测模型流程图

Fig.1   Flow chart of traffic accident prediction model


1.1. 双尺度分解与重构

双尺度方程是有效的数据处理方式,可以对原始数据进行分解和重构处理。该方式对处理非平稳和类别复杂的数据有较好的效果,使非平稳数据经过处理后趋于近似平稳,并降低数据的复杂性[19-21]. 具体计算如下:

$\varphi \left( t \right) = \sum\nolimits_{n = - p}^q {h\left( n \right)} \varphi \left( {2t - n} \right),$

$\psi \left( t \right) = \sum\nolimits_{n = 1 - q}^{1 + p} {g\left( n \right)\psi \left( {2t - n} \right)} .$

式中: $\varphi \left( t \right)$为父小波; $\psi \left( t \right)$为母小波; $h\left( n \right)$$g\left( n \right)$为滤波系数, $g\left( n \right) = {\left( { - 1} \right)^n}h\left( {1 - n} \right)$$p$$q \geqslant 0$$p + q$为奇数,令 $p + q + 1{\rm{ = }}2M$$M$为正整数.

$n \in \left[ {0,p + q} \right]$时,式(1)、(2)分别变为

$\varphi \left( t \right) = \sum\nolimits_{n = 0}^{p + q} {h\left( {n - p} \right)} \varphi \left( {2t - n + p} \right),$

$\psi \left( t \right) = \sum\nolimits_{n = 0}^{p + q} {g\left( {n + 1 - q} \right)} \psi \left( {2t - n - 1 + q} \right).$

$a\left( n \right) \!=\! \sqrt 2 h\left( {n \!-\! p} \right),$ $n \!=\! 0,1, \cdots ,p \!+\! q,$ $b\left( n \right) = {\left( { - 1} \right)^{n - q + 1}}\times a\left( {2M - 1 - n} \right)$,则有 $h\left( n \right) = \sqrt 2 a\left( {n + p} \right) ,$ $n = - p, - p - 1, \cdots ,q .\,$ 将其分别代入式(3)、(4),有

$\begin{split} \varphi \left( t \right) =& \sqrt 2 \sum\nolimits_{n = 0}^{p + q} {a\left( n \right)} \varphi \left( {2t - n + p} \right) = \\ & \sqrt 2 \sum\nolimits_{n = 0}^{2M - 1} {a\left( n \right)} \varphi \left( {2t - n + p} \right) \end{split} ,$

$\begin{split} \psi \left( t \right) =& \sum\nolimits_{n = 0}^{p + q} {\sqrt 2 b\left( n \right)\psi \left( {2t - n - 1 + q} \right)} = \\ & \sum\nolimits_{n = 0}^{2M - 1} {\sqrt 2 b\left( n \right)\psi \left( {2t - n - 1 + q} \right)}. \end{split} $

$t{\rm{ = }}{{\rm{2}}^{ - j}}t - k$$\;\;t{\rm{ = }}t - k$,两边同乘 ${2^{{{ - j} / 2}}}$后分别代入式(5)、(6),得到

$\begin{split} {2^{{{ - j} / 2}}}\varphi \left( {{{\rm{2}}^{ - j}}t - k} \right) =& {2^{{{\left( { - j + 1} \right)} / 2}}}\sum\nolimits_{n = 0}^{2M - 1} {a\left( n \right)}\times\\& \varphi \left( {{2^{ - j + 1}}t - 2k - n + p} \right), \end{split} $

$\begin{split} {2^{{{ - j} / 2}}}\psi \left( {t{\rm{ - }}k} \right) =& {2^{{{\left( { - j{\rm{ + 1}}} \right)} / 2}}}\sum\nolimits_{n = 0}^{2M - 1} {b\left( n \right)}\times\\& \psi \left( {2t - 2k - n - 1 + q} \right) . \end{split} $

假设给定离散信号 ${c^0}\left( k \right)$$k = 0,1,2, \cdots ,{2^n}$. 根据分解思想,由式(7)、(8)推导得出:

$\begin{split} {c_j(k)} =& \left\langle {f\left( t \right),{\varphi _{j,k}}\left( t \right)} \right\rangle = \int\limits_{\bf R} {f\left( t \right)} {\left( {{2^{{{ - j} / 2}}}\varphi \left( {{2^{ - j}}t - k} \right)} \right)^{1/2}} {\rm d}t = \\ & \sum\nolimits_{n = 0}^{2M \!-\! 1} {{a_n}\!{{\int\limits_{\bf R}\! {f\left( t \right)\left( {{2^{{{\left( {\! -\! j\! +\! 1} \right)} / 2}}}\!\varphi \left( {{2^{\! -\! j\! + \!1}}t\! -\! 2k \!-\! n\! +\! p} \right)} \right)} }^{1/2}}{\rm d}t}\! = \\ & \sum\nolimits_{n = 0}^{2M - 1} {{a_n}\left\langle {f\left( t \right),{\varphi _{j - 1,2k + n - p}}\left( t \right)} \right\rangle }=\\&\sum\nolimits_{n = 0}^{2M - 1} {{a_n}{c_{j - 1}}}({2k + n - p}) .\\[-13pt] \end{split} $

式中:f(t)为原始数据函数,cj(k)为原始数据上的分解函数,φj,k(t)为分解函数的父波,an为得到的分解序列的权值参数.

定义函数 ${L_j}\left( k \right)$${D_j}\left( k \right)$

${L_j}\left( k \right) = {c_j}\left( k \right) = \sum\nolimits_{n = 0}^{2M - 1} {a\left( n \right){c_{j - 1}}\left( {2k + n - p} \right)} ,$

${D_j}\left( k \right) = {d_j}\left( k \right) = \sum\nolimits_{n = 0}^{2M - 1} {b\left( n \right){c_{j - 1}}\left( {2k + n + 1 - p} \right)} .$

式中: ${L_j}\left( k \right)$${D_j}\left( k \right)$为原数据分解的序列, $j = 1,2, \cdots ,n $$ k = 0,1,2 \cdots ,{2^{n - j}}$.

根据重构原理,由式(5)、(8)推导出重构方程:

$\begin{split} f\left( t \right) =& \sum\nolimits_{k = 0}^{{2^{n - j}}} {{c_j}\left( k \right){2^{{{\left( {n - j} \right)} / 2}}}\varphi \left( {{2^{n - j}}t - k} \right)} +\\ & \sum\nolimits_{k = 0}^{{2^{n - j}}} {{d_j}\left( k \right){2^{{{\left( {n - j} \right)} / 2}}}\psi \left( {{2^{n - j}}t - k} \right)} . \end{split} $

设下列形式的信号 $f\left( t \right)$展开式:

$\begin{split} f\left( t \right) =& \sum\nolimits_{k = 0}^{{2^{n - j}}} {{c_j}\left( k \right)} {2^{{{\left( {n - j} \right)} / 2}}}\sum\nolimits_{m = 0}^{2M - 1} {a\left( m \right)}\times\\&\varphi \left( {{2^{n - j + 1}}t - 2k - m + p} \right) + \\ & \sum\nolimits_{k = 0}^{{2^{n - j}}} {{d_j}\left( k \right)} {2^{{{\left( {n - j} \right)} / 2}}}\sum\nolimits_{m = 0}^{2M - 1} {b\left( m \right)}\times\\&\psi \left( {{2^{n - j + 1}}t - 2k - m + p - 1} \right) = {f_1}\left( t \right) + {f_2}\left( t \right) . \end{split} $

对上式两边同乘 ${2^{{{\left( {n - j + 1} \right)} / 2}}}\varphi \left( {{2^{n - j + 1}}t - 2n} \right)$,在 $\left( {{\rm{ - }}\infty ,\infty } \right)$上利用正交性积分. 在 ${f_1}\left( t \right)$中,仅当 $2k + m - p = 2n$,即 $m = 2n - 2k + p$时,对应项不为零,设 $m=2i + 1 \left( {i = 0,1, \cdots ,M - 1} \right)$,则 $k = n - i + {{\left( {p - 1} \right)} / 2}$;在 ${f_2}\left( t \right)$中,仅当 $2k + m - q + 1 = 2n$,即 $m = 2n + q - 1 - 2k$ 时,对应项不为零,设 $m=2i + 1\left( i = 0,1, \cdots , M - 1 \right)$,则 $k = n - i + {q / 2} - 1$. 综上可得

$\begin{split} {c_{j - 1}}\left( {2n} \right) =& \sum\nolimits_{n = 0}^{M - 1} {a\left( {2k} \right)} {c_j}\left( {n - k + {{\left( {p - 1} \right)} / 2}} \right)+ \\ & \sum\nolimits_{n = 0}^{M - 1} {b\left( {2k} \right){d_j}\left( {n - k + {q / 2} - 1} \right)} . \end{split} $

同理可得

$\begin{split} {c_{j - 1}}\left( {2n + 1} \right) =& \sum\nolimits_{n = 0}^{M - 1} {a\left( {2k + 1} \right){c_j}\left( {n - k + {{\left( {p + 1} \right)} / 2}} \right)} + \\ & \sum\nolimits_{n = 0}^{M - 1} {b\left( {2k + 1} \right){d_j}\left( {n - k + {q / 2}} \right)}. \\[-15pt] \end{split} $

最终预测值和权重分别为

$\tilde y = \sum\nolimits_{i = 1}^n {{w_i}{{f}} {{\left( t \right)}_i}} + {w_{\rm dn}}{{f}} {\left( t \right)_{\rm dn}},$

${w_i} = \sum\nolimits_{i = 1}^{n + 1} {{{\left( {{{{{f}} {{\left( t \right)}_i}} \bigg/ {\sum\limits_{j = 1}^{n + 1} {{{f}} {{\left( t \right)}_j}} }}} \right)}_i}}. $

式中:下标 $i$表示低频子层、 ${{\rm dn}}$表示高频子层; ${w_i}$${w_{\rm dn}}$为各子层预测值权重, $f{\left( t \right)_i}$$f{\left( t \right)_j}$为各子层预测结果, ${w_{n + 1}}$$f{\left( t \right)_{n + 1}}$${w_{\rm dn}}$$f{\left( t \right)_{\rm dn}}$.

1.2. LSTM

LSTM由循环神经网络(recurrent neural network, RNN)优化演变而来,原始RNN的隐藏层只有一个状态,对于短期输入较敏感,若对RNN增加一个状态,使其对长期输入也敏感,则能使得RNN具有长期记忆功能. LSTM主要由输入门、遗忘门、输出门组成,结构如图2所示:

图 2

图 2   LSTM记忆块结构

Fig.2   LSTM memory block structure


一个记忆块在 $t$时刻的计算过程[22]如下:

${\tilde c_t} = \tanh \;\left( {{w_{{\rm{cx}}}}{x_t} + {w_{{\rm{ch}}}}{h_{t - 1}} + {b_{\rm{c}}}} \right),$

${i_t} = \sigma \left( {{w_{{\rm{ix}}}}{x_t} + {w_{{\rm{ih}}}}{h_{t - 1}} + {w_{{\rm{ic}}}}{c_{t - 1}} + {b_{\rm{i}}}} \right),$

${f_t} = \sigma \left( {{w_{{\rm{fx}}}}{x_t} + {w_{{\rm{fh}}}}{h_{t - 1}} + {w_{{\rm{fc}}}}{c_{t - 1}} + {b_{\rm{f}}}} \right),$

${o_t} = \sigma \left( {{w_{{\rm{ox}}}}{x_t} + {w_{{\rm{oh}}}}{h_{t - 1}} + {w_{{\rm{oc}}}}{c_t} + {b_{\rm{o}}}} \right),$

${c_t} = {c_{t - 1}} \circ {f_t} + {i_t} \circ {\tilde c_t},$

${h_t} = {o_t} \circ \tanh \;{{c_t}} .$

式中: ${\tilde c_t}$t时刻记忆细胞的更新状态; ${i_t}$${f_t}$${o_t}$${c_t}$${h_t}$分别为输入门、遗忘门、输出门、记忆细胞以及隐藏层在 $t$时刻的状态; ${x_t}$$t$时刻的输入; ${h_{t - 1}}$${c_{t - 1}}$分别为隐藏层及记忆细胞在 $t - 1$时刻的输出; ${w_{{\rm{cx}}}}$${w_{{\rm{ch}}}}$分别为记忆细胞与输入 ${x_t}$和隐藏层的权值; ${w_{{\rm{ix}}}}$${w_{{\rm{ih}}}}$${w_{{\rm{ic}}}}$分别为输入门与 ${x_t}$、隐藏层、记忆细胞的权值; ${w_{{\rm{fx}}}}$${w_{{\rm{fh}}}}$${w_{{\rm{fc}}}}$分别为遗忘门与 ${x_t}$、隐藏层、记忆细胞的权值; ${w_{{\rm{ox}}}}$${w_{{\rm{oh}}}}$${w_{{\rm{oc}}}}$分别为输出门与 ${x_t}$、隐藏层、记忆细胞的权值; ${b_{\rm{c}}}$${b_{\rm{i}}}$${b_{\rm{f}}}$${b_{\rm{o}}}$为偏置项; $\sigma \left( \cdot \right)$$\tanh \;\left( \cdot \right)$为激活函数;“ $ \circ $”为哈达玛积,即逐点乘.

通过式(9)~(11)将原始数据分解成 ${L_j}\left( k \right)$${D_j}\left( k \right)$这2个序列,将分解后的序列输入LSTM预测模型. 原始数据经过预处理后n层分解为 ${c^0}\left( k \right){\rm{ = }}{L_1}\left( k \right) + {L_2}\left( k \right) + \cdots + {L_n}\left( k \right) + {D_n}\left( k \right).$通过式(12)~(17)得到预测模型的预测值 ${y_1},{y_2},{y_3}, \cdots ,{y_n},{y_{\rm dn}}$,然后利用重构获得最终预测值 $\tilde y$.

1.3. 预测性能标准

在衡量模型性能时使用4个标准:平均绝对误差(mean absolute error,MAE)、均方误差(mean squared error,MSE)、均方根误差 (root mean squard error,RMSE)和准确度(accuracy,ACC)来评估预测模型[23-24]. 相关定义如下:

${\rm{MAE}} = \frac{1}{N}\sum\limits_t {\left| {\tilde y\left( t \right) - y\left( t \right)} \right|} ,$

${\rm{MSE}} = \sqrt {{{\left( {\tilde y\left( t \right) - y\left( t \right)} \right)}^2}}, $

${\rm{RMSE}} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {y\left( t \right) - \tilde y\left( t \right)} \right)}^2}} } ,$

${\rm{ACC}} = 1 - {{{ {\sum\limits_{t = 0}^N {\bigg| {\tilde y\left( t \right) - y\left( t \right)} \bigg|} } } \Bigg/ {\sum\limits_{t = 0}^N {y\left( t \right)} }}}.$

式中: $y(t)$$t$时刻交通事故数的实测值, $\tilde y(t)$为预测值, $N$为样本个数.

2. 实验与分析

2.1. 数据描述

采用Kaggle比赛公开的2011~2015年利兹和UK地区的交通事故数据. 使用2011~2014年数据集训练预测模型,2015年数据集测试预测模型. 2个数据集的数据量和数据复杂度不同,利兹数据集训练数据有10万条,测试数据有4000条;UK数据集训练数据有50万条,测试数据有1万条. 本研究主要使用2个数据集中的事故发生时天气状态、事故发生的道路表面状态和事故发生量等数据项.

2.2. 实验与结论

实验是在Windows10的Python3.6.6、TensorFlow1.12.0和Keras2.2.4下进行的. 分别将利兹和UK的2011~2014年的天气状况、路面状态和事故量作为训练输入;2015年的天气状况和路面状态作为预测模型输入,模型输出为事故量. 每个实验包含4个交通事故预测模型:LSTM模型[25]、GRU模型[26]、SAEs模型[27]和本研究所提出的DS-LSTM模型.

为了测试DS-LSTM的有效性,须确定该模型的参数—训练次数(epochs). 由于数据的差异性,在达到较好的训练结果时模型参数有一定的差异.

表1所示,随着epochs的增加,混合模型准确度有所提高,但当达到一定值之后,准确度会下降. 在使用利兹数据集时,当epochs=900时DS-LSTM模型的预测准确度较高;在使用UK数据集时,当epochs=700时DS-LSTM模型预测准确度最高.

表 1   DS-LSTM模型在不同epochs下的准确度

Tab.1  Accuracy of DS-LSTM model under different epochs

epochs ACC/%
利兹数据集 UK数据集
400 74.8891 84.8406
500 79.3250 85.2503
600 79.9246 85.9217
700 81.5287 88.1876
800 82.0915 88.0292
900 83.2079 88.0172
1000 82.2952 85.4329

新窗口打开| 下载CSV


2.2.1. 利兹数据集

当epochs=900时,4种交通事故预测模型结果如图3所示. 图中,N为事故量,T为时间月份,左上角小图为1月1日—1月30日的事故发生量的局部放大结果,D为时间日期. 可以看出,DS-LSTM模型预测结果相较于(LSTM、GRU、SAEs)模型更加接近真实值.

图 3

图 3   epochs为900时的事故量(利兹数据集)

Fig.3   Accident number with epochs of 900 (Leeds database)


2.2.2. UK数据集

当epochs=700时,4种交通事故的预测模型结果如图4所示. 图中,左上角小图为1月1日—1月30日事故发生量的局部放大结果. 可以看出,DS-LSTM模型的预测结果相较于其他3个模型(LSTM、GRU、SAEs)更加接近真实值.

图 4

图 4   epochs为700时的事故量(UK数据集)

Fig.4   Accident number with epochs of 700 (UK database)


由于2个数据集在离散程度和数据特征上有所不同,利用同种参数进行实验得到结果,如图34所示. 可以看出,混合模型较于单个神经网络的预测准确度有显著提高. 比如,当从利兹数据集更换为UK数据集时,对图34进行分析,发现在单个神经网络情况下(如LSTM),预测结果出现较大偏差;利用式(9)~(11)处理得到的数据,数据趋于近似平稳,利用式(12)~(17)重构预测值,预测准确度有显著提高.

当根据常用的模型评价标准,达到最优预测模型时,各模型的性能指标如表2所示. 由表12可以看出,同一个数据集DS-LSTM的预测模型精度要高于LSTM、GRU和SAEs模型. 例如,当利兹数据集的epochs=900时,预测模型DS-LSTM性能指标相较于LSTM:MAE降低0.1061、MSE降低0.3771、RMSE降低0.3105,可以看出DS-LSTM的预测性能较好,在相同参数下准确度为83.2079%,相较于LSTM提高约6%、相较于GRU提高约38%、相较于SAEs提高约30%;当UK数据集的epochs=700时,预测模型DS-LSTM性能指标相较于LSTM:MAE降低0.3235、MSE降低0.5306、RMSE降低0.4925,可以看出DS-LSTM的预测性能较好,在相同参数下准确度为88.187 0%,相较于LSTM提高约28%,相较于GRU提高约38%,相较于SAEs提高约33%.

表 2   不同数据集下的模型特性

Tab.2  Model characteristics under different data sets

模型 UK,epochs=700 Leeds,epochs=900
MAE MSE RMSE ACC/% MAE MSE RMSE ACC/%
LSTM 0.5135 0.6161 0.7849 60.8588 0.4288 0.5811 0.7622 76.7608
GRU 0.6531 1.2837 1.1330 50.2231 1.0072 2.2285 1.4928 45.4190
SAEs 0.5872 0.8195 0.9052 55.2421 0.8611 1.4739 1.2140 53.3366
DS-LSTM 0.1900 0.0855 0.2924 88.1876 0.3227 0.2040 0.4517 83.2079

新窗口打开| 下载CSV


通过以上实验结果得出,在不同epochs情况和不同数据集下,本研究所提出的混合模型DS-LSTM的预测性能相对于其他模型有显著提高,由此证明该模型的有效性和鲁棒性.

3. 结 语

提出新的交通事故量预测模型. 这种预测模型对于道路交通事故有较好的预测效果,利用4种预测模型对2个数据集进行测试. 实验结果表明混合模型DS-LSTM相比LSTM、GRU和SAEs等预测模型,准确率有显著提高.

后续将进一步研究交通数据集的特征提取和处理方法. 比如有效提取事故数据集中影响交通事故的天气、路面状况信息,并利用其他深度学习优化方法提高交通事故预测的准确率;降低本研究提出的混合模型训练时间,提高模型性能.

参考文献

ZIYAB A H, AKHTAR S

Incidence and trend of road traffic injuries and related deaths in Kuwait: 2000–2009

[J]. Injury, 2012, 43 (12): 2018- 2022

DOI:10.1016/j.injury.2011.09.023      [本文引用: 1]

YANNIS G, DRAGOMANOVITS A, LAIOU A, et al

Road traffic accident prediction modelling: a literature review

[J]. Proceedings of the Institution of Civil Engineers, 2017, 170 (5): 245- 254

[本文引用: 1]

ZHANG J, LIU X M, HE Y L, et al

Application of ARIMA model in forecasting traffic accidents

[J]. Journal of Beijing University of Technology, 2007, 33 (12): 1295- 1299

[本文引用: 1]

BARBA L, RODRIGUEZ N, MONTT C

Smoothing strategies combined with ARIMA and neural networks to improve the forecasting of traffic accidents

[J]. The Scientific World Journal, 2014, 1- 12

[本文引用: 1]

张艳艳, 刘晓佳, 熊子龙, 等

基于 ARIMA 模型的水上交通事故预测

[J]. 中国水运: 下半月, 2017, (2): 51- 54

[本文引用: 1]

ZHANG Yan-yan, LIU Xiao-jia, XIONG Zi-long, et al

Waterborne traffic accident prediction based on ARIMA model

[J]. China Water Transport: the Second Half of the Month, 2017, (2): 51- 54

[本文引用: 1]

BECKER U, MANZ H

Grey systems theory time series prediction applied to road traffic safety in Germany

[J]. IFAC-PapersOnLine, 2016, 49 (3): 231- 236

DOI:10.1016/j.ifacol.2016.07.039      [本文引用: 1]

王星, 刘小勇

基于灰色马尔科夫模型的交通事故预测研究

[J]. 交通科技与经济, 2017, 19 (4): 9- 13

[本文引用: 1]

WANG Xing, LIU Xiao-yong

Study on traffic accident prediction based on grey Markov model

[J]. Transportation Science and Technology, 2017, 19 (4): 9- 13

[本文引用: 1]

邸韡, 巴德瓦杰, 魏佳宁. 深度学习基础教程[M]. 北京: 机械工业出版社, 2018.

[本文引用: 1]

WANG J, GU Q, WU J, et al. Traffic speed prediction and congestion source exploration: a deep learning method [C]// IEEE 16th International Conference on Data Mining. Barcelona: IEEE, 2016: 499-508.

[本文引用: 1]

CONTRERAS E, TORRES-TREVINO L, TORRES F. Prediction of car accidents using a maximum sensitivity neural network [C]// 2018 EAI International Conference on Smart Technology. Monterrey: Springer, 2018: 86-95.

ZANG D, FANG Y, WANG D, et al. Long term traffic flow prediction using residual net and deconvolutional neural network [C]// Chinese Conference on Pattern Recognition and Computer Vision (PRCV). Guangzhou: Springer, 2018: 62-74.

GARCIADE SOTO B, BUMBACHER A, DEUBLEIN M, et al

Predicting road traffic accidents using artificial neural network models

[J]. Infrastructure Asset Management, 2018, 5 (4): 132- 144

DOI:10.1680/jinam.17.00028     

ZHANG C, ZHANG H, YUAN D, et al

Citywide cellular traffic prediction based on densely connected convolutional neural networks

[J]. IEEE Communications Letters, 2018, 22 (8): 1656- 1659

DOI:10.1109/LCOMM.2018.2841832     

PAMULA T

Impact of data loss for prediction of traffic flow on an urban road using neural networks

[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 20 (3): 1000- 1009

[本文引用: 1]

陈海龙, 彭伟

改进 BP 神经网络在交通事故预测中的研究

[J]. 华东师范大学学报: 自然科学版, 2017, 2: 61- 68

[本文引用: 1]

CHEN Hai-long, PENG Wei

Study on improved BP neural network in traffic accident prediction

[J]. Journal of East China Normal University: Natural Science, 2017, 2: 61- 68

[本文引用: 1]

ZHAO Z, CHEN W, WU X, et al

LSTM network: a deep learning approach for short-term traffic forecast

[J]. IET Intelligent Transport Systems, 2017, 11 (2): 68- 75

DOI:10.1049/iet-its.2016.0208      [本文引用: 1]

CORTEZ B, CARRERA B, KIM Y J, et al

An architecture for emergency event prediction using LSTM recurrent neural networks

[J]. Expert Systems with Applications, 2018, 97: 315- 324

DOI:10.1016/j.eswa.2017.12.037      [本文引用: 1]

ALKHEDER S, TAAMNEH M, TAAMNEH S

Severity prediction of traffic accident using an artificial neural network

[J]. Journal of Forecasting, 2017, 36 (1): 100- 108

DOI:10.1002/for.2425      [本文引用: 1]

BEYLKIN G, COIFMAN R, ROKHLIN V

Fast wavelet transforms and numerical algorithms I

[J]. Communications on Pure and Applied Mathematics, 1991, 44 (2): 141- 183

DOI:10.1002/cpa.3160440202      [本文引用: 1]

MALLAT S G

A theory for multiresolution signal decomposition: the wavelet representation

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1989, (7): 674- 693

彭玉华. 小波变换与工程应用[M]. 北京: 科学出版社, 1999.

[本文引用: 1]

SHI X J, CHEN Z, WANG H, et al. Convolutional LSTM network: a machine learning approach for precipitation nowcasting [C]// Advances in Neural Information Processing Systems. 2015: 802-810.

[本文引用: 1]

RAHMANI B

Early model of traffic sign reminder based on neural network

[J]. Telkomnika, 2012, 10 (4): 749

DOI:10.12928/telkomnika.v10i4.864      [本文引用: 1]

CHAI T, DRAXLER R R

Root mean square error (RMSE) or mean absolute error (MAE)? : arguments against avoiding RMSE in the literature

[J]. Geoscientific Model Development, 2014, 7 (3): 1247- 1250

DOI:10.5194/gmd-7-1247-2014      [本文引用: 1]

FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction [C]// 2016 31st Youth Academic Annual Conference of Chinese Association of Automation. Wuhan: IEEE, 2016: 324-328.

[本文引用: 1]

ZHANG D, KABUKA M R

Combining weather condition data to predict traffic flow: a GRU-based deep learning approach

[J]. IET Intelligent Transport Systems, 2018, 12 (7): 578- 585

DOI:10.1049/iet-its.2017.0313      [本文引用: 1]

LV Y, DUAN Y, KANG W, et al

Traffic flow prediction with big data: a deep learning approach

[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 16 (2): 865- 873

[本文引用: 1]

/