浙江大学学报(工学版), 2025, 59(10): 2096-2105 doi: 10.3785/j.issn.1008-973X.2025.10.010

交通工程、水利工程、土木工程

基于时空信息融合的高速公路区域货运量预测模型

赵利英,, 王占中,

1. 西安理工大学 经济与管理学院,陕西 西安 710054

2. 吉林大学 交通学院,吉林 长春 130022

Prediction model for regional freight volume on highways based on spatiotemporal information fusion

ZHAO Liying,, WANG Zhanzhong,

1. School of Economics and Management, Xi’an University of Technology, Xi’an 710054, China

2. Transportation College, Jilin University, Changchun 130022, China

通讯作者: 王占中,男,教授,博士. orcid.org/0009-0007-8105-8704. E-mail:wangzz@jlu.edu.cn

收稿日期: 2024-08-23  

基金资助: 陕西省社会科学基金资助项目(2021R025);陕西省自然科学基础研究计划(2024JC-YBMS-376);陕西省教育厅科学研究计划项目(23JK0557).

Received: 2024-08-23  

Fund supported: 陕西省社会科学基金资助项目(2021R025);陕西省自然科学基础研究计划(2024JC-YBMS-376);陕西省教育厅科学研究计划项目(23JK0557).

作者简介 About authors

赵利英(1988—),女,讲师,博士.从事物流资源优化技术研究.orcid.org/0000-0002-3954-9258.E-mail:lyzhao@xaut.edu.cn , E-mail:lyzhao@xaut.edu.cn

摘要

高速公路区域间货运量数据相互影响,传统长短期记忆网络(LSTM)模型无法同时处理时空问题,为此设计基于时空信息融合的改进LSTM模型(TS-LSTM),提出按照时空信息的重要性对数据集进行重构的方法. 为了验证模型有效性,以某地区连续12个月的高速公路收费系统数据(共25563256条)为原始数据集,将TS-LSTM与基于时间的LSTM模型(T-LSTM)、基于空间的LSTM模型(S-LSTM),全连接神经网络、单向LSTM、双向LSTM和Transformer进行对比分析. 结果表明,不同区域使用TS-LSTM效果不同,相比其他机器学习模型,TS-LSTM的平均绝对值误差降低范围在40%~85%;TS-LSTM的平均绝对值误差相比Transformer低10%,平均绝对百分比误差低21个百分点;TS-LSTM的预测效果均优于对比模型.

关键词: 高速公路运输 ; 区域货运量预测 ; 时空信息融合 ; 长短期记忆网络(LSTM)模型 ; 数据集重构

Abstract

The freight volume data between regions of highway has mutual influence, and the temporal and spatial problems cannot be handled simultaneously by traditional long short-term memory (LSTM) models. An improved LSTM model (TS-LSTM) based on spatiotemporal information fusion was designed, and a method for reconstructing the dataset was proposed according to the importance of spatiotemporal information. To verify the effectiveness of the model, the highway toll system data (25 563 256 in total) for a consecutive 12-month period in a certain region was used as the original dataset, and TS-LSTM was compared and analyzed with a time-based LSTM model (T-LSTM), a space-based LSTM model (S-LSTM), a fully connected neural network, an unidirectional LSTM, a bidirectional LSTM, and the Transformer. Results showed that the performance of TS-LSTM varied across different regions, and compared to other machine learning models, the reduction range of the mean absolute error was between 40% and 85%. The mean absolute error of TS-LSTM was 10% lower than that of Transformer, and the mean absolute percentage error was 21 percentage points lower. The prediction performance of TS-LSTM were superior to those of the comparison model.

Keywords: highway transportation ; regional freight volume forecast ; spatiotemporal information fusion ; long short-term memory (LSTM) model ; dataset reconstruction

PDF (1204KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

赵利英, 王占中. 基于时空信息融合的高速公路区域货运量预测模型. 浙江大学学报(工学版)[J], 2025, 59(10): 2096-2105 doi:10.3785/j.issn.1008-973X.2025.10.010

ZHAO Liying, WANG Zhanzhong. Prediction model for regional freight volume on highways based on spatiotemporal information fusion. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(10): 2096-2105 doi:10.3785/j.issn.1008-973X.2025.10.010

高速公路区域货运量是衡量区域物流水平与行业发展状况的关键指标,为基础设施规划、运输网络优化与管理决策提供重要依据[1]. 随着大数据技术的发展,该领域预测方法逐步从传统定量预测转向智能预测,从单一模型转向组合模型. 传统方法(如指数平滑、线性回归、灰色预测等)[2-4]大多依赖历史时间序列数据,难以整合多维度影响因素,且因货运系统具有显著非线性特征,这些方法的预测结果往往误差较大. 组合模型虽可弥补单一模型缺陷(如马尔可夫-ARIMA缓解了外部冲击导致的偏差[5-7]),但其优化多集中于流程层面,常忽略数据源特征,预测效果仍不理想.

大数据技术作为新兴关键手段,通过归纳、演绎挖掘数据内在关联,以其高预测精度、低数据需求和良好的可解释性等优势[8],在提升货运量预测工作的科学性与结果可靠性方面获得了广泛应用. 多项研究显示智能算法在预测中表现优异,如Gao等[9]融合长短期记忆网络(long short-term memory,LSTM)与其他机器学习算法,验证了融合模型在多城市数据中的有效性;Li等[10]应用LSTM预测物流需求时序,误差低于传统方法且抗外部干扰能力强;Mohammadzadeh等[11]利用LSTM捕捉非规则信息,在未过拟合情况下取得较高精度;Yin等[12]结合信息粒提取、最小二乘支持向量机与粒子群优化提升了预测效果;Yang等[13]通过灰色-马尔可夫模型进一步提高了预测精度. 随着时空影响因素被纳入交通领域的预测研究,Cai等[14]构建时空状态矩阵和改进K最近邻(k-nearest neighbor,KNN)模型,采用高斯加权欧氏距离量化时空影响,适用于短期交通流多步预测;Wu等[15]通过加权距离与状态向量改进KNN,验证了模型在多路段多时段上的适应性,表明时空融合模型优于单一时间模型. 基于LSTM处理缺失数据和残差调整的能力[16],Zou等[17]提出时空日(space-time diurnal, ST-D)方法,融合时空特征与非负性,实现高精度短期旅行时间预测,具更强鲁棒性.

本研究将时空影响因素纳入预测框架,旨在探索时空融合对精度的影响,寻求适合该场景的人工智能预测模型. 高速公路区域货运量具有较强的区域性、季节性,且行驶里程有限,受时空影响显著. 从时空角度构建数据集,整合相关影响因素建立预测模型,提高货运量预测的精度已然成为物流领域亟待解决的问题. 本研究建立基于时空信息融合的改进LSTM模型(TS-LSTM),提出适用于TS-LSTM网络模型的数据集重构方法,以期为实现更精准、可靠的货运量预测提供新途径.

1. 模型构建

1.1. 长短期记忆网络结构

LSTM是深度循环神经网络[18],主要由遗忘门、输入门和输出门组成. 通过3个门的状态,依次决定遗忘状态、加入新状态和输出最终状态,从而影响网络中每个时刻的状态. LSTM的结构如图1所示. 向量从某节点输出再输入其他节点, LSTM的核心是不仅通过细胞状态的连接存放上一次的状态,还通过网络学习存放有用的状态. 在迭代过程中,遗忘门、输入门、输出门的更新公式如下. 1)遗忘门:

图 1

图 1   经典长短期记忆网络结构图

Fig.1   Structure diagram of classic long short-term memory


$ {{\boldsymbol{f}}_t} = {{ \sigma }}({{\boldsymbol{W}}_{\text{i}}}[{{\boldsymbol{h}}_{t - 1}},{{\boldsymbol{x}}_t}]+{{\boldsymbol{b}}_{\text{i}}}){\text{ }} . $

2)输入门:

$ \left.\begin{gathered} {\boldsymbol{i}}_t = {{ \sigma }}({{\boldsymbol{W}}_{\text{i}}}[{{\boldsymbol{h}}_{t - 1}},{{\boldsymbol{x}}_t}]+{{\boldsymbol{b}}_{\text{i}}}){\text{ }} , \\ \widetilde {{{\boldsymbol{C}}_{\boldsymbol{t}}}} = {\text{tanh}}\;({{\boldsymbol{W}}_{\text{c}}}[{{\boldsymbol{h}}_{t - 1}},{{\boldsymbol{x}}_t}]+{{\boldsymbol{b}}_{\text{c}}}) , \\ {{\boldsymbol{C}}_{\boldsymbol{t}}} = {{\boldsymbol{f}}_t}{{\boldsymbol{C}}_{t{{ - 1}}}}+{\boldsymbol{i}}_t\widetilde {{{\boldsymbol{C}}_t}}. \\ \end{gathered} \right\} $

3)输出门:

$\left. \begin{gathered} {\boldsymbol{o}}_t = {{ \sigma }}({{\boldsymbol{W}}_{\text{o}}}[{{\boldsymbol{h}}_{t - 1}},{{\boldsymbol{x}}_t}]+{{\boldsymbol{b}}_{\text{o}}}){\text{ }}, \\ {{\boldsymbol{h}}_t} = {{\boldsymbol{o}}_t}*{\text{tanh}}({{\boldsymbol{C}}_t}) . \\ \end{gathered} \right\} $

式中:$ {{\boldsymbol{W}}_{\text{f}}},{{\boldsymbol{W}}_{\text{i}}},{{\boldsymbol{W}}_{\text{o}}} $分别为遗忘门、输入门和输出门对应的权重,$ {{\boldsymbol{b}}_{\text{f}}},{{\boldsymbol{b}}_{\text{i}}},{{\boldsymbol{b}}_{\text{o}}} $为对应的偏置向量,$ {{\boldsymbol{h}}_{t{{ - 1}}}} $$ {{\boldsymbol{h}}_t} $分别为上一个阶段和此阶段的输出,$ {{\boldsymbol{x}}_t} $为此阶段的输入,$ \widetilde {{{\boldsymbol{C}}_t}} $为备选记忆细胞,$ {\text{tanh}} $控制$ {{\boldsymbol{C}}_t} $加入的多少,$ {{\boldsymbol{W}}_{\text{c}}} $$ {{\boldsymbol{b}}_{\text{c}}} $分别为记忆细胞权重和偏置向量,$ {{\boldsymbol{C}}_t} $为新的细胞状态向量,$ {{\boldsymbol{C}}_{t - 1}} $为上一时刻的细胞状态向量,$ {{ \sigma }} $为Sigmoid函数.

1.2. 基于时空信息融合的改进长短期记忆网络模型结构

TS-LSTM的结构如图2示,TS-LSTM细胞主要从第一和第二通道分别探索数据在时间和空间维度内的隐藏信息,$ {{\boldsymbol{H}}_{t{{ - 1}}}} $为上一时刻的隐藏矩阵. 细胞的内部架构如图3所示. TS-LSTM的第一通道即时间通道,主要针对时间序列的相关性开展工作,时间序列内的相关性主要是指相邻步长间的相似性以及趋势性. 与传统LSTM相同的是,TS-LSTM细胞内状态由部分当前输入和过去状态的组合决定,但细胞内的序列特征须进行周期性更新;与传统LSTM不同的是,TS-LSTM细胞不再是单一的时间序列嵌入,而是一系列时间序列的嵌入表示,即时间序列输入矩阵. 定义$ {{\boldsymbol{C}}_{{\mathrm{i}},t}} \in {{\bf{R}}^{l \times N}} $$ {{\boldsymbol{H}}_{{\mathrm{i}},t}} \in {{\bf{R}}^{u \times N}} $分别为时刻$ t $细胞间的序列状态和序列间隐藏状态矩阵,其中$ l $为将时间序列变为输入矩阵时新增维度的长度,$ \mu $为嵌入的维度数量,$ {{N}} $为相关的时间序列长度. $ {{\boldsymbol{I}}}_{{\mathrm{i}},t}、{{\boldsymbol{F}}}_{{\mathrm{i}},t}、{{\boldsymbol{O}}}_{{\mathrm{i}},t} $分别表示遗忘门、输入门、输出门,用以控制多少信息应保留在此刻的时间序列中,相应的迭代更新公式分别为

图 2

图 2   基于时空信息融合的改进长短期记忆网络模型结构图

Fig.2   Structure diagram of improved long short-term memory model based on spatiotemporal information fusion


图 3

图 3   基于时空信息融合的改进长短期记忆网络模型的细胞内部结构图

Fig.3   Cell internal structure diagram of improved long short-term memory model based on spatiotemporal information fusion


$ {{\boldsymbol{I}}_{{\mathrm{i}},t}} = {\text{sigmoid\;(}}{{\boldsymbol{W}}_{\mathrm{i}}}{\text{[}}{{\boldsymbol{X}}_{{\mathrm{i}},t}},{{\boldsymbol{H}}_{{\mathrm{i}},t - {\text{1}}}}{\text{]}}+{{\boldsymbol{b}}_{\mathrm{i}}}{\text{)}},$

${{\boldsymbol{F}}_{{\mathrm{i}},t}} = {\text{sigmoid\;(}}{{\boldsymbol{W}}_{\text{f}}}{\text{[}}{{\boldsymbol{X}}_{{\mathrm{i}},t}},{{\boldsymbol{H}}_{{\mathrm{i}},t{{ - 1}}}}{\text{]}}+{{\boldsymbol{b}}_{\text{f}}}{\text{)}},$

$ {{\boldsymbol{O}}_{{\mathrm{i}},t}} = {\text{sigmoid\;(}}{{\boldsymbol{W}}_{\text{o}}}{\text{[}}{{\boldsymbol{X}}_{{\mathrm{i}},t}},{{\boldsymbol{H}}_{{\mathrm{i}},t{{ - 1}}}}{\text{]}}+{{\boldsymbol{b}}_{\text{o}}}{\text{)}},$

${{{\tilde {\boldsymbol{C}}}}_{{\mathrm{i}},t}} = {\text{tanh\;(}}{{\boldsymbol{W}}_{\text{c}}}{\text{[}}{{\boldsymbol{X}}_{{\mathrm{i}},t}},{{\boldsymbol{H}}_{{\mathrm{i}},t{{ - 1}}}}{\text{]}}+{{\boldsymbol{b}}_{\text{c}}}{\text{)}},$

$ {{\boldsymbol{C}}_{{\mathrm{i}},t}} = {{\boldsymbol{I}}_{{\mathrm{i}},t}}\circ {{{\tilde {\boldsymbol{C}}}}_{{\mathrm{i}},t}}+{{\boldsymbol{F}}_{{\mathrm{i}},t}}\circ {{\boldsymbol{C}}_{{\mathrm{i}},t - 1}} , $

$ {{\boldsymbol{H}}_{{\mathrm{i}},t{{ - 1}}}} = {{\boldsymbol{O}}_{{\mathrm{i}},t}}\circ \tanh \;({{\boldsymbol{C}}_{{\mathrm{i}},t}}) . $

式中:$ \circ $表示元素相乘.TS-LSTM的第二通道即空间通道,序列内的空间相关性是指时间序列与其他序列间的相互影响. 输入通道$ {{\boldsymbol{X}}_{{\mathrm{i}},f}} \in {{\bf{R}}^{d \times N}} $$ {{N}} $个相关序列,每个序列均属于$ {{d}} $维空间. 矩阵$ {\boldsymbol{S}} \in {{\bf{R}}^{N \times N}} $为时间序列的空间相互影响系数矩阵,将$ {{\boldsymbol{X}}_{{\mathrm{i}},f}} $与空间关系矩阵$ {\boldsymbol{S}} $相乘,得到新的矩阵$ {\boldsymbol{X}}_{{\mathrm{i}},f}' $即时间序列间的相互关系. 序列间状态、隐藏权重层根据$ {\boldsymbol{X}}_{{\mathrm{i}},f}' $计算. $ {{\boldsymbol{I}}}_{{\mathrm{i}},f}、{{\boldsymbol{F}}}_{{\mathrm{i}},f}、{{\boldsymbol{O}}}_{{\mathrm{i}},f} $用以控制信息流,输入通道信息$ {{{\tilde {\boldsymbol{C}}}}_{{\mathrm{i}},f}} $$ {\boldsymbol{X}}_{{\mathrm{i}},f}' $和序列间空间通道前一时刻的隐藏层输出$ {{\boldsymbol{H}}_{{\mathrm{i}},t - 1}} $决定. 个体嵌入代表信息包括对每个序列与其他序列间的空间信息,公式更新如下:

$ {\boldsymbol{X}}_{{\mathrm{i}},f}' = {\text{ }}{{\boldsymbol{X}}_{{\mathrm{i}},f}} \times {\boldsymbol{S}} , $

$ {{\boldsymbol{I}}_{{\mathrm{i}},f}} = {\text{ sigmoid}}\;({{\boldsymbol{W}}_{\text{i}}}'[{\boldsymbol{X}}_{{\text{i}},f}',{{\boldsymbol{H}}_{{\mathrm{i}},t - 1}}]+{\boldsymbol{b}}_{\text{i}}') , $

$ {{\boldsymbol{F}}_{{\text{i}},f}} = {\text{ sigmoid}}\;({\boldsymbol{W}}_{\text{f}}'[{\boldsymbol{X}}_{{\mathrm{i}},f}',{{\boldsymbol{H}}_{{\mathrm{i}},t - 1}}]+{\boldsymbol{b}}_{\text{f}}') , $

$ {{\boldsymbol{O}}_{{\mathrm{i}},f}} = {\text{ sigmoid}}\;({\boldsymbol{W}}_{\text{o}}'[{\boldsymbol{X}}_{{\mathrm{i}},f}',{{\boldsymbol{H}}_{{\mathrm{i}},t - 1}}]+{\boldsymbol{b}}_{\text{o}}') , $

$ {\widetilde {\boldsymbol{C}}_{{\mathrm{i}},f}} = {\text{ tanh}}\;({\boldsymbol{W}}_{\text{c}}'[{\boldsymbol{X}}_{{\mathrm{i}},f}',{{\boldsymbol{H}}_{{\mathrm{i}},t - 1}}]+{\boldsymbol{b}}_{\text{c}}') , $

$ {{\boldsymbol{C}}_{{\mathrm{i}},f}} = {\text{ }}{{\boldsymbol{I}}_{{\mathrm{i}},f}} \circ {\widetilde {\boldsymbol{C}}_{{\mathrm{i}},f}}+{{\boldsymbol{F}}_{{\mathrm{i}},f}} \circ {{\boldsymbol{C}}_{{\mathrm{i}},f - 1}} , $

$ {{\boldsymbol{H}}_{{\mathrm{i}},f}} = {\text{ }}{{\boldsymbol{O}}_{{\mathrm{i}},f}} \circ {\text{tanh}}\;({{\boldsymbol{C}}_{{\mathrm{i}},f}}) . $

在第一层中,为了将数据$ {{\boldsymbol{X}}_t} \in {{\bf{R}}^N} $转变成TS-LSTM的2个信道输入,令$ {{\boldsymbol{X}}}_{\text{i},t}=\text{ }{{\boldsymbol{X}}}_{t}{'}、{{\boldsymbol{X}}}_{\text{i},f}=\text{ }{{\boldsymbol{X}}}_{t}' $,其中$ {{\boldsymbol{X}}_t}' \in {{\bf{R}}^{l \times N}} $$ {{\boldsymbol{X}}_t} $扩展了1个维度. 令$ {{\boldsymbol{W}}_*} = [{{\boldsymbol{W}}_*}^{{x}}, {{\boldsymbol{W}}_*}^{{h}}] $,其中$ {{\boldsymbol{W}}_*}^x \in {{\bf{R}}^{u \times d}},{{\boldsymbol{W}}_*}^h \in {{\bf{R}}^{u \times u}},* \in \left\{ {{{\mathrm{{i,f,o,c}}}}} \right\} $$ {\boldsymbol{W}}_*' $$ {{\boldsymbol{W}}_*} $相似,$ {{\boldsymbol{b}}_*}、 {{\boldsymbol{b}}_*}' \in {{\bf{R}}^u} $为偏置. $ {\boldsymbol{W}}_*'、{{\boldsymbol{W}}_*}、{{\boldsymbol{b}}_*}、{{\boldsymbol{b}}_*}' $均为学习参数,$ {\boldsymbol{S}} $为相关时间序列间的相互影响系数矩阵,根据先验知识进行设定,比如在研究地理空间的相关时间序列时,$ {\boldsymbol{S}} $可以是不同站点间物理距离的相似矩阵,也可以设置$ {\boldsymbol{S}} $为优先权矩阵,再根据实际训练数据进行微调. 所有$ {\tilde{{\boldsymbol{C}}}}_{\text{i},t}、{\tilde{{\boldsymbol{C}}}}_{\text{i},f}、{{\boldsymbol{H}}}_{\text{i},t}、{{\boldsymbol{H}}}_{\text{i},f} $仍使用正切函数作为激活函数.

1.3. 模型性能评估指标

采用均方根误差RMSE、平均绝对值误差MAE和平均绝对百分比误差MAPE评估模型的预测性能,计算式分别为

$ {\text{RMSE = }}\sqrt {\frac{{\text{1}}}{N}\sum\limits_{i{\text{ = 1}}}^N {{{{\text{(}}{y_i}{{ - }}\hat {{y_i}}{\text{)}}}^{{\text{2}}}}} } , $

$ {\text{MAE = }}\frac{{\text{1}}}{N}\sum\limits_{i = {\text{1}}}^N {\left| {{y_i}{{ - }}\hat {{y_i}}} \right|} , $

$ {\text{MAPE = }}\frac{{\text{1}}}{N}\sum\limits_{i{\text{ = 1}}}^N {\frac{{\left| {{y_i}{{ - }}\hat {{y_i}}} \right| \cdot {\text{100\% }}}}{{\hat {{{\text{y}}_i}}}}} . $

式中:$ N $为样本数量,$ {y_i} $$ \hat {{y_i}} $分别为真实值和预测值. MAE和MAPE越小说明模型预测性能越好.

2. 时空数据集重构方法

高速公路区域货运量预测是指根据高速公路历史货运量统计数据和其他关联数据,使用预测方法对规划区域内高速公路未来时刻货运量的指标进行预测的过程. 本研究基于行政区域划分对高速公路货运量进行预测. 对货运量进行预测时,除了模型的选取至关重要之外,模型数据集的作用也不容忽视. 为了适应TS-LSTM,须建立合适的方法对时空数据进行融合重构. 货运量数据集来源于高速公路收费系统数据,原始数据集包含交通流往来数据,但不包含有效的时空信息,为此将数据中包含的潜在有效时空信息提取出来. 在完成货运量的处理之后,分别从时间和空间维度提取影响因素,实现货运量预测数据集的重构. 数据集重构前,处理工作包括:将货车往来记录按照起始点归属映射为区域货车流往来信息;对输入记录进行预处理,获取各个区域的货运量信息;在挖掘区域内货运量时间序列信息的同时,进一步挖掘空间影响因素.

2.1. 栅格划分

定义1  将统计时间间隔$ T{\text{ = [}}{T_a}{\text{,}}{T_b}{\text{]}} $划分成时间序列$ \left\{ {{{{T}}_i}|i=1,2,\cdots,{M}} \right\} $,其中$ {T_i} $为时间间隙. 在进行货运量统计时,时间间隙可以是年、月、日、时、分等任意时间颗粒.

定义2  将某个区域(如某个行政区、城市或者省份等)分成$ N $个无重叠的网格$ {G}= \{{g}_{i}|{i}= 1, 2, \cdots , {N}\} $,称每个网格为栅格,其大小由区域面积及栅格最大数量$ N $确定. $ g_{i} $在给定$ {T_i} $的数据$ {M_i} $不仅受以往时间间隙$ {T_1}{\text{,}}{T_{\text{2}}},\cdots,{T_{i{{ - 1}}}} $的影响,还与其他栅格的数据$ {M_j},j = 1,2,\cdots, N,j \ne i $有关,到达此栅格的货运量与以其他栅格为起始点的货运量密切相关.

定义3 当$ g_i $与其他栅格$ {g_j},j = 1,2,\cdots, N,j \ne i $之间存在货物运输记录$ {M_{ij}} $,即$ {{\varOmega }}_t^i{\text{ = }}\{ {g_j}{\text{|}}{M_{ij}} > 0,{M_{ij}} \in {M_t} \} $时,称$ g_{j} $$ g_i $的邻域.

2.2. 数据预处理

高速公路运输量数据收录188个吉林省内收费站和24个省界门架收费站的货车往来记录,以收费记录的形式存在,包含如车辆行驶路程的入站口时间、入站口收费站、行驶车道、出口时间、出站口收费站、行驶车辆类型、载重、ETC收费与否、车辆的车牌等有效信息. 省界门架收费站主要记录车辆进出省界的信息,如进出省界的时间、进出省界的收费站序号、车牌等. 观察高速公路收费系统数据发现,中长行程占据了绝大多数,运输时间都不超过1 d,因此在将数据输入组织模型时,设置每对栅格的截取时间间隔为1 d,即一天内的货物往来数量. 以2020年12月1日为例,假如从东丰县至长春市的货物运输量为486.2 t,意味着当天所有从东丰县境内的所有收费站为起点到长春市任意收费站为终点的货物总和为486.2 t. 数据预处理的具体流程及步骤如下.

1)设置吉林省全域栅格为$ G_{i}( i=1,2, \cdots, N) $,栅格与县级行政区域对应,建立收费站-栅格映射图,每个栅格的货运量为该栅格内所有收费站的货运量之和. 在本研究中,N=48,包括41个县级行政区和7个省界收费站. 对高速公路收费系统数据和门架数据进行数据清洗,主要包括缺失值、异常值的处理. 将每条记录中的出入收费站映射至对应栅格,将数据整理为栅格间的货物往来记录.

2)从原始数据集中筛选所需货车类型,供选择包括6种车型,编号为车型I~车型Ⅵ.

3)将载重减去对应车型的车辆平均自重之后进行加和.

4)将省内记录和门架记录根据车牌信息和时间信息进行关联,形成完整的数据记录.

5)以$ g_i $为起始点O$ g_{j}( j=1,2, \cdots, N) $为终止点D,以出站口时间为统计标准,计算每天的不同货车类型的货运量总重.

6)对所有的栅格重复步骤4)和5).

7)将输入数据编码成二维矩阵格式,其中列按照网格顺序排列,行按照时间序列排序,行记录$ g_i $在某时间间隙邻域内的货物发生量.

2.3. 基于时空信息的建模数据集重构

重构预处理后的数据,货运量的影响因素主要包括2个部分:空间信息、时间信息. 空间信息即与出发网格$ g_o $有货物往来记录的所有目的网格$ g_{D} $的货运量信息. 在这个数据集中,每天统计每个栅格至其他邻域的货运量,将其他栅格的货运量往来视为影响因素,各栅格权重矩阵计算式为

$ {{\boldsymbol{w}}_{\boldsymbol{i}}}{\text{ = mean}}\left(\sum\limits_T {\left\{ {{g_i}} \right\} \cap \left\{ {{g_j},{g_j} \in {{G}}} \right\}} \right) . $

$ {\boldsymbol{W}}=\left[{{\boldsymbol{w}}}_{i}\text{,}{{\boldsymbol{w}}}_ {j}\right]\text{; }j\text{=1,2,}\cdots ,N\text{;}j\ne i . $

式中:$ {{\boldsymbol{w}}_{\boldsymbol{i}}} $$ g_i $与其他栅格的空间关系向量,$ {\text{mean}}\left( \cdot \right) $为栅格$ g_i $$ g_{j} $的平均起讫点货运量,$ {\boldsymbol{W}} $为所有栅格的空间权重矩阵,$ \left[ {{{\boldsymbol{w}}_{{i}}}{\text{,}}{{\boldsymbol{w}}_j}} \right] $为2个栅格权重的纵向拼接. 时间信息即该栅格历史时刻与未来时刻货运量数据,选取历史货运量时间序列的长度,组成时间信息数据. 选定时间域嵌入维度以及栅格间的空间权重信息是进行高速公路区域货运量预测的基础. 使用TS-LSTM可以针对此重构数据集预测对应栅格的货物发生量.

2.4. 区域短期货运量预测算法流程

1)对高速公路收费系统数据进行预处理,选取合适的时间间隔,统计得到每对栅格间的货运量. 2)获取栅格之间的空间权重矩阵. 3)统计并获取系统中每个栅格的历史时刻数据,即时间序列数据. 4)选定输入时空维度长度,针对子序列输入和对应输出,利用TS-LSTM进行预测. 5)完成预测后,将误差结果与其他预测模型进行比较.

3. 结果分析与模型对比

影响高速公路区域货运量序列的相关因素有时间和空间,将它们纳入预测模型特征,可增加算法的鲁棒性,提升算法的准确率. 将预处理后的数据进行重构,构成历史影响因素-未来运输量数据对,是进行货运量预测的基础,选取历史影响因素的长度对于模型的精度也至关重要.

3.1. 时空因素影响分析

选用分类与回归树(classification and regression trees, CART)算法分别计算历史时刻和邻域栅格的重要性,根据计算结果进行维度选择. 以时间维度为例,通过计算历史货运量$ {M_{t - i}} $与第$ t $时刻货运量$ {M_t} $之间的基尼指数Gini将$ {M_{t - i}} $$ {M_t} $的重要性进行排序,计算式为

$ \begin{split} I{\text{(}}{a_i}) &= \sum\limits_{t = 1}^T {\frac{{{M_t}}}{{{M_{{\mathrm{CART}}}}}}} \Delta {\text{Gini\;}}{\text{(}}{M_t}_{ - i},{M_t}{\text{) }} = \\& \sum\limits_{t = 1}^T {\frac{{{M_t}}}{{{M_{{\mathrm{CART}}}}}}} ({\text{Gini\;(}}{M_t}{\text{) }} - {\text{Gini\;(}}{M_t}_{ - i},{M_t}{\text{) )}} \end{split} . $

式中:$ I{\text{(}}{a_i}{\text{)}} $$ a $栅格第$ i $个影响因素的重要性,$ \Delta {\text{Gini\;}}{\text{(}}{M_t}_{ - i},{M_t}{\text{)}} $为引入$ t $时刻的影响因素$ {{{a}}_i} $的货运量之后的基尼指数变化,$ {M_{{\text{CART}}}} $为总货运量,$ {M_t} $为第$ t $时刻的货运量. 根据影响因素属性,可将$ I $分为时间重要性系数$ {I_{\text{t}}}(a) $和空间重要性系数$ {I_{\text{s}}}(a) $.

对全省每个栅格由CART算法得到的前30个时间时刻和48个空间变量的重要性进行排序. 选取珲春市、磐石市、四平市、图们市为代表格栅,其时间重要性如图4所示, 其中编号表示$ T $时刻的前$ P $个时刻的编号,重要性系数的数值越大,对应的时刻编号对时刻$ T $的影响越大. 每个栅格的货运量受历史时刻货运量的影响不同,珲春市的前2、1、23、5、13、29、6、26个时刻的重要性分别为19.31%、18.37%、13.04%、7.95%、5.18%、4.79%、4.41%、4.01%. 磐石市的前1、23、4、13、8、2、6、11个的时刻重要性分别为56.34%、6.74%、4.19%、4.11%、4.06%、3.12%、2.18%、2.12%. 四平市的前1、2、23、3个的重要性依次为54.91%、13.86%、3.30%、3.19%. 图们市的前22、1、26、9、24个的重要性为29.22%、28.23%、4.45%、3.38%、3.21%. 可以看出,不同栅格的历史时刻对货运量的影响不完全相同,在考虑模型输入时,可根据需要灵活选择重要性大于阈值的$ N $个时刻作为历史货运量的时间维度.

图 4

图 4   举例格栅的时间重要性分析结果

Fig.4   Results of temporal importance analysis for representative grids


4个代表栅格的空间重要性系数如图5所示(仅展示有影响的栅格重要性),重要性系数的数值越大,表示对应的邻域对栅格的影响越大. 不同栅格受其他栅格货运量的影响不同,珲春市主要受图们市、延吉市、蛟河市、吉林市、安图市、长春市、敦化市、长春边界、通化边界的影响,比例分别为47.40%、19.11%、10.06%、9.44%、4.64%、2.22%、1.69%、1.51%、1.45%. 磐石市主要受自身、辉南县、农安县、东丰县、通化边界、吉林市、永吉县、长春市的影响,重要性分别为33.96%、22.95%、13.22%、5.52%、4.13%、3.36%、3.33%、2.58%. 四平市的空间影响变量比较少,为公主岭市、梨树县、长春市、四平市,重要性分别为39.10%、29.33%、12.65%、7.47%. 图们市受安图市、吉林市、延吉市、珲春市、长春市的影响比较大,重要性分别为33.88%、25.67%、20.26%、9.25%、2.88%. 不同栅格间的货运量关系与栅格间的货运量往来密切相关,因此获取不同栅格间的货运量矩阵作为TS-LSTM的动态输入对货运量的预测意义重大.

图 5

图 5   举例格栅的空间重要性分析结果

Fig.5   Results of spatial importance analysis for representative grids


3.2. TS-LSTM模型性能分析

为验证TS-LSTM在货运量预测上的有效性与性能优势,设计3组仿真实验:1)只考虑时间因素,即从时间维度预测每个栅格未来的货运量值;2)只考虑空间维度. 3)融合时空信息的数据集. 前2组使用传统的LSTM模型(T-LSTM和S-LSTM),第3组使用TS-LSTM. 3组实验均从仿真时间$t_{\mathrm{s}} $、相对误差$e_{\mathrm{r}} $、MAE三方面比较不同模型的性能.

对数据观察发现,高速公路区域货运量的波动以周为周期,因此将时间序列长度取为7 d. 设置批量大小batch_size = 10,预测未来1天的数据delay = 1,仿真迭代轮次epoch=50,训练集、测试集、验证集的比例设置为0.70∶0.15∶0.15. 实验平台为CPU Intel(R) core i5 and 12G RAM,Windows 10 64 bit Anaconda3(64 bit). 原始数据均来源于吉林省高速公路收费系统数据2020年11月—2021年11月的记录,共计25 563 256条,任意选取长春市、吉林市、松原市为格栅进行仿真实验.

表1所示为3种模型对区域货运量预测的结果对比,日期为任意选取3个时刻,NFVT、NFVP分别为z-score标准化的实际货运量和预测货运量. T-LSTM、S-LSTM和TS-LSTM的N个栅格MAE分别为0.16、1.01、0.11,ts=8635.5212455.3439766.99 s. 可以看出,尽管T-LSTM和S-LSTM在不同栅格上的表现存在差异,但TS-LSTM的相对误差始终低于二者. 结果表明,TS-LSTM在预测精度上显著优于T-LSTM和S-LSTM,其MAE分别降低了约31.3%和89.1%. TS-LSTM更高的计算复杂度也导致其仿真时间大幅增加,约为T-LSTM的4.6倍. 因此,TS-LSTM是以更高的计算成本为代价,换取了极高的预测精度提升.

表 1   不同长短期记忆网络模型的货运量预测结果对比

Tab.1  Comparison of freight volume prediction results among different long short-term memory models

gi日期NFVTT-LSTMS-LSTMTS-LSTM
NFVPer/%NFVPer/%NFVPer/%
长春市2020–11–08−1.760 35−0.425 58−75.821.57041−10.791.61972−7.99
2021–01–09−1.041 60−0.987 70−5.170.84213−19.151.02464−1.63
2021–05–131.500 421.092 39−27.191.623758.221.575685.02
吉林市2020–11–09−1.013 21−0.965 39−4.720.58918−41.850.99375−1.92
2020–12–150.072 360.026 48−63.410.08794821.530.0856218.33
2021–01–07−0.542 42−0.606 1711.750.7232633.340.588818.55
松原市2020–11–140.562 480.408 93−27.300.53919−4.140.55495−1.34
2021–01–27−2.074 66−2.126 462.502.7736133.692.06008−0.70
2021–03–281.101 011.129 072.551.02592−6.821.09384−0.65

新窗口打开| 下载CSV


图6所示为不同模型预测的栅格货运量变化与实际变化对比图,其中$ {D_{{\text{or}}}} $为货运天数序列,NFV为归一化的货运量. 预测模型均使用过去7天的数据预测未来1天的货运量. 可以看出,TS-LSTM能够比其他模型更准确地预测出货运量变化趋势,特别是在货运量急剧下降的月份,如对于长春市第49个时刻,T-LSTM, S-LSTM, TS-LSTM的$e_{\mathrm{r}}= $−7.18%、−1.85%和0.87%. 相比T-LSTM和S-LSTM,TS-LSTM的预测值更接近实际值,说明通过融合时空影响因素的模型可有效提高LSTM的预测性能. 分析原因,机器学习以基尼指数充分挖掘时空影响因素与货运量之间的内在关联程度,所得时间和空间信息维度能够充分代表影响因素的重要程度,提高LSTM的预测性能. T-LSTM和S-LSTM分别从时间和空间维度进行预测,由于无法体现各影响因素的差异性,导致信息发生冗余,预测效果较差. 大部分情况下,T-LSTM的预测效果优于S-LSTM,比如表1中长春市的2021–01–09,吉林市的2020–11–09、2021–01–07,松原市的2021–01–27、2021–03–28;使用S-LSTM预测长春市的2020–11–08、2021–05–13,吉林市的2020–12–15和松原市的2020–11–14数值比使用T-LSTM预测的数值更接近真实值,也说明从单一角度预测货运量容易造成信息的缺失,预测效果不佳,这与时空影响因素影响预测结果的结论一致.

图 6

图 6   不同长短期记忆网络模型预测年周期货运量变化的对比图

Fig.6   Comparison chart of annual cyclical freight volume changes predicted by different long short-term memory models


图7所示为3种模型在3个栅格上的MAE变化. 可以看出,TS-LSTM的MAE最大、最小值比T-LSTM和S-LSTM的均有所降低. 如松原训练集,使用T-LSTM的MAE=0.25,使用S-LSTM的MAE=0.75,TS-LSTM的MAE=0.13,分别降低了48.0%和82.6%. TS-LSTM在第15轮左右达到收敛,T-LSTM和S-LSTM在第20轮收敛,而且松原和吉林的货运量预测数据稳定性远不如TS-LSTM,表明融合时空信息的模型预测精度高于只包含时间信息或者空间信息的2个模型.

图 7

图 7   不同长短期记忆网络模型的预测性能对比

Fig.7   Comparison of prediction performance among different long short-term memory models


3.3. 模型对比分析

3.3.1. 对比经典机器学习模型

基于相同的数据集,将TS-LSTM与3种经典机器学习模型进行性能对比分析,对比模型分别为全连接神经网络、单向LSTM、双向LSTM(BidLSTM),性能评估指标选取MAE、MAPE、仿真时间进行对比分析如表2所示. 可以看出TS-LSTM模型的误差均低于经典机器学习模型. 唯一的不足是TS-LSTM的仿真时间在参与对比的模型中最长,这主要是模型的内部结构不同导致的.

表 2   不同预测模型的性能指标对比

Tab.2  Comparison of performance metrics for different prediction methods

模型MAEMAPEts/s
全连接0.171 3104.051 11105.25
LSTM0.354 5150.324 26544.97
BidLSTM0.2514120.564 520819.69
TS-LSTM0.155 472.251 239766.99

新窗口打开| 下载CSV


选取辽源市、公主岭市、四平市进行仿真,不同模型的MAE对比结果如图8所示. 在参与对比的模型中,TS-LSTM的预测效果最好,3个格栅的MAE分别为0.037160.03615,0.021 31,比预测表现次好的全连接模型依次低了35.62%,66.30%,80.85%;相比之下,LSTM与BidLSTM模型的MAE大多维持在0.2左右,显著高于TS-LSTM和全连接模型,表明其预测性能相对较差. 由此可见,将融合时空信息的数据集作为TS-LSTM的输入,是有效的高速公路短期货运量预测方法,不仅能够发挥LSTM的优势,更好地反映高速公路货运量变化的特征,而且能体现时空影响因素的重要性,提高预测精度. 在所有的栅格中单向LSTM的预测效果明显差于双向LSTM,就辽源市、公主岭市、四平市而言,前者的MAE=0.085950.15817,0.197 39;后者的平均误差为0.05717,0.145 54,0.147 55,分别提高了33.48%,7.99%,25.25%. 说明将信息进行双向传输能提高预测精度,主要原因是BidLSTM利用了时间序列的顺序敏感性,会捕捉到单向LSTM忽略的模式,这也为将TS-LSTM改进为双向TS-LSTM提供了研究思路. 根据实验数据结果将模型预测效果降序排列如下:TS-LSTM、全连接模型、BidLSTM、LSTM.

图 8

图 8   不同预测模型在举例格栅中的预测性能对比

Fig.8   Comparison of prediction performance of different prediction models on representative grids


3.3.2. 对比Transformer模型

鉴于Transformer模型在时间序列预测方面的性能,将时空融合后的数据集使用Transformer与LS-LSTM进行性能比较,选取Adam优化器,其他仿真参数设置与3.2节中的参数一致,为表现模型的泛化能力,使用48个栅格的MAE和MAPE平均值进行分析,对比结果如图9所示. TS-LSTM的MAE和MAPE均低于Transformer模型,Transformer模型48个栅格训练集和验证集的MAE平均值分别约为0.082和0.089,TS-LSTM的分别约为0.048和0.080;Transformer模型48个栅格训练集和验证集的MAPE平均值分别约为51.54%和52.51%,TS-LSTM的分别为30.50%和31.69%. 相比于Transformer模型,TS-LSTM模型训练集和验证集的MAE分别降低了41%和10%,MAPE均降低了21个百分点. 显而易见,TS-LSTM的预测效果优于Transformer模型.

图 9

图 9   对比2种预测模型的泛化能力

Fig.9   Comparison of generalization capabilities between two prediction models


4. 结 语

高速公路区域货运量是多影响因素作用下的复杂动态系统,受限于数据源缺乏、统计模型区域货运量分配不均、预测精度较低,现有预测方法存在不足. 本研究以区域高速公路货运量为对象,按时空影响因素的重要性进行数据源的重构,根据数据特点设计双通道LSTM改进模型,与多种预测模型进行比较,建立在稳定性、预测精度、推广能力方面更优秀的预测模型来预测货运量的发展趋势,可为区域高速公路货运组织和物流运作提供决策依据. TS-LSTM的内部结构分别为时间和空间信息提供数据输入通道. 为了提高计算效率,算法利用机器学习进行输入信息筛选,分析时空信息的重要性,重构TS-LSTM输入的数据集,在保证精度的同时增强了模型稳定性. TS-LSTM的预测值比分别从时间和空间维度使用LSTM模型的预测值更接近实际值;TS-LSTM与经典机器学习模型的仿真对比实验结果表明,TS-LSTM能够很好地反映公路货运量的变化趋势及规律,提高预测精度;TS-LSTM比Transformer模型的预测效果好. 实验均以吉林省高速公路货运量为例进行验证,说明TS-LSTM可以作为实用性较强的高速公路货运量预测方法推广使用. 下一步将继续在数据集构建方法和预测模型方面开展相关研究.

参考文献

徐菲, 任爽

基于分解—集成的铁路货运需求预测研究

[J]. 运筹与管理, 2021, 30 (8): 133- 138

[本文引用: 1]

XU Fei, REN Shuang

Railway freight demand forecasting based on decompose-ensemble method

[J]. Operations Research and Management Science, 2021, 30 (8): 133- 138

[本文引用: 1]

蔡志强. 阿拉山口铁路货运量预测分析 [D]. 兰州: 兰州交通大学, 2015: 1–44.

[本文引用: 1]

CAI Zhiqiang. The forecasting analysis of volume of railway freight about Ala Shan Kou [D]. Lanzhou: Lanzhou Jiaotong University, 2015: 1–44.

[本文引用: 1]

付建飞, 安仲文, 宋小满, 等

基于灰色模型的铁路分品类货运量预测

[J]. 交通运输工程与信息学报, 2014, 12 (3): 38- 42

FU Jianfei, AN Zhongwen, SONG Xiaoman, et al

Traffic volume forecast of railway different freight categories based on grey model

[J]. Journal of Transportation Engineering and Information, 2014, 12 (3): 38- 42

王开鹏. 基于高维面板数据的铁路货运量预测方法 [D]. 武汉: 华中科技大学, 2019: 1–87.

[本文引用: 1]

WANG Kaipeng. Railway freight volume forecasting method based on high-dimensional panel data [D]. Wuhan: Huazhong University of Science and Technology, 2019: 1–87.

[本文引用: 1]

徐曼, 陆芬

基于组合预测模型的陕西省物流需求预测

[J]. 物流科技, 2023, 46 (11): 27- 31

[本文引用: 1]

XU Man, LU Fen

Forecasting and analysis of Shaanxi Province’s logistics demand based on combination forecasting model

[J]. Logistics Sci-Tech, 2023, 46 (11): 27- 31

[本文引用: 1]

席少龙. 基于PCA-AFSA-SVM的河南省公路货运量预测研究 [D]. 深圳: 深圳大学, 2019: 1–67.

XI Shaolong. Prediction of highway freight volume in Henan Province based on PCA-AFSA-SVM [D]. Shenzhen: Shenzhen University, 2019: 1–67.

SOBASZEK Ł, GOLA A, KOZŁOWSKI E

Predictive scheduling with Markov chains and ARIMA models

[J]. Applied Sciences, 2020, 10 (17): 6121

DOI:10.3390/app10176121      [本文引用: 1]

NUZZOLO A, COMI A

Urban freight demand forecasting: a mixed quantity/delivery/vehicle-based model

[J]. Transportation Research Part E: Logistics and Transportation Review, 2014, 65: 84- 98

DOI:10.1016/j.tre.2013.12.014      [本文引用: 1]

GAO N, HONG Y, CHEN J, et al

Regional expressway freight volume prediction algorithm based on meteorological information

[J]. Promet - Traffic and Transportation, 2023, 35 (2): 195- 211

[本文引用: 1]

LI Y, WEI Z

Regional logistics demand prediction: a long short-term memory network method

[J]. Sustainability, 2022, 14 (20): 13478

DOI:10.3390/su142013478      [本文引用: 1]

MOHAMMADZADEH M, CHOUPANI A A, AFSHAR F

The short-term prediction of daily traffic volume for rural roads using shallow and deep learning networks: ANN and LSTM

[J]. The Journal of Supercomputing, 2023, 79 (15): 17475- 17494

DOI:10.1007/s11227-023-05333-w      [本文引用: 1]

YIN S, JIANG Y, TIAN Y, et al

A data-driven fuzzy information granulation approach for freight volume forecasting

[J]. IEEE Transactions on Industrial Electronics, 2017, 64 (2): 1447- 1456

DOI:10.1109/TIE.2016.2613974      [本文引用: 1]

YANG F, TANG X, GAN Y, et al

Forecast of freight volume in Xi’an based on gray GM (1, 1) model and Markov forecasting model

[J]. Journal of Mathematics, 2021, 2021: 6686786

[本文引用: 1]

CAI P, WANG Y, LU G, et al

A spatiotemporal correlative k-nearest neighbor model for short-term traffic multistep forecasting

[J]. Transportation Research Part C: Emerging Technologies, 2016, 62: 21- 34

DOI:10.1016/j.trc.2015.11.002      [本文引用: 1]

WU S, YANG Z, ZHU X, et al

Improved k-nn for short-term traffic forecasting using temporal and spatial information

[J]. Journal of Transportation Engineering, 2014, 140 (7): 04014026

DOI:10.1061/(ASCE)TE.1943-5436.0000672      [本文引用: 1]

TIAN Y, ZHANG K, LI J, et al

LSTM-based traffic flow prediction with missing data

[J]. Neurocomputing, 2018, 318: 297- 305

DOI:10.1016/j.neucom.2018.08.067      [本文引用: 1]

ZOU Y, ZHU X, ZHANG Y, et al

A space–time diurnal method for short-term freeway travel time prediction

[J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 33- 49

DOI:10.1016/j.trc.2013.10.007      [本文引用: 1]

HOCHREITER S, SCHMIDHUBER J

Long short-term memory

[J]. Neural Computation, 1997, 9 (8): 1735- 1780

DOI:10.1162/neco.1997.9.8.1735      [本文引用: 1]

/