基于门控循环单元的多因素感知短期游客人数预测模型

doi:10.3785/j.issn.1008-973X.2019.12.013

基于门控循环单元的多因素感知短期游客人数预测模型

王敬昌^,, 陈岭^,, 余珊珊, 蒋晨书, 吴勇

Multi-factor perceived short-term tourist number prediction model based on gated recurrent unit

WANG Jing-chang^,, CHEN Ling^,, YU Shan-shan, JIANG Chen-shu, WU Yong

通讯作者: 陈岭，男，副教授. orcid.org/0000-0003-1934-5992. E-mail： lingchen@cs.zju.edu.cn

收稿日期: 2018-10-25

Received: 2018-10-25

作者简介 About authors

王敬昌（1977—），男，高级工程师，从事数据挖掘研究.orcid.org/0000-0003-0884-1472.E-mail：wangjc@zjhcsoft.com , E-mail：wangjc@zjhcsoft.com

摘要

提出的预测模型采取分时序分段策略，使用卷积神经网络（CNN）提取景区多因素时序数据的特征，并对不同因素的时序数据赋予不同的权重，将结果送入门控循环单元（GRU）以挖掘其中的时序信息，结合预测时刻的情境信息（天气状况和节假日）预测短期景区内游客人数. 在某景区的闸机数据集和监控点车辆数据集上的实验结果表明：基于门控循环单元的多因素感知短期游客人数预测模型可以充分考虑多情境因素并对不同因素时序数据赋予不同的权重，均方根误差（RMSE）和平均绝对百分比误差（MAPE）均小于传统模型，能够有效降低短期游客人数预测误差。

关键词： 短期游客人数预测 ; 多因素感知 ; 门控循环单元（GRU） ; 卷积神经网络（CNN） ; 情境信息

Abstract

The proposed prediction model adopted a time series segmentation strategy. Firstly, each time series was split into segments and convolved separately by using convolutional neural network (CNN). Then, gated recurrent unit (GRU) was utilized to mine the time series information. Finally, relevant context information (weather conditions and holidays) of the prediction time was added to predict short-term tourist number. Experiments on the gate dataset and vehicle monitoring dataset of a scenic area show that multi-factor perceived short-term tourist number prediction model based on GRU considers multi context factors and the differences between multi time series. The root mean square error (RMSE) and mean absolute percent error (MAPE) of the proposed model are smaller than that of the traditional models, which reveals that the model can effectively reduce short-term tourist number prediction error.

Keywords： short-term tourist number prediction ; multi-factor perception ; gated recurrent unit (GRU) ; convolutional neural network (CNN) ; context information

PDF (719KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

王敬昌, 陈岭, 余珊珊, 蒋晨书, 吴勇. 基于门控循环单元的多因素感知短期游客人数预测模型. 浙江大学学报(工学版)[J], 2019, 53(12): 2357-2364 doi:10.3785/j.issn.1008-973X.2019.12.013

WANG Jing-chang, CHEN Ling, YU Shan-shan, JIANG Chen-shu, WU Yong. Multi-factor perceived short-term tourist number prediction model based on gated recurrent unit. Journal of Zhejiang University(Engineering Science)[J], 2019, 53(12): 2357-2364 doi:10.3785/j.issn.1008-973X.2019.12.013

随着社会经济的飞速发展和人们生活水平的提高，出门旅游的人越来越多，给景区管理带来很大挑战. 短期景区内游客人数预测能为景区的科学管理与流量合理调度提供重要的数据依据.

近年来，短期游客人数预测引起了学术界的广泛关注. 根据使用的技术，现有短期游客人数预测模型大致可分为3种：基于自回归的模型、基于传统机器学习的模型和基于深度学习的模型.

自回归滑动平均（autoregressive moving average，ARMA）^[1-2]、自回归积分滑动平均（autoregressive integrated moving average，ARIMA）^[3-4]是经典的时间序列建模方法，能有效解决变化平稳的时间序列预测问题. Lim等^[5]提出了基于ARIMA的模型来预测从澳大利亚到香港的游客人数. Pai等^[6]提出了基于ARIMA的模型来预测游客的需求. 然而，这类模型只能处理线性变化的时间序列^[7]，且没有考虑影响游客人数的多种因素.

因子分解机（factorization machine，FM）、支持向量回归（support vector regression，SVR）等传统机器学习方法能处理非线性变化的时间序列，在交通流量预测^[8-9]和游客人数预测^[10-13]中得到了广泛应用. 然而，基于传统机器学习的模型在游客人数预测时没有考虑影响游客人数的多种因素，且人工定义的特征会造成信息丢失^[14].

循环神经网络（recurrent neural network，RNN）是专门处理序列数据的深度神经网络，其变体长短期记忆（long short-term memory，LSTM）神经网络^[15]可以发现序列数据中的长期依赖. 门控循环单元（gated recurrent unit，GRU）神经网络^[16]精简了LSTM的控制门，实现了较低的网络复杂度. Li等^[17]利用LSTM来预测游客人数，但没有考虑影响游客人数的多种因素. GRU在流量预测领域也有广泛的应用^[18-19]，但同样忽略了影响游客人数的多种因素，且当时间序列过长时GRU性能降低. 王文庆等^[20]提出了基于卷积神经网络（convolutional neural network，CNN）和GRU的模型来预测航空发动机剩余寿命. 该模型考虑了相关的多种因素且使用CNN来缩短时间序列的长度，但对不同因素的时序数据，其赋予的权重是相同的，忽略了多因素时序数据之间的差异性.

为解决上述问题，本文提出基于GRU的多因素感知短期游客人数预测模型（multi-factor perceived short-term tourist number prediction model based on gated recurrent unit，MFPPM）. 该模型采取分时序分段策略，利用CNN来提取景区多因素时序数据的特征，并对不同因素的时序数据赋予不同的权重，再利用GRU挖掘其中的时序信息，然后结合预测时刻的情境信息（天气状况和节假日）预测短期景区内游客人数.

1. 基于门控循环单元的多因素感知短期游客人数预测模型

1.1. 问题定义

短期游客人数预测：给定某景区的闸机数据、附近监控点车辆数据和相关情境数据（天气状况和节假日），短期游客人数预测是根据当前时刻的前m个时刻（每个时刻之间的时间间隔为1 min）的景区历史数据和预测时刻的情境信息来预测1 h后景区内的游客人数.

1.2. 模型框架

本文模型框架如图1所示. 首先对景区闸机数据和监控点车辆数据进行预处理得到多因素时间序列和预测时刻的相关情境信息；然后采取分时序分段策略，利用CNN提取多因素时间序列的特征向量；再利用GRU处理提取的特征向量得到时序特征向量；将其与预测时刻的情境信息独热（one-hot）编码相连接，送入全连接层，得到预测时刻景区内的游客人数.

图 1

新窗口打开| 下载原图ZIP| 生成PPT

图 1 基于门控循环单元的多因素感知短期游客人数预测模型（MFPPM）框架图

Fig.1 Architecture of multi-factor perceived short-term tourist number prediction model based on gated recurrent unit (MFPPM)

1.3. 因素相关性分析

基于浙江省开化县根宫佛国旅游景区2017.3.31—2018.1.31的数据得到，不同天气状况（晴、阴、雨、雪、雾、万里无云）景区内平均游客人数为306、271、200、95、310和301，不同节假日（小长假、工作日、周末）景区内平均游客人数为429、169和241，不同时间段（早上、中午、下午）景区内平均游客人数为289、290和287. 使用ANOVA检验不同天气状况、不同节假日、不同时间段下景区内游客人数的差异性，结果表明：天气状况（F（5，16 518）=5.899，p<0.001）、节假日（F（2，16 521）=172.840，p<0.001）对景区内游客人数的影响显著，而时间段（F（2，16 521）=0.043，p>0.05）对景区内游客人数的影响不显著.

使用线性回归检验景区内车辆数对游客人数的影响，结果表明：景区内车辆数与游客人数显著相关（F（1，52）=71.116，p<0.001，R²=0.578）. 因此，构建后续模型时考虑天气状况、节假日和景区附近监控点车辆信息，忽略时间段的影响.

1.4. 数据预处理

获取当前时刻的前m个时刻的景区闸机数据和监控点车辆数据，将其处理成多个时间序列，再进行归一化处理. 此外，获取预测时刻的情境信息（天气状况和节假日）并进行one-hot编码.

1.4.1. 时序数据

景区闸机数据包括游客进入景区闸机数据和游客离开景区闸机数据，数据集包含的字段有游客id、闸机号、经过时间和IP地址。景区附近监控点车辆数据集包含的字段有车牌号、车辆类型、车辆方向、监控点和经过时间.

利用景区闸机数据可以得到当前时刻的前m个时刻中每一时刻景区内的游客人数以及每一时刻与前一时刻之间进入和离开景区的游客人数. 利用景区附近监控点车辆数据中的车辆方向字段可以判断车辆的进和出，从而得到监控点每一时刻与前一时刻之间各类车辆进入数和离开数. 由于通过监控点的本地车辆、外地本省车辆和外省车辆进入景区的概率不同，将车辆按车牌信息分为本地、外地本省和外省3类. 由于游客旅游时乘坐的交通工具通常是客车或轿车，选择这2个类型的车辆进行统计.

为充分挖掘数据集中的信息，将景区闸机数据和监控点车辆数据处理成15个时间序列，如表1所示.

表 1 利用景区闸机数据和监控点车辆数据得到的时间序列

Tab.1 Time series obtained from gate dataset and vehicle monitoring dataset of scenic area

数据集	时间序列	参数符号
景区闸机数据	景区内游客人数	x_tot
	进入景区游客人数	x_in
	离开景区游客人数	x_out
监控点车辆数据	本地客车进入数	x_ttbin
	本地客车离开数	x_ttbout
	本地轿车进入数	x_ttcin
	本地轿车离开数	x_ttcout
	外地本省客车进入数	x_tfbin
	外地本省客车离开数	x_tfbout
	外地本省轿车进入数	x_tfcin
	外地本省轿车离开数	x_tfcout
	外省客车进入数	x_ffbin
	外省客车离开数	x_ffbout
	外省轿车进入数	x_ffcin
	外省轿车离开数	x_ffcout

新窗口打开| 下载CSV

对每个时间序列进行最大最小归一化处理，使数据归一化到[0，1]，公式如下：

(1) $ x' = \frac{{x - {x_{\min }}}}{{{x_{\max }} - {x_{\min }}}}. $

式中：x为时间序列某一时刻的原始数值，x′为归一化后的数值，x_max为该数值所在时间序列的最大值，x_min为该数值所在时间序列的最小值.

1.4.2. 非时序数据

除时序数据外，节假日（小长假、工作日、周末）和天气状况（晴、阴、雨、雪、雾、万里无云）也会影响短期景区内游客人数。分别对预测时刻的节假日和天气状况one-hot编码得到向量表示v_h和v_w.

1.5. 卷积模块设计

CNN由1个输入层、1个输出层和多个隐藏层组成，隐藏层可以是卷积层或池化层. 本模型构建的CNN包含卷积层和池化层，每层包含多个神经单元.

1）卷积层（Convolutional layer）. 卷积层充当特征提取器，将输入数据转化为抽象表示. 以数据a为输入，对其进行核卷积，输出数据的特征图：

(2) $ { a}_j^{l + 1} ={\rm{ ReLU}}\;\left( {\sum\nolimits_{f = 1}^{{F^l}} {{ K}_{j,f}^l{ a}_f^l + { b}_j^l} } \right). $

式中：l为层数， ${ a^{l+1}_j} $为在l+1层的第j个特征图，K为卷积核，b为偏置量， $1\leqslant f \leqslant F^l $， $F^l $为l层特征图的个数， ReLU为激活函数.

2）池化层（Pooling layer）. 池化是一种非线性下采样，用来降低上一层输出的特征向量的维度，并减少参数的数量. 本文使用最大池化层（Max pooling）来对数据进行下采样，公式如下：

(3) $ x\,_i^{l + 1} = \max _{k = 1}^r\;\left( {x\,_{i + k}^l} \right). $

其中， $x\,^{l+1}_i $为l+1层第i个神经单元的数值； $x\,^l_{i+k} $为l层第i+k个神经单元的数值，1≤k≤r，r为池化区域大小.

为了对不同因素的时间序列赋予不同的权重，令卷积后得到的向量仍保持时序性，采取分时序分段策略，利用CNN对景区闸机数据和监控点车辆数据中的多因素时序数据进行处理. 对各个时间序列分别进行卷积，由于每个时间序列包含m个时刻的数据，以s个时刻（s≤m）为单位划分每个归一化后的时间序列，共n（n=m/s）段，再将其分别输入到CNN中，得到每个时间序列. 每s个时刻的特征向量如图1所示.

不同时间序列采用的CNN网络结构相同，但学习到的网络参数不同. 同一时间序列的不同段采用的CNN网络结构相同，且每个CNN共享网络参数. 该CNN由2个卷积层和2个池化层组成，具体网络如图2所示，卷积层中“@”前的数值表示卷积核的大小，“@”后的数值表示卷积核的数目，池化层中的数值表示池化操作的大小. 对每个卷积层都设置3个大小为5的卷积核，第1个池化层将卷积得到的特征向量长度缩小到原来的1/3，第2个池化层将卷积得到的特征向量缩小到原来的1/2.

图 2

新窗口打开| 下载原图ZIP| 生成PPT

图 2 用于分时序分段策略的CNN结构

Fig.2 CNN structure for time series segmentation strategy

1.6. GRU模块设计

如图3所示，GRU包含1个记忆单元c_t和2个门：更新门z_t和重置门r_t，分别控制数据的更新和重置.

图 3

新窗口打开| 下载原图ZIP| 生成PPT

图 3 门控循环单元（GRU）示意图

Fig.3 Diagram of gated recurrent unit (GRU)

以x_t为t时刻的输入，h_t−1和c_t−1为前一时刻的隐状态和记忆单元状态，计算公式如下：

(4) $ {{{r}}_t} = {\rm{sigm}}\;\left( {{{{W}}_{{\rm{xr}}}}{{{x}}_t} + {{{W}}_{{\rm{hr}}}}{{{h}}_{t - 1}}} \right), $

(5) $ {{{z}}_t} = {\rm{sigm}}\;\left( {{{{W}}_{{\rm{xz}}}}{{{x}}_t} + {{{W}}_{{\rm{hz}}}}{{{h}}_{t - 1}}} \right), $

(6) $ {{{c}}_t} = {\rm{tanh}}\; \left[ {{{{W}}_{{\rm{xc}}}}{{{x}}_t} + {{{W}}_{{\rm{hc}}}}\left( {{{r}}_t^ \circ {{{h}}_{t - 1}}} \right)} \right], $

(7) $ {{{h}}_t} = {\left( {1 - {{{z}}_t}} \right)^ \circ }{{{h}}_{t - 1}} + {{z}}_t^ \circ {{{c}}_t}. $

式中：操作符“°”表示点乘运算，W_xr和W_hr、W_xz和W_hz、W_xc和W_hc分别表示在计算当前时刻重置门状态为r_t、当前时刻更新门状态为z_t、当前时刻记忆单元状态为c_t时输入x_t和前一时刻隐状态h_t−1的权重矩阵，sigm和tanh分别表示sigmoid函数和双曲正切函数.

从式（6）中可以看到，当重置门接近于0时，当前候选隐状态h_t会忽略前一时刻的隐状态，仅根据当前时刻的输入重置. 这样可以去掉无关的前一时刻状态信息，得到更合理的当前隐状态表示. 另外，更新门控制前一时刻隐状态的信息传递到当前隐状态的程度.

所提模型先拼接CNN提取的同一时间段的所有时间序列特征向量，得到每s个时刻的特征向量，其按时间顺序输入到GRU中，得到时序特征向量v_ts.

GRU网络每层包含d（d的影响见第2.5节）个GRU单元，且将上一时刻的状态输入到下一时刻GRU单元中，保留了数据的时序信息.

1.7. 全连接层设计

将GRU输出的时序特征向量v_ts与预测时刻的相关情境信息one-hot编码v_h和v_w连接，送入全连接层就可以得到预测时刻景区内的游客人数.

全连接层将输入的特征进行加权，公式如下：

(8) $ {{{y}}_t} = {{{x}}_t}{{w}}. $

式中：x_t为输入向量，w为权重，y_t为经过全连接层后得到的预测时刻景区内游客人数. 全连接层神经元数为1，激活函数为LeakyReLU.

2. 实验结果分析

2.1. 数据集

本文利用浙江省开化县根宫佛国旅游景区的闸机数据集（包括游客进入景区的数据和游客离开景区的数据），以及景区附近监控点车辆数据集进行实验，数据集时间跨度均为2017.3.31—2018.1.31. 其中，每个数据集包含440 640条记录，每条记录之间的时间间隔是1 min.

2.2. 实验设置

所有实验都在一台双CPU（Intel E5-2630 v4）服务器上运行. 基于Tensorflow后端的高层神经网络API（Keras）来构建提出的模型，该模型的平均训练时间约为91.9 s，每个样本的平均预测时间约为0.8 ms，能够满足实际景区人数预测需求. 当训练样本非常庞大时，模型的训练时间会急剧增加，这时可以采取一些措施（例如分布式计算）来减小其时间开销.

模型的输入为当前时刻的前m个时刻的历史数据，参数m的取值对结果的影响通过实验来学习（见第2.4节）. GRU模块的输入为n个时间序列向量，s根据经验设为60，输出维度d对结果的影响通过实验来学习（见第2.5节），训练时根据经验将batch_size设为64，epochs设为3. 预测时刻的情境信息经one-hot编码后得到的向量维度为9. 模型中设置的超参如表2所示.

表 2 MFPPM超参设置

Tab.2 Hype-rparameters setting of MFPPM

网络层	超参
卷积层	Filters=3；Kernel_size=5；Strides=1；Activation=Relu
池化层	第1个池化层：Pool_size=3；第2个池化层：Pool_size=2
GRU	Units=d
全连接层	Units=1；Activation=LeakyRelu（alpha=0.3）

新窗口打开| 下载CSV

2.3. 评估指标

采用留一交叉验证法来验证模型性能. 具体步骤如下：每次选取数据集中9个月的数据作为训练集，将剩下1个月的数据作为测试集.

为评估所提出模型的性能，将通过模型得到的短期景区内游客人数的预测值与真实值进行对比，利用均方根误差（root mean square error，RMSE）和平均绝对百分比误差（mean absolute percent error，MAPE）作为性能指标来衡量两者之间的误差，计算公式如下：

(9) $ {\rm{RMSE}} = \sqrt {\frac{1}{M}\sum\nolimits_t {{{\left( {{N_t} - {{\tilde N}_t}} \right)}^2}} } \;, $

(10) $ {\rm{MAPE}} = \frac{{100}}{M}\sum\nolimits_t {\left| {\frac{{{N_t} - \widetilde {{N_t}}}}{{{N_t}}}} \right|} .\quad $

式中：N_t和 ${\tilde N_t}$分别为1 h后景区内真实游客人数和通过模型预测的游客人数，M为样本数.

2.4. 模型中参数m的影响

模型的输入为当前时刻的前m个时刻（每个时刻之间的时间间隔为1 min）的历史数据. 若m的取值过大，计算复杂度会大幅度提高；若m过小，则无法获得充分的游客人数信息. 为研究模型中参数m的影响，令前m个时刻的时间跨度在7~10个小时取值，实验结果如表3所示.

表 3 MFPPM中参数m对结果的影响

Tab.3 Effect of parameter m on results in MFPPM

评估指标	RMSE	MAPE
m=420	193.63	150.16
m=480	190.98	121.08
m=540	193.92	123.65
m=600	197.67	132.82

新窗口打开| 下载CSV

从表中可以看出，当m=480，即前m个时刻的时间跨度为8 h时，RMSE取得最小值190.98，MAPE取得最小值121.08，模型的性能最好. 因此，后续实验中根据当前时刻前480个时刻（时间跨度为8 h）的景区历史数据来预测1 h后景区内的游客人数.

2.5. 模型中GRU输出维度的影响

GRU输出维度d表示GRU在训练过程中所传递信息量的大小. 若d的取值过大，模型计算复杂度过高且容易过拟合；若d的取值过小，则无法充分利用有效信息. 为研究模型中GRU输出维度d的影响，令d在50~80取值，实验结果如表4所示. 从表中可以看出，当d=70时，RMSE取得最小值190.98，MAPE取得最小值121.08，模型的性能最好. 因此，后续实验中将GRU的输出维度d设为70.

表 4 MFPPM中输出维度对结果的影响

Tab.4 Effect of output dimension on results in MFAPM

评估指标	RMSE	MAPE	评估指标	RMSE	MAPE
d=50	195.73	136.54	d=70	190.98	121.08
d=60	192.93	123.56	d=80	197.35	129.70

新窗口打开| 下载CSV

2.6. 模型中不同情境因素的影响

为获取不同情境因素对短期游客人数预测的影响程度，设计MFPPM的3种变体：MFPPM-W/O-Weather、MFPPM-W/O-Holiday和MFPPM-W/O-Vehicle. 这3种变体分别忽略了天气状况、节假日和监控点车辆进出数量的影响.

这些变体的性能如表5所示，从表中看出，同时考虑这3种情境因素模型性能最好. 除此之外还观察到：

表 5 不同情境因素对短期游客人数预测结果的影响

Tab.5 Effect of different context factors on prediction results of short-term tourist numbers

模型	RMSE	MAPE
MFPPM-W/O-Weather	193.02	129. 96
MFPPM-W/O-Holiday	203.04	140.28
MFPPM-W/O-Vehicle	217.04	159.77
MFPPM	190.98	121.08

新窗口打开| 下载CSV

1）MFPPM和MFPPM-W/O-Vehicle之间的精度差距最大，表明利用景区附近监控点车辆数据能够显著减小预测误差，这是由于游客大部分以乘坐交通工具的方式进入景区，监控点车辆进出数与景区内游客人数相关；

2）MFPPM与MFPPM-W/O-Holiday之间的精度差距较大，说明考虑节假日信息能有效减小短期景区内游客人数的预测误差；

3）MFPPM与MFPPM-W/O-Weather之间的精度差距不大，说明考虑天气状况只能小幅度减小景区内游客人数的预测误差. 这是由于旅游行程一般是根据放假时间事先计划，大部分情况下天气状况都不能改变行程.

2.7. 不同模型的预测效果对比

将提出的模型与短期游客人数预测领域具有代表性的模型进行对比，对比模型介绍如下.

1）基于SVR的多因素感知预测模型（SVR-multi）：类似于Chen等^[13]提出的基于SVR的游客人数预测模型Naïve_SVR. 本实验根据景区闸机数据和监控点车辆数据得到历史景区游客人数、游客进出数和景区内各类车辆进出数的一些统计特征（最大值、最小值、中位数、均值和方差等）以及预测时刻相关情境信息来预测景区内短期游客人数.

2）基于GRU的多因素感知预测模型（GRU-multi）：类似于Fu等^[18]提出的基于GRU预测交通流量的模型GRU NN. 本实验根据景区闸机数据和监控点车辆数据得到多时序数据，将其处理成时间序列后，结合预测时刻相关情境信息来预测景区内短期游客人数.

3）基于CNN和GRU的多因素感知预测模型（CNNGRU-multi）：类似于Wang等^[20]提出的基于CNN和GRU来预测航空发动机剩余寿命的模型CNNGRU. 本实验根据景区闸机数据和监控点车辆数据得到多时序数据，将其处理成时间序列后一起送入CNN进行卷积，再利用GRU挖掘其中的时序信息，然后结合预测时刻相关情境信息来预测景区内短期游客人数.

4）MFPPM的变体MFPPM-only：MFPPM的变体仅使用基于景区的闸机数据，不考虑情境信息（景区附近监控点车辆数据、天气状况和节假日）的影响. 将每个时刻景区游客人数处理成时间序列来预测景区内短期游客人数.

利用提出的模型和其他基线模型使用当前时刻的前480个时刻（时间跨度为8 h）的景区历史数据预测1 h后景区内游客人数，预测结果对比如表6所示.

表 6 不同短期游客人数预测模型的预测效果对比

Tab.6 Comparison of prediction effects by different short-term tourist number prediction models

模型	RMSE	MAPE
SVR-multi	272.63	147.19
GRU-multi	268.76	141.16
CNNGRU-multi	250.49	139.02
MFPPM-only	225.05	130.67
MFPPM	190.98	121.08

新窗口打开| 下载CSV

1）考虑相同的情境信息，基于循环神经网络的模型MFPPM、CNNGRU-multi和GRU-multi的RMSE和MAPE值均小于基于传统机器学习的模型SVR-multi，表明该方法的预测误差更小. 这是由于循环神经网络有记忆单元，能有权重地保留不同时刻的历史状态.

2）同样是基于循环神经网络的模型，且考虑相同的情境信息，MFPPM和CNNGRU-multi的预测误差均小于GRU-multi，表明在GRU进行处理之前先用CNN提取特征，能解决GRU在时间序列过长时性能下降的问题. 而MFPPM的预测精度要高于CNNGRU-multi，是因为当多因素时序数据之间差异较大时，分开卷积能够对不同因素的时序数据赋予不同的权重，进而提高模型性能.

3）MFPPM的性能要优于MFPPM-only，说明监控点车辆数据和预测时刻的情境信息是影响景区游客人数的重要因素，充分利用这些情境信息能减小景区内短期游客人数预测误差.

3. 结　语

本文提出了基于GRU的多因素感知短期游客人数预测模型，在真实数据集上的实验结果表明：1）在预测景区内短期游客人数时，同时考虑天气状况、节假日和监控点车辆进出数量，模型的性能最好，且这3种情境因素对模型的影响程度不同，监控点车辆进出数量>节假日>天气状况；2）景区内短期游客人数受多种因素影响，分时序分段卷积策略可以解决GRU在时间序列过长时性能下降的问题，且分开卷积能够考虑到不同因素的时序数据间的差异性，进而提高模型性能；3）所提模型的RMSE和MAPE均小于传统模型，验证了该模型的有效性。

所提模型仍有进一步拓展空间，如：引入注意力机制，使模型学习选择性关注输入；引入景区附近高速收费等相关数据，进一步规约模型预测结果；使模型能应用于其他场景的短期人数预测.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

CHU F L

Forecasting tourism demand with ARMA-based methods

[J]. Tourism Management, 2009, 30 (5): 740- 751

DOI:10.1016/j.tourman.2008.10.016 [本文引用: 1]

[2]

GUSTAVSSON P, NORDSTROM J

The impact of seasonal unit roots and vector ARMA modelling on forecasting monthly tourism flows

[J]. Tourism Economics, 2001, 7 (2): 117- 133

DOI:10.5367/000000001101297766 [本文引用: 1]

[3]

BOX G E P, PIERCE D A

Distribution of residual autocorrelations in autoregressive-integrated moving average time series models

[J]. Journal of the American Statistical Association, 1970, 65 (332): 1509- 1526

DOI:10.1080/01621459.1970.10481180 [本文引用: 1]

[4]

AHMED M S, COOK A R. Analysis of freeway traffic time-series data by using Box-Jenkins techniques [M]. [S. l.]: Transportation Research Board, 1979.

[本文引用: 1]

[5]

LIM C, MCALEER M

Time series forecasts of international travel demand for Australia

[J]. Tourism Management, 2002, 23 (4): 389- 396

DOI:10.1016/S0261-5177(01)00098-X [本文引用: 1]

[6]

PAI P F, HONG W C

An improved neural network model in forecasting arrivals

[J]. Annals of Tourism Research, 2005, 32 (4): 1138- 1141

DOI:10.1016/j.annals.2005.01.002 [本文引用: 1]

[7]

JANACEK G

Time series analysis forecasting and control

[J]. Journal of Time Series Analysis, 2010, 31 (4): 303

[本文引用: 1]

[8]

WU C H, HO J M, LEE D T

Travel-time prediction with support vector regression

[J]. IEEE Transactions on Intelligent Transportation Systems, 2004, 5 (4): 276- 281

DOI:10.1109/TITS.2004.837813 [本文引用: 1]

[9]

HONG W C

Traffic flow forecasting by seasonal SVR with chaotic simulated annealing algorithm

[J]. Neurocomputing, 2011, 74 (12-13): 2096- 2107

DOI:10.1016/j.neucom.2010.12.032 [本文引用: 1]

[10]

CHEN K Y, WANG C H

Using genetic algorithms to optimize support vector regression in tourism demand forecasting

[J]. Journal of Outdoor Recreat Study, 2005, 18 (1): 47- 72

[本文引用: 1]

[11]

PAI P F, HONG W C, CHANG P T, et al

The application of support vector machines to forecast tourist arrivals in Barbados: an empirical study

[J]. International Journal of Management, 2006, 23 (2): 375

[12]

CHEN K Y, WANG C H

Support vector regression with genetic algorithms in forecasting tourism demand

[J]. Tourism Management, 2007, 28 (1): 215- 226

DOI:10.1016/j.tourman.2005.12.018

[13]

CHEN K Y

Combining linear and nonlinear model in forecasting tourism demand

[J]. Expert Systems with Applications, 2011, 38 (8): 10368- 10376

DOI:10.1016/j.eswa.2011.02.049 [本文引用: 2]

[14]

CHEN R, LIANG C Y, HONG W C, et al

Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm

[J]. Applied Soft Computing, 2015, 26: 435- 443

DOI:10.1016/j.asoc.2014.10.022 [本文引用: 1]

[15]

HOCHREITER S, SCHMIDHUBER J

Long short-term memory

[J]. Neural Computation, 1997, 9 (8): 1735- 1780

DOI:10.1162/neco.1997.9.8.1735 [本文引用: 1]

[16]

CHO K, MERRIENBOER B V, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation [J]. arXiv preprint. arXiv: 1406.1078, 2014.

[本文引用: 1]

[17]

LI Y F, CAO H. Prediction for tourism flow based on LSTM neural network [C] // International Conference on Identification, Information and Knowledge in the Internet of Things. Qufu: ELSEVIER, 2017: 277-287.

[本文引用: 1]

[18]

FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction [C] // 2016 31st Youth Academic Annual Conference of Chinese Association of Automation. Wuhan: IEEE, 2016: 324-328.

[本文引用: 2]

[19]

GUO J, WANG Z, CHEN H. On-line multi-step prediction of short term traffic flow based on GRU neural network [C] // Proceedings of the 2nd International Conference on Intelligent Information Processing. Bangkok: ACM, 2017: 11.

[本文引用: 1]

[20]

王文庆, 郭恒, 范启富. 基于CNN与GRU的航空发动机剩余寿命预测 [C] // 第37届中国控制会议. 武汉: 中国学术期刊电子出版社, 2018: 546-551.

[本文引用: 2]

WANG Wen-qing, GUO Heng, FAN Qi-fu. Predict remaining useful life of aerospace engine based on CNN and GRU [C] // Proceedings of the 37th Chinese Control Conference. Wuhan: China Academic Journal Electronic Publishing House, 2018: 546-551.

[本文引用: 2]

Forecasting tourism demand with ARMA-based methods

2009

... 自回归滑动平均（autoregressive moving average，ARMA）^[1-2]、自回归积分滑动平均（autoregressive integrated moving average，ARIMA）^[3-4]是经典的时间序列建模方法，能有效解决变化平稳的时间序列预测问题. Lim等^[5]提出了基于ARIMA的模型来预测从澳大利亚到香港的游客人数. Pai等^[6]提出了基于ARIMA的模型来预测游客的需求. 然而，这类模型只能处理线性变化的时间序列^[7]，且没有考虑影响游客人数的多种因素. ...

The impact of seasonal unit roots and vector ARMA modelling on forecasting monthly tourism flows

2001

Distribution of residual autocorrelations in autoregressive-integrated moving average time series models

1970

Time series forecasts of international travel demand for Australia

2002

An improved neural network model in forecasting arrivals

2005

Time series analysis forecasting and control

2010

Travel-time prediction with support vector regression

2004

... 因子分解机（factorization machine，FM）、支持向量回归（support vector regression，SVR）等传统机器学习方法能处理非线性变化的时间序列，在交通流量预测^[8-9]和游客人数预测^[10-13]中得到了广泛应用. 然而，基于传统机器学习的模型在游客人数预测时没有考虑影响游客人数的多种因素，且人工定义的特征会造成信息丢失^[14]. ...

Traffic flow forecasting by seasonal SVR with chaotic simulated annealing algorithm

2011

Using genetic algorithms to optimize support vector regression in tourism demand forecasting

2005

The application of support vector machines to forecast tourist arrivals in Barbados: an empirical study

2006

Support vector regression with genetic algorithms in forecasting tourism demand

2007

Combining linear and nonlinear model in forecasting tourism demand

2011

... 1）基于SVR的多因素感知预测模型（SVR-multi）：类似于Chen等^[13]提出的基于SVR的游客人数预测模型Naïve_SVR. 本实验根据景区闸机数据和监控点车辆数据得到历史景区游客人数、游客进出数和景区内各类车辆进出数的一些统计特征（最大值、最小值、中位数、均值和方差等）以及预测时刻相关情境信息来预测景区内短期游客人数. ...

Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm

2015

Long short-term memory

1997

... 循环神经网络（recurrent neural network，RNN）是专门处理序列数据的深度神经网络，其变体长短期记忆（long short-term memory，LSTM）神经网络^[15]可以发现序列数据中的长期依赖. 门控循环单元（gated recurrent unit，GRU）神经网络^[16]精简了LSTM的控制门，实现了较低的网络复杂度. Li等^[17]利用LSTM来预测游客人数，但没有考虑影响游客人数的多种因素. GRU在流量预测领域也有广泛的应用^[18-19]，但同样忽略了影响游客人数的多种因素，且当时间序列过长时GRU性能降低. 王文庆等^[20]提出了基于卷积神经网络（convolutional neural network，CNN）和GRU的模型来预测航空发动机剩余寿命. 该模型考虑了相关的多种因素且使用CNN来缩短时间序列的长度，但对不同因素的时序数据，其赋予的权重是相同的，忽略了多因素时序数据之间的差异性. ...

... 2）基于GRU的多因素感知预测模型（GRU-multi）：类似于Fu等^[18]提出的基于GRU预测交通流量的模型GRU NN. 本实验根据景区闸机数据和监控点车辆数据得到多时序数据，将其处理成时间序列后，结合预测时刻相关情境信息来预测景区内短期游客人数. ...

... 3）基于CNN和GRU的多因素感知预测模型（CNNGRU-multi）：类似于Wang等^[20]提出的基于CNN和GRU来预测航空发动机剩余寿命的模型CNNGRU. 本实验根据景区闸机数据和监控点车辆数据得到多时序数据，将其处理成时间序列后一起送入CNN进行卷积，再利用GRU挖掘其中的时序信息，然后结合预测时刻相关情境信息来预测景区内短期游客人数. ...

〈

〉