文章快速检索     高级检索
  浙江大学学报(理学版)  2018, Vol. 45 Issue (1): 82-91  DOI:10.3785/j.issn.1008-9497.2018.01.013
0

引用本文 [复制中英文]

刘丽, 张丰, 杜震洪, 刘仁义, 贾玉杰. 基于深圳市出租车轨迹数据的高效益寻客策略研究[J]. 浙江大学学报(理学版), 2018, 45(1): 82-91. DOI: 10.3785/j.issn.1008-9497.2018.01.013.
[复制中文]
LIU Li, ZHANG Feng, DU Zhenhong, LIU Renyi, JIA Yujie. The analysis of high profitable strategy for seeking passengers based on taxi GPS trajectory data of Shenzhen city[J]. Journal of Zhejiang University(Science Edition), 2018, 45(1): 82-91. DOI: 10.3785/j.issn.1008-9497.2018.01.013.
[复制英文]

基金项目

国家自然科学基金资助项目(41671391,41471313,41101356,41101371,41171321);国家科技基础性工作专项(2012FY112300);海洋公益性行业科研专项经费资助项目(2015418003,201305012);浙江省科技攻关项目(2014C33G20,2013C33051)

作者简介

刘丽(1990-), ORCID:http://orcid.org/0000-0002-9480-2412, 女, 硕士研究生, 主要从事交通GIS、WEBGIS及其应用研究

通信作者

杜震洪, ORCID:http://orcid.org/0000-0001-9449-0415, E-mail:duzhenhong@zju.edu.cn

文章历史

收稿日期:2016-11-09
基于深圳市出租车轨迹数据的高效益寻客策略研究
刘丽1,2 , 张丰1,2 , 杜震洪1,2 , 刘仁义1,2 , 贾玉杰1,2     
1. 浙江大学 浙江省资源与环境信息系统重点实验室, 浙江 杭州 310028;
2. 浙江大学 地理信息科学研究所, 浙江 杭州 310027
摘要: 出租车作为城市公共交通的重要补充形式,在居民日常出行中发挥着重要作用.然而,客源时空分布不均衡导致了出租车空载率高、寻客难度大等问题,降低了出租车的运营效率.随着ITS(intelligent transport system)技术的发展,越来越多的学者将出租车寻客模式作为其研究点,目前尚缺乏对基于寻客效益指标的寻客策略方法的研究.为了提高出租车寻客效益,提出了基于寻客效益指标模型的时空分析方法,将出租车载客态单位时间收入E及相邻空载态寻客时间T相结合作为寻客效益评价指标,并采用数理统计与地理统计相结合的方法,对高效益客源的时空分布特征进行研究.采用深圳市2011年4月18-24日一周内13 798辆出租车的GPS轨迹数据,分析了深圳市出租车的运营特点及人们出行需求的时空分布特征.结果表明:该方法能够较好地反映高效益客源的时空分布特征,为出租车高效益寻客提供辅助决策支持,也为出租车高效运营提供了新的视角.
关键词: GPS轨迹数据    数理统计    地理统计    高效益寻客    
The analysis of high profitable strategy for seeking passengers based on taxi GPS trajectory data of Shenzhen city
LIU Li1,2 , ZHANG Feng1,2 , DU Zhenhong1,2 , LIU Renyi1,2 , JIA Yujie1,2     
1. Zhejiang Provincial Key Lab of GIS, Zhejiang University, Hangzhou 310028, China;
2. Department of Geographic Information Science, Zhejiang University, Hangzhou 310027, China
Abstract: Taxi, as an important supplement of urban public transport, plays an important role in resident daily traffic. However, because of the unbalanced spatial and temporal distribution of the potential passengers, high no-load rate and unhealthy competition keep releasing negative impacts on taxi business. With the development of ITS (intelligent transport system) technology, more and more attempts have been made to study approaches of seeking taxi passengers, while neglecting the analysis of high profitable seeking strategy. Based on mathematical statistics and geo-statistics, we propose a novel spatial and temporal analysis method based on an evaluation index, which takes the combination of income per unit time in the load state and the time for seeking passengers in the adjacent no-load state. We investigated the Shenzhen's taxi data set, which contained 13 798 taxis GPS trajectories during a week from April 18 to April 24, 2011 to conduct a comprehensive analysis on the characteristics of taxi operation and the spatial and temporal distribution of people's daily traffic. Our study indicates that the designed method yields a better reflection on the distribution of high profitable passengers, providing a new perspective for the efficient operation of the taxi.
Key words: GPS trajectory data    mathematical statistics    geo-statistics    high profitable passengers seeking    
0 引言

随着经济的快速发展和城市化建设的日益推进,人们对出行服务的需求越来越高,出租车作为城市公共交通的重要组成部分,在人们的日常出行中发挥着重要作用.然而,尽管出租车的数量日益增多,出租车资源在时空分布上却出现了“扎堆”或“缺乏”的不均衡现象,难以在短时间内得到改善.近年来ITS技术衍生出如“快的”“滴滴”“优步”等打车软件,虽然在一定程度上给予人们出行更多选择,但也造成了出租车之间的不良竞争,乘客被拒载现象时有发生,不仅影响了人们出行的便捷性,还将直接影响城市公共交通的运行效率和城市形象[1].

人们的出行具有随机性,在不同时间、不同地区,乘客的分布不均匀.出租车司机如何在海量乘客中寻找到高效益客源,成为国内外学者研究的热点问题.此类研究对于改善出租车资源分布不均衡的现状,充分发挥出租车在城市交通中的补充作用有重要意义.

随着GPS(global position system)技术的飞速发展和智能定位终端的广泛应用,基于位置的信息服务得到了飞速发展[2].城市出租车上基本都安装了GPS传感器,能够记录当前车辆的位置、采集时间、瞬时速度、行车方向及载客状态等信息.很多国内外学者基于该信息展开了各项研究,取得了相关学术成果.针对出租车寻客策略的研究主要包括以下3个方面:(1) 通过研究出租车司机行为模式特征进行寻客推荐.如LIU等[3]通过分析出租车轨迹数据对比出租车司机的行为模式,发现收益较高的司机倾向于选择长距离路程并通过提高车速缩短行车时间等方式提高效益;LI等[4]基于出租车轨迹数据,分析了主动寻客和原地待客2种寻客策略的差异,为出租车获得更好的寻客途径提供了理论依据;ZHENG等[5]研究了空驶出租车的行为模式,通过评估各个地点的等车时长为乘客推荐合适的等车位置.(2) 通过研究客源的时空分布特征进行出租车寻客推荐.如关金平等[6]通过对出租车FCD数据的要素筛选、特征提取、聚类分析、归纳统计等处理,获取出租车空驶时空分布特征,并通过分析成因提出了解决办法;唐炉亮等[1]针对上下客具体位置未知的出租车GPS轨迹数据,提出了出租车上下客时空分布的线密度探测模型,进而获取城市出租车上下客的时空分布规律;孙飞等[7]以出租车GPS数据为研究对象优化了出租车效率评估模型,建立优质客源的时空分析方法,为改善出租车司机的收益、提高出租车运营效率提供科学依据;王郑委[8]基于Hadoop平台实现K-Means聚类方法并行化处理出租车GPS轨迹数据,进而挖掘载客热点区域的空间分布特征;(3) 通过建立载客路径推荐算法及预测模型进行寻客推荐.如罗端高等[9]提出需求分布影响下的城市出租车网络平衡模型并设计了相应的模型算法;李衢伶[2]在研究和分析出租车GPS轨迹数据及道路规划遗传算法的基础上,通过融合出租车司机行驶经验,提出了一种基于多种群遗传算法的出租车载客路径推荐方法;PHITHAKKITNUKOON等[10]通过分析150辆出租车的轨迹数据,建立了特定时空下的空车数量预测模型;YUAN等[11]利用T-Finder提供了一个面向司机和乘客的双向推荐服务,为出租车司机寻客提供了相关参考;XU等[12]基于出租车GPS轨迹数据的热点区域扫描算法和偏好轨迹算法创建了Taxi-RS系统,以进行寻客推荐.

综上所述,各研究方法虽然对出租车司机寻客进行了相关推荐,但在高效益寻客策略研究方面,少有将出租车司机的运营效益纳入寻客策略;由于样本量过小、研究对象仅考虑出租车载客态或空载态的行为特征,难免分析不够全面;进行出租车高效益寻客推荐,获取高效益客源随时空变化的分布特征至关重要.出租车轨迹数据本身包含地理位置信息和时间信息,是典型的时空大数据.采用时空分析方法分析轨迹数据随时间和空间的演化过程,对于挖掘出租车轨迹数据中隐含的出租车载客时间及地理位置信息有重要作用.

本文基于已有研究成果,提出了基于效益评价指标模型的时空分析方法,并以深圳市出租车GPS轨迹数据为研究对象,取每段载客态及相邻空载态为研究内容,通过效益评价指标对客源进行量化,并采用数理统计和地理统计的时空分析方法对高效益客源的时空分布特征进行研究,为出租车高效益寻客及高效率运营提供辅助决策支持.

1 效益评价指标

获取单位时间收入高、距离下次载客换乘时间间隔短的客源,才能最大程度提高出租车的工作效益[13].传统的出租车效益计算只是简单考虑载客态下的单位时间收入,没有考虑距离下次载客的换乘时间间隔的长短,如果距离下次载客间隔很长,必然会增加成本消耗,削减收入.因此,研究高效益寻客需要结合考虑载客段单位时间收入与相邻空载段的空载时间2个因素.高效益寻客是指寻找能使出租车司机在载客段单位时间收入高,同时距离下次载客换乘时间短的客源.

本研究在已有基础上,以载客态和相邻空载态为研究对象(见图 1),提出采用出租车载客态单位时间收入E和空载态寻客时间T 2个指标量化客源,当满足载客态单位时间收入高且空载态寻客时间短时,该载客点才作为出租车高效益客源选择区.

图 1 研究对象的选取 Fig. 1 The selection of research objects
1.1 效益影响因素

出租车在寻客过程中影响效益的因素很多,如天气、路况、客源分布、出租车之间的竞争等都会对出租车的寻客效益造成一定的影响.基于本文对高效益寻客的定义,影响出租车寻客效益的指标主要包括出租车在载客态的单位时间收入及相邻空载态的寻客时间.

1.1.1 载客态单位时间收入E

载客态单位时间收入指出租车在载客状态下单位时间的收入,是载客态的总收入与载客态时间的比值,而载客态的总收入是出租车计价标准与行车里程的乘积.在计价标准不变的情况下,载客态单位时间收入仅取决于行驶里程和载客态时间,收入越高说明载客期间行驶速度越快.同时,该指标在一定程度上也可反映当前载客段道路的通行情况,具体量化公式为

$E={{K}_{0}}\times {{L}_{1}}/{{T}_{1}},$ (1)

其中,L1为载客态的行驶里程;K0为某一时期该地的出租车计价标准;T1为载客态的行驶时间;基于L1K0计算载客态的总收入后再引入时间因素T1,定义出租车载客态单位时间收入E.

1.1.2 空载态寻客时间T

空载态寻客时间指出租车行车状态从一次载客态到下次载客态之间空载的时间,从数据层面来说,即出租车从空载态(0) 变为下一次载客态(1) 的时间间隔.空载态寻客时间短,说明在完成一次载客之后距离下次载客之前换乘时间间隔短.指标的量化公式为

$T=t_{\rm 再载}-t_{\rm 空},$ (2)

其中,t再载是下一次载客态即行车状态从0变成1时的时刻;t是开始空载的时刻.

1.2 效益指标模型

在原始数据中,各指标因素都具有自己的量纲和单位,因此数据的大小与变化范围也各不相同,各指标因素之间无法直接进行比较和计算.为保证得到正确的分析结果,本文采用min-max方法对原始数据中的载客态单位时间收入E及相邻空载态寻客时间T进行标准化处理.

min-max标准化方法是将原始数据用线性化方法转换成[0, 1]内的数,转化公式为

${{X}_{\text{norm}}}=\frac{X-{{X}_{\text{min}}}}{{{X}_{\text{max}}}-{{X}_{\text{min}}}},$ (3)

该方法实现了对原始数据的等比例缩放,其中Xnorm为标准化后的数据,X为原始数据,XmaxXmin分别为原始数据集中的最大值和最小值.

效益指数是基于2个效益指标提出的综合评价指数,包含了在一段研究对象中与载客态E成正相关,与客载态T成负相关.因此,效益指数F定义为标准化后的载客态单位时间收入E与相邻空载态寻客时间T的比值,如计算第j辆出租车在第i个研究对象期间的效益指数F,构建效益指标模型如下:

${{F}_{ij}}=\frac{{{E}_{ij}}}{{{T}_{ij}}},\text{ }i=1.2,\ldots ,\text{ }n,\text{ }j=1.2,\ldots ,\text{ }m.$ (4)

采用出租车效益指数随时间的变化值来量化出租车司机效益水平随时间的浮动特征.

2 高效益客源时空分析 2.1 研究区简介

深圳市位于中国南海海滨,毗邻香港,地处广东省南部,位于北回归线以南113°46′E~114°37′E,22°27′N~22°52′N.截至2014年年底,深圳市总面积为1 996.85 km2,全市年末常住人口达1 077.89万.同时,深圳是中国改革开放建立的第一个经济特区,创造了举世瞩目的“深圳速度”.在交通方面,深圳是重要的交通枢纽城市,也是华南的重要交通中心之一[14].深圳交通出行设施健全,对外出行拥有铁路、航空、海运、口岸等不同的交通方式,对内有地铁、公交、出租等多种公共交通设施,居民出行方便.多种交通工具的协调补充在一定程度上也缓解了城市的交通压力.

2.2 数据处理

出租车轨迹数据具有数据量大、维数高、变化快等特点,是典型的大数据,已成为地理信息系统(GIS)、行为地理学、智能交通系统、城市规划新技术等领域的研究热点[15].获取出租车轨迹大数据之后做合理的数据处理,是实现数据分析和应用的重要基础.

本研究以深圳市2011年4月18日(周一)至24日(周日)共13 798辆出租车的轨迹数据为研究对象,总数据量约28 GB.每辆出租车轨迹数据文件均以车牌号命名,并采用csv格式进行存储(如粤B000H6.csv),包括车牌号、采集时间点、经度、纬度、车辆状态、车速及行车方向7个字段.数据字段与字段含义的关系如表 1所示.

表 1 轨迹数据字段与字段含义 Table 1 Trajectory data field and field meaning

数据处理过程包括:数据质量控制、数据分割组织、效益评价计算及指标字段筛选.具体流程如图 2所示.

图 2 数据处理流程图 Fig. 2 The data processing flow chart
2.2.1 数据质量控制

由于GPS自身精度有限,以及地面建筑物遮挡、天气恶劣、车载GPS设备故障等原因,可能造成采样数据异常,对后续数据分析造成一定的干扰,因此必须对原始数据进行数据质量控制以过滤异常数据[16].质量控制主要包括:剔除字段为空或缺失的记录;剔除出租车全天空驶记录(车辆状态始终为0);剔除相同位置不同时间的多条记录(夜间停运等);剔除瞬时速度不合理记录(通过对城市出租车运营数据的分析,城市出租车行驶的平均速度一般取≤80 km·h-1[17],则原始数据中车速不在0~80 km·h-1的数据属于异常数据);剔除车辆状态非0也非1的异常记录;剔除行车方向不在0~7的记录;过滤研究区域外的数据(研究区域地理范围为113°46′E~114°37′E,22°27′N~22°52′N).

2.2.2 数据分割组织

针对每个数据文件,选取每一段载客态和相邻下一个空载态为研究对象,对数据进行分割处理.获取各段研究对象的载客时刻t1(车辆状态从0变为1的时刻)、空载时刻t2(车辆状态从1变为0的时刻)及下一段研究对象再次载客时刻t3(车辆状态从0再次变为1).

2.2.3 效益评价计算

利用轨迹数据中GPS记录的经纬度信息获取各段研究对象中载客时刻t1、空载时刻t2所对应的经纬度,根据经纬度与距离的换算公式[18]及相应时间间隔,计算各段研究对象中载客时刻t1到空载时刻t2的载客距离L1和载客行驶时间T1;将L1T1代入式(1) 中,结合出租车计价标准K0计算各段研究对象中载客态的单位时间收入E.根据2009年10月开始执行的深圳市出租车运价调整方案,调价后的计价标准为:起步价10元2 km,2 km后里程价2.4元·km-1,总里程超过25 km的,超出部分按里程价的30%加收返空费(不考虑红灯等因素).将各段空载时刻t2及下次载客时刻t3,代入式(2),计算各段研究对象中空载态寻客时间T.

2.2.4 指标字段筛选

为方便后续的数据分析与时空分布规律的研究,需要对原始数据及处理后数据集中的指标字段信息进行有效筛选.将每段研究对象载客时刻t1所对应的GPS轨迹数据记录的车牌号、采集时间点、经度、纬度及计算所得的载客态单位时间收入E和空载态寻客时间T作为一条完整记录存储在mysql数据库中.

2.3 高效益客源时间分布特征

研究客源量在一周及一天不同时段的变化特征,对于高效益客源的时间分布特征研究有一定的参考价值.为了更直观地研究出租车司机高效益时段的分布情况,将效益评价指标的效益指数作为研究对象,分析效益指数随时间的变化情况,进一步验证客源量对高效益客源的影响.

2.3.1 一周内客源量的变化特征

为了研究客源量在一周内不同时期的变化特征,将处理后的载客点数据按照时间排序,如图 3所示.由图 3可知,载客量的时间分布特征与乘客出行规律紧密相关.除周三(可能数据异常量较多)以外的工作日时间,出租车载客量基本处于较高水平,客源量相对稳定.这是由于在工作日,居民上下班、上学放学等出行目的地、出行路径及出行方式比较稳定.而周末载客量明显减少,且周六载客量高于周日,这是因为在深圳市有很多单位需周六加班,加之周六出行游玩的居民也较多,所以出行量相对较多.而周日居民基本不加班或外出游玩,选择在家休息,出行量相对较低.

图 3 深圳市出租车一周不同时期载客量变化图 Fig. 3 The change of Shenzhen taxi passenger volume in different times of a week
2.3.2 一天内不同时段客源量变化特征

为了更好地分析客源量在一天内不同时段的变化特征,本研究将周一至周日的数据按每2 h分时段,结果如图 4所示.

图 4 深圳市出租车一天不同时段客源量变化图 Fig. 4 The change of Shenzhen taxi passenger volume in different times of a day

图 4可得:

(1) 工作日和周末的客源量在一天不同时段的变化特征总体相似,但在某些时段也有较明显的差异.首先,周末的客源量从7:00开始增加,而工作日基本都在6:00左右,且增加幅度明显高于周末,此外,周末10:00—20:00客源量较为平稳,20:00后客源量呈增加趋势.

(2) 0:00—6:00,客源量明显减少,在6:00左右出现客源量最低值.深圳作为一线城市,金融业、IT等第三产业发达,这些行业加班较为普遍,0:00左右可能还有很多刚下班的人,且由于服务业发达,深圳市丰富的夜生活持续至凌晨,故此时的出行量较多,出租车客源量较大;而之后上班族基本已下班回家,出行量减少,出租车的客源量也明显减少.

(3) 6:00—9:00,由于上班、上学的需要,居民出行量大且相对集中.

(4) 9:00和17:00,客源量呈减少趋势,这是由于此时正处在上下班的高峰期,虽然居民出行量大,出租车载客率高,但由于此时的交通量急剧上升,交通拥堵现象较为严重,出租车车速缓慢,行驶时间变长,上下客频率低,故出租车利用率和运行效率较低,可载到的客源量也会随之下降.

(5) 20:00—23:00,正是深圳市夜生活最繁忙时段,居民出行量相对增加,交通逐渐恢复畅通,加之此时大部分公共交通停运,出租车的需求量及运行效率明显提高,出现客源量增加的趋势,在23:00左右客源量达到最高值.

通过分析深圳市出租车客源量在一周不同时期及一天不同时段的变化特征,可知一个城市的出租车客源量不仅与城市居民的出行规律及生活模式有关,还与城市交通的畅通状况有关.当然,对出租车司机而言,要实现高效益寻客,不仅要寻找城市中客源量大的时段,同时应该避免选择该时段城市交通拥堵的载客路线.

2.3.3 效益指数在一天不同时段内的变化特征

效益指数是在充分考虑效益评价指标的情况下,综合定义的一个指数,包含一段研究对象中载客态的单位时间收入E及相邻空载态的寻客时间T,并与E成正相关,与T成负相关.采用出租车效益指数随时间的变化来量化出租车司机收益水平随时间的浮动特征,是一种更为直观的方式,见图 5.

图 5 深圳市出租车一天不同时段效益指数变化图 Fig. 5 The change of Shenzhen taxi profitable index in different time of a day

图 5中可以看出:

(1) 结合图 4可知效益指数随时间的变化趋势与客源量相似,客源量较大的时间段出租车司机的效益也较高,进一步说明客源量对高效益客源有一定程度的影响.

(2) 出租车司机的效益指数随时间的变化特征,在工作日和周末大致相同,但局部也存在差异.收益较高的时段主要在8:00—10:00和16:00—18:00,这2段时间恰好是上下班高峰期.而周末效益较高的时段明显晚于工作日,一般出现在12:00—14:00和16:00—18:00,这与居民的作息和出行规律有关.

分析出租车客源量随时间的变化情况及出租车司机效益随时间的变化情况可知,出租车司机在进行高效益寻客时,工作日可以选择居民上下班高峰期进行载客,如每天的8:00—10:00和16:00—18:00;周末,可以选择相对较晚的时段,如12:00—14:00和16:00—18:00,此时段居民有较多出行活动,对出租车的需求量增多.

2.4 高效益客源空间分布特征

通过对出租车客源的量化处理,采用AcrGIS反距离加权的空间插值方法,对单独考虑出租车载客态单位时间收入E(如图 6(a)所示)和同时考虑ET 2个因素的效益指数(如图 6(b)所示)这2种状态下客源的空间分布特征进行研究.

图 6 2种状态下客源的空间分布图 Fig. 6 The spatial distribution of passenger in two states

图 6中可以看出,单独考虑E与综合考虑ET的客源空间分布十分相似,较高效益的客源主要分布在石岩街道、光明街道、坪山街道及南澳街道,说明载客态单位时间收入高的大部分出租车司机整体效益也高;但是,在葵涌街道和公明街道,虽然载客态单位时间收入很高,但整体载客效益指数却处于中间或较低水平,说明仅通过单位时间收入E来评价出租车司机的效益的方式是不合理的,应该同时考虑距离下次接单的空载态寻客时间T.故本文综合考虑2个因素的影响,采用效益指数F来研究高效益客源的空间分布特征.

2.4.1 高效益客源在一周内的空间分布特征

以综合出租车载客态单位时间收入E及空载态寻客时间T 2个指标的效益指数F来分析出租车高效益客源在一周内的空间分布特征,如图 7所示.图 7(h)为深圳市出租车某一天载客点的位置分布,图 7(a)~(g)为周一至周日一周内出租车高效益客源的分布情况.

图 7 深圳市出租车一周内不同时期客源分布图 Fig. 7 The spatial distribution of Shenzhen taxi passengers in different times of a week

图 7(h)出租车点位分布图中可以发现:出租车载客点分布于原特区范围内(南山区、福田区及罗湖区)、主要口岸(罗湖口岸、福田口岸等)、交通枢纽(宝安机场、深圳北站)、交通干道(深南大道、华强路、东门路、滨河大道)及商业中心(华强商业中心、东门商业中心等).这些地区为出租车上客密集区域,其他区域则较为稀疏.

(1) 图 7(a)~(e)是工作日期间(周一至周五)出租车高效益客源的分布情况,图中数据显示工作日出租车客源在空间分布上存在显著差异,但是,高效益客源分布与出租车上下客密集分布不存在显著的相关性.主要分布在光明车站、深圳东站、福田口岸、宝安机场等交通枢纽及滨海大道南山段、北环大道、南坪快速等主干道及布吉街道、光明街道、观澜街道、坪地街道、坪山街道、葵涌街道、大鹏街道、南澳街道等较为边缘的区域;而经济发达,载客量较多的南山区、福田区及罗湖区等市中心区域虽然交通发达,居民交通需求量大,但同时也存在交通堵塞、出租车竞争激烈的现象,反而是在较偏离市中心的区域,由于交通状况好,出租车竞争压力较小,出租车司机的收益相对较高.说明出租车客源的多寡不是影响出租车司机收益的唯一因素.

(2) 图 7(f)~(g)为周末出租车高效益客源的分布情况图,分析表明:其客源空间分布状况与工作日较为相似,但高效益客源的分布比较分散,具有明显的区域性,在较为偏远的远郊地区、公园(梅林公园、大旺槟榔公园、相思林公园、铁岗水库)及商业中心(东门商业中心、华强商业中心)均有分布,而在葵涌街道、大鹏街道和南澳街道等地区出现了较低收益.这是由于周末居民主要选择在家休息,出行也主要以目的地较为分散的近郊短途游玩、逛街等娱乐活动为主.

2.4.2 高效益客源在一天不同时段内的空间分布特征

以2011年4月21日(周四)的客源数据为研究对象,分析深圳市典型工作日不同时段内的高效益客源空间分布特征,分8个时段:0:00—7:00,7:00—9:00,9:00—11:00,11:00—13:00,13:00—17:00,17:00—19:00,19:00—21:00,21:00—24:00,对高效益客源空间分布进行对比分析,结果如图 8所示.

图 8 深圳市出租车一天内不同时段客源分布图 Fig. 8 The spatial distribution of Shenzhen taxi passengers in different times of a day

图 8中可得到以下高效益客源空间分布规律:

(1) 0:00—7:00,高效益客源主要分布在光明街道、布吉街道、坪地街道和坑梓街道,同时在宝安区、南山区和罗湖区也有分布,这是因为该时段市内区域交通较为通畅,同时市区边缘的居民有到市区活动的出行需求,因此市区附近及外围的出租车司机收益较高.

(2) 7:00—9:00,早高峰期间,进入市区的人数暴增,交通拥堵.期间高效益客源主要分布在市区外围,且数量开始增加.因为该时段是工作日的上班高峰期,居民出行量开始增加,同时市区外围的交通状况良好,出租车收益较高.

(3) 9:00—11:00,高效益客源数量减少,由于已经开始上班、上课,该时段居民出行量减少,高效益客源也相对减少.11:00—13:00,居民外出吃饭或娱乐的出行量增加,高效益客源开始增多,且主要分布在光明广场、信达商业中心、城中心写字楼、黄金海岸广场、大万文化广场、投资大厦及六角大楼等商业中心与写字楼较密集的区域.13:00—17:00,居民出行需求显著下降,高效益客源较少且集中分布在交通状态良好的光明街道、横岗街道、坪山街道及葵涌街道等远郊区域.

(4) 17:00—19:00,高效益客源数量增加且分散在市区外围.该时段是工作日的下班高峰期,居民需求量大,但此时市区交通拥堵(拥堵集中于梅林关、布吉街道、南油彩田路等),导致高效益客源市区分布较少,分散分布于市区外围.

(5) 19:00—21:00,居民出行量较少,高效益客源亦较少,但在21:00以后高效益客源明显增多,主要分布在金田购物广场、坪山影剧院、千百汇、葵涌商贸城、大鹏湾俱乐部等区域附近.因为该时段深圳市夜生活开始丰富起来,居民外出娱乐休闲的需求开始增多,而这些区域拥有不同层次的商业购物中心及娱乐场所,且此时交通状况良好.

通过分析深圳市出租车高效益客源在一周不同时期和一天不同时段的空间分布特征可以发现,高效益客源的空间分布不仅与该区域居民的出行量有关,还与该区域的交通状况有关.对于出租车司机而言,想要高效益寻客,需要综合考虑这两方面的影响因素,尽量避免交通较为拥堵的区域,选择居民出行需求量较大且交通状况较好的区域进行载客.

3 结论

以深圳市2011年4月18—24日一周内13 798辆出租车GPS数据为研究对象,采用基于寻客效益指标模型的数理统计方法,提出了采用出租车载客态单位时间收入E与空载态寻客时间T相结合的综合指标,对出租车客源进行量化,并利用基于空间插值时空分析的地理统计方法分析了出租车客源的时空分布特征.研究表明:(1) 深圳市出租车出行需求在空间分布上存在明显的差异,区域集聚效应明显.在交通枢纽(宝安机场、深圳北站、福田口岸)、主要交通干道和商服中心(集商业、居住、办公、娱乐为一体的区域)需求量较为集中.(2) 受高房价的影响,深圳市居民存在关外居住、市区工作的生活模式,因此深圳市出租车在一天的工作中呈现波浪起伏状态,存在明显的早晚高峰效应,受此模式影响,存在潮汐交通拥堵现象,直接影响了司机的收入.(3) 出租车高效益客源分布区域在工作日分布平稳且主要分布在深圳市的快速主干道路及近郊区域,而经济活动较频繁且载客量较多的南山区、福田区及罗湖区受交通状况及竞争关系的影响,高效益客源分布较少;周末高效益客源受出行需求的影响在城市中呈分散分布,且偏向于娱乐、休闲场所等区域.(4) 出租车司机为了更好地收获高效益客源,应该重点服务于中短时间和中短距离的出行需求.在空间上选择交通通达的快速干道、近郊区域及出行需求旺盛的交通枢纽和商业服务中心,在时间上早高峰选择出关方向,晚高峰则反之.

分析深圳市出租车的时空分布特征,可为出租车高效益寻客提供了决策支持.本研究所设计的基于寻客效益指标模型的时空分析方法能够较好地反映客源的时空分布特征,对于其他类型城市的出租车轨迹数据依旧适用,但寻客策略需要进一步结合特定城市的出租车出行规律进行研究.该方法为出租车高效益寻客提供辅助支持的同时也存在一定的不足,如未考虑上下客位置的不确定性对高效益客源时空分布的影响,未结合深圳市已有调查资料及其他数据进行数据融合分析等,这是未来进一步研究的方向.

参考文献
[1] 唐炉亮, 郑文斌, 王志强, 等. 城市出租车上下客的GPS轨迹时空分布探测方法[J]. 地球信息科学学报, 2015(10): 1179–1186.
TANG L L, ZHENG W B, WANG Z Q, et al. Space time analysis on the pick-up and drop-off of taxi passengers based on GPS big data[J]. Journal of Geo-Information Science, 2015(10): 1179–1186.
[2] 李衢伶. 基于GPS轨迹的出租车载客路径智能推荐[D]. 长沙: 湖南科技大学, 2014.
LI Q L.Intelligent GPS-based Taxi Passenger Path Trajectory Recommendation[D].Changsha:Hunan University of Science and Technology, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10534-1015015474.htm
[3] LIU L, ANDRIS C, RATTI C. Uncovering cab drivers' behavior patterns from their digital traces[J]. Computers, Environment and Urban Systems, 2010, 34(6): 541–548. DOI:10.1016/j.compenvurbsys.2010.07.004
[4] LI B, ZHANG D, SUN L, et al.Hunting or waiting? Discovering passenger-finding strategies from a large-scale real-world taxi dataset[C]//Pervasive Computing and Communications Workshops(PERCOM Workshops), 2011 IEEE International Conference. Seattle:IEEE, 2011:63-68.
[5] ZHENG X, LIANG X, XU K.Where to wait for a taxi?[C]//Proceedings of the ACM SIGKDD International Workshop on Urban Computing.Beijing:ACM, 2012:149-156.
[6] 关金平, 朱竑. 基于FCD的出租车空驶时空特性及成因研究——以深圳国贸CBD为例[J]. 中山大学学报(自然科学版), 2010(S1): 29–36.
GUAN J P, ZHU H. Research on space-time characteristics and reasons of idle taxi based on FCD-Case in Shenzhen Guomao CBD[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 2010(S1): 29–36.
[7] 孙飞, 张霞, 唐炉亮, 等. 基于GPS轨迹大数据的优质客源时空分布研究[J]. 地球信息科学学报, 2015(3): 329–335.
SUN F, ZHANG X, TANG L L, et al. Temporal and spatial distribution of high efficiency passengers based on GPS trajectory big data[J]. Journal of Geo-Information Science, 2015(3): 329–335.
[8] 王郑委. 基于大数据Hadoop平台的出租车载客热点区域挖掘研究[D]. 北京: 北京交通大学, 2016.
WANG Z W.Research on Mining Taxi Pick-up Hotspots Area Based on Big Data Hadoop Platform[D].Beijing:Beijing Jiao Tong University, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10004-1016074254.htm
[9] 罗端高, 史峰. 考虑需求分布影响的城市出租车运营平衡模型[J]. 铁道科学与工程学报, 2009(1): 87–91.
LUO D G, SHI F. A taxi service network equilibrium model with the influenced of demand distribution[J]. Journal of Railway Science and Engineering, 2009(1): 87–91.
[10] PHITHAKKITNUKOON S, VELOSO M, BENTO C, et al.Taxi-aware map:Identifying and predicting vacant taxis in the city[C]//International Joint Conference on Ambient Intelligence.Berlin/Heidelberg:Springer, 2010:86-95.
[11] YUANG N J, ZHENG Y, ZHANG L, et al. T-finder:A recommender system for finding passengers and vacant taxis[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(10): 2390–2403. DOI:10.1109/TKDE.2012.153
[12] XU X, ZHOU J Y, LIU Y, et al. Taxi-RS:Taxi-hunting recommendation system based on taxi GPS data[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 1–12. DOI:10.1109/TITS.2015.2455191
[13] 宋炜. 晒晒出租车的收入账[N]. 榆林日报, 2012-03-27(3).
SONG W.The income for bask in the taxi[N].YU LIN RI BAO, 2012-03-27(3).
[14] 祁文田. 基于GPS数据的出租车载客点空间特征分析[D]. 长春: 吉林大学, 2013.
QI W T. Analyzing Spatial Characteristics of Taxi Pick-up with GPS Data[D].Changchun:Jilin University, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10183-1013195534.htm
[15] 张红, 王晓明, 过秀成, 等. 出租车GPS轨迹大数据在智能交通中的应用[J]. 兰州理工大学学报, 2016(1): 109–114.
ZHANG H, WANG X M, GUO X C, et al. Application of taxi GPS big trajectory data in intelligent traffic system[J]. Journal of Lanzhou University of Technology, 2016(1): 109–114.
[16] 辛飞飞, 陈小鸿, 林航飞. 浮动车数据路网时空分布特征研究[J]. 中国公路学报, 2008(4): 105–110.
XIN F F, CHEN X H, LIN H F. Research on time space distribution characteristics of floating car data in road network[J]. China Journal of Highway and Transport, 2008(4): 105–110.
[17] 郑运鹏, 赵刚, 刘健. 基于出租车GPS数据的交通热区识别方法[J]. 北京信息科技大学学报(自然科学版), 2016(1): 43–47.
ZHENG Y P, ZHAO G, LIU J. A novel method for traffic hotspots recognition based on taxi GPS data[J]. Journal of Beijing Information Science & Technology University(Natural Science Edition), 2016(1): 43–47.
[18] 韩忠民. 知经纬度计算两点精确距离[J]. 科技传播, 2011(11): 196, 174.
HAN Z M. Knowing the latitude and longitude to calculate two precise points[J]. Public Communication of Science & Technology, 2011(11): 196, 174.