文章快速检索     高级检索
  浙江大学学报(理学版)  2018, Vol. 45 Issue (5): 605-616  DOI:10.3785/j.issn.1008-9497.2018.05.013
0

引用本文 [复制中英文]

郑嘉丽, 张丰, 杜震洪, 来丽芳, 刘仁义, 刘尧. 传染病的多尺度时空特征分析——以杭州市淋病、细菌性痢疾和流行性腮腺炎为例[J]. 浙江大学学报(理学版), 2018, 45(5): 605-616. DOI: 10.3785/j.issn.1008-9497.2018.05.013.
[复制中文]
ZHENG Jiali, ZHANG Feng, DU Zhenhong, LAI Lifang, LIU Renyi, LIU Yao. Multi-scale analysis of spatial-temporal characteristics of infectious diseases: A case study on gonorrhea, bacillary dysentery and mumps in Hangzhou[J]. Journal of Zhejiang University(Science Edition), 2018, 45(5): 605-616. DOI: 10.3785/j.issn.1008-9497.2018.05.013.
[复制英文]

基金项目

国家自然科学基金资助项目(41471313,41671391);浙江省公益性科研专项(2014C33G20,2013C33051);国家测绘局公益性行业科研专项(201512024);浙江省科学技术厅2015年度省级公益性技术应用研究计划项目(2015C33052)

作者简介

郑嘉丽(1992-), ORCID:http://orcid.org/0000-0002-1899-4299, 女, 硕士研究生, 主要从事时空数据建模和WebGIS应用研究

通信作者

杜震洪, ORCID:http://orcid.org/0000-0001-9449-0415, E-mail:duzhenhong@zju.edu.cn

文章历史

收稿日期:2017-12-07
传染病的多尺度时空特征分析——以杭州市淋病、细菌性痢疾和流行性腮腺炎为例
郑嘉丽1,2 , 张丰1,2 , 杜震洪1,2 , 来丽芳3 , 刘仁义1,2 , 刘尧1,2     
1. 浙江大学 浙江省资源与环境信息系统重点实验室, 浙江 杭州 310028;
2. 浙江大学 地理信息科学研究所, 浙江 杭州 310027;
3. 浙江建设职业技术学院 城市建设工程系, 浙江 杭州 311231
摘要: 针对目前传染病时空分析中存在时间尺度单一的问题,提出一种面向多尺度的传染病时空分析框架.该框架综合利用自组织神经网络、核密度估计和时空扫描统计量等模型方法,从年份、季节、月份多个尺度对杭州市2006-2013年淋病、细菌性痢疾和流行性腮腺炎的时空分布特征进行了系统分析.结果表明,在人口密度高的辖区,3类传染病发病率年际变化明显,总体呈逐年下降趋势,而在人口稀疏的区县,发病率处于较低水平;各类传染病均具有明显的时空聚集性,各季节疾病高发区主要集中在杭州主城区,淋病的发病热度值无明显季节性差异,细菌性痢疾表现为夏、秋高发,冬、春低发,流行性腮腺炎则相反;淋病的时空聚类在月份分布上较分散,而细菌性痢疾的聚集时间多为每年的6-11月,流行性腮腺炎则为12月至次年5月.
关键词: 淋病    细菌性痢疾    流行性腮腺炎    时空特征    多尺度分析    杭州市    
Multi-scale analysis of spatial-temporal characteristics of infectious diseases: A case study on gonorrhea, bacillary dysentery and mumps in Hangzhou
ZHENG Jiali1,2, ZHANG Feng1,2, DU Zhenhong1,2, LAI Lifang3, LIU Renyi1,2, LIU Yao1,2     
1. Zhejiang Provincial Key Lab of GIS, Zhejiang University, Hangzhou 310028, China;
2. Department of Geographic Information Science, Zhejiang University, Hangzhou 310027, China;
3. Department of Urban Construction Engineering, Zhejiang College of Construction, Hangzhou 311231, China
Abstract: Spatial-temporal analysis on infectious diseases is crucial for the prevention and control of infectious diseases. However, existing related studies are still in an early exploratory stage and few of them consider the multiple temporal scales. To solve the problem, this paper proposes a multi-scale spatial-temporal analytical framework for systematically analyzing the spatial-temporal distribution patterns of infectious diseases at multiple temporal scales (year, season and month), by integrating the models of self-organizing map, kernel density estimation and space-time scan statistic. This framework is applied to analyze the data about gonorrhea, bacillary dysentery and mumps collected in Hangzhou from 2006 to 2013. The results show that the incidences of the three types of infectious diseases exhibit remarkable inter-annual variations and decrease gradually during the time period in the districts with high population density, but remain stable at a low level in the sparsely populated areas. Evidently, different types of diseases present spatial-temporal aggregation and most of cases are concentrated in main urban districts of Hangzhou for different seasons. There is no remarkable seasonal variation regarding the density of gonorrhea. Bacillary dysentery shows a relatively higher density in summer and autumn but a lower occurrence rate in winter and spring. The seasonal distribution characteristics of mumps are contrary to those of bacillary dysentery. The spatial-temporal clusters of gonorrhea incidence are scattered, whereas those of bacillary dysentery and mumps mainly occur during June to November and December to May, respectively. This paper systematically analyzes the spatial-temporal patterns of infectious diseases from macro-to micro-level. The conclusion drawn from this research will provide more scientific and sound references for effective prevention and control of infectious diseases and optimal allocation of resources. Furthermore, the proposed spatial-temporal data analytical framework will provide a new perspective for exploration of spatial-temporal characteristics of infectious diseases.
Key words: gonorrhea    bacillary dysentery    mumps    spatial-temporalcharacteristics    multi-scale analysis    Hangzhou city    

近年来,随着医疗卫生水平的提高,部分传染病已得到有效控制,但城市扩张、人口密度增大、环境恶化等问题也促使某些传染病疫情的发生和蔓延,许多已被控制的传染病有死灰复燃之势,新发传染病也不断涌现[1-2].传染病的流行和传播不仅威胁人类健康,也对经济发展和社会稳定造成了严重影响[3-4].如何有效预防和控制传染病的发生,一直是流行病学、统计学、人口学、地理学及环境学等众多领域学者致力解决的问题.

随着地理信息系统(geographic information system,GIS)技术的迅速发展和广泛使用,结合地理模型方法研究传染病的时空分布特征,已成为公共卫生领域的研究热点之一.例如,查文婷等[5]应用分级统计图法,按年份对湖南省各市2004—2013年细菌性痢疾的发病率进行空间分析,发现大部分地区的疫情呈逐年下降趋势;COULIBALY等[6]采用空间扫描统计量法,以季节为尺度对马里共和国邦贾加拉镇2009年6月至2010年5月的疟疾数据进行聚集性分析,并利用GIS技术对聚类结果进行可视化展示,结果表明,疟疾的空间分布存在明显的季节性差异;陈江平等[7]以月为分析时间单元,以中国大陆各省2009年5月到2010年3月的甲流疫情数据为研究对象,利用空间自相关方法对其进行统计分析,发现疫情传播的聚集性是由弱到强变化的,但聚集重心始终在中东部的福建、浙江、上海等地.这些研究在传染病的时空分析上取得了一定的成果,但缺乏对时间的多尺度考量.而尺度问题是地理学研究中的重要内容之一,尺度过大,大量细节会被忽略;尺度过小,易陷入局部而不能把握整体态势[8-9].因此,探索传染病在不同时间尺度下的时空模式和规律,有助于相关部门从宏观到微观层面更全面地认识传染病的分布特征,从而制定更合理、更有效的防控策略.此外,不同传播途径的传染病在流行病学及时空分布特征上存在一定差异,但现有研究主要集中于采用描述性流行病学法和时间序列法对不同类型传染病的流行规律进行比较分析[10-13],鲜有从时空分析角度开展对比研究的案例.

在传染病时空分析的研究中,目前主要使用的方法有时空重排扫描统计量法[14-16]、贝叶斯时空模型法[2, 17-18]、空间自相关方法[7, 19-20]等.其中,时空重排扫描统计量法的基本假设是研究区域内各空间单元的人口在时间上呈均匀、平稳的增长态势,而当分析的时间跨度较大时,各个空间单元的人口增长速率很可能不一致,易导致分析结果出现偏差[21-22];贝叶斯时空模型需利用数据的先验信息进行统计推断,存在一定的主观性[18];空间自相关方法需人为选择邻接或距离矩阵,产生选择偏倚性问题的可能性较大[23].此外,已有研究大多只选用一种时空方法开展实证分析,而不同方法的分析视角及挖掘的时空特性有所不同,因此,综合应用多种模型方法,能更全面、更深入地揭示传染病的时空规律.

总体而言,目前尚缺乏应用多种GIS分析手段,从多个时间尺度充分挖掘传染病多维度(空间维、时间维以及类型维)特征的实证研究.因此,本文基于自组织神经网络、核密度估计和时空扫描统计量等模型方法,提出一种传染病多尺度时空特征分析框架,分别从年份、季节和月份3个尺度对杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的时空分布规律及其差异展开对比研究,以期为传染病时空模式的探索提供新的分析视角,并为杭州市传染病防控工作的有效开展提供科学指导.

1 多尺度时空分析框架

本文从时空动态分析视角出发,构建一种面向多尺度的传染病时空分析框架(见图 1).在方法的选择上,考虑到基于离散Poisson模型的时空扫描统计量法,通过引入人口数据有效解决了时空重排扫描统计量法探测结果出现偏倚的问题[24];相较于贝叶斯时空模型,核密度估计法无须利用与数据分布有关的任何先验知识,同时对数据的分布也不必附加任何前提假设,而是从数据本身出发分析其分布特征[25];自组织神经网络,由于引入了具有拓扑结构的邻域函数,聚类效果受初值的影响较传统的K-means等聚类算法小,结果较为稳定[26].此外,与其他时空分析方法相比,自组织神经网络法、核密度估计法和时空扫描统计量法能相对简单有效地将空间分析和空间统计功能从二维空间扩展到三维空间,并能将分析结果很好地与GIS环境相结合.因此,本文选用此方法构建多尺度时空分析框架.

图 1 面向多尺度的传染病时空分析框架 Fig. 1 multi-scale spatial-temporal analytical framework for identifying characteristics of infectious diseases

在年尺度下,结合自组织神经网络、平行坐标系和时空颜色矩阵,挖掘传染病空间分布状况的年际变化特征,从而在宏观层面对传染病整体的时空发展趋势进行理解和把握;在季节尺度下,利用核密度估计法揭示不同季节传染病的热点分布位置及热度的变化情况,旨在从中观角度探索传染病的时空聚集性及其演变特征;在月尺度下,应用时空扫描统计量法,以月和乡镇街道为分析的时间和空间单元,探讨该尺度下传染病的时空分异特征,以期在微观层面更精细地阐释其背后的时空规律.不同尺度下的主要研究方法介绍如下:

1.1 自组织神经网络法

自组织神经网络[27](self-organizing map,SOM)是一种非监督的神经网络学习算法,通过自适应的学习竞争,可实现对数据的聚类划分.网络的拓扑结构由输入层和输出层构成,输入层和输出层分别包含m个和n个神经元,输出层的每个神经元代表 1个类别.SOM的网络是全连接的,因此,每个输入神经元均与所有的输出神经元相连,连接的权值为wij (i = 1, 2, …, m; j = 1, 2, …, n).算法的具体步骤如下:

表 1 三类传染病的发病数及男女患者的比例 Table 1 The total number and the gender proportion of cases of three types of infectious diseases

1) 随机初始化网络权值wij (i = 1, 2, …, m; j = 1, 2, …, n),设定一个较大的初始邻域,并令迭代次数t=0;

2) 将输入向量x随机加载进网络;

3) 计算输入向量x=(x1, x2, …, xm)与输出层神经元j(j = 1, 2, …, n)之间的距离dj

$ {d_j} = \left| {\sum\limits_{i = 1}^m {{{\left( {{x_i} - {w_{ij}}} \right)}^2}} } \right|; $ (1)

4) 选择与输入向量x距离最近的输出层神经元c作为获胜神经元;

5) 更新神经元c及其邻域Nc(t)内的其他神经元的连接权值:

$ {w_{ij}}\left( {t + 1} \right) = {w_{ij}}\left( r \right) + \alpha \left( t \right)\left( {{x_i} - {w_{ij}}\left( t \right)} \right), $ (2)
$ \alpha \left( t \right) = 1/t, $ (3)

其中,α(t)为学习速率,随迭代次数t的增加而递减.

6) 令t=t+1,转步骤2),直至t达到最大迭代次数时聚类结束.

1.2 核密度估计法

核密度估计法[28-29](kernel density estimation,KDE)是空间点模式分析中应用广泛的非参数估计技术,能在平面空间中生成一个反映点数据的密度连续变化的光滑表面.对于一个二维的地理空间而言,空间中每个格网的密度估计值可表示为:

$ \hat f\left( {x, y} \right) = \frac{1}{{n{h^2}}}\sum\limits_{i = 1}^n {K\left( {\frac{{x - {x_i}}}{h}, \frac{{y - {y_i}}}{h}} \right)} , $ (4)

式中,n为点数据数目,(x, y)为格网中心点的空间位置,(xi, yi)为第i个点数据的空间位置,h为搜索半径,K为核函数.

核函数属于距离衰减函数,距数据点越远,计算得到的密度值越小,在搜索半径边缘处时密度为0.鉴于Epanechnikov核函数所产生的均方误差和效率损失均较Normal, Uniform, Gaussian等核函数的小[30-31],本研究选用Epanechnikov内核计算传染病的KDE值,其公式为:

$ K\left( {\alpha , \beta } \right) = \left\{ \begin{array}{l} 2{\pi ^{ - 1}}\left( {1 - \left( {{\alpha ^2} + {\beta ^2}} \right)} \right), \left( {{\alpha ^2} + {\beta ^2}} \right) < 1, \\ 0, \left( {{\alpha ^2} + {\beta ^2}} \right) \ge 1, \end{array} \right. $ (5)

式中,$\alpha = \frac{{x - {x_i}}}{h}, \beta = \frac{{y - {y_i}}}{h}$.

在KDE中,搜索半径h对最终的热点可视化效果有重要影响.搜索半径越大,越能突显研究对象的整体分布特征;搜索半径越小,则越能反映研究对象的局部特征差异.为得到更好的热点可视化效果,本研究采用试错法比较不同h值时的KDE结果,以确定最优的搜索半径[32].

1.3 时空扫描统计量法

时空扫描统计量法[33]在疾病监测和卫生决策领域中应用广泛,不仅能探测疾病是否存在时空聚集性,还能对聚集位置和时间进行定位.该方法基于的概率模型主要有Poisson分布模型和Bernoulli分布模型.本研究利用SaTScan 9.4软件[34]提供的基于离散Poisson模型的时空扫描统计量法对传染病的时空聚集性进行扫描分析,探测过程为:(1)在所研究的时空区间中随机选取1个点,将其作为圆柱形扫描窗口的底面中心;(2)不断扩大圆柱体底面半径以改变扫描区域的大小,同时逐渐增加圆柱体的高度,使扫描窗口所覆盖的时间长度逐步延长,直至达到预先设置的空间和时间上限;(3)不断移动扫描窗口,并在其他时空区域重复相同的扫描过程;(4)依据窗口内外的真实发病人数与预期发病人数计算每个窗口的对数似然比(log likelihood ratio,LLR),并将其用于检验窗口的扫描统计量[33, 35].LLR的计算公式为:

$ {\rm{LLR = }}{n_{\rm{D}}}\log \frac{{{\eta _{\rm{D}}}}}{{{\mu _{\rm{D}}}}} + \left( {{n_{\rm{G}}} - {n_Z}} \right)\log \frac{{{n_{\rm{G}}} - {n_{\rm{D}}}}}{{{\mu _{\rm{G}}} - {\mu _{\rm{D}}}}} - {n_{\rm{G}}}\log \frac{{{n_{\rm{G}}}}}{{{\mu _{\rm{G}}}}}, $ (6)

式中,D代表某个圆柱形扫描窗口,nD是窗口D中的真实发病人数,μD为在无效假设下,结合真实发病人数和人口数计算而得的窗口D内预期的发病人数,nGμG分别为整个研究区域的总发病数和预期发病数.

应用LLR对窗口内发病情况的异常水平进行评估,LLR值越大,表示该窗口中的发病人数越异常,其时空聚集性越强.同时,为避免虚假检验的产生,通常会利用蒙特卡洛模拟法对各个窗口的统计学意义进行定量评价.

2 实例分析 2.1 研究区域概况及数据来源

杭州市位于浙江省西北部钱塘江下游,是浙江省的政治、经济、文化和金融中心,也是华东地区的中心城市之一.2013年,该市下辖8个区、2个县,代管3个县级市(如图 2所示),全市总面积1.66×104 km2,属亚热带季风区,四季分明,光照充足,雨量充沛,年平均气温15~17 ℃,一月份最冷,七月份最热.年平均降水量1 100~1 600 mm,以春雨、梅雨和台风雨为主.杭州年鉴[36]的数据显示,2013年全市拥有884.4万常住人口,流动人口数则高达426万,是全省流动人口最多的城市.

图 2 研究区位置及2013年人口密度分布 Fig. 2 Study area and population density distribution in 2013

图 2的人口密度图可知,杭州市人口分布极其不均匀,上城区、下城区、拱墅区、西湖区、江干区、滨江区等主城区人口稠密,而周边的临安市、淳安县、建德市等区县的人口密度较低.杭州作为浙江省的省会,地理位置特殊,人口流动频繁,自然灾害时有发生,其传染病发病率在省内一直处于较高水平.如2013年,该市报告的法定传染病发病数多达7.1万人次,占全省发病总数的19.2%,居全省第一,因此,研究杭州市传染病的时空分布规律,对该市乃至全省疫情的防控具有重要的指导意义.

本文的研究对象为杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的发病数据,这三类疾病分别属于典型的性传播疾病、肠道传染病和呼吸道传染病.数据来源于国家疾病监测信息报告管理系统,每条信息记录了患者的年龄、性别、职业、患病类型、家庭住址和发病时间.去除地址不详的记录,按家庭住址对有效数据进行空间化处理,最终得到的发病例数及男女患者的比例如表 1所示.

2.2 框架应用及结果分析 2.2.1 总体特征

图 3利用百分比堆积柱形图和箱线图刻画了各类传染病的人群分布特征,箱线图中各横线的含义如图 4所示.从图 3(a)的职业分布以及图 3(b)的性别、年龄组成来看,淋病患者以农民(34.6%)和工人(32.6%)居多,这与其文化水平和经济基础及性病防治意识相对薄弱有关[37],病例主要集中于性活跃的青壮年,50%的男性患者处于25~42岁的年龄段,50%的女性患者年龄在24~50岁.细菌性痢疾职业构成中以儿童(33.2%)、学生(15.0%)和农民(14.3%)为主,这主要是因为该类疾病的发病与卫生习惯和周围环境有关,而这三类人群的卫生知识水平相对较低,受菌痢病原体感染的概率更高[38].在年龄分布上,36岁以下的男性患者占75%,47岁以下的女性患者占75%,女性患者的平均年龄(29岁)明显高于男性患者(23岁).流行性腮腺炎的高发人群为儿童(37.9%)和学生(52.8%),患者的平均年龄在10岁左右,在不考虑异常点的情况下,女性患者的年龄跨度(0~25岁)略大于男性(0~20岁).由表 1可知,各类疾病发病数均为男性多于女性,对于淋病而言,主要由于女性被感染后症状不明显,就诊率低,因此在报告病例中,男性居多[11];其他两类疾病,男性病例数较高可能与其活动范围较广,接触传染源的机会更多有关.

图 3 三类传染病在职业、性别和年龄上的分布特征 Fig. 3 Demographic distribution characteristics of the three types of infectious diseases in people with different occupation, gender and age
图 4 箱线图结构 Fig. 4 The structure of the boxplot

图 5为应用平均中心法(mean center,MC)和标准差椭圆法(standard deviational ellipse,SDE)对三类疾病分布的描述.其中,平均中心法确定了病例分布的平均位置,标准差椭圆可度量传染病的扩散方向和聚集程度,椭圆长轴的方向表征数据的总体扩散方向,椭圆越小表明数据越聚集[39].直观分析可知,淋病病例的平均中心较其他两类疾病更偏向西南侧,而细菌性痢疾则更偏向东北侧.3个平均中心的直线距离在6 km以内,均分布在西湖区,说明病例在研究区域的东北部分布较多,这可能是因为东北部的人口密度大,疾病在人群中传播与流行的概率比较高.从图 5的标准差椭圆可见,三类疾病的总体扩散趋势均为从东北到西南,其中,细菌性痢疾感染者的空间分布最聚集,而淋病和流行性腮腺炎的分布较分散.

图 5 三类传染病的平均中心及标准差椭圆 Fig. 5 Mean centers and standard deviational ellipses for three types of infectious diseases

平均中心和标准差椭圆均很好地反映了疾病的总体分布特点,但不能精确表示病例的聚集程度和时空分布差异性.因此,需进一步探究疾病数据的时空特征.

2.2.2 基于年尺度的时空特征

在三类传染病年际变化规律的时空分析上,本研究使用SOM对传染病的发病率进行聚类分析,并集成了地图矩阵、平行坐标系和时空颜色矩阵等可视化聚类结果[40](见图 6).SOM中的每个输入向量由特定年份、特定区县三类传染病的发病率构成.各类传染病数据在时间维度上均包含8个年份,空间维度上涵盖了杭州的13个区、县,因此,整个输入数据集含有8×13=104条样本数据.SOM的输出层采用2×4(8类)的二维网络结构,最大迭代次数设为1 000.图 6(a)~(h)为地图矩阵应用分层设色法可视化分类结果,每种颜色代表 1种聚类;图 6(i)的平行坐标系具有多维图例作用,横轴代表不同类型的传染病,纵轴代表相应传染病的发病率,每条折线为SOM中的一个聚类中心(该聚类内所有样本的平均值);图 6(j)的时空颜色矩阵与地图矩阵相对应,表达时间、空间信息,可辅助增强可视化效果.

图 6 杭州市各辖区不同年份三类传染病发病率SOM聚类图 Fig. 6 SOM clustering maps of the incidences of the three types of infectious diseases for different years in different districts of Hangzhou

结合图 6(a)~(h)图 6(j)可知,属于红色和橙色聚类的区、县数目逐年增多(2013年的数目和2012年持平),而这2个聚类所对应的三类疾病的发病率均较低,说明2006—2013年杭州市淋病、细菌性痢疾和流行性腮腺炎发病率总体呈下降趋势.随着淋病防治知识的宣传、人民群众卫生意识的提高、饮食卫生环境的改善以及腮腺炎疫苗的大规模推广使用等,这三类传染病得到了有效控制.图 6亦显示了传染病年际变化的空间异质性.例如,桐庐县、建德市、临安市等人口密度相对较低的市县,这三类传染病的发病率未表现出显著的年际变化特征,一直处于较低的水平;而江干区、下城区及拱墅区等人口稠密、流动人口多的市区,传染病发病率波动明显,具有较显著的年份差异.如,拱墅区2006—2008年淋病和细菌性痢疾的发病率均相对较高(粉红聚类),至2009年,这两类疾病的发病率有所下降,但流行性腮腺炎的发病率却出现上升现象(靛青聚类),随后,细菌性痢疾和流行性腮腺炎都得到了有效控制,而淋病的发病率却一直处于相对较高的水平(绿色聚类).由此可见,加强宣传、提高人们主动预防淋病的意识,依然是拱墅区传染病防控工作的重点.

图 6综合SOM、平行坐标系和时空颜色矩阵等方法, 做基于年尺度的传染病时空多维可视化分析,有利于研究人员把握传染病时空分布的整体特征,但为了更全面、更深入地挖掘各类传染病的时空规律,还需要在季节、月份等更微观的时间尺度下探讨时空分异特征及差异.

2.2.3 基于季节尺度的时空特征

本文在研究三类疾病的季节变化特点时,按照3—5月、6—8月、9—11月和12—2月将数据划分为春夏秋冬4个季节,将划分好的数据作为KDE输入,以100 m×100 m的格网大小,1 km的搜索半径为参数,采用Epanechnikov核函数绘制各类传染病的核密度分布图(如图 7所示).由图 7可知,3种疾病的发病率在空间分布上均具有明显的聚集性,各季节密度值最高的区域主要都集中在人口稠密的主城区,与图 5平均中心的分布情况相吻合.这些区域人与人之间频繁的近距离接触增大了传染病的传播风险和人员被感染的概率,在空间上表现出很强的聚集性.虽然这三类疾病的热点分布位置大致相同,但从总体热度值来看,流行性腮腺炎感染者的空间分布热度远低于其他两类疾病.

图 7 三类传染病不同季节核密度分布图 Fig. 7 Kernel density maps for the three types of infectious diseases in different seasons

图 7(a)~(d)可知,淋病在空间分布上无明显的季节性差异,不同季节热点基本都分布于主城区的中心处,且热度值十分接近,可见淋病全年散发,因此,对于该类疾病,全年均要做好相关的防控工作.图 7(e)~(h)的结果表明,细菌性痢疾的季节性特征显著,夏、秋季是发病高峰期,进入冬季后,病例的空间分布热度迅速下降,到春季又有所上升.这可能是因为细菌性痢疾属于肠道传染病,病原菌可通过苍蝇、蟑螂等间接传播,通过污染食品、水源或手,最终病从口入,使易感者被感染,而夏、秋季苍蝇、细菌易滋生,增大了疾病传播的概率,故夏、秋细菌性痢疾多发[38].不同季节流行性腮腺炎的核密度分布情况恰好与细菌性痢疾相反,表现为冬、春季发病密度高,夏、秋季发病密度低(如图 7(i)~(l)所示),与LI等[41]的研究结果一致.这是由于流行性腮腺炎是以唾液、飞沫为主要传播途径,冬、春季气温较低,通常门窗紧闭,空气流通差,易引发该类疾病.

与基于年尺度的时空特征研究相比,以季节为时间单元的分析,通过采用分时段核密度估计法,直观、具体地展示了杭州市淋病、细菌性痢疾和流行性腮腺炎病例的空间热度分布情况及其季节性差异,不仅可以为疾病病因的探索提供更详细的线索,而且可为疾病防治对策的制定提供科学依据.

2.2.4 基于月尺度的时空特征

为进一步挖掘三类传染病的时空分布特征及其差异,应用基于离散Poisson模型的时空扫描统计量法,以乡镇街道为地理单元,以月为时间尺度,对杭州市2006—2013年淋病、细菌性痢疾和流行性腮腺炎的分月发病数和平均人口数进行回顾性时空扫描分析.在模型参数的设置上,将聚类范围的上限设定为覆盖30%总人口,最大空间扫描半径设为10 km,最大时间扫描半径设为6个月,蒙特卡洛模拟数设为999次,当检验统计量的P值小于0.001时,可认为扫描窗口内外发病数的差异有统计学意义,窗口所在的区域属于传染病的高发时空聚集区.图 8表 2展示了P<0.001时的时空聚集信号.

图 8 三类传染病回顾性时空扫描统计结果分布图(以月和乡镇街道为时间和空间基本单元) Fig. 8 Maps of the results of the retrospective space-time scan statistic for three types of infectious diseases at month scale and sub-district level 图中的数字代表聚类编号,与表 2相对应.
表 2 三类传染病回顾性时空扫描统计结果(分别以月和乡镇街道为时间和空间的基本单元) Table 2 The results of the retrospective space-time scan statistic for three types of infectious diseases at month scale and sub-district level

图 8(a)~(c)中可直观地看到,被识别的各类传染病时空聚集信号主要出现在杭州主城区及其附近区域,这与KDE分析中(见图 7)的热点分布较一致.值得注意的是,有些区域虽然在图 7中未呈现很高的热度值,却被扫描统计为高发病时空聚集区(如:图 8(a)的聚类6;图 8(b)的聚类4和5;图 8(c)的聚类4,12,13).这是因为当对KDE的结果进行可视化渲染时,其全局密度阈值易导致小范围内的局部高发热度被减弱甚至被忽略,而时空扫描统计量法的圆柱体扫描窗口的大小和位置是动态变化的,从而实现对数据聚集性的探测和数据的最大挖掘,因此,对局部高发的时空聚集信号有更好的检测能力[22, 42].由表 2(a)可知,淋病的时空聚集区域在月份分布上比较分散,1号和3号聚类发生于6—11月,2号聚类出现在4—9月,4~6号聚类则分别产生于3—7月、11月至次年2月和1—5月.而细菌性痢疾和流行性腮腺炎聚类所处的月份均比较集中,前者发病聚集时间主要在每年的6—11月(见表 2(b)),后者则为每年的12月至次年5月(见表 2(c)),与前述基于季节尺度的分析结果基本吻合.总体而言,相较于以年份和季节为时间单元的研究,基于月份尺度的分析更精细地体现了各类传染病在不同时空区间上的聚集性特征.

3 结论

传染病在不同尺度下的时空分布特征有所不同,因此在多尺度下对其进行考察和研究才能充分把握其内在规律.目前,对传染病的时空分析尚缺乏对时间的多尺度考量,且研究的疾病类型也较单一.针对以上问题,本文运用多种统计学和地理学方法,选取典型的性传播疾病(淋病)、肠道传染病(细菌性痢疾)和呼吸道传染病(流行性腮腺炎),通过不同时间尺度的分析,将3种传染病的时空分布特征纳入整体框架进行探究.研究结果表明,三类传染病在年份、季节和月份尺度上均表现出特定的时空分布特点.在年尺度上,各类疾病的发病率在人口密度大、人员流动频繁的辖区变化和波动较明显,总体呈逐年下降趋势;而人口稀疏的区、县发病率长期处于较低水平,未表现出明显的年际变化特征.在季节尺度下,各季节不同传染病的高发区主要都集中在人口稠密的主城区;淋病的空间热度分布无明显的季节性差异,细菌性痢疾表现为夏、秋高发,冬、春低发,流行性腮腺炎则相反.在月尺度上,三类传染病的时空聚集信号主要出现在主城区, 周边KDE值较低的区、县,也有部分聚类;淋病的时空聚集区域在月份分布上较分散,而细菌性痢疾的聚集时间多为每年的6—11月,流行性腮腺炎则为12月至次年5月.

在框架构建上,综合SOM、平行坐标系和时空颜色矩阵等方法,做基于年尺度的分析,有利于从宏观角度把握传染病时空分布的整体特征;以季节为时间单元采用KDE开展研究,可直观了解疾病的热度分布及季节性差异;利用时空扫描统计量法进行月尺度探究,可更精细地检测和识别局部高发的时空聚集信号.不同尺度下所应用的模型相辅相成,从宏观到微观层面较深入地剖析了传染病的时空分布规律.

本文的研究成果对杭州市传染病防控措施的制定和防控资源的优化配置具有一定的指导意义,构建的多尺度时空分析框架可为今后类似流行病研究提供新的分析视角.本文仅定性分析了传染病的时空分布特征与人口密度、气象因素的关系,下一步将考虑应用地理加权回归分析等方法对发病率与空间风险因子之间的关联进行定量研究.

参考文献
[1] 宋捷. 大气污染和气象因素对传染病的交互影响[D]. 兰州: 兰州大学, 2015.
SONG J. The Interaction Effects of Air Pollution and Meteorological Factors on the Infectious Diseases[D]. Lanzhou: Lanzhou University, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10730-1015342428.htm
[2] 徐冰. 基于贝叶斯网络的传染病时空预警模型研究[D]. 西安: 长安大学, 2015.
XU B. A Study on the Spatial-Time Early Warning Models of Infectious Disease Based on Bayesian Network[D]. Xi'an: Chang'an University, 2015. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D748363
[3] 徐聪. 基于GIS的小空间尺度传染病时空预警技术[D]. 杭州: 浙江大学, 2014.
XU C. GIS-based Technologies on Spatio-temporal Early-Warning of Infectious Diseases in Small-Scale Space[D]. Hangzhou: Zhejiang University, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10335-1014359289.htm
[4] 张旭, 霍爱梅, 姚晓丽, 等. 空间分析技术在研究传染病时空传播规律中的应用[J]. 测绘与空间地理信息, 2015, 38(7): 79–81.
ZHANG X, HUO A M, YAO X L, et al. Application of spatial analysis techniques in the temporal spread pattern study of infections diseases[J]. Geomatics & Spatial Information Technology, 2015, 38(7): 79–81.
[5] 查文婷, 刘意, 郑剑, 等. 湖南省2004-2013年细菌性痢疾时空格局GIS技术分析[J]. 中国公共卫生, 2015, 31(10): 1297–1300.
ZHA W T, LIU Y, ZHENG J, et al. Spatio-temporal distribution of bacterial dysentery from 2004 to 2013 Hunan province:Analysis with geographic information system[J]. Chinese Journal of Public Health, 2015, 31(10): 1297–1300.
[6] COULIBALY D, REBAUDET S, TRAVASSOS M, et al. Spatio-temporal analysis of malaria within a transmission season in Bandiagara, Mali[J]. Malaria Journal, 2013, 12(1): 82. DOI:10.1186/1475-2875-12-82
[7] 陈江平, 张兰兰, 余远剑, 等. 利用空间自相关的中国内陆甲型H1N1流感疫情分析[J]. 武汉大学学报(信息科学版), 2011, 36(11): 1363–1366.
CHEN J P, ZHANG L L, YU Y J, et al. Analysis on epidemic of A/H1N1 Flu in mainland China based on spatial statistical methods[J]. Geomatics and Information Science of Wuhan University, 2011, 36(11): 1363–1366.
[8] 李双成, 蔡运龙. 地理尺度转换若干问题的初步探讨[J]. 地理研究, 2005, 24(1): 11–18.
LI S C, CAI Y L. Some scaling issues of geography[J]. Geographical Research, 2005, 24(1): 11–18.
[9] 刘海猛, 石培基, 潘竟虎, 等. 中国城镇房价收入比时空演变的多尺度分析[J]. 地理科学, 2015, 35(10): 1280–1287.
LIU H M, SHI P J, PAN J H, et al. Spatio-temporal evolution on housing price to income ratio of China using multiscale analysis[J]. Scientia Geographica Sinica, 2015, 35(10): 1280–1287.
[10] ZHANG L, WILSON D P. Trends in notifiable infectious diseases in China:Implications for surveillance and population health policy[J]. Plos One, 2012, 7(2): e31076. DOI:10.1371/journal.pone.0031076
[11] MARTÍPASTOR M, OLALLA P G D, BARBERÁM J, et al. Epidemiology of infections by HIV, syphilis, gonorrhea and lymphogranuloma venereum in Barcelona city:A population-based incidence study[J]. Bmc Public Health, 2015, 15(1): 1015.
[12] GAO H, LUAN W, WANG M, et al. Epidemic characteristics of main infectious diseases in Yantai city between 2010 and 2012 and prevention strategy research[J]. Pakistan Journal of Pharmaceutical Sciences, 2016, 29(6): 2191–2198.
[13] 冯霞燕. Y市2005-2015年报告传染病流行特征分析[D]. 杭州: 浙江大学, 2016.
FENG X Y. Epidemiologic Characteristics of Reported Infectious Diseases in Y City from 2005 to 2015[D]. Hangzhou: Zhejiang University, 2016. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y3119178
[14] RODRÍUEZ E M, DÍAZ F, P ÉREZ M V. Spatio-temporal clustering of American Cutaneous Leishmaniasis in a rural municipality of Venezuela[J]. Epidemics, 2013, 5(1): 11–19. DOI:10.1016/j.epidem.2012.10.002
[15] 赵晓辉, 周大宇, 孙佩龙, 等. 2010-2014年锦州市流感监测及时空分布特征分析[J]. 现代预防医学, 2015, 42(11): 2062–2064.
ZHAO X H, ZHOU D Y, SUN P L, et al. Analysis of influenza surveillance and its spatio-temporal characteristics in Jinzhou from 2010 to 2014[J]. Modern Preventive Medicine, 2015, 42(11): 2062–2064.
[16] GREENE S K, PETERSONE R, KAPEL D, et al. Daily reportable disease spatiotemporal cluster detection, New York city, New York, USA, 2014-2015[J]. Emerging Infectious Diseases, 2016, 22(10): 1808–1812.
[17] MUKHSAR, ABAPIHI B, SANI A, et al. Extended convolution model to bayesian spatio-temporal for diagnosing the DHF endemic locations[J]. Journal of Interdisciplinary Mathematics, 2016, 19(2): 233–244. DOI:10.1080/09720502.2015.1047591
[18] 吴北平, 杨典, 王劲峰, 等. 利用贝叶斯时空模型分析山东省手足口病时空变化及影响因素[J]. 地球信息科学学报, 2016, 18(12): 1645–1652.
WU B P, YANG D, WANG J F, et al. Space-time variability and determinants of hand, foot and mouth in Shandong province:A bayesian spatio-temporal modeling approach[J]. Journal of Geo-Information Science, 2016, 18(12): 1645–1652.
[19] GUI J, LIU Z, ZHANG T, et al. Epidemiological characteristics and spatial-temporal clusters of hand, foot, and mouth disease in Zhejiang province, China, 2008-2012[J]. Plos One, 2015, 10(9): e0139109. DOI:10.1371/journal.pone.0139109
[20] 李美芳, 欧金沛, 黎夏. 基于地理信息系统的2009-2013年甲型H1N1流感的时空分析[J]. 地理研究, 2016, 35(11): 2139–2152.
LI M F, OU J P, LI X. Spatio-temporal analysis of influenza A(H1N1) in China during 2009 to 2013 based on GIS[J]. Geographical Research, 2016, 35(11): 2139–2152.
[21] KULLDROFF M, HEFFERNAN R, HARTMAN J, et al. A space-time permutation scan statistic for disease outbreak detection[J]. Plos Medicine, 2005, 2(3): e59. DOI:10.1371/journal.pmed.0020059
[22] 殷菲, 冯子健, 李晓松, 等. 基于前瞻性时空重排扫描统计量的传染病早期预警系统[J]. 卫生研究, 2007, 36(4): 455–458.
YIN F, FENG Z J, LI X S, et al. The early warning system based on the prospective space-time permutation statistic[J]. Journal of Hygiene Research, 2007, 36(4): 455–458.
[23] 王培安, 罗卫华, 白永平. 基于空间自相关和时空扫描统计量的聚集比较分析[J]. 人文地理, 2012, 27(2): 119–127.
WANG P A, LUO W H, BAI Y P. Comparative analysis of aggregation detection based on spatial autocorrelation and spatial temporal scan statistics[J]. Human Geography, 2012, 27(2): 119–127.
[24] 殷菲. 时-空扫描统计量在传染病早期预警中的应用研究[D]. 成都: 四川大学, 2007.
YIN F. A Study on the Applicability of Space-time Scan Statistic in Early Warning of Infectious Disease[D]. Chengdu: Sichuan University, 2007. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1194543
[25] 张学工. 模式识别[M]. 第3版. 北京: 清华大学出版社, 2010.
ZHANG X G. Pattern Recognition[M]. 3rd. Beijing: Tsinghua University Press, 2010.
[26] 徐步云, 倪禾. 自组织神经网络和K-means聚类算法的比较分析[J]. 新型工业化, 2014, 4(7): 63–69.
XU B Y, NI H. Comparative analysis of SOM and K-means clustering[J]. Journal of New Industrialization, 2014, 4(7): 63–69.
[27] KOHONEN T. Self-Organizing Maps 3rd Edition[M]. Berlin: Springer-Verlag, 2001: 153-160.
[28] ROSENBLATT M. Remarks on some nonparametric estimates of a density function[J]. The Annals of Mathematical Statistics, 1956, 27(3): 832–837. DOI:10.1214/aoms/1177728190
[29] PARZEN E. On estimation of a probability density function and mode[J]. The Annals of Mathematical Statistics, 1962, 33(3): 1065–1076. DOI:10.1214/aoms/1177704472
[30] EPANECHNIKOV V A. Non-parametric estimation of a multivariate probability density[J]. Theory of Probability & Its Applications, 1969, 14(1): 153–158.
[31] SILVERMAN B W. The kernel method for multivariate data[J]. Density Estimation for Statistics and Data Analysis, 1986(4): 76–86.
[32] GAO S. Spatio-temporal analytics for exploring human mobility patterns and urban dynamics in the mobile age[J]. Spatial Cognition & Computation, 2015, 15(2): 86–114.
[33] KULLDORFF M, ATHAS W F, FEURER E J, et al. Evaluating cluster alarms:A space-time scan statistic and brain cancer in Los Alamos, New Mexico[J]. American Journal of Public Health, 1998, 88(9): 1377. DOI:10.2105/AJPH.88.9.1377
[34] KULLDORFF M. SaTScanTM User Guide for Version 9. 4[EB/OL]. [2017-11-30]. https://www.satscan.org/.
[35] 马越, 李晓松, 张彦利. 扫描统计量在传染病监测应用中的空间尺度选择[J]. 现代预防医学, 2011, 38(9): 1601–1604.
MA Y, LI X S, ZHANG Y L. Spatial scale selection of space-time statistic method analysis on the application in surveillance for infectious diseases[J]. Modern Preventive Medicine, 2011, 38(9): 1601–1604.
[36] 杭州市人民政府地方志办公室. 杭州年鉴(2014)[M]. 北京: 方志出版社, 2014: 346.
The Local Records Office of Hangzhou Municipal People's Government. Hangzhou Almanac(2014)[M]. Beijing: Local Records Press, 2014: 346.
[37] 张国庆. 1990-2012年寿光市法定传染病流行趋势分析[D]. 济南: 山东大学, 2013.
ZHANG G Q. Analysis of Epidemic Situation and Trend of Notifiable Infectious Diseases in Shouguang City from 1990 to 2012[D]. Jinan: Shandong University, 2013. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2330840
[38] 李媛媛, 徐成东, 肖革新, 等. 京津唐地区细菌性痢疾社会经济影响时空分析[J]. 地球信息科学学报, 2016, 18(12): 1615–1623.
LI Y Y, XU C D, XIAO G X, et al. Spatial-temporal analysis of social-economic factors of bacillary dysentery in Beijing-Tianjin-Tangshan, China[J]. Journal of Geo-Information Science, 2016, 18(12): 1615–1623.
[39] RAHMANIATI M, ERYANDO T, SUSANNA D, et al. The utilization of standard deviational ellipse (SDE) model for the analysis of dengue fever cases in Banjar city 2013[J]. Aspirator Journal of Vector Borne Diseases Studies, 2014, 6(1): 21–28.
[40] GUO D, CHEN J, MACEACHREN A M, et al. A visualization system for space-time and multivariate patterns (VIS-STAMP)[J]. IEEE Transactions on Visualization & Computer Graphics, 2006, 12(6): 1461–1474.
[41] LI R, CHENG S, LUO C, et al. Epidemiological characteristics and spatial-temporal clusters of mumps in Shandong province, China from 2005 to 2014[J]. Scientific Reports, 2017(7): 46328.
[42] NAKAYA T, YANO K. Visualizing crime clusters in a space-time cube:An exploratory data-analysis approach using space-time kernel density estimation and scan statistics[J]. Transactions in GIS, 2010, 14(3): 223–239. DOI:10.1111/j.1467-9671.2010.01194.x