浙江大学学报(工学版), 2020, 54(5): 1039-1048 doi: 10.3785/j.issn.1008-973X.2020.05.023

计算机技术

基于模式识别和集成CNN-LSTM的阵发性房颤预测模型

杨萍,, 王丹,, 康子健, 李童, 付利华, 余悦任

Prediction model of paroxysmal atrial fibrillation based on pattern recognition and ensemble CNN-LSTM

YANG Ping,, WANG Dan,, KAGN Zi-jian, LI Tong, FU Li-hua, YU Yue-ren

通讯作者: 王丹,女,教授. orcid.org/0000-0001-9876-6431. E-mail: neuwd@sina.com.cn

收稿日期: 2019-11-27  

Received: 2019-11-27  

作者简介 About authors

杨萍(1987—),女,博士生,从事机器学习、大数据和生命健康领域研究.orcid.org/0000-0002-7091-2289.E-mail:yangping_sx@163.com , E-mail:yangping_sx@163.com

摘要

为了适用于长期心电监护和ICU等实时性、数据密集型应用场合,提出可在8 Hz采样频率的1 min心电图(ECG)片段上提前45 min预测阵发性房颤(PAF)发作的实时预测模型. 采用概率符号化模式识别方法,在降采样后的ECG序列上提取出1 min窗口内的模式转移特征,降低模型的计算量和对存储空间的需求,确保实时预测的效果. 提出卷积神经网络(CNN)和长短-期记忆网络(LSTM)的混合模型(CNN-LSTM),用于提取模式转移特征内隐含的局部空间特征和时间依赖特征. 为了提升模型泛化能力,构建基于CNN-LSTM的集成分类器. 采用Spark Streaming技术完成对ECG流式数据的读、写和计算,实现数据和模型之间的低延迟通信. 所提模型在公开数据集上的准确率、灵敏度和特异度分别为91.26%、82.21%、95.79%. 模型处理总延迟平均为2 s,满足实时PAF预测需求.

关键词: 阵发性房颤 ; 心电图(ECG) ; 预测 ; 概率符号化模式识别 ; 卷积神经网络(CNN) ; 长短-期记忆网络(LSTM) ; Spark Streaming

Abstract

The real-time prediction model that can predict the onset of paroxysmal atrial fibrillation (PAF) 45 min in advance on the one minute electrocardiogram (ECG) segment with 8 Hz sampling frequency was proposed, for real-time and data-intensive application scenarios such as long-term ECG monitoring and intensive care units (ICU). The probabilistic symbolic pattern recognition method was used to extract the pattern transition features within one minute window of down sampled ECG sequence, reducing the calculation complexity of the model and the demand for storage space, so as to ensure the effect of real-time prediction. A hybrid model (CNN-LSTM) of the convolutional neural network (CNN) and the long short-term memory (LSTM) was proposed to extract local spatial features and time-dependent features implied in pattern transition features. An ensemble classifier based on CNN-LSTM was constructed to improve the generalization ability of the model. Spark Streaming technology was used to read, write and calculate ECG streaming data, and low latency communication between data and model was realized. The accuracy, sensitivity, and specificity of the proposed model were 91.26%, 82.21%, and 95.79% respectively. The average delay of model processing was 2 s, which can meet the real-time PAF prediction demand.

Keywords: paroxysmal atrial fibrillation (PAF) ; electrocardiogram (ECG) ; prediction ; probabilistic symbolic pattern recognition ; convolutional neural network (CNN) ; long short-term memory (LSTM) ; Spark Streaming

PDF (1051KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

杨萍, 王丹, 康子健, 李童, 付利华, 余悦任. 基于模式识别和集成CNN-LSTM的阵发性房颤预测模型. 浙江大学学报(工学版)[J], 2020, 54(5): 1039-1048 doi:10.3785/j.issn.1008-973X.2020.05.023

YANG Ping, WANG Dan, KAGN Zi-jian, LI Tong, FU Li-hua, YU Yue-ren. Prediction model of paroxysmal atrial fibrillation based on pattern recognition and ensemble CNN-LSTM. Journal of Zhejiang University(Engineering Science)[J], 2020, 54(5): 1039-1048 doi:10.3785/j.issn.1008-973X.2020.05.023

阵发性房颤(paroxysmal atrial fibrillation,PAF)是房颤的早期阶段,是一类严重的心律失常疾病[1-2]. 24 h动态心电图技术可以用于记录长时间的心电图(electrocardiogram,ECG)信号,以观察偶发、阵发的异常心电活动. 人工观察并分析ECG信号的方法费时费力,还易出现漏诊. 因此,基于机器学习方法的PAF自动筛查和预测技术,作为重要的辅助诊断方法,得到了研究者的关注.

目前,基于ECG的PAF研究任务主要包括两类,一类是PAF筛查,即从所有受试者中,识别出患有PAF的个体. 另一类是PAF预测,即根据受试者当前的ECG数据,确定在接下来的时间段是否会发生PAF,防患于未然. 还有研究是预测一次PAF发作是否可以自发终止,以及何时终止[3]. 本研究的主要内容是基于受试者当前的短时间片段ECG数据(1 min),预测受试者在接下来的45 min内是否会发生房颤.

通常有2种机器学习的策略对ECG信号进行分析:逐步(step-by-step)的机器学习和端到端(end-to-end)的深度学习. 逐步机器学习主要涉及信号预处理、人工特征提取和分类3个步骤. Boon等[4-5]对ECG片段的心律变异性(heart rate variability,HRV)特征进行分析,分别得到79.3%和90.0%的PAF预测准确率. Lake等[6]使用改进的样本熵度量法,可以在12个心拍上进行AF检测. Demazumder等[7]使用熵估计法,对AF和室性心律失常进行区分,取得了比植入式心脏复律除颤器节律识别算法更好的分类性能. Panusittikorn等[8]结合HRV不同频带的小波信息、香农熵和幅度变化值对PAF样本组和正常组分类,得到的灵敏度为71%. Pourbabaee等[9]基于P波、QRS波与T波相关的3组特征进行PAF检测和预测,得到的准确率分别为90%、70%. 兰天杰等[10]基于RR间期(ECG中2个R波之间的时间间隔)的递归分析进行AF复发预测,得到的准确率为95%.

上述逐步机器学习方法表明,HRV分析、熵度量、小波变换特征,时域和频域等特征在PAF检测或预测中有重要作用,其中HRV的分析应用最为广泛. 基于HRV分析的PAF预测,须使用长时间ECG片段进行分析并需要较高的采样频率(通常为10~30 min,128 Hz采样频率),不利于PAF的实时预测[5]. 此外,与PAF相关的模式复杂,人工提取的特征难以覆盖到所有隐含特征. ECG信号易受肌电伪影、电力线噪声、基线漂移等干扰,而这些噪声对逐步机器学习方法影响较大,影响模型的鲁棒性. 鉴于此,一些端到端的深度学习方法被用来解决上述问题.

Parvaneh等[11]使用稠密连接的卷积神经网络(convolutional neural network,CNN)对3类心律进行分类,其中对AF分类的F1=0.83. Erdenebayar等[12]基于5层卷积的CNN网络,使用PAF预测挑战数据库[13]、MIT-BIH正常窦性心律数据库[14]和MIT-BIH房颤数据库[15]3种120 Hz采样频率的混合数据库,得到的AF预测准确率为98%. Faust等[16]使用长短-期记忆网络(long short-term memory,LSTM)对PAF的预测准确率为98%. Kamaleswaran等[17-18]使用深层CNN对ECG信号进行分类,获得比浅层网络更优的分类性能. Schwab等[19]使用带有注意力机制的循环神经网络(recurrent neural network,RNN)对4类心拍进行分类,对AF分类的F1=0.79. Shashikumar等[20-21]使用CNN与RNN的混合网络进行ECG信号的分类,获得比单个CNN或RNN网络更优的分类结果.

总的来说,采用深度学习的方法可以减少人工特征提取工作,且模型对噪声干扰具有更强的鲁棒性. 但是,在ICU等实时性、数据密集型应用场景中,上述方法的应用存在实时处理和海量数据有效存储方面的技术挑战. Mahajan等[22]研究在连续ECG数据流上不同的采样频率对分类性能的影响. 采用概率符号化模式识别方法(probabilistic symbolic pattern recognition,PSPR)[23]对PAF进行筛查,实验结果表明PSPR方法在8 Hz采样频率下,也具有较强的模式提取能力,采样频率的降低没有对分类性能造成影响. Sutton等[24]使用PSPR方法提取待检测样本模式转移概率矩阵,并计算该矩阵与由PAF发作期数据组成的概率矩阵之间的距离作为特征,结合其他人工提取特征,使用随机森林进行分类.

为了满足数据密集型应用场景中实时PAF预测的需要,本研究使用PSPR方法在低采样频率的ECG信号上提取模式转移特征,提出2维CNN与LSTM的混合模型CNN-LSTM,在模式转移特征上自动提取ECG数据在时域与空间维度的特征,进行PAF预测;构建基于CNN-LSTM的集成分类器进一步提高模型的泛化能力. 基于Spark Streaming技术对ECG流式数据进行接收与实时计算. 文中数据集、代码以及模型地址共享在https://github.com/duocolours/PAF-prediction.

1. 概率符号化模式识别

概率符号化模式识别PSPR是用于发现序列数据潜在特征的方法[23]. PSPR可以视作扩展的马尔科夫模型,可以使用有限的状态和状态之间的模式转移概率来建立模型. PSPR的基本思想是序列中每个采样点的状态只与其之前的有限个状态有关. 若每个采样点的状态只由其之前的p个采样点决定,即只考察单位长度为p的模式匹配情况,则可以称为p元模式匹配长度. p元模式向其后的另一个模式转变,即p元模式后再跟一个采样点,可以视作模式转移. 通过分析不同模式匹配长度下的模式变化规律,即模式转移行为,可以对序列数据的模式及模式之间的隐含关系进行建模.

在使用PSPR方法提取序列数据模式转移特征时,首先须对序列数据进行离散化,然后用自定义的符号集按照一定规则对序列进行符号化表示,最后在符号化的序列上计算不同模式匹配长度下的模式转移概率矩阵(pattern transition probabilistic matrixes,PTPM).

例如,对由符号集{abc}表示的长度为11的序列数据S={abccbacbacc},其模式匹配长度为2的模式转移为:ab转移到cbc转移到ccc转移到b,以此类推. 如表1所示为序列S中,符号匹配长度为2的模式转移频次PTF2和模式转移概率PTP2. 当观察到S中有模式ab时,下一个状态只有c;当观察到模式ac时,下一个状态既可能是b也可能是c.

表 1   模式匹配长度为2时,序列S的模式转移频次和转移概率

Tab.1  Pattern transition frequencies and probabilities with pattern matching length of sequence of 2

模式 PTF2 PTP2
a b c 总计 a b c
aa 0.0 0.0 0.0 0.0 0.0 0.0 0.0
ab 0.0 0.0 1.0 1.0 0.0 0.0 1.0
ac 0.0 1.0 1.0 2.0 0.0 0.5 0.5
ba 0.0 0.0 2.0 2.0 0.0 0.0 1.0
bb 0.0 0.0 0.0 0.0 0.0 0.0 0.0
bc 0.0 0.0 1.0 1.0 0.0 0.0 1.0
ca 0.0 0.0 0.0 0.0 0.0 0.0 0.0
cb 2.0 0.0 0.0 2.0 1.0 0.0 0.0
cc 0.0 1.0 0.0 1.0 0.0 1.0 0.0

新窗口打开| 下载CSV


2. PAF实时预测方法

区别于其他研究工作须对ECG信号去噪声和确定R峰位置的预处理,PAF预测方法无须对ECG数据进行预处理. 使用PSPR方法对原始ECG数据降采样并将其表示为由符号集{abcde}所表示的符号序列,在符号化的序列上计算模式转移特征,生成PTPM;将具有不同形状的PTPM输入对应的CNN-LSTM基分类器进行训练;将所有基分类器集成,得到最终预测结果. ECG信号如图1所示. 图中,n为采样点个数,A为ECG信号幅值,As为ECG信号幅值经符号化表示后的幅值. 所提方法的基本框架如图2所示.

图 1

图 1   原始的和经符号化处理后的1 min ECG信号片段

Fig.1   One minute segment of raw and symbolized ECG signal


图 2

图 2   PAF预测模型的总体框架

Fig.2   Overall framework of PAF prediction model


2.1. 基于PSPR方法的ECG模式转移特征提取

采用PSPR方法将由实数表示的ECG连续信号离散化,并将其表示成由符号集{abcde}表示的符号序列. 在符号化的序列上提取不同模式匹配长度下决定的模式转移特征(即计算不同模式匹配长度下的PTPM).

2.1.1. ECG连续数据的离散、符号化表示

使用8 Hz采样频率对初始ECG信号降采样,并进行符号化表示. 设得到的ECG序列为 $X =\{ {x_1},{x_2},\cdots,{x_n}\}$,令Max为X中的最大值,Min为X中的最小值,D=Max−Min. 对X中的任意元素 ${x_i}$,计算 ${x_i}$与Min之间的差值:

${D_i} ={x_i} - {\rm{Min}}\;.$

${x_i}$通过函数fxi)转换成对应的符号描述:

$f({x_i}) =\left\{ \begin{array}{l} a,\;\;{D_i} \leqslant 0.2 D; \\ b,\;\;0.2 D < {D_i} \leqslant 0.4 D; \\ c,\;\;0.4 D < {D_i} \leqslant 0.6 D; \\ d,\;\;0.6 D < {D_i} \leqslant 0.8 D; \\ e,\;\;{D_i}> 0.8 D\;. \\ \end{array} \right.$

将采集到的第1 min ECG数据序列的480个采样点内的最大值赋值给Max,最小值赋值给Min. 从大数定律的角度来讲是可行的. 此外,从式(2)中可以看出,即使后续采集到的数据中有部分数据大于Max或小于Min,也能够被正确符号化.

2.1.2. 模式匹配长度的确定

Sn元符号集表示的长度为l的序列,模式匹配长度为p,则p的范围为[1,l−1]. 使用PSPR方法,会生成 ${n^p} \times n$大小的PTPM. PTPM的大小会随着模式匹配长度的增加而呈指数级增长. 增加模式匹配长度可以提取到更丰富的模式信息,但当匹配长度过长时,不仅会增加计算量,还会造成数据稀疏. 设置合理的p可以有效平衡计算量和信息量. 因此采用稠密指数(density index,DI)[25]确定模式匹配的长度. 稠密指数的定义如下:

${\rm{D}}{{\rm{I}}_p} ={A_p}/{T_P}\;.$

式中:ApTp分别为当模式匹配长度为p时,序列中实际出现的模式个数和所有可能的模式个数. 分别从训练集中的正例和负例记录中各随机抽取5条,得到共10条30 min ECG记录. 计算每条记录中符号匹配长度从1到10时的DIp,取平均值作为稠密指数估计,结果如表2所示. 表中,n为实际模式个数,t为总模式个数. 如表2所示,当 $p > 4$时,模式转移概率矩阵的稠密指数小于0.1. 此时,模式转移概率矩阵所含信息量与计算量已经失去平衡. 因此,本研究设置模式匹配长度的范围为 $[1,4]$,分别生成4个大小不同的PTPM作为CNN-LSTM的输入.

表 2   不同模式匹配长度对应的稠密指数

Tab.2  Density index values corresponding to different symbol matching lengths

p n t DIp
1 4.90 5 0.980 0
2 18.90 25 0.750 0
3 51.30 125 0.410 0
4 98.69 625 0.160 0
5 171.25 3 125 0.050 0
6 270.31 15 625 0.020 0
7 398.43 78 125 0.010 0
8 546.88 390 625 0.001 0
9 585.94 1 953 125 0.000 3
10 828.13 9 765 625 <0.000 1

新窗口打开| 下载CSV


2.2. 基于CNN-LSTM的集成预测模型

CNN善于提取数据的空间局部相关特征,但难以捕捉到序列数据中的长期依赖关系. LSTM可以弥补这一缺陷. 因此本研究提出CNN和LSTM串行的混合网络模型CNN-LSTM.

目前把CNN与LSTM结合起来的研究大多将CNN和LSTM分开训练或者是将CNN中全连接层的输出作为LSTM的输入. 本研究所提出的CNN-LSTM混合网络模型的结构如图3所示. 与其他研究的不同之处在于:1)区别于使用一维卷积(Conv1D)对ECG序列数据进行特征提取,将PSPR方法生成的2维PTPM送入CNN,用Conv2D提取2维图像上的特征;2)将由卷积核提取到的特征图通过平铺层(flatten)展开成一维序列,送入LSTM,直接由LSTM进一步提取序列的前后依赖关系,不再输入CNN的全连接层.

图 3

图 3   CNN-LSTM混合网络模型结构

Fig.3   Model structure of CNN-LSTM hybrid network


2.2.1. CNN-LSTM基学习器

使用PSPR方法按照模式匹配长度从1到4产生4个不同形状的PTPM. 将这4个不同大小的PTPM依次作为不同基分类器的输入. 采用五折交叉验证的方法对基分类器进行训练,均使用交叉熵损失函数(binary cross-entropy loss function),选择Adam作为优化器. 由于每个基分类器的输入数据形状和数据集大小各不相同,4个CNN-LSTM基学习器的网络模型结构及每层参数设置均不同.

基学习器1的输入为大小为 $5 \times 5$的PTPM;前3层由卷积核大小为 $1 \times 5$,步长为 $1 \times 1$,数量分别为512、256、128的卷积层组成,后接SeLU激活函数;第4层连接大小为 $1 \times 5$,步长为 $1 \times 1$的Max-pooling过滤器;第5、6层分别为Flatten层和LSTM层;LSTM层后面连接一个丢弃率为0.2的Dropout层;最后一层为Softmax层.

基学习器2的输入为大小为2 $5 \times 5$的PTPM. 前3层由卷积核大小为 $1 \times 5$,步长为 $1 \times 1$,数量为64的卷积层组成,后接SeLU激活函数;第4层连接大小为 $1 \times 5$,步长为 $1 \times 1$的Max-pooling过滤器;此后的网络结构设置同基学习器1.

基学习器3的输入为大小为12 $5 \times 5$的PTPM. 第1层由卷积核大小为 $1 \times 5$,步长为 $1 \times 1$,数量为64的卷积层组成,后接SeLU激活函数;第2层连接大小为 $1 \times 5$,步长为 $1 \times 1$的Max-pooling过滤器;此后的网络结构设置同基学习器1.

基学习器4的输入为大小为62 $5 \times 5$的PTPM. 第1层由卷积核大小为 $1 \times 5$,步长为 $1 \times 1$,数量为64的卷积层组成,后接SeLU激活函数;第2层连接大小为 $1 \times 5$,步长为 $1 \times 1$的Max-pooling过滤器;第3、4层重复前2层的设置;此后的网络结构设置同基学习器1.

CNN卷积核的大小和数量对于网络的训练速度和特征提取的能力有重要影响. 本研究在输入矩阵规模在4个基学习器中居中的基学习器3上进行对比实验,分别令卷积核大小从4×5变化到1×5. 实验结果表明,基学习器3在1×5大小的卷积核上取得最高的测试准确率89.04%. 因此基学习器模型的卷积核大小均设置为1×5.

2.2.2. 基于CNN-LSTM的集成预测模型

为了进一步提高预测模型的泛化能力,采用集成学习的思想,用加权投票的方法将4个基学习器的预测结果进行融合得到最终预测结果. 集成模型网络的总体结构如图4所示. 基学习器1到基学习器4的输出均为2维张量,分别设为ABCD. 将他们拼接为新的张量X=[x1x2x3x4x5x6x7x8]. 设集成预测模型的全连接层参数矩阵表达式为

图 4

图 4   基于CNN-LSTM集成预测模型总体结构

Fig.4   Overall structure of ensemble prediction model based on CNN-LSTM


${{H}} =\left[ \begin{array}{l} {\alpha _1}\;\;{\alpha _{\rm{2}}}\;\;{\alpha _{\rm{3}}}\;\;{\alpha _{\rm{4}}}\;\;{\alpha _{\rm{5}}}\;\;{\alpha _{\rm{6}}}\;\;{\alpha _{\rm{7}}}\;\;{\alpha _{\rm{8}}}\; \\ {\beta _{\rm{1}}}\;\;{\beta _{\rm{2}}}\;\;\;{\beta _{\rm{3}}}\;\;{\beta _{\rm{4}}}\;\;\;{\beta _{\rm{5}}}\;\;{\beta _{\rm{6}}}\;\;\;{\beta _{\rm{7}}}\;\;{\beta _{\rm{8}}}\; \\ \end{array} \right]\;.$

该层输出为Y=[y1y2], ${{Y}} ={{X}}{{{H}}^{\rm T}}$.Y作为激活层的输入,从而获得最终预测结果. 激活层采用Softmax激活函数,通过使用该激活函数,模型分别输出PAF发作与不发作的概率.

2.3. 基于Spark Streaming的实时预测模型

调用Spark提供的Python API TensorFlow,与Spark Streaming相结合,实现实时预测. 实时模型采用Spark Streaming的本地模式,以多线程的方式运行. 模型能够接收外部数据源通过TCP Socket套接字方式发送来的实时数据,并转换成模型需要的数据形式以用于预测分析,数据流处理流程如图5所示,包括Model Predict和Spark Streaming这2个线程.

图 5

图 5   数据流处理示意图

Fig.5   Schematic diagram of data flow processing


2.3.1. Spark Streaming线程

在设置好接收数据的IP地址和端口号后,Spark Streaming线程开始通过Spark中的socket Text Stream函数接收数据并创建相应的数据流DStream. 与普通弹性分布式数据集(resilient distributed dataset,RDD)相比,DStream的操作方式较少,读取较困难. 因此将DStream通过saveAsTextFile函数转化成非流式数据,并在指定文件夹下以当前时间戳为名称创建文件,将DStream中包含的RDD顺序写入对应的文本文件中.

2.3.2. Model Predict线程

基于采集到的1 min ECG数据确定符号映射关系,因此Model Predict线程在启动后,等待Spark Streaming线程记录下长度为1 min的数据. 经过实验分析发现,实时模型对数据集进行处理的时间较短,但模型加载时间较长,所以在该线程启动后,将模型载入,可以缩短延迟. TCP Socket套接字的通信方式,在最初几秒接收到的数据可能会因数据传输延迟导致Spark Streaming线程创建的数据文件为空,因此先删除前5 s接收到的数据,保证正确地读取数据. 此外,在通信中还可能出现数据丢失的情况,因此Model Predict线程须检测读取的文件夹下文件数量是否正确,若错误则不再读取该文件夹下的数据. 为了避免Spark Streaming线程持续创建文件夹占用空间,Model Predict线程在读取过文件夹内容之后会将其删除.

如2.1.1节所述,根据接收到的第1 min的ECG信号降采样后得到的480个数据点,确定ECG序列振幅值的最大值、最小值和两者的差值,并根据这些数值对序列进行符号化. 当接收到的数据个数不足480时,则等待Spark Streaming线程进一步记录数据,直到接收数据的个数大于或等于480时,再依次赋值给振幅最大值、最小值.

3. 实验及结果分析

3.1. 数据集

使用2001年阵发性房颤预测挑战赛公开数据集[13]. 包括来自健康对照组的50条30 min ECG记录(以NN表示)和来自25名PAF患者的ECG记录集,每个记录集由2条长度为30 min的记录和2条长度为5 min的记录组成. 第1条记录为PAF发作之前的30 min记录(PAFO)和紧随其后的5 min PAF发作记录(PAFE). 第2条为距离任何房颤发生都至少45 min的记录(PAFN). 上述记录的初始采样频率均为128 Hz,分辨率为12. 如图6所示为不同类型记录之间的关系. 使用50 条NN记录和25条PAFN记录,没有使用PAFO和PAFE记录. 所有的75条记录降采样至8 Hz并被切分成长度为1 min的片段,得到1 500个正常样本和750个PAF阳性样本.

图 6

图 6   数据集中各数据类型之间的关系[24]

Fig.6   Relationship between data types in dataset adopted[24]


3.2. 实验评价指标

用准确率(accuracy,ACC)、灵敏度(sensitivity,SEN)和特异度(specificity,SPE)指标来评价模型性能. 各指标的计算如下:

${\rm{ACC =(TP + TN)/(TP + TN + FN + FP)}}\;,$

${\rm{SEN =TP/(FN + TP)}}\;,$

${\rm{SPE =TN/(TN + FP)}}\;.$

式中:TP为正确分类的正例样本数,TN为正确分类的负例样本数,FN为正例样本被分类器错误地分为负例样本的数量,FP为负例样本被分类器错误地分为正例样本的数量.

3.3. 实验结果

3.3.1. 模型与基线模型的对比

分别从NN和PAFN中各随机取80%的样本作为训练集,共有1 800个样本,包括NN样本1 200个,PAFN样本600个;剩余的20%样本作为测试集,共有450个样本,其中NN样本300个,PAFN样本150个. 所有模型均采用五折交叉验证方式训练.

为了验证所提方法在8 Hz低采样频率上的有效性,将所提模型与3个基线模型:一维CNN(1D-CNN)、LSTM、一维CNN与LSTM的混合网络1D CNN-LSTM进行对比,实验结果如表3所示. 所有模型的输入都是8 Hz采样并用符号表示的1维ECG数据序列. 1D CNN-LSTM模型采用Oh等[25]设计的网络结构,该模型被用来进行心拍分类,取得了较好的分类效果,表明该网络层次结构对基于一维ECG数据的分类任务具有较好的适用性. 网络结构中每层参数的具体设置须根据数据长度以及数据规模训练得到.

表 3   所提方法与基线模型的实验性能对比

Tab.3  Comparison between prediction results of proposed method and baseline models

模型 ACC/% SEN/% SPE/%
1D-CNN 53 68 53
LSTM 66 0 100
1D-CNN-LSTM 61 72 56
本研究方法 91 82 96

新窗口打开| 下载CSV


基线模型1D CNN-LSTM的输入为长度为480的一维序列. 第2层为卷积核大小为60,步长为1,数量为3的卷积层,后接ReLU激活函数;第2层连接大小为2,步长为2的Max-pooling过滤器;第3~6层重复前2层的设置,但第3层和第5层卷积核的大小分别为30、15,数量分别为64、6;第7层连接LSTM层;第8、9层为分别包含60、30个隐含结点数的Dense层,使用ReLU激活函数;最后一层为Softmax层.

表3可知,在8 Hz的采样频率下,LSTM分类性能最差,无法识别出正例样本. 可能是因为在低采样频率下,ECG序列中所含的时序信息较少,不足以支持LSTM学习到有用信息. 1D-CNN的分类结果比LSTM更好,虽然在低采样频率下可能会丢失部分局部特征,但其受频率的影响小于LSTM. 1D CNN-LSTM结合CNN提取空间特征能力强和LSTM善于提取序列数据中的时序依赖关系的优点,获得更好的预测结果. 所提方法实验结果优于上述基线模型,表明PSPR方法可以在低采样频率下获得高信息量,使得2D CNN-LSTM可以在基于其提取到的模式转移特征上进一步学习到有用的时空特征.

3.3.2. 模型与相关工作的对比

将所提方法与使用相同数据集的相关工作进行对比. 采用3.3.1节中训练集和测试集划分方法,此数据划分方法虽然确保了训练集和测试集中样本互不重合,但不同的样本却可能来自同一个受试者. 与之对比的相关文献也采用同样的划分方法,实验结果如表4所示. 表中,t为信号长度,f为采样频率,GAⅢ为genetic algorithm Ⅲ算法.

表 4   模型与相关工作在训练集和测试集随机划分模式下的比较

Tab.4  Comparison between proposed model and related studies under random partition mode of training and testing sets

文献 特征提取方法 t/min f/Hz ACC/% SEN/% SPE/%
Boon等[4] HRV特征,GA 15 128 79.3 77.4 81.1
10 128 68.8 58.5 81.1
Narin等[5] HRV线性和非线性特征组合,GA 5 128 90.0 92.0 88.0
Sutton等[24] PSPR,模板匹配 1 8 82.1 100.0 73.6
Boon等[26] HRV特征,GAⅢ 5 128 87.7 86.8 88.7
Costin等[27] HRV特征, QRS复合波形态变异性 30 128 89.4 89.3 89.4
本研究方法 PSPR+CNN-LSTM+集成学习 1 8 91.3 82.2 95.8

新窗口打开| 下载CSV


可以看出,其他相关工作中的方法须在长时间间隔和高采样频率的ECG信号上进行分析. 一般来讲,可以用来分析的信号时间长度越长,获得的分类性能越好. 如Boon等[4]表明,信号长度减少5 min,即使采用相同的特征和分类方法,得到准确率和灵敏度分别下降11%、19%. 本研究所提方法在时间长度为1 min,采样频率为8 Hz的情况下,获得了最高的分类准确率和特异度. 此外,上述文献中的方法都须对ECG信号进行预处理,且为了在更短时间间隔的上进行分析(如5 min),采用遗传算法等优化算法来进行特征选择和模型参数优化,增加了模型训练时间的复杂度. 本研究所提方法中的PAF预测的灵敏度低于Sutton等[24]的方法. Sutton等[24]通过PSPR计算ECG序列模式转移概率矩阵,然后与以PAF发作期ECG片段组成的参考数据库做模式匹配,将得到的模式匹配相似度与其他人工提取的ECG特征,一起送入随机森林进行分类. 该方法以数据集中所有PAF患者的PAF发作期数据建立参考数据库,通过计算待预测序列的PTPM与参考数据库之间的距离,得到待预测序列与PAF发作期的相似性度量. 由于参照数据库中包括所有患者的PAF发作期数据,可能使模型提前学习到患者的特异性,具有一定的数据相关性.

上述训练集和测试集随机划分的方法,使得测试集中的样本可能与训练集中的样本来自相同的患者,在一定程度上不能完全反映模型对未见过的受试者的预测能力. 为此,本研究重新对数据集进行划分,保证训练集和测试集中的数据来自不同的患者(跨患者模式). 以n打头的数据表示来自正常对照组的记录,以p打头的记录表示来自患有PAF的受试者的记录. 进行五折交叉验证,实验设置如表5所示. 表中同时还列出同样采用跨患者模式的相关研究. 可以看出,在跨患者模式下,本研究所提方法取得的ACC、SEN、SPE分别比非完全跨患者的模式下取得的分类结果低10%、6%、13%. 说明不同患者所表现出的ECG信号特征不尽相同,在PAF发作预测任务中,预测结果不仅受到与PAF疾病相关特征的影响,同时还受到受试者个体差异性的影响. 因此,提高模型在不同患者间的泛化能力,是须进一步重点关注的问题.

表 5   模型在跨患者模式下的实验结果

Tab.5  Experimental results of models under inter-patient paradigm

文献 训练集 测试集 ACC/% SEN/% SPE/%
Thong等[28] 76.0 68.0 86.0
Zong等[29] 80.0
本研究方法 P06~P25,n11~n50 P01~p05,n01~n10 86.9 82.4 90.0
P01~P05,P11~P25,n01~n10,n21~n50 P06~P10,n11~n20 70.6 60.0 73.1
P01~p10,p16~p25,n01~n20,n31~n50 P11~p15,n31~n30 77.9 76.9 78.2
P01~p15,P21~p25,n01~n30,n41~n50 P16~p20,n31~n40 89.9 89.7 89.9
P01~p20,n01~n40 P21~p25,n41~n50 78.5 67.2 83.1
平均值 80.6 75.7 82.7

新窗口打开| 下载CSV


3.3.3. 模型运行时间评估

所提出的实时模型采用Spark Streaming的本地模式,编译器使用PyCharm,Python版本为3.5.0,Spark版本为2.4.4,TensorFlow版本为1.13.0-GPU. 通过预设好的端口,可以查看模型的实时情况. Spark Streaming接收数据和将数据写入文件的平均时延均为352 ms. Model Predict线程的执行时间为1~2 s,即总时延约为2 s. 在实时模型的可接受范围内.

3.4. 实验结果分析

由2.1.2节介绍的稠密指数DI,设置最大模式匹配长度为4. 实验结果表明,当基学习器训练轮数相同时,随着PTPM稠密指数的减小,基学习器的学习效果会变差,因此须同时结合PTPM的尺寸与稠密指数来决定基学习器的网络结构. 稠密指数大的模式转移概率矩阵应该对应规模更大的网络结构. 每个基学习器在非完全跨患者模式下,得到的预测准确率如表6所示. 基学习器4的PTPM稠密指数较小,因此准确率不高. 基学习器1的PTPM稠密指数最大,但是尺寸较小,包含的有用信息较少. 因此基学习器1、4的测试集准确率都低于基学习器2、3.

表 6   基学习器的实验性能对比

Tab.6  Experimental results comparison of base learners

基学习器 p DIp ACC / %
1 1 0.98 84.09
2 2 0.76 89.33
3 3 0.41 89.52
4 4 0.16 75.64

新窗口打开| 下载CSV


为了考察采样频率对所提PAF预测模型的分类性能是否有影响,从128 Hz采样频率开始,每次缩小至上一次采样频率的1/2,直至采样频率降到8 Hz. 在跨患者模式下,采用五折交叉验证的方式进行实验,结果如表7所示. 可以看出,模型在8 Hz采样频率时得到最高的ACC和SEN,分别比在128 Hz采样频率时高出1.5%、6.0%. 进一步说明,模型适用于低采样频率,采样频率的降低并没有对该方法造成分类性能的损失. 在8 Hz采样时,能够将样本点的数量缩小16倍,降低模型计算复杂度和对存储空间的要求,使模型具有时间和空间的双重优势.

表 7   模型在不同采样频率ECG信号上的实验结果

Tab.7  Experimental results of proposed method on ECG signals with different sampling frequencies

f / Hz ACC / % SEN / % SPE / %
128 79.1 69.3 83.7
64 80.2 70.7 84.8
32 78.5 68.6 83.9
16 75.3 69.5 78.1
8 80.6 75.7 82.7

新窗口打开| 下载CSV


4. 结 语

采用PSPR方法可以在8 Hz低采样频率的1 min ECG信号上提取模式转移隐含特征. 所提出的二维CNN-LSTM混合网络可以在模式转移特征上进一步自动提取ECG信号的局部空间特征和时间依赖关系特征. 所提出的PAF预测模型无须对信号进行预处理,具有较强的鲁棒性. 在未来的工作中,可以增强Spark Streaming的并发调度应用,进一步完善实时模型以及Spark分布式平台,来提升模型的吞吐量和计算性能,加强其应对多并发情况的能力.

参考文献

BALL J, CARRINGTON M J, MCMURRAY J J V, et al

Atrial fibrillation: profile and burden of an evolving epidemic in the 21st century

[J]. International Journal of Cardiology, 2013, 167 (5): 1807- 1824

DOI:10.1016/j.ijcard.2012.12.093      [本文引用: 1]

黄从新, 张澍, 黄德嘉, 等

心房颤动: 目前的认识和治疗的建议-2018

[J]. 中国心脏起搏与心电生理杂志, 2018, 32 (4): 6- 59

[本文引用: 1]

HUANG Cong-xin, ZHANG Shu, HUANG De-jia, et al

Atrial fibrillation: current understanding and treatment recommendations - 2018

[J]. Chinese Journal of Cardiac Pacing and Electrophysiology, 2018, 32 (4): 6- 59

[本文引用: 1]

黄忠朝, 陈真诚, 赵于前. 基于支持向量机的阵发性房颤自动终止预测研究[C]// 2007中国生物医学工程联合学术年会论文集(上册). 西安: 中国知网. 2007: 180-184.

[本文引用: 1]

HUANG Zhong-chao, CEHN Zhen-cheng, ZHAO Yu-qian. Research on automatic termination of paroxysmal atrial fibrillation based on support vector machine [C]// Proceedings of the 2007 China Biomedical Engineering Joint Academic Conference: Volume 1. Xi’an: CNKI, 2007: 180-184.

[本文引用: 1]

BOON K H, KHALIL-HANI M, MALARVILI M B, et al

Paroxysmal atrial fibrillation prediction method with shorter HRV sequences

[J]. Computer Methods and Programs in Biomedicine, 2016, 134: 187- 196

DOI:10.1016/j.cmpb.2016.07.016      [本文引用: 3]

NARIN A, ISLER Y, OZER M, et al

Early prediction of paroxysmal atrial fibrillation based on short-term heart rate variability

[J]. Physica A: Statistical Mechanics and Its Applications, 2018, 509: 56- 65

DOI:10.1016/j.physa.2018.06.022      [本文引用: 3]

LAKE D E, MOORMAN J R

Accurate estimation of entropy in very short physiological time series: the problem of atrial fibrillation detection in implanted ventricular devices

[J]. American Journal of Physiology-Heart and Circulatory Physiology, 2010, 300 (1): 319- 325

[本文引用: 1]

DEMAZUMDER D, LAKE D E, CHENG A, et al

Dynamic analysis of cardiac rhythms for discriminating atrial fibrillation from lethal ventricular arrhythmias

[J]. Circulation: Arrhythmia and Electrophysiology, 2013, 6 (3): 555- 561

DOI:10.1161/CIRCEP.113.000034      [本文引用: 1]

PANUSITTIKORN M, UCHAIPICHAT N, TANTIBUNDHIT C et al. Prediction of paroxysmal atrial fibrillation occurrence with wavelet-based markers [C]// ECTI-CON2010: The 2010 ECTI International Confernce on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology. Chiang Mai: IEEE, 2010: 342-345.

[本文引用: 1]

POURBABAEE B, LUCAS C. Automatic detection and prediction of paroxysmal atrial fibrillation based on analyzing ecg signal feature classification methods [C]// 2008 Cairo International Biomedical Engineering Conference. Cairo: IEEE, 2008: 1-4.

[本文引用: 1]

兰天杰, 杨翠微

基于RR间期的阵发性房颤复发预测

[J]. 生物医学工程学杂志, 2019, 36 (4): 1- 10

[本文引用: 1]

LAN Tian-jie, YANG Cui-wei

Prediction of recurrence of paroxysmal atrial fibrillation based on RR interval

[J]. Journal of Biomedical Engineering, 2019, 36 (4): 1- 10

[本文引用: 1]

PARVANEH S, RUBIN J, RAHMAN A, et al

Analyzing single-lead short ECG recordings using dense convolutional neural networks and feature-based post-processing to detect atrial fibrillation

[J]. Physiological Measurement, 2018, 39 (8): 084003

DOI:10.1088/1361-6579/aad5bd      [本文引用: 1]

ERDENEBAYAR U, KIM H, PARK J U, et al

Automatic prediction of atrial fibrillation based on convolutional neural network using a short-term normal electrocardiogram signal

[J]. Journal of Korean Medical Science, 2019, 34 (7): e64

DOI:10.3346/jkms.2019.34.e64      [本文引用: 1]

MOODY G, GOLDBERGER A, MCCLENNEN S, et al. Predicting the onset of paroxysmal atrial fibrillation: the computers in cardiology challenge 2001 [C]// Computers in Cardiology 2001. Rotterdam: IEEE, 2001: 113-116.

[本文引用: 2]

GOLDBERGER A L, AMARAL L A, Glass L, et al

PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals

[J]. Circulation, 2000, 101 (23): 215- 220

[本文引用: 1]

MOODY G B, MARK R G

A new method for detecting atrial fibrillation using R-R intervals

[J]. Computers in Cardiology, 1983, 10: 227- 230

[本文引用: 1]

FAUST O, SHENFIELD A, KAREEM M, et al

Automated detection of atrial fibrillation using long short-term memory network with RR interval signals

[J]. Computers in Biology and Medicine, 2018, 102: 327- 335

DOI:10.1016/j.compbiomed.2018.07.001      [本文引用: 1]

KAMALESWARAN R, MAHAJAN R, AKBILGIC O

A robust deep convolutional neural network for the classification of abnormal cardiac rhythm using single lead electrocardiograms of variable length

[J]. Physiological Measurement, 2018, 39 (3): 035006

DOI:10.1088/1361-6579/aaaa9d      [本文引用: 1]

RAJPURKAR P, HANNUN A Y, HAGHPANAHI M, et al. Cardiologist-level arrhythmia detection with convolutional neural networks [J/OL]. 2017. [2020-03-13]. https://arxiv.org/pdf/1707.01836.pdf.

[本文引用: 1]

SCHWAB P, SCEBBA G C, ZHANG J, et al. Beat by beat: classifying cardiac arrhythmias with recurrent neural networks [C]// Computing in Cardiology. Rennes: IEEE, 2017: 1-4.

[本文引用: 1]

SHASHIKUMAR S P, CLIFFORD G D, SHAH S J, et al. Detection of paroxysmal atrial fibrillation using attention-based bidirectional recurrent neural networks [C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London: ACM, 2018: 715-723.

[本文引用: 1]

张异凡, 黄亦翔, 汪开正, 等

用于心律失常识别的LSTM和CNN并行组合模型

[J]. 哈尔滨工业大学学报, 2019, 51 (10): 76- 82

DOI:10.11918/j.issn.0367-6234.201810178      [本文引用: 1]

ZHANG Yi-fan, HUANG Yi-xiang, WANG Kai-zheng, et al

Arrhythmia classification using parallel combination of LSTM and CNN

[J]. Journal of Harbin Institute of Technology, 2019, 51 (10): 76- 82

DOI:10.11918/j.issn.0367-6234.201810178      [本文引用: 1]

MAHAJAN R, KAMALESWARAN R, AKBILGIC O, et al. Effects of varying sampling frequency on the analysis of continuous ECG data streams [C]// VLDB Workshop on Data Management and Analytics for Medicine and Healthcare. Cham: Springer, 2017: 73-87.

[本文引用: 1]

AKBILGIC O, HOWE J A

Symbolic pattern recognition for sequential data

[J]. Sequential Analysis, 2017, 36 (4): 528- 540

DOI:10.1080/07474946.2017.1394719      [本文引用: 2]

SUTTON J R, MAHAJAN R, AKBILGIC O, et al

PhysOnline: an open source machinelearning pipeline for real-time analysis of streaming physiological waveform

[J]. IEEE Journal of Biomedical and Health Informatics, 2018, 23 (1): 59- 65

[本文引用: 6]

OH S L, NG E Y K, SAN TAN R, et al

Automated diagnosis of arrhythmia using combination of CNN and LSTM techniques with variable length heart beats

[J]. Computers in Biology and Medicine, 2018, 102: 278- 287

DOI:10.1016/j.compbiomed.2018.06.002      [本文引用: 2]

BOON K H, KHALIL-HANI M, MALARVILI M B

Paroxysmal atrial fibrillation prediction based on HRV analysis and non-dominated sorting genetic algorithm III

[J]. Computer Methods and Programs in Biomedicine, 2018, 153: 171- 184

DOI:10.1016/j.cmpb.2017.10.012      [本文引用: 1]

COSTIN H, ROTARIU C, PĂSĂRICĂ A. Atrial fibrillation onset prediction using variability of ECG signals [C]// 2013 8th International Symposium on Advanced Topics in Electrical Engineering. Bucharest: IEEE, 2013: 1-4.

[本文引用: 1]

THONG T, MCNAMES J, ABOY M, et al. Paroxysmal atrial fibrillation prediction using isolated premature atrial events and paroxysmal atrial tachycardia [C]// Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Cancun: IEEE, 2003, 1: 163-166.

[本文引用: 1]

ZONG W, MUKKAMALA R, MARK R G. A methodology for predicting paroxysmal atrial fibrillation based on ECG arrhythmia feature analysis [C]// Computers in Cardiology. Rotterdam: IEEE, 2001: 125-128.

[本文引用: 1]

/