基于模式识别和集成CNN-LSTM的阵发性房颤预测模型
Prediction model of paroxysmal atrial fibrillation based on pattern recognition and ensemble CNN-LSTM
通讯作者:
收稿日期: 2019-11-27
Received: 2019-11-27
作者简介 About authors
杨萍(1987—),女,博士生,从事机器学习、大数据和生命健康领域研究.orcid.org/0000-0002-7091-2289.E-mail:
为了适用于长期心电监护和ICU等实时性、数据密集型应用场合,提出可在8 Hz采样频率的1 min心电图(ECG)片段上提前45 min预测阵发性房颤(PAF)发作的实时预测模型. 采用概率符号化模式识别方法,在降采样后的ECG序列上提取出1 min窗口内的模式转移特征,降低模型的计算量和对存储空间的需求,确保实时预测的效果. 提出卷积神经网络(CNN)和长短-期记忆网络(LSTM)的混合模型(CNN-LSTM),用于提取模式转移特征内隐含的局部空间特征和时间依赖特征. 为了提升模型泛化能力,构建基于CNN-LSTM的集成分类器. 采用Spark Streaming技术完成对ECG流式数据的读、写和计算,实现数据和模型之间的低延迟通信. 所提模型在公开数据集上的准确率、灵敏度和特异度分别为91.26%、82.21%、95.79%. 模型处理总延迟平均为2 s,满足实时PAF预测需求.
关键词:
The real-time prediction model that can predict the onset of paroxysmal atrial fibrillation (PAF) 45 min in advance on the one minute electrocardiogram (ECG) segment with 8 Hz sampling frequency was proposed, for real-time and data-intensive application scenarios such as long-term ECG monitoring and intensive care units (ICU). The probabilistic symbolic pattern recognition method was used to extract the pattern transition features within one minute window of down sampled ECG sequence, reducing the calculation complexity of the model and the demand for storage space, so as to ensure the effect of real-time prediction. A hybrid model (CNN-LSTM) of the convolutional neural network (CNN) and the long short-term memory (LSTM) was proposed to extract local spatial features and time-dependent features implied in pattern transition features. An ensemble classifier based on CNN-LSTM was constructed to improve the generalization ability of the model. Spark Streaming technology was used to read, write and calculate ECG streaming data, and low latency communication between data and model was realized. The accuracy, sensitivity, and specificity of the proposed model were 91.26%, 82.21%, and 95.79% respectively. The average delay of model processing was 2 s, which can meet the real-time PAF prediction demand.
Keywords:
本文引用格式
杨萍, 王丹, 康子健, 李童, 付利华, 余悦任.
YANG Ping, WANG Dan, KAGN Zi-jian, LI Tong, FU Li-hua, YU Yue-ren.
目前,基于ECG的PAF研究任务主要包括两类,一类是PAF筛查,即从所有受试者中,识别出患有PAF的个体. 另一类是PAF预测,即根据受试者当前的ECG数据,确定在接下来的时间段是否会发生PAF,防患于未然. 还有研究是预测一次PAF发作是否可以自发终止,以及何时终止[3]. 本研究的主要内容是基于受试者当前的短时间片段ECG数据(1 min),预测受试者在接下来的45 min内是否会发生房颤.
通常有2种机器学习的策略对ECG信号进行分析:逐步(step-by-step)的机器学习和端到端(end-to-end)的深度学习. 逐步机器学习主要涉及信号预处理、人工特征提取和分类3个步骤. Boon等[4-5]对ECG片段的心律变异性(heart rate variability,HRV)特征进行分析,分别得到79.3%和90.0%的PAF预测准确率. Lake等[6]使用改进的样本熵度量法,可以在12个心拍上进行AF检测. Demazumder等[7]使用熵估计法,对AF和室性心律失常进行区分,取得了比植入式心脏复律除颤器节律识别算法更好的分类性能. Panusittikorn等[8]结合HRV不同频带的小波信息、香农熵和幅度变化值对PAF样本组和正常组分类,得到的灵敏度为71%. Pourbabaee等[9]基于P波、QRS波与T波相关的3组特征进行PAF检测和预测,得到的准确率分别为90%、70%. 兰天杰等[10]基于RR间期(ECG中2个R波之间的时间间隔)的递归分析进行AF复发预测,得到的准确率为95%.
上述逐步机器学习方法表明,HRV分析、熵度量、小波变换特征,时域和频域等特征在PAF检测或预测中有重要作用,其中HRV的分析应用最为广泛. 基于HRV分析的PAF预测,须使用长时间ECG片段进行分析并需要较高的采样频率(通常为10~30 min,128 Hz采样频率),不利于PAF的实时预测[5]. 此外,与PAF相关的模式复杂,人工提取的特征难以覆盖到所有隐含特征. ECG信号易受肌电伪影、电力线噪声、基线漂移等干扰,而这些噪声对逐步机器学习方法影响较大,影响模型的鲁棒性. 鉴于此,一些端到端的深度学习方法被用来解决上述问题.
Parvaneh等[11]使用稠密连接的卷积神经网络(convolutional neural network,CNN)对3类心律进行分类,其中对AF分类的F1=0.83. Erdenebayar等[12]基于5层卷积的CNN网络,使用PAF预测挑战数据库[13]、MIT-BIH正常窦性心律数据库[14]和MIT-BIH房颤数据库[15]3种120 Hz采样频率的混合数据库,得到的AF预测准确率为98%. Faust等[16]使用长短-期记忆网络(long short-term memory,LSTM)对PAF的预测准确率为98%. Kamaleswaran等[17-18]使用深层CNN对ECG信号进行分类,获得比浅层网络更优的分类性能. Schwab等[19]使用带有注意力机制的循环神经网络(recurrent neural network,RNN)对4类心拍进行分类,对AF分类的F1=0.79. Shashikumar等[20-21]使用CNN与RNN的混合网络进行ECG信号的分类,获得比单个CNN或RNN网络更优的分类结果.
总的来说,采用深度学习的方法可以减少人工特征提取工作,且模型对噪声干扰具有更强的鲁棒性. 但是,在ICU等实时性、数据密集型应用场景中,上述方法的应用存在实时处理和海量数据有效存储方面的技术挑战. Mahajan等[22]研究在连续ECG数据流上不同的采样频率对分类性能的影响. 采用概率符号化模式识别方法(probabilistic symbolic pattern recognition,PSPR)[23]对PAF进行筛查,实验结果表明PSPR方法在8 Hz采样频率下,也具有较强的模式提取能力,采样频率的降低没有对分类性能造成影响. Sutton等[24]使用PSPR方法提取待检测样本模式转移概率矩阵,并计算该矩阵与由PAF发作期数据组成的概率矩阵之间的距离作为特征,结合其他人工提取特征,使用随机森林进行分类.
为了满足数据密集型应用场景中实时PAF预测的需要,本研究使用PSPR方法在低采样频率的ECG信号上提取模式转移特征,提出2维CNN与LSTM的混合模型CNN-LSTM,在模式转移特征上自动提取ECG数据在时域与空间维度的特征,进行PAF预测;构建基于CNN-LSTM的集成分类器进一步提高模型的泛化能力. 基于Spark Streaming技术对ECG流式数据进行接收与实时计算. 文中数据集、代码以及模型地址共享在https://github.com/duocolours/PAF-prediction.
1. 概率符号化模式识别
概率符号化模式识别PSPR是用于发现序列数据潜在特征的方法[23]. PSPR可以视作扩展的马尔科夫模型,可以使用有限的状态和状态之间的模式转移概率来建立模型. PSPR的基本思想是序列中每个采样点的状态只与其之前的有限个状态有关. 若每个采样点的状态只由其之前的p个采样点决定,即只考察单位长度为p的模式匹配情况,则可以称为p元模式匹配长度. p元模式向其后的另一个模式转变,即p元模式后再跟一个采样点,可以视作模式转移. 通过分析不同模式匹配长度下的模式变化规律,即模式转移行为,可以对序列数据的模式及模式之间的隐含关系进行建模.
在使用PSPR方法提取序列数据模式转移特征时,首先须对序列数据进行离散化,然后用自定义的符号集按照一定规则对序列进行符号化表示,最后在符号化的序列上计算不同模式匹配长度下的模式转移概率矩阵(pattern transition probabilistic matrixes,PTPM).
例如,对由符号集{a,b,c}表示的长度为11的序列数据S={abccbacbacc},其模式匹配长度为2的模式转移为:ab转移到c,bc转移到c,cc转移到b,以此类推. 如表1所示为序列S中,符号匹配长度为2的模式转移频次PTF2和模式转移概率PTP2. 当观察到S中有模式ab时,下一个状态只有c;当观察到模式ac时,下一个状态既可能是b也可能是c.
表 1 模式匹配长度为2时,序列S的模式转移频次和转移概率
Tab.1
模式 | PTF2 | PTP2 | ||||||
a | b | c | 总计 | a | b | c | ||
aa | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
ab | 0.0 | 0.0 | 1.0 | 1.0 | 0.0 | 0.0 | 1.0 | |
ac | 0.0 | 1.0 | 1.0 | 2.0 | 0.0 | 0.5 | 0.5 | |
ba | 0.0 | 0.0 | 2.0 | 2.0 | 0.0 | 0.0 | 1.0 | |
bb | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
bc | 0.0 | 0.0 | 1.0 | 1.0 | 0.0 | 0.0 | 1.0 | |
ca | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
cb | 2.0 | 0.0 | 0.0 | 2.0 | 1.0 | 0.0 | 0.0 | |
cc | 0.0 | 1.0 | 0.0 | 1.0 | 0.0 | 1.0 | 0.0 |
2. PAF实时预测方法
图 1
图 1 原始的和经符号化处理后的1 min ECG信号片段
Fig.1 One minute segment of raw and symbolized ECG signal
图 2
2.1. 基于PSPR方法的ECG模式转移特征提取
采用PSPR方法将由实数表示的ECG连续信号离散化,并将其表示成由符号集{a,b,c,d,e}表示的符号序列. 在符号化的序列上提取不同模式匹配长度下决定的模式转移特征(即计算不同模式匹配长度下的PTPM).
2.1.1. ECG连续数据的离散、符号化表示
使用8 Hz采样频率对初始ECG信号降采样,并进行符号化表示. 设得到的ECG序列为
将
将采集到的第1 min ECG数据序列的480个采样点内的最大值赋值给Max,最小值赋值给Min. 从大数定律的角度来讲是可行的. 此外,从式(2)中可以看出,即使后续采集到的数据中有部分数据大于Max或小于Min,也能够被正确符号化.
2.1.2. 模式匹配长度的确定
设S为n元符号集表示的长度为l的序列,模式匹配长度为p,则p的范围为[1,l−1]. 使用PSPR方法,会生成
表 2 不同模式匹配长度对应的稠密指数
Tab.2
p | n | t | DIp |
1 | 4.90 | 5 | 0.980 0 |
2 | 18.90 | 25 | 0.750 0 |
3 | 51.30 | 125 | 0.410 0 |
4 | 98.69 | 625 | 0.160 0 |
5 | 171.25 | 3 125 | 0.050 0 |
6 | 270.31 | 15 625 | 0.020 0 |
7 | 398.43 | 78 125 | 0.010 0 |
8 | 546.88 | 390 625 | 0.001 0 |
9 | 585.94 | 1 953 125 | 0.000 3 |
10 | 828.13 | 9 765 625 | <0.000 1 |
2.2. 基于CNN-LSTM的集成预测模型
CNN善于提取数据的空间局部相关特征,但难以捕捉到序列数据中的长期依赖关系. LSTM可以弥补这一缺陷. 因此本研究提出CNN和LSTM串行的混合网络模型CNN-LSTM.
目前把CNN与LSTM结合起来的研究大多将CNN和LSTM分开训练或者是将CNN中全连接层的输出作为LSTM的输入. 本研究所提出的CNN-LSTM混合网络模型的结构如图3所示. 与其他研究的不同之处在于:1)区别于使用一维卷积(Conv1D)对ECG序列数据进行特征提取,将PSPR方法生成的2维PTPM送入CNN,用Conv2D提取2维图像上的特征;2)将由卷积核提取到的特征图通过平铺层(flatten)展开成一维序列,送入LSTM,直接由LSTM进一步提取序列的前后依赖关系,不再输入CNN的全连接层.
图 3
2.2.1. CNN-LSTM基学习器
使用PSPR方法按照模式匹配长度从1到4产生4个不同形状的PTPM. 将这4个不同大小的PTPM依次作为不同基分类器的输入. 采用五折交叉验证的方法对基分类器进行训练,均使用交叉熵损失函数(binary cross-entropy loss function),选择Adam作为优化器. 由于每个基分类器的输入数据形状和数据集大小各不相同,4个CNN-LSTM基学习器的网络模型结构及每层参数设置均不同.
基学习器1的输入为大小为
基学习器2的输入为大小为2
基学习器3的输入为大小为12
基学习器4的输入为大小为62
CNN卷积核的大小和数量对于网络的训练速度和特征提取的能力有重要影响. 本研究在输入矩阵规模在4个基学习器中居中的基学习器3上进行对比实验,分别令卷积核大小从4×5变化到1×5. 实验结果表明,基学习器3在1×5大小的卷积核上取得最高的测试准确率89.04%. 因此基学习器模型的卷积核大小均设置为1×5.
2.2.2. 基于CNN-LSTM的集成预测模型
为了进一步提高预测模型的泛化能力,采用集成学习的思想,用加权投票的方法将4个基学习器的预测结果进行融合得到最终预测结果. 集成模型网络的总体结构如图4所示. 基学习器1到基学习器4的输出均为2维张量,分别设为A、B、C、D. 将他们拼接为新的张量X=[x1,x2,x3,x4,x5,x6,x7,x8]. 设集成预测模型的全连接层参数矩阵表达式为
图 4
图 4 基于CNN-LSTM集成预测模型总体结构
Fig.4 Overall structure of ensemble prediction model based on CNN-LSTM
该层输出为Y=[y1,y2],
2.3. 基于Spark Streaming的实时预测模型
调用Spark提供的Python API TensorFlow,与Spark Streaming相结合,实现实时预测. 实时模型采用Spark Streaming的本地模式,以多线程的方式运行. 模型能够接收外部数据源通过TCP Socket套接字方式发送来的实时数据,并转换成模型需要的数据形式以用于预测分析,数据流处理流程如图5所示,包括Model Predict和Spark Streaming这2个线程.
图 5
2.3.1. Spark Streaming线程
在设置好接收数据的IP地址和端口号后,Spark Streaming线程开始通过Spark中的socket Text Stream函数接收数据并创建相应的数据流DStream. 与普通弹性分布式数据集(resilient distributed dataset,RDD)相比,DStream的操作方式较少,读取较困难. 因此将DStream通过saveAsTextFile函数转化成非流式数据,并在指定文件夹下以当前时间戳为名称创建文件,将DStream中包含的RDD顺序写入对应的文本文件中.
2.3.2. Model Predict线程
基于采集到的1 min ECG数据确定符号映射关系,因此Model Predict线程在启动后,等待Spark Streaming线程记录下长度为1 min的数据. 经过实验分析发现,实时模型对数据集进行处理的时间较短,但模型加载时间较长,所以在该线程启动后,将模型载入,可以缩短延迟. TCP Socket套接字的通信方式,在最初几秒接收到的数据可能会因数据传输延迟导致Spark Streaming线程创建的数据文件为空,因此先删除前5 s接收到的数据,保证正确地读取数据. 此外,在通信中还可能出现数据丢失的情况,因此Model Predict线程须检测读取的文件夹下文件数量是否正确,若错误则不再读取该文件夹下的数据. 为了避免Spark Streaming线程持续创建文件夹占用空间,Model Predict线程在读取过文件夹内容之后会将其删除.
如2.1.1节所述,根据接收到的第1 min的ECG信号降采样后得到的480个数据点,确定ECG序列振幅值的最大值、最小值和两者的差值,并根据这些数值对序列进行符号化. 当接收到的数据个数不足480时,则等待Spark Streaming线程进一步记录数据,直到接收数据的个数大于或等于480时,再依次赋值给振幅最大值、最小值.
3. 实验及结果分析
3.1. 数据集
使用2001年阵发性房颤预测挑战赛公开数据集[13]. 包括来自健康对照组的50条30 min ECG记录(以NN表示)和来自25名PAF患者的ECG记录集,每个记录集由2条长度为30 min的记录和2条长度为5 min的记录组成. 第1条记录为PAF发作之前的30 min记录(PAFO)和紧随其后的5 min PAF发作记录(PAFE). 第2条为距离任何房颤发生都至少45 min的记录(PAFN). 上述记录的初始采样频率均为128 Hz,分辨率为12. 如图6所示为不同类型记录之间的关系. 使用50 条NN记录和25条PAFN记录,没有使用PAFO和PAFE记录. 所有的75条记录降采样至8 Hz并被切分成长度为1 min的片段,得到1 500个正常样本和750个PAF阳性样本.
图 6
3.2. 实验评价指标
用准确率(accuracy,ACC)、灵敏度(sensitivity,SEN)和特异度(specificity,SPE)指标来评价模型性能. 各指标的计算如下:
式中:TP为正确分类的正例样本数,TN为正确分类的负例样本数,FN为正例样本被分类器错误地分为负例样本的数量,FP为负例样本被分类器错误地分为正例样本的数量.
3.3. 实验结果
3.3.1. 模型与基线模型的对比
分别从NN和PAFN中各随机取80%的样本作为训练集,共有1 800个样本,包括NN样本1 200个,PAFN样本600个;剩余的20%样本作为测试集,共有450个样本,其中NN样本300个,PAFN样本150个. 所有模型均采用五折交叉验证方式训练.
表 3 所提方法与基线模型的实验性能对比
Tab.3
模型 | ACC/% | SEN/% | SPE/% |
1D-CNN | 53 | 68 | 53 |
LSTM | 66 | 0 | 100 |
1D-CNN-LSTM | 61 | 72 | 56 |
本研究方法 | 91 | 82 | 96 |
基线模型1D CNN-LSTM的输入为长度为480的一维序列. 第2层为卷积核大小为60,步长为1,数量为3的卷积层,后接ReLU激活函数;第2层连接大小为2,步长为2的Max-pooling过滤器;第3~6层重复前2层的设置,但第3层和第5层卷积核的大小分别为30、15,数量分别为64、6;第7层连接LSTM层;第8、9层为分别包含60、30个隐含结点数的Dense层,使用ReLU激活函数;最后一层为Softmax层.
由表3可知,在8 Hz的采样频率下,LSTM分类性能最差,无法识别出正例样本. 可能是因为在低采样频率下,ECG序列中所含的时序信息较少,不足以支持LSTM学习到有用信息. 1D-CNN的分类结果比LSTM更好,虽然在低采样频率下可能会丢失部分局部特征,但其受频率的影响小于LSTM. 1D CNN-LSTM结合CNN提取空间特征能力强和LSTM善于提取序列数据中的时序依赖关系的优点,获得更好的预测结果. 所提方法实验结果优于上述基线模型,表明PSPR方法可以在低采样频率下获得高信息量,使得2D CNN-LSTM可以在基于其提取到的模式转移特征上进一步学习到有用的时空特征.
3.3.2. 模型与相关工作的对比
将所提方法与使用相同数据集的相关工作进行对比. 采用3.3.1节中训练集和测试集划分方法,此数据划分方法虽然确保了训练集和测试集中样本互不重合,但不同的样本却可能来自同一个受试者. 与之对比的相关文献也采用同样的划分方法,实验结果如表4所示. 表中,t为信号长度,f为采样频率,GAⅢ为genetic algorithm Ⅲ算法.
表 4 模型与相关工作在训练集和测试集随机划分模式下的比较
Tab.4
文献 | 特征提取方法 | t/min | f/Hz | ACC/% | SEN/% | SPE/% |
Boon等[4] | HRV特征,GA | 15 | 128 | 79.3 | 77.4 | 81.1 |
10 | 128 | 68.8 | 58.5 | 81.1 | ||
Narin等[5] | HRV线性和非线性特征组合,GA | 5 | 128 | 90.0 | 92.0 | 88.0 |
Sutton等[24] | PSPR,模板匹配 | 1 | 8 | 82.1 | 100.0 | 73.6 |
Boon等[26] | HRV特征,GAⅢ | 5 | 128 | 87.7 | 86.8 | 88.7 |
Costin等[27] | HRV特征, QRS复合波形态变异性 | 30 | 128 | 89.4 | 89.3 | 89.4 |
本研究方法 | PSPR+CNN-LSTM+集成学习 | 1 | 8 | 91.3 | 82.2 | 95.8 |
可以看出,其他相关工作中的方法须在长时间间隔和高采样频率的ECG信号上进行分析. 一般来讲,可以用来分析的信号时间长度越长,获得的分类性能越好. 如Boon等[4]表明,信号长度减少5 min,即使采用相同的特征和分类方法,得到准确率和灵敏度分别下降11%、19%. 本研究所提方法在时间长度为1 min,采样频率为8 Hz的情况下,获得了最高的分类准确率和特异度. 此外,上述文献中的方法都须对ECG信号进行预处理,且为了在更短时间间隔的上进行分析(如5 min),采用遗传算法等优化算法来进行特征选择和模型参数优化,增加了模型训练时间的复杂度. 本研究所提方法中的PAF预测的灵敏度低于Sutton等[24]的方法. Sutton等[24]通过PSPR计算ECG序列模式转移概率矩阵,然后与以PAF发作期ECG片段组成的参考数据库做模式匹配,将得到的模式匹配相似度与其他人工提取的ECG特征,一起送入随机森林进行分类. 该方法以数据集中所有PAF患者的PAF发作期数据建立参考数据库,通过计算待预测序列的PTPM与参考数据库之间的距离,得到待预测序列与PAF发作期的相似性度量. 由于参照数据库中包括所有患者的PAF发作期数据,可能使模型提前学习到患者的特异性,具有一定的数据相关性.
上述训练集和测试集随机划分的方法,使得测试集中的样本可能与训练集中的样本来自相同的患者,在一定程度上不能完全反映模型对未见过的受试者的预测能力. 为此,本研究重新对数据集进行划分,保证训练集和测试集中的数据来自不同的患者(跨患者模式). 以n打头的数据表示来自正常对照组的记录,以p打头的记录表示来自患有PAF的受试者的记录. 进行五折交叉验证,实验设置如表5所示. 表中同时还列出同样采用跨患者模式的相关研究. 可以看出,在跨患者模式下,本研究所提方法取得的ACC、SEN、SPE分别比非完全跨患者的模式下取得的分类结果低10%、6%、13%. 说明不同患者所表现出的ECG信号特征不尽相同,在PAF发作预测任务中,预测结果不仅受到与PAF疾病相关特征的影响,同时还受到受试者个体差异性的影响. 因此,提高模型在不同患者间的泛化能力,是须进一步重点关注的问题.
表 5 模型在跨患者模式下的实验结果
Tab.5
文献 | 训练集 | 测试集 | ACC/% | SEN/% | SPE/% |
Thong等[28] | − | − | 76.0 | 68.0 | 86.0 |
Zong等[29] | − | − | 80.0 | − | − |
本研究方法 | P06~P25,n11~n50 | P01~p05,n01~n10 | 86.9 | 82.4 | 90.0 |
P01~P05,P11~P25,n01~n10,n21~n50 | P06~P10,n11~n20 | 70.6 | 60.0 | 73.1 | |
P01~p10,p16~p25,n01~n20,n31~n50 | P11~p15,n31~n30 | 77.9 | 76.9 | 78.2 | |
P01~p15,P21~p25,n01~n30,n41~n50 | P16~p20,n31~n40 | 89.9 | 89.7 | 89.9 | |
P01~p20,n01~n40 | P21~p25,n41~n50 | 78.5 | 67.2 | 83.1 | |
平均值 | 80.6 | 75.7 | 82.7 |
3.3.3. 模型运行时间评估
所提出的实时模型采用Spark Streaming的本地模式,编译器使用PyCharm,Python版本为3.5.0,Spark版本为2.4.4,TensorFlow版本为1.13.0-GPU. 通过预设好的端口,可以查看模型的实时情况. Spark Streaming接收数据和将数据写入文件的平均时延均为352 ms. Model Predict线程的执行时间为1~2 s,即总时延约为2 s. 在实时模型的可接受范围内.
3.4. 实验结果分析
由2.1.2节介绍的稠密指数DI,设置最大模式匹配长度为4. 实验结果表明,当基学习器训练轮数相同时,随着PTPM稠密指数的减小,基学习器的学习效果会变差,因此须同时结合PTPM的尺寸与稠密指数来决定基学习器的网络结构. 稠密指数大的模式转移概率矩阵应该对应规模更大的网络结构. 每个基学习器在非完全跨患者模式下,得到的预测准确率如表6所示. 基学习器4的PTPM稠密指数较小,因此准确率不高. 基学习器1的PTPM稠密指数最大,但是尺寸较小,包含的有用信息较少. 因此基学习器1、4的测试集准确率都低于基学习器2、3.
表 6 基学习器的实验性能对比
Tab.6
基学习器 | p | DIp | ACC / % |
1 | 1 | 0.98 | 84.09 |
2 | 2 | 0.76 | 89.33 |
3 | 3 | 0.41 | 89.52 |
4 | 4 | 0.16 | 75.64 |
为了考察采样频率对所提PAF预测模型的分类性能是否有影响,从128 Hz采样频率开始,每次缩小至上一次采样频率的1/2,直至采样频率降到8 Hz. 在跨患者模式下,采用五折交叉验证的方式进行实验,结果如表7所示. 可以看出,模型在8 Hz采样频率时得到最高的ACC和SEN,分别比在128 Hz采样频率时高出1.5%、6.0%. 进一步说明,模型适用于低采样频率,采样频率的降低并没有对该方法造成分类性能的损失. 在8 Hz采样时,能够将样本点的数量缩小16倍,降低模型计算复杂度和对存储空间的要求,使模型具有时间和空间的双重优势.
表 7 模型在不同采样频率ECG信号上的实验结果
Tab.7
f / Hz | ACC / % | SEN / % | SPE / % |
128 | 79.1 | 69.3 | 83.7 |
64 | 80.2 | 70.7 | 84.8 |
32 | 78.5 | 68.6 | 83.9 |
16 | 75.3 | 69.5 | 78.1 |
8 | 80.6 | 75.7 | 82.7 |
4. 结 语
采用PSPR方法可以在8 Hz低采样频率的1 min ECG信号上提取模式转移隐含特征. 所提出的二维CNN-LSTM混合网络可以在模式转移特征上进一步自动提取ECG信号的局部空间特征和时间依赖关系特征. 所提出的PAF预测模型无须对信号进行预处理,具有较强的鲁棒性. 在未来的工作中,可以增强Spark Streaming的并发调度应用,进一步完善实时模型以及Spark分布式平台,来提升模型的吞吐量和计算性能,加强其应对多并发情况的能力.
参考文献
Atrial fibrillation: profile and burden of an evolving epidemic in the 21st century
[J].DOI:10.1016/j.ijcard.2012.12.093 [本文引用: 1]
心房颤动: 目前的认识和治疗的建议-2018
[J].
Atrial fibrillation: current understanding and treatment recommendations - 2018
[J].
Paroxysmal atrial fibrillation prediction method with shorter HRV sequences
[J].DOI:10.1016/j.cmpb.2016.07.016 [本文引用: 3]
Early prediction of paroxysmal atrial fibrillation based on short-term heart rate variability
[J].DOI:10.1016/j.physa.2018.06.022 [本文引用: 3]
Accurate estimation of entropy in very short physiological time series: the problem of atrial fibrillation detection in implanted ventricular devices
[J].
Dynamic analysis of cardiac rhythms for discriminating atrial fibrillation from lethal ventricular arrhythmias
[J].DOI:10.1161/CIRCEP.113.000034 [本文引用: 1]
基于RR间期的阵发性房颤复发预测
[J].
Prediction of recurrence of paroxysmal atrial fibrillation based on RR interval
[J].
Analyzing single-lead short ECG recordings using dense convolutional neural networks and feature-based post-processing to detect atrial fibrillation
[J].DOI:10.1088/1361-6579/aad5bd [本文引用: 1]
Automatic prediction of atrial fibrillation based on convolutional neural network using a short-term normal electrocardiogram signal
[J].DOI:10.3346/jkms.2019.34.e64 [本文引用: 1]
PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals
[J].
A new method for detecting atrial fibrillation using R-R intervals
[J].
Automated detection of atrial fibrillation using long short-term memory network with RR interval signals
[J].DOI:10.1016/j.compbiomed.2018.07.001 [本文引用: 1]
A robust deep convolutional neural network for the classification of abnormal cardiac rhythm using single lead electrocardiograms of variable length
[J].DOI:10.1088/1361-6579/aaaa9d [本文引用: 1]
用于心律失常识别的LSTM和CNN并行组合模型
[J].DOI:10.11918/j.issn.0367-6234.201810178 [本文引用: 1]
Arrhythmia classification using parallel combination of LSTM and CNN
[J].DOI:10.11918/j.issn.0367-6234.201810178 [本文引用: 1]
Symbolic pattern recognition for sequential data
[J].DOI:10.1080/07474946.2017.1394719 [本文引用: 2]
PhysOnline: an open source machinelearning pipeline for real-time analysis of streaming physiological waveform
[J].
Automated diagnosis of arrhythmia using combination of CNN and LSTM techniques with variable length heart beats
[J].DOI:10.1016/j.compbiomed.2018.06.002 [本文引用: 2]
Paroxysmal atrial fibrillation prediction based on HRV analysis and non-dominated sorting genetic algorithm III
[J].DOI:10.1016/j.cmpb.2017.10.012 [本文引用: 1]
/
〈 |
|
〉 |
