基于脑电信号预发作数据段选取的癫痫发作预测
Seizure prediction based on pre-ictal period selection of EEG signal
通讯作者:
收稿日期: 2019-11-25
Received: 2019-11-25
作者简介 About authors
王雅静(1997—),女,硕士生,从事医学信号处理研究.orcid.org/0000-0002-2027-9104.E-mail:
为了提高癫痫发作预测的准确性,提出针对病患个体进行癫痫发作预测的算法,包括特征提取、预发作数据段选取、特征挑选与导联挑选. 算法采用半重叠的2 s窗对每个导联分别提取时频特征和空域特征. 从发作前期选择与发作间期相比具有最大线性可分性的连续10 min数据作为预发作数据段的有效正样本. 算法通过弹性网进行特征挑选,再基于所选特征通过贪婪算法选择有效导联,将有效导联的有效特征输入到分类器中. 将该算法在MIT公共头皮脑电数据库和宣武医院收集的数据集上进行测试,测试结果为:在MIT数据库上的击中率为95.76%,假阳性率为0.1073 h−1;在宣武医院数据集上的击中率为97.80%,假阳性率为0.0453 h−1. 结果表明,该算法具有较高的击中率和较低的假阳性率.
关键词:
A novel algorithm for seizure prediction based on patient specific manner was proposed to improve the accuracy of epileptic prediction, including feature extraction, pre-ictal period selection, feature selection and channel selection. Time-frequency features and spatial features were extracted from each channel by 2 s windows with 1 s overlap. A continuous 10 min data was selected as a valid positive sample of the pre-ictal period from segment before seizure onset, which achieved the maximum linear separability compared with the inter-ictal period. The effective features were selected by elastic net, then the selected effective features were used to select effective channels in greedy manner. The effective features of effective channels were input into classifier. The algorithm was tested on the scalp electroencephalogram (sEEG) from the MIT Physio database and the database collected in Xuanwu Hospital. The algorithm achieved a recall of 95.76% and a false positive rate of 0.1073 h−1 in MIT database, and a recall of 97.80% and a false positive rate of 0.0453 h−1 in Xuanwu Hospital database. Results show that the algorithm has high sensitivity and low false positive rate.
Keywords:
本文引用格式
王雅静, 王群, 李博闻, 刘志文, 朴媛媛, 遇涛.
WANG Ya-jing, WANG Qun, LI Bo-wen, LIU Zhi-wen, PIAO Yuan-yuan, YU Tao.
癫痫是第二大神经系统疾病,表现为由大脑神经活动超同步引起的神经系统紊乱. 全世界约1%的人口患有癫痫[1],影响约5000万人[2]. 现有的治疗方法主要是抗癫痫药物治疗和手术切除病灶. 没有靶向的药物会对神经系统产生较大副作用,其中约30%的患者无法通过药物进行控制. 癫痫发作时的突然抽搐和意识丧失使患者生活在无助和焦虑中,这些症状有可能导致更严重的伤害,如跌倒、溺水、烧伤甚至死亡. 如果能在癫痫发作前向护理人员及时发出警报,可以确保患者的安全,提高患者的生活质量. 脑电图具有较高的时间分辨率,可以反映各个脑区的状态变化,具有实时性好、便捷的特征,是监测神经活动的重要工具,已广泛应用于癫痫相关的医疗研究中.
癫痫发作预测算法一般包括特征提取和分类,所提取的特征涵盖线性、非线性和空间信息. 许多线性特征,如峰度[3]、能量[4]、统计特征[5]和功率谱分析[6–9]等相关研究证实脑电信号在发作前期和发作间期均有变化[10–14]. Aarabi等[3]研究表明,患者的脑电信号在发作前会出现峰度增加和方差减小.Teixeira等[5]使用功率谱预测和检测癫痫,准确率达到75.8%. 此外,小波变换[15]、自回归系数[16]的分析方法在癫痫发作预测中得到广泛应用.非线性特征如李雅普诺夫指数[17]和相关维数可以描述大脑的动态变化,被广泛应用于脑电信号分析[18]. 研究证实,在癫痫发作前存在脑电活动由复杂向简单转化的状态[19]. 在癫痫发作前数分钟至数十分钟脑电活动的李雅普诺夫指数、相关维数动力学特征指标显著减小,预示癫痫即将发作[20].
综上所述,在癫痫发作预测方面已有较多成果. 然而,基于脑电图的癫痫发作预测还难以实现临床应用,还有一些挑战须解决,特别是:1)癫痫发作往往起源于某一区域并不断向周围传播,脑区之间的同步活动和空间连通性在传播过程中不断变化,现有基于多变量的方法没有考虑大脑内部的空间同步和连通信息. 2)癫痫发作预测是二分类问题,通常以发作前期和发作间期的特征为正、负样本进行训练. 所选择的发作前期正样本是否合理将直接影响分类器的性能,目前临床上没有明确方法判定最佳预发作时段.
本研究主要解决以下关键问题:1)通过计算脑功能连接网络参数来描述癫痫发作预测和检测中经常被忽略的空间信息和导联间的同步活动,再结合时频特征与非线性特征从多方面描述癫痫发作前的异常状态. 2)通过预发作数据段选取方法从发作前期自动选择出与发作间期相比具有最大线可分性的数据段作为正样本,并验证选取的合理性和有效性.
1. 材料与方法
1.1. 数据集
数据来源为MIT头皮脑电(sEEG)公共数据库[29]和首都医科大学宣武医院患者脑电数据集. MIT公共数据库收集于波士顿儿童医院,由顽固性癫痫患者的脑电数据组成. 该数据采用国际10-20脑电图电极位置和命名系统进行记录,共收集22例(5名男性,3.0~22.0岁;17名女性,1.5~19.0岁),所有信号均以256 Hz进行采样. 该数据库主要针对多次发作的患者,其中一次发作用于训练模型,其余至少一次发作用于测试,共分析14名患者的68次癫痫发作. 首都医科大学宣武医院经志愿者允许后使用其脑电数据进行研究,并得到伦理委员会的批准. 该数据采用国际10-20脑电图系统进行记录,包含从19名患者中收集的94次癫痫发作,总时长为278 h. 脑电图在256 Hz下采集和记录,电极数量为26. 所有患者均包含一次以上的癫痫发作.
1.2. 方法
1.2.1. 特征提取
所提取的特征包括功率谱密度、功率谱熵和脑功能网络参数. 数据处理流程如图1所示.
图 1
特征提取自半重叠的2 s滑动窗. 综合考虑大脑状态的变化周期和频率分析的长度,将窗长设置为2 s,并采用0.5 Hz的高通滤波和47~53 Hz的带通滤波去除噪声干扰.
1)功率谱密度. 功率谱密度(power spectral density, PSD)表示信号在频域中的功率分布,用于描述癫痫发作引起的大脑状态变化. 脑电节律性活动一般分为5个频带,即
式中:
归一化功率谱为各子带的功率与总功率之比,计算方法为该子带的功率除以总功率Ptot:
2)功率谱熵. 功率谱熵(power spectral entropy,PSE)能较好地描述癫痫发作的频谱分布,可以理解为测量频域中的时间不确定性和复杂性. 第i子带的功率谱概率密度分布函数和功率谱熵的表达式分别为
脑功能连接网络参数(functional connectivity network,FCN)分析方法包括2个步骤:基于皮尔逊相关系数建立相关矩阵并对其二值化;采用平均路径长度和聚类系数来度量网络特性. 相关矩阵表达式如下:
式中:c为导联的个数;
式中:
通过确定的阈值将相关矩阵转换为二值脑网络矩阵,小于阈值的矩阵值设为0,表示2个导联之间没有连接;大于阈值的矩阵值设为1,表示2个导联之间有连接. 阈值计算方法为单样本t检验,具体步骤如下.
1)设相关矩阵二值化的阈值为T,样本均值为μ,在显著性水平α下,假设:
式中:
2)为了使阈值划定更具有统计意义,对于一位病患,挑选当前时刻前120个窗所求得的T进行平均,作为当前时刻的脑功能网络的划分阈值. 每移动一个窗,划分阈值更新一次.
同一位患者在不同时期所构建的二值脑网络连接矩阵如图2所示. 图中,黑色代表0,表示2个导联之间没有连接;白色代表1,表示2个导联之间有连接. 每位患者的大脑功能连接性都存在明显差异.
图 2
平均路径长度为第i个导联与其他导联间的平均距离,用于衡量网络传递信息的能力:
式中:V为所有导联的序号集合,
聚类系数表示一个节点的所有邻居之间互为邻居的可能性,用于衡量节点趋向于聚集在一起的程度. 第i导联的聚类系数表达式为
式中:
综上所述,每2 s从一个导联中提取26个特征,包括8个绝对功率谱值、8个归一化功率谱值、8个功率谱熵值以及脑功能网络参数的平均路径长度和聚类系数. 与仅计算功率谱密度相比,使用这3类特征的关键优势在于:这些特征描述了癫痫发作的3个不同维度,包括功率在频率域的分布、非线性动力学信息和大脑不同区域间的同步活动. 不同特征之间的相关性较小,可以得到更多的信息.
1.2.2. 预发作数据段选取
癫痫脑电数据可以分为几个时段:发作间期、发作前期、发作期和发作后期. 癫痫发作前脑电信号发生显著变化的时段为发作前期,可以持续几分钟到几个小时,医学领域对这一时段的时间长度并无统一划分. Teixeira等[5]分别研究发作前期的时间长度选择10、20 、30、40 min时的预测效果,发现发作前期时间越长,预测的准确性越高. 按照癫痫脑电分析研究的常用时段划分,定义癫痫发作时刻前60 min为发作前期(pre-ictal period);临床发作时间标定的癫痫起始、终止时间之内为发作期(ictal period);癫痫终止时刻后30 min为发作后期(post-ictal period),介于上一次发作后期与此次发作前期之间的时段为发作间期(inter-ictal period).
本研究提出预发作数据段选取(pre-ictal period selection,PPS)方法,以最小类内距离和最大类间距离为标准,从发作前期的数据中选取连续的10 min作为预发作期. 该数据与从发作间期随机挑选的10 min数据相比,其特征具有最大线性可分性,通过窗长为10 min,包含1 s重叠的滑动窗进行挑选. 该方法使用类内距离
式中:
最终选取J最大的10 min作为预发作期进行特征选择和分类. 理论上所选预发作数据段为发作前期内与发作间期相比线性可分性最好的时段,但有时会受到噪声的影响,因此设置J平均值的5倍作为上限以避免噪声.
1.2.3. 特征挑选和导联挑选
首先使用弹性网[31]对每一导联分别进行特征挑选. 弹性网表达式如下:
式中:
弹性网是LASSO和岭回归的一个凸组合,当
根据所选特征进行导联挑选,以避免无效和冗余特征的影响. 从所有导联中选择K个有效的导联,包括子集搜索和子集评价过程. 定义导联集
1.2.4. 分类
为了实现针对病患个人进行预测,患者的发作次数应多于一次,其中1次发作用于训练,其余至少1次发作用于测试. 以挑选出的预发作期的特征为正样本,发作间期的特征为负样本,输入至XGBoost分类器中. 认为癫痫发作前60 min内的警报是真阳性,发作后30 min内的数据因可能存在发作后脑电图抑制现象而不对其进行预测.
2. 结果与讨论
采用击中率(recall,R)和假阳性率(false positive rate,FPR)衡量算法性能. 击中率是准确预测的癫痫发作次数与癫痫发作总次数之比,反映算法的查全程度;假阳性率是每小时内发生的虚警个数与所有未发作样本数之比,反映算法是否容易产生虚警. 对每位患者分别训练模型,采用交叉验证方法,每次实验依次以其中一次发作的数据训练模型,再对所有次发作进行预测,计算该次试验的击中次数. 对多次试验的结果求平均值,作为平均击中次数,并计算击中率. 算法在MIT公共数据库和宣武医院数据集上进行测试,在MIT数据库上的击中率为95.76%,假阳性率为0.1073 h−1;在宣武医院数据集上的击中率为97.80%,假阳性率为0.0453 h−1. MIT数据库与宣武医院数据集的预测结果如表1、2所示. 表中,T为数据时长,Ne为有效发作次数,nh为平均击中次数.
表 1 MIT公共数据库预测结果
Tab.1
编号 | Ne | nh | R /% | FPR /h−1 |
1 | 6 | 5.6 | 94.44 | 0.0430 |
5 | 4 | 4.0 | 100.00 | 0.1311 |
6 | 10 | 9.5 | 95.00 | 0.1741 |
7 | 3 | 3.0 | 100.00 | 0.1717 |
8 | 5 | 4.4 | 88.00 | 0.0419 |
9 | 4 | 3.5 | 87.50 | 0.1177 |
10 | 7 | 6.5 | 93.88 | 0.0884 |
11 | 3 | 3.0 | 100.00 | 0.1387 |
14 | 6 | 6.0 | 100.00 | 0.1195 |
16 | 5 | 4.4 | 88.00 | 0.1814 |
18 | 4 | 3.7 | 93.75 | 0.0916 |
19 | 2 | 2.0 | 100.00 | 0.0056 |
20 | 6 | 6.0 | 100.00 | 0.0487 |
22 | 3 | 3.0 | 100.00 | 0.1483 |
平均 | − | − | 95.76 | 0.1073 |
表 2 宣武医院数据集预测结果
Tab.2
编号 | T | Ne | nh | R /% | FPR /h−1 |
1 | 20 | 6 | 5.5 | 91.67 | 0.0412 |
2 | 22 | 6 | 4.8 | 80.56 | 0.0302 |
3 | 8 | 2 | 2.0 | 100.00 | 0.0412 |
4 | 16 | 3 | 3.0 | 100.00 | 0.1161 |
5 | 8 | 2 | 2.0 | 100.00 | 0.0527 |
6 | 11 | 4 | 4.0 | 100.00 | 0.0475 |
7 | 18 | 10 | 9.7 | 97.00 | 0.0280 |
8 | 8 | 2 | 2.0 | 100.00 | 0.0379 |
9 | 22 | 9 | 9.0 | 100.00 | 0.0726 |
10 | 19 | 6 | 6.0 | 100.00 | 0.0632 |
11 | 19 | 5 | 5.0 | 100.00 | 0.0485 |
12 | 17 | 4 | 4.0 | 100.00 | 0.0410 |
13 | 7 | 4 | 4.0 | 100.00 | 0.0465 |
14 | 13 | 4 | 4.0 | 100.00 | 0.0334 |
15 | 8 | 4 | 4.0 | 100.00 | 0.0489 |
16 | 16 | 7 | 7.0 | 100.00 | 0.0105 |
17 | 11 | 5 | 5.0 | 100.00 | 0.0324 |
18 | 27 | 9 | 8.0 | 88.89 | 0.0395 |
19 | 8 | 2 | 2.0 | 100.00 | 0.0289 |
平均 | − | − | − | 97.80 | 0.0453 |
2.1. 预发作数据段选取
提出新的预发作数据段选取方法,对发作前期的数据进行挑选,使挑选出的样本具有更强的判别性,从而提高预测的准确性. 为了更好地说明预发作数据段选取的挑选效果,对所选预发作数据段和发作前时刻的特征进行对比,如图3所示,依次展示了MIT数据库中第10、14、18、22号患者的正、负样本对比结果. 图中,第1列为J曲线,其中第1个圆圈表示J的最大值,在时间轴上对应于挑选的10 min数据;第2个圆圈表示J的最后一个值,在时间轴上对应于最接近发作的10 min数据. 第2列为以挑选的10 min数据作为正样本与发作间期负样本特征进行对比,第3列为以最接近发作的10 min数据作为正样本与相同的发作间期负样本特征进行对比. 图中,“黑色*”表示发作前期的特征,“灰色○”表示发作间期的特征,所有特征均进行了归一化.
图 3
图 3 预发作期与发作前10 min的特征对比
Fig.3 Comparison of features between pre-ictal period and 10 minutes before onset
比较图3的第2、3列可知,相比于以发作前时刻作为正样本,若以挑选后的预发作数据段作为正样本,正样本与发作间期负样本的特征重叠更少,可分离程度更大,特征具有更好的线性可分离性. 观察J的曲线可知,从发作前1 h到发作时刻,J不断变化,最大值并不完全出现于发作前时刻,说明发作间期数据与发作前期数据段的可分离程度不一定会随着癫痫临近而增加.
图 4
图 5
2.2. 脑功能网络参数
图 6
图 7
使用包含脑功能网络参数的特征进行预测,所有患者的平均击中率由90.22%提升至95.76%,假阳性率由0.1261 h−1降低至0.1073 h−1. 引入脑功能网络参数可以分析癫痫发作前的空间信息,表征空间状态变化,更加符合癫痫发作时的大脑生理模型,从而提高预测的准确性.
2.3. 方法比较
目前已有许多癫痫发作预测的方法. 如表3所示为2013—2017年的6篇癫痫发作预测相关文献,对比了不同方法在MIT数据库上的结果,这些研究均针对患者个体训练模型. 与现有其他方法相比,本研究的方法具有更高的击中率和更低的假阳性率. 可以得出,本研究算法的预测效果更好.
表 3 基于MIT数据库的不同方法结果对比
Tab.3
3. 结 语
提出基于患者特异性的癫痫发作预测算法,并提出新的预发作数据段选取方法来选择最具判别性的预发作期时段. 提取脑电信号的时频特征和空间特征,经过预发作数据段选取、特征挑选和导联挑选后对模型进行训练,最终在MIT数据库和宣武医院数据集上的击中率分别为95.76%、97.80%,假阳性率分别为0.1073、0.0453 h−1. 与现有研究相比,本研究的特征提取更全面,预发作数据段选取方法更合理,预测模型的击中率高,假阳性率低,具有较好的预测效果.
使用头皮脑电图进行癫痫发作预测已有较多研究成果,与颅内脑电图(intracranial EEG, iEEG)相比,头皮脑电图包含更多的噪声. iEEG的采样率更高,包含更多的大脑模式信息. 随着神经电刺激技术的发展,基于iEEG实现癫痫发作预测可以与药物释放或电刺激治疗相结合,形成闭环控制,成为癫痫治疗的新方法. 未来将针对iEEG验证该方法的有效性.
参考文献
The global burden and stigma of epilepsy
[J].DOI:10.1016/j.yebeh.2007.12.019 [本文引用: 1]
A system to detect the onset of epileptic seizures in scalp EEG
[J].DOI:10.1016/j.clinph.2004.08.004 [本文引用: 2]
Epileptic seizure predictors based on computational intelligence techniques: acomparative study with 278 patients
[J].DOI:10.1016/j.cmpb.2014.02.007 [本文引用: 3]
Epileptic seizure prediction using relative spectral power features
[J].DOI:10.1016/j.clinph.2014.05.022 [本文引用: 2]
Seizure prediction with spectral power of EEG using cost-sensitive support vector machines
[J].DOI:10.1111/j.1528-1167.2011.03138.x
Power spectrum and intracranial EEG patterns at seizure onset in partial epilepsy
[J].DOI:10.1016/0013-4694(94)00286-T
Fisher's linear discriminant analysis
[J].
Intracranial electroencephalographic seizure-onset patterns: effect of underlying pathology
[J].DOI:10.1093/brain/awt299 [本文引用: 1]
On the predictability of epileptic seizures
[J].
Seizure prediction: the long and winding road
[J].
Prediction of epileptic seizures
[J].DOI:10.1016/S1474-4422(02)00003-0
High-frequency oscillations (HFOs) in clinical epilepsy
[J].DOI:10.1016/j.pneurobio.2012.03.001 [本文引用: 1]
Application of wavelet-based similarity analysis to epileptic seizures prediction
[J].DOI:10.1016/j.compbiomed.2006.08.010 [本文引用: 1]
Real-time epileptic seizure prediction using AR models and support vector machines
[J].DOI:10.1109/TBME.2009.2038990 [本文引用: 1]
Phase space topography and the Lyapunov exponent of electrocorticograms in partial seizures
[J].DOI:10.1007/BF01140588 [本文引用: 1]
Epileptic seizure prediction and control
[J].DOI:10.1109/TBME.2003.810705 [本文引用: 1]
Dynamical diseases of brain systems: different routes to epileptic seizures
[J].DOI:10.1109/TBME.2003.810703 [本文引用: 1]
The role of EEG in epilepsy: acritical review
[J].DOI:10.1016/j.yebeh.2009.02.035 [本文引用: 1]
Neural synchrony in brain disorders: relevance for cognitive dysfunctions and pathophysiology
[J].DOI:10.1016/j.neuron.2006.09.020 [本文引用: 2]
Automated detection of a preseizure state based on a decrease in synchronizationin intracranial electroencephalogram recordings from epilepsy patients
[J].
Assessing seizure dynamics by analysing the correlation structure of multichannel intracranial EEG
[J].
Seizure prediction using EEG spatiotemporal correlation structure
[J].DOI:10.1016/j.yebeh.2012.07.007 [本文引用: 1]
Low-complexity seizure prediction from iEEG/sEEG using spectral power and ratios of spectral power
[J].DOI:10.1109/TBCAS.2015.2477264 [本文引用: 1]
Automated seizure detection using limited-channel EEG and non-linear dimension reduction
[J].
PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals
[J].
From intracerebral EEG signals to brain connectivity: identification of epileptogenic networks in partial epilepsy
[J].
Seizure prediction and detection via phase and amplitude lock values
[J].
Predicting epileptic seizures from scalp EEG based on attractor state analysis
[J].
Epileptic seizure prediction using CSP and LDA for scalp EEG signals
[J].
A generalised seizure prediction with convolutional neural networks for intracranial and scalp electroencephalogram data analysis
[J].
/
〈 |
|
〉 |
