基于脉搏波信号多维度特征的身份识别
Identity recognition based on multi-dimensional features of pulse wave signals
收稿日期: 2024-02-26
基金资助: |
|
Received: 2024-02-26
Fund supported: | 浙江省基础公益研究计划资助项目(LGF21F030003). |
作者简介 About authors
傅幼萍(1980—),女,讲师,硕士,从事智能视觉、数据挖掘研究.orcid.org/0009-0007-1405-5490.E-mail:
现有光电容积脉搏波(PPG)身份识别方法特征表征不全面、鲁棒性不强,为此提出基于PPG信号多维度特征的身份识别方法. 该方法将PPG信号的非线性维度作为重要特征引入身份识别. 对PPG信号进行预处理;分别从时域、频域和非线性3个维度提取PPG信号的特征参数;通过优化和选择,构建有效的特征集;将该特征集用于身份识别,并对身份识别系统的性能进行分析和评估. 通过对多维度的全面分析,该方法实现了较全面的特征提取,并且时域、频域和非线性维度分析提供的互补信息增强了识别系统的鲁棒性. 在包含200个主体和
关键词:
A novel identity recognition method based on multi-dimensional features extracted from photoplethysmography (PPG) signals was proposed, addressing the limitations of existing methods in terms of incomplete feature representation and weak robustness. The non-linear dimension of PPG signals was incorporated as a crucial feature for identity recognition. After preprocessing the PPG signals were processed, and features were extracted from three distinct dimensions, i.e., time domain, frequency domain, and non-linearity. An effective feature set was then constructed through optimization and selection. Finally, this feature set was utilized for identity recognition, and the performance of the recognition system was analyzed and evaluated. By comprehensively analyzing multiple dimensions, the proposed method achieved comprehensive feature extraction. Furthermore, the complementary information provided by time domain, frequency domain, and non-linearity analysis enhanced the robustness of the recognition system. On an identity recognition task involving 200 subjects and
Keywords:
本文引用格式
傅幼萍, 张航, 厉梦菡, 孟濬.
FU Youping, ZHANG Hang, LI Menghan, MENG Jun.
2003年,Gu等[4]提出基于PPG信号的生物识别方法. 之后,研究人员对此领域进行了广泛的探索和研究,并获得了一定的成果. Kavsaoglu等[5]从PPG信号及其一阶、二阶导数中提取了40个时域特征,并提出特征排序算法对其排序,最终取得了94.4%的准确率;Jaafar等[6]的研究证明了加速度体积描记信号作为生物识别系统特征的稳健性和可靠性;Chakraborty等[7]从滤波后的PPG及其导数中提取了12个特征,并使用线性判别分析进行分类,该研究对15名受试者的PPG信号进行分类识别,达到了100%的准确率. 孙斌等[8]对PPG信号提取了24维特征;利用寻优算法获取最佳特征子集后利用人工蜂群算法优化支持向量机算法对样本的最佳特征子集进行训练与测试,完成个体身份识别.
以PPG信号的特征点为基础,提取各特征点的峰值、时间间隔、斜率等时域特征来制定特征向量模板. Gu等[9]的研究从受试者的PPG信号中提取了4个时域特征(波峰数、上升斜率、下降斜率、时间间隔)构成特征向量模板,然后用模糊逻辑方法来研究使用PPG信号进行生物识别的可行性.
根据PPG信号整体形态,通常通过时间或频率分析来获取统计特征,从PPG波形中提取鉴别性信息. Salanke等[10] 研究了PPG信号在生物识别中的适用性. 该研究运用主成分分析法对单周期PPG信号进行特征提取,以样本间的欧氏距离为判别依据. 结果表明,该方法对正常PPG信号和含有运动伪影的PPG信号都表现出良好的识别精度.
还有一些研究将PPG信号特征与深度学习结合用于身份识别. Jeon等[11]提出新的方法,称为多层嵌套递归图(multi-slice nested recurrence plot, MsNRP),这个方法主要用于解决存在噪声的PPG信号在身份识别中的问题. MsNRP展示了其对噪声的鲁棒性,从而为实际场景中的识别提供了可靠的解决方案. Lee等[12]提出基于长短期记忆(long short term memory, LSTM)和卷积神经网络(convolutional neural network, CNN)的集成身份识别技术. 在预处理步骤中使用滤波器来去除噪声,并且从原始信号中提取时域特征作为LSTM的输入,获得了一定程度上的身份识别性能提升.
现有的研究在特征提取方面较为单一,多数研究仅在时域或频域中的某一维度进行特征提取,导致所得身份识别模型的准确率有待提高. 基于此,本研究提出基于PPG信号多维度特征的身份识别方法,将PPG信号的非线性维度作为一种重要的特征引入身份识别. 对PPG信号进行预处理;分别从时域、频域和非线性3个维度提取PPG信号的特征参数;通过优化和选择,构建有效特征集;将该特征集用于身份识别,并对身份识别系统的性能进行分析和评估.
1. 多维度特征的身份识别系统概述
所构建的身份识别具体流程如图1所示. 基于PPG信号特征的身份识别方法包含信号采集、信号处理和身份识别3个部分. 1)在信号采集阶段,须采集PPG信号,一般是通过脉搏波传感器进行采集(例如:合肥华科电子技术研究所的HKG-07C红外脉搏传感器),通过串口通信协议在电脑端保存. 2)信号处理,一般包含预处理、特征提取和特征选择3个步骤. 在预处理阶段,须对前一步采集得到的PPG信号进行去噪、峰值检测和去除基线漂移. 在特征提取阶段,对经过预处理的PPG信号进行分析,提取其时域特征、频域特征、非线性特征. 在特征选择阶段,对前一步提取的特征进行优化和选择,构建一个有效特征集. 3)在身份识别阶段,通过分类算法得到身份识别的结果.
图 1
通过对多维度的全面分析,使得识别方法有更全面的特征提取,并且,时域、频域和非线性维度分析提供互补的信息使得识别系统的鲁棒性增强.此外,非线性维度分析可以揭示时域和频域分析中可能隐藏的复杂模式和动态特性,并且非线性特征对PPG信号中细微的生理变化更敏感,这可能有助于提高身份识别的准确性.
2. PPG信号的预处理与特征提取
2.1. PPG信号的预处理
2.1.1. 滤波去噪
通常情况下,采集到的PPG信号会包含噪声和伪影,这些噪声和伪影会对后续的特征提取和分类造成不利影响. 在预处理步骤中,须最大限度地去除干扰信号,首先须明确噪声源,然后据此对PPG信号进行去噪处理.
根据PPG信号及噪声的频率分布特点,采用截止频率为5 Hz的三阶低通巴特沃斯滤波器来降低噪声对PPG信号的干扰,其滤波效果如图2所示.
图 2
2.1.2. 波峰波谷检测
在PPG信号的预处理过程中,波峰波谷检测是必要的步骤. 一方面,对数据进行特征点检测须分割出单周期的PPG信号. 另一方面,本研究基于PPG信号的波谷去除PPG信号的基线漂移.
由于进行滤波去噪处理后的PPG信号中并不总是理想平滑的信号,使用极值法获取PPG信号波峰的方法存在误检的问题. 为此,基于PPG信号周期性的特点,采用基于滑动窗口的波峰波谷检测算法[15],具体步骤如下.
1)计算窗口的大小,使得一个窗口内有且仅有一个波峰. 表达式如下:
式中:
由于信号的周期大小存在一定的波动,为了保证窗口内有波峰点,须加上一个偏移量. 由于PPG信号的上升支较短,一般在半个周期以内便能达到波峰,基于此选取窗口偏移量、窗口大小:
式中:
2)在初始时,窗口大小为
3)记窗口中信号的最大值为信号的波峰点幅值,对应的下标为波峰下标,记为
4)滑动窗口,使窗口的左端位于上一个波峰点,窗口大小为
5)记窗口中信号的最大值为信号的波峰点幅值,对应的下标为波峰下标,记为
重复步骤4)、5),直到窗口位于输入信号的末尾.
由于最后一个窗口中不一定包含波峰,去掉最后一个获得的“波峰”,最终得到输入信号的波峰下标,记为
在得到峰值点之后,以峰值点为窗口的右端,选取窗口大小为
2.1.3. 基线漂移去除
在对PPG信号进行滤波去噪之后,部分信号还存在明显的基线漂移. 本研究基于插值法去除PPG信号的基线漂移,具体步骤如下.
1)根据上述“基于滑动窗口的波峰波谷检测算法”,可以得到一段PPG信号的谷点(起始点).
2)根据这段PPG信号的长度对提取的谷点进行插值,即可得到基线漂移信号.
3) 将原始PPG信号减去基线漂移信号即可得到去除基线漂移的PPG信号.
谷点插值得到的基线漂移曲线和基线漂移去除效果如图3所示.
图 3
图 3 10 s的PPG信号的基线漂移去除效果
Fig.3 Baseline drift removal effect of 10-second PPG signal
2.2. PPG信号的特征参数提取
PPG信号反映了心脏搏动和血液微循环综合作用下的血管内血容量的变化情况,具有时变性、频变性的特点,同时具有明显的非平稳、非线性特点. 不同的个体,其PPG信号的波形形态、幅值大小、频域特性、复杂程度和混乱程度都会有所不同. 因此,从时域、频域、非线性3个维度对PPG信号提取特征参数,为后续的身份识别提供特征集.
2.2.1. 时域特征参数
PPG信号的幅值、周期、上升支斜率、下降支斜率等都与主体的生理情况有关,反映了主体独特的个人信息. 因此,提取PPG信号的幅值、周期、上升支斜率、下降支斜率等参数作为其时域特征参数. 将单周期PPG信号表示为
表 1 PPG信号的时域特征参数名称、定义及表达式
Tab.1
参数名称 | 定义 | 表达式 |
波峰幅值 | A点的幅值 | |
上升支时间 | 点O到点A经历的时间 | |
下降支时间 | 点A到点 | |
全周期 | 点O到点 | |
上升支斜率 | ||
下降支斜率 | ||
上升面积 | 上升曲线 | |
下降面积 | 下降曲线 | |
全周期面积 | PPG曲线 | |
比例 | 脉搏波压力脉动分量的均值在 脉动分量最大值中所占比例 |
图 4
2.2.2. 频域特征参数
尽管幅值、周期、上升支斜率、下降支斜率等信息可以直观反映信号的波形特征,但为了获取更全面的身份识别特征,须对PPG信号进行频域分析[14].
功率谱是功率谱密度函数(power spectral density, PSD)的简称,描述了信号功率随频率变化的情况,被广泛应用于各个领域[16]. 功率谱估计的方法主要有2种:一种是从给定数据集出发的非参数估计,即经典谱估计方法;另一种是基于参数模型的参数估计,即现代谱估计方法. 相较于现代谱估计方法,经典谱估计方法分辨率较低、方差性较差,但是由于其算法简单、物理意义明确,在误差范围要求不高的情况下同样可以获得较好的效果.
经典谱估计选取数据序列的一部分,而将其余部分假设为零,相当于给数据加窗. 经典谱估计方法一般采用相关函数法和周期图法,其中平均修正周期图法(Welch法)是一种改进的周期图法. 本研究采用Welch功率谱估计方法来提取PPG信号的频域特征参数.
给定一个信号,其功率谱的计算过程如下:1)将信号分割成重叠的分段;2)给每段信号加窗,常用的窗函数有矩形窗、凯瑟窗、汉宁窗、切比雪夫窗等;3)计算每段信号的功率谱,并平均功率谱估计值.
为了获得稳定的频域特征参数,采用10 s的PPG信号计算频域特征参数. 首先,对原始PPG信号进行预处理,包括滤波去噪、波峰波谷检测、去除基线漂移;然后,采用Welch功率谱估计方法得到功率谱;最后,按照频域范围划分,得到频域特征参数. 参数名称及频域范围(frequency domain, FD)如表2所示.
表 2 PPG信号的频域特征参数名称及其含义
Tab.2
参数名称 | FD/Hz | 参数名称 | FD/Hz | |
power_1 | 0~0.02 | power_5 | 0.13~0.16 | |
power_2 | 0.02~0.05 | power_6 | 0.16~0.30 | |
power_3 | 0.05~0.09 | power_7 | 0.30~1.00 | |
power_4 | 0.09~0.13 | power_all | 0~1.00 |
分析的信号为10 s的PPG信号,采样频率为125 Hz,因此,信号长度为
图 5
图 5 基于10 s的PPG信号的标准化功率谱
Fig.5 Standardized power spectrum based on 10 second PPG signal
2.2.3. 非线性特征参数
除了时域特征和频域特征之外,PPG信号还具有明显的非线性特性,这些特性与心脏、血管和微循环等部位的活动有关,不同个体PPG信号的非线性参数对于其身份识别具有重要意义. 但是,此前国内外对PPG信号的分析大多集中于其时域特性和频域特性,对于其非线性特性的研究成果相对较少. 近年来,随着对生理信号研究的深入,生理信号的非线性特性也越来越受到关注. 常见的非线性特征参数有关联维数、最大李雅普诺夫指数、近似熵、样本熵、联合熵、互信息等. 目前,已有研究基于这些非线性参数对心电信号[17-18]、指纹[19]、步态[20]等生理信号进行分析. 研究表明,这些非线性参数可以用于评估时序信号的复杂度和混乱程度,对于生理信号的分析具有重要意义.
与频域特征参数的计算相同,非线性特征参数也是基于10 s的PPG信号计算得到. 本研究选用以下3种非线性特征参数:样本熵(sample entropy, SampEn)、模糊熵(fuzzy entropy, FuzzyEn)、精细复合多尺度散布熵(refined composite multiscale dispersion entropy, RCMDE)对PPG信号的非线性特性进行分析.
1) 样本熵.
设原始一维序列为
首先,对原始序列进行相空间重构,得到新的m维序列:
接着,计算每个序列
然后,计算序列的相关程度. 根据给定的相似容限r,计算
计算
令
样本熵的计算过程与近似熵类似,主要的区别在于:在相空间重构时,式(5)中
样本熵定义如下:
在实际工作过程中,序列长度n为有限值,常将样本熵估计为
样本熵受到嵌入维数m、相似容限r和序列长度n的取值的影响较大. Pincus研究指出,当
2) 模糊熵.
模糊熵是由Chen等[25]于2007年提出的. 模糊熵的计算过程与近似熵类似,主要的区别如下.
在计算向量相关程度时引入了模糊隶属度,根据距离
然后对除自身以外所有隶属度求平均值:
从而定义模糊熵为
3) 精细复合多尺度散布熵.
Azami等[26]的研究表明RCMDE能够区分不同的动力学,因此,将RCMDE作为PPG身份识别的特征参数是有意义的.
RCMDE是在散布熵(dispersion entropy, DisEn)的基础上,按照尺度因子
设原始一维序列为
式中:c为类别的数量,表示将信号x映射到的类的总数;
对于原始一维序列X,其第k个粗粒度时间序列为
式中:
最终RCMDE定义如下:
式中:
作为一种时间序列信号,PPG信号的非线性特性可以通过以上3种方法进行分析和量化.
由于PPG信号是每个人的独特生理特征,这3种熵度量可以通过挖掘PPG信号非线性特征中的个体特异性模式来促进身份识别应用. 具体而言如下所示.
样本熵:可以识别和量化PPG信号中不可预测和复杂的模式,这些模式因人而异. 通过量化这些模式,样本熵可以帮助区分不同个体的PPG信号.
模糊熵:能够反映时间序列的复杂性,在一定程度上可以评估PPG信号对噪声和异常值的鲁棒性. 在存在噪声或信号质量较差的情况下,模糊熵有助于提高身份识别准确性.
精细复合多尺度散布熵:在多个尺度上分析时间序列的复杂性,可以揭示PPG信号中复杂性的多尺度模式. 它是PPG信号复杂性变化模式与动态特性的反映,可以帮助识别个体之间更细微的差异,从而提高识别准确性.
综上所述,本研究采用样本熵(SampleEn)、模糊熵(FuzzyEn)以及精细复合多尺度散布熵(RCMDE)作为PPG信号非线性特性的表征,以提高PPG身份识别系统的准确性和鲁棒性.
2.3. 有效特征集的构建
2.3.1. 特征参数的优化
根据上节的特征参数提取算法,基于实验数据提取特征集. 为了使特征集中的特征参数能够更好地表征主体,须对特征参数进行优化. 特征参数优化主要分为2个部分:标准化处理和表征值选择.
对于特征参数的标准化处理,为了避免“消除个体差异”,基于不同个体的同一特征值进行归一化,表达式如下:
另外,选择一个合适的特征值用于表征主体的特性是特征参数优化的重要一步,同时也是特征参数能够区分不同主体的关键.
对于时域特征参数的选择,由于主体状态稳定,PPG信号的时域特征参数变化小,选择平均值进行表征优化:每个时域特征参数都是由10 s(125 Hz)PPG信号计算得到的;对这10 s的PPG信号进行去噪、峰值检测、去除基线漂移和单周期分割;计算10 s的PPG信号中每个单周期PPG信号的时域特征,再对计算得到的时域特征取平均值.
在过往的研究中,每一个时域特征参数都是基于单周期PPG信号计算得到的,本研究则是由10 s的PPG信号的平均值表征,有助于提高该值的稳定性. 另外,频域特征参数和非线性特征参数也是基于10 s的PPG信号计算得到的.
2.3.2. 基于逐步回归法的特征选择
过多的特征参数可能导致维度灾难,使分类精度不升反降. 为了解决这个问题,须进行特征选择.
目前,常见的特征选择算法包括前向搜索算法、后向搜索算法和双向搜索算法. 前向搜索算法首先从一个空集开始,不断向里添加能提升模型性能的特征,直到模型性能无法提升. 后向搜索算法从全集开始,不断从特征集里面剔除特征使得模型性能提升,直到模型性能无法提升. 前向搜索和后向搜索都只沿着一个方向进行,最后选择的特征集里面可能包含某个特征加入之后不再有效的特征,也可能遗漏单独分析不显著但对整体特征集有较大作用的特征.
因此,本研究基于逐步回归法进行特征选择. 逐步回归是一种双向搜索算法,结合了前向搜索和后向搜索的优点. 其特征选择步骤如下.
1) 遍历原始特征集,选择使得Wilk’s Lambda最小化的特征[27].
2) 特征引入:计算F统计量的平均值p值,如果不在模型中的任何特征的p值小于引入阈值
3) 特征剔除:计算F统计量的p值,如果模型中的任何特征的p值大于剔除阈值
4) 当没有特征可以引入或剔除时,结束特征选择过程.
图 6
图 6 参数取值对特征选择结果的影响
Fig.6 Impact of parameter values on feature selection results
根据逐步回归法的实验结果,按照特征加入特征集的顺序,本研究的特征选择结果如表3所示,选出了18个特征参数,对比特征选择前的结果,身份识别任务的准确率提升了2.0%.
表 3 根据特征选择结果构建的有效特征集
Tab.3
序号 | 特征参数 | 序号 | 特征参数 | |
1 | FuzzyEn | 10 | ||
2 | RCMDE | 11 | power_all | |
3 | 12 | power_7 | ||
4 | PermEn | 13 | ||
5 | power_1 | 14 | SampleEn | |
6 | power_5 | 15 | K值 | |
7 | power_4 | 16 | ||
8 | power_6 | 17 | t1 | |
9 | h | 18 | power_2 |
3. 基于PPG信号的身份识别
本研究的身份识别任务基于MIMIC数据库中的PPG信号展开. 首先,从MIMIC数据库中选择了200名受试者的记录,从每条记录中选择了60 s的PPG数据. 之后,对其进行预处理,再从60 s的PPG数据中截取5条10 s的PPG信号,每条信号之间无重叠. 因此,每个身份识别主体有5条10 s的PPG数据用于身份识别. 根据上节的特征选择结果,每条数据提取18个特征参数用于分类识别,最终构成了
3.1. 身份识别模型的选择与参数优化
基于PPG信号的身份识别(分类)不仅依赖于从PPG信号中提取的特征参数,同时,分类算法在基于PPG信号的身份识别系统中起着举足轻重的作用. 常见的生物识别分类算法有最近邻分类(KNN)、支持向量机(SVM)、线性判别分析(LDA)、决策树(DT)等.
表 4 身份识别的不同模型
Tab.4
模型 | A/% | SS/(obs·s−1) | Tinfer/s | S/kB |
DT | 40.0 | ~ | 5.16 | 573 |
KNN | 96.0 | ~ | 0.63 | 517 |
Linear SVM | 94.0 | ~15 | ||
QuadraticSVM | 94.8 | ~12 | ||
Cubic SVM | 94.8 | ~12 | ||
Gaussian SVM | 97.6 | ~11 | ||
LDA | 98.4 | ~ | 0.86 |
为了选取合适的模型,分别对KNN、SVM进行参数优化,并对比实验效果.
1)KNN分类模型的参数优化.
对于KNN分类模型,邻居个数k的选择可以对结果产生一定影响. 为此,采用十折交叉验证,分析对比不同邻域个数Num下KNN分类模型的准确率,结果如图7所示.
图 7
图 7 不同邻居个数下KNN分类模型的准确率
Fig.7 Accuracy of KNN classification models under different neighbor numbers
2)SVM分类模型的参数优化.
参数设置对于SVM分类性能具有至关重要的影响,如果选择不合适的SVM参数,所得的分类准确率可能会很差[28].
基于网格搜索法对高斯核的框约束和核尺度进行优化,将框约束的值k1分别设置为0.5、1.0、1.5、2.0、2.5、3.0、3.5,将核尺度的值k2分别设置为5.0、5.5、6.0、6.5、7.0、7.5进行参数优化. 对于其他核函数,仅对框约束的值进行优化.
同样,将上节得到的特征分类矩阵作为输入,采用十折交叉验证,参数优化的结果如表5所示.
表 5 SVM模型参数优化结果
Tab.5
核函数 | k1 | k2 | A/% | SS(obs·s−1) |
Linear | 2.5 | — | 96.8 | ~14 |
Quadratic | 2.0 | — | 95.6 | ~11 |
Cubic | 2.0 | — | 95.2 | ~11 |
Gaussian | 2.0 | 6.5 | 98.0 | ~11 |
如图8所示,优化后的SVM模型的分类准确率都有所提升,不同核函数的提升幅度分别为2.8、0.8、0.4、0.4个百分点. 分类准确率最高的SVM模型所选用的核函数是Gaussian核函数,准确率达到了98.0%.
图 8
图 8 参数优化前后SVM分类模型的准确率
Fig.8 Accuracy of SVM classification model before and after parameter optimization
经过参数优化之后,KNN模型的准确率为96.0%,SVM模型的准确率为98.0%,LDA模型的准确率为98.4%. 另外,LDA模型的分类速度约为
3.2. 身份识别结果与分析
身份识别任务基于MIMIC数据库[29]中的PPG信号展开. MIMIC数据库包括多名重症监护室患者的记录数据,每条记录通常包含从波士顿贝斯以色列医院的内科、外科和心脏重症监护室的病人监护仪中记录的24~48 h的连续数据,采样频率为125 Hz. 从MIMIC数据库中选择了年龄10~80岁不同性别的200个身份识别主体,每人有5条PPG数据,共
1) 将数据随机划分为10折;2)对于每折,将该折保留作为测试集,并且将剩余9折合并为训练集,在训练集上训练模型,在测试集上评估模型性能;3)将10次迭代的性能指标的准确率取平均值作为模型的最终性能估计.
每个PPG数据样本都按照其所属主体标记真实标签为1~200. 提取有效特征集输入LDA分类模型,得到分类结果为1~200. 根据真实标签和分类结果构成混淆矩阵,对混淆矩阵进行分析,可以得出:身份识别任务的总体准确率为98.4%,身份识别任务的宏精准率为98.9%,宏召回率为98.4%,
为了评估多维度特征对于提升身份识别任务准确率的作用,将所提取的时域特征参数、频域特征参数和非线性特征参数单独或组合输入分类器,得到如图9所示的分类准确率.可以看出,使用2个维度(时域+频域)特征集的身份识别模型,其分类准确率要高于仅仅使用单一维度(时域或频域)特征集的模型;而使用3个维度(时域+频域+非线性)特征集的模型,其分类准确率又要高于仅使用2个维度特征集的模型. 在没有进行特征选择的情况下,三维度特征集的分类准确率也达到了98.0%,而单一维度特征集的分类准确率最高只有96.0%,2个维度特征集的分类准确率最高仅为96.9%.由此可见,提取多个维度的特征可以更加全面地表征PPG信号,提高身份识别准确率.
图 9
图 9 不同维度特征集的分类准确率
Fig.9 Classification accuracy of feature sets with different dimensions
3.3. 与相关研究的对比分析
在身份识别任务中,识别人数会对识别准确率产生影响. 为了与其他现有基于PPG信号的身份识别研究进行对比分析,基于上述有效特征集和LDA分类器对25人(125组PPG数据)和50人(250组PPG数据)的数据集进行身份识别,十折交叉验证准确率分别为100.0%和99.9%.
表 6 本研究PPG身份识别方法与相关研究的比较
Tab.6
文献 | 年份 | M(PPG数据) | 特征提取 | 分类器 | A/% |
注:1) FAR为假接受率;2) FRR为假拒绝率. | |||||
文献[30] | 2003 | 17 | 时域 | KNN | 94.0 |
文献[9] | 2003 | 17 | 时域 | 模糊逻辑 | 94.0 |
文献[5] | 2014 | 40 | 时域 | KNN | 94.4 |
文献[6] | 2015 | 10 | 时域 | 贝叶斯网络 | 97.5 |
文献[31] | 2015 | 10(708组) | 时域 | FNN | FAR:4.21) FRR:3.72) |
文献[7] | 2016 | 15 | 时域 | LDA | 100.0 |
文献[10] | 2016 | 23 | 高斯参数 | LDA | 95.7 |
文献[32] | 2017 | 42 | 小波变换 | KNN | 99.8 |
文献[15] | 2017 | 42 | 小波变换 | SVM | 100.0 |
文献[33] | 2020 | 20 | 时域+频域 | SVM | 93.1 |
文献[34] | 2021 | 100 | — | CNN+LSTM | 98.0 |
文献[35] | 2021 | 35 | 频域 | CNN | 99.4 |
文献[12] | 2022 | 100 | 时域+频域+小波变换 | CNNLSTM | 98.3 |
文献[11] | 2023 | 50 | — | MsNRPNet | 92.0 |
本研究 | 25(125组) | 时域+频域+非线性特征 | LDA | 100.0 | |
— | 50(250组) | 99.9 | |||
200( | 98.4 |
4. 结 语
提出基于PPG信号多维度特征的身份识别方法. 对获得的PPG信号进行预处理,分析PPG信号的噪声来源并基于此进行去噪. 在完成信号滤波后,对PPG信号的波峰和波谷进行检测,并基于此去除基线漂移. 随后,提取用于身份识别的新特征,构建多维度的PPG信号特征集,其中包括10个时域参数、8个频域参数和5个非线性参数,共23个特征参数. 之后,对提取的特征参数进行优化,并通过逐步回归法选出18个特征参数. 相比于没有进行特征选择的PPG身份识别模型,准确率提升了2.0%. 最后,对分类模型进行参数优化和对比分析,最终选择LDA作为分类器进行身份识别. 在200个主体、
本研究的PPG身份识别方法在去噪和波峰波谷检测方面仍有提升空间,特征选择与分类器的选取仍可借鉴层出不穷的新技术进一步优化,数据集的规模还可以扩大,模型的可解释性亦可增强. 未来的研究将探索更先进的去噪和波峰波谷检测算法,对比多种特征选择方法,尝试更强大的分类器,扩充数据集,并提高模型的可解释性,甚至考虑结合其他生物特征,使得模型更加强大和通用.
参考文献
A method for PPG signal identification based on improved neighborhood rough set
[J].
Multi-slice nested recurrence plot (msnrp): a robust approach for person identification using daily ECG or PPG signals
[J].DOI:10.1016/j.engappai.2023.106799 [本文引用: 2]
Personal identification using an ensemble approach of 1D-LSTM and 2D-CNN with electrocardiogram signals
[J].DOI:10.3390/app12052692 [本文引用: 2]
On the analysis of fingertip photoplethysmogram signals
[J].DOI:10.2174/157340312801215782 [本文引用: 1]
A new method for pulse oximetry possessing inherent insensitivity toartifact
[J].DOI:10.1109/10.915711 [本文引用: 2]
Differences in power spectral densities and phase quantities due to processing of EEG signals
[J].DOI:10.3390/s20216285 [本文引用: 1]
Enhanced and secured random number generation for eUASBP
[J].
Approximate entropy as a measure of system complexity
[J].DOI:10.1073/pnas.88.6.2297 [本文引用: 1]
基于眼电信号近似熵探讨针灸治神的临床应用
[J].
Clinical application of acupuncture-moxibustion for the treatment of spirit based on approximate entropy of electrooculogram signal
[J].
A novel feature ranking algorithm for biometric recognition with PPG signals
[J].DOI:10.1016/j.compbiomed.2014.03.005 [本文引用: 2]
基于脑电非线性动力学特征探究TEAS内关穴对焦虑的影响
[J].DOI:10.3969/j.issn.1000-1158.2022.01.21 [本文引用: 1]
Explore the lnfluence of transcutaneous electrical acupoint stimulation neiguan point on anxiety based on electroencephalogram nonlinear dynamic analysis method
[J].DOI:10.3969/j.issn.1000-1158.2022.01.21 [本文引用: 1]
Physiological time-series analysis using approximate entropy and sample entropy
[J].DOI:10.1152/ajpheart.2000.278.6.H2039 [本文引用: 1]
Characterization of surface EMG signal based on fuzzy entropy
[J].DOI:10.1109/TNSRE.2007.897025 [本文引用: 1]
Refined composite multiscale dispersion entropy and its application to biomedical signals
[J].DOI:10.1109/TBME.2017.2679136 [本文引用: 1]
改进WOA算法优化SVM的网络入侵检测
[J].DOI:10.3969/j.issn.1006-7167.2019.08.031 [本文引用: 1]
Improved whale optimization algorithm to optimize support vector machine for network intrusion detection
[J].DOI:10.3969/j.issn.1006-7167.2019.08.031 [本文引用: 1]
Evaluation of the time stability and uniqueness in PPG-based biometric system
[J].DOI:10.1109/TIFS.2020.3006313 [本文引用: 1]
PPG-based human identification using Mel-frequency cepstral coefficients and neural networks
[J].DOI:10.1007/s11042-021-10781-8 [本文引用: 1]
/
〈 |
|
〉 |
