基于慢时间分割的超宽带雷达步态识别
Ultra wide band radar gait recognition based on slow-time segmentation
收稿日期: 2019-07-20
Received: 2019-07-20
作者简介 About authors
周金海(1964—),男,实验师,从事微波光子学、智能传感技术、机器智能研究.orcid.org/0000-0003-1797-0399.E-mail:
为了解决室内监控时摄像头的隐私泄露问题和可穿戴设备的侵入性等问题,同时针对传统雷达步态识别算法中的行走条件限制问题,提出基于超宽带(UWB)雷达的自由空间步态识别算法.算法沿慢时间轴对目标行走动作产生的雷达步态信号进行分割产生一系列子信号;对于每个子信号,在距离单元上分别进行傅里叶变换得到距离-多普勒图像,这些距离-多普勒图像前后之间存在时序关系;利用方向梯度直方图算法对属于同一个步态信号的一组距离-多普勒图像进行特征提取,采用长短期记忆网络对得到的特征进行时序建模以获取目标身份分类结果. 实验在空旷的室内环境中进行,对四人的步态分类准确率为79.10%. 结果表明所提出的算法对自由空间中不同个体的步态具有一定的区分能力.
关键词:
An algorithm for free space gait recognition using ultra wide band (UWB) radar was proposed in order to solve the problems of privacy leakage caused by cameras and intrusiveness caused by wearable devices in the indoor monitoring, and to relax the restriction on walking conditions in traditional radar gait recognition algorithms. The radar gait signal reflected from the walking target is segmented along the slow-time axis to generate a series of sub-signals. For each sub-signal, the Fourier transform is performed on range bins to obtain a range-Doppler map. These range-Doppler maps temporally correlate each other. The features of a set of range-Doppler maps belonging to the same gait signal are extracted using the histogram of oriented gradient algorithm, and the resulting features are modeled by long short-term memory networks to obtain the final classification result of the target identity. The experiment was carried out in an empty indoor environment, and the accuracy of gait classification for four individuals was 79.10%. Results show that the proposed algorithm has a certain discrimination ability to different individual’s gait in free space.
Keywords:
本文引用格式
周金海, 王依川, 佟京鲆, 周世镒, 吴翔飞.
ZHOU Jin-hai, WANG Yi-chuan, TONG Jing-ping, ZHOU Shi-yi, WU Xiang-fei.
步态是人类的生物学特征之一,依靠步态识别,能检测侵入家庭中的陌生人,甚至辅助诊断一些类似帕金森综合征的疾病(患病后行走姿态发生改变)[10]. 前人研究中使用的实验对象之间具有较大的区分度,例如,Saho等[11]使用模拟的微多普勒遥感数据中的速度参数来识别健康的年轻人和老年人;Tivive等[12]利用短时傅里叶变换(short-time Fourier transform,STFT)和多层滤波器提取特征来区分自由臂摆动、单臂摆动和无臂摆动3种行走动作;Seifert等[13]通过节奏速度图(cadence-velocity diagram,CVD)来观察特定的多普勒频移出现的频率,并对正常行走、单脚跛行、双脚跛行、同步拐杖行走和非同步拐杖行走这5种步态进行识别. 在上述研究中,所研究的步态类型之间差异较大;所使用的数据表示域—时频图(time-Doppler map,TDM)丢失了目标的距离信息;最重要的是,步行数据都是沿着雷达视线方向(line of sight,LOS)产生的,也就是说,实验目标须沿着雷达径向方向行走,这将在实际应用中带来诸多不便.
本研究的目的是通过自由空间中的步态对若干个年龄相近、行走特点相似的目标身份进行识别,对他们的行走方向和角度不作限制. 算法对雷达反射信号进行慢时间分割,并通过计算得到一系列表征短时间段内(约200 ms)步态信息的距离-多普勒图像(range-Doppler maps,RDM),这些图像在慢时间轴上顺序排列构成的数据表示域同时保留雷达回波信号中的时间(表现RDM的变化)、空间距离(表现RDM中的目标位置)和多普勒频率(表现RDM中目标步态在当前时间段内的频率分布)信息. 依靠对RDM逐个进行方向梯度直方图(histogram of oriented gradient,HOG)特征提取构成前后具有时序关系的多个特征,再利用长短期记忆(long short term memory,LSTM)网络对所得到的特征进行时序建模以获取目标身份分类结果. 算法利用雷达信号中蕴含的相位之外的所有信息,通过统计建模的方式来自动学习数据中的相互关联性. 通过在空旷的室内环境中采集的数据来测试算法的识别性能并给出目标人数为4时的身份分类准确率,以验证所提算法的可行性.
1. 数据表示域
式中:
当忽略散射体距离信息时,可以通过STFT[18]计算得到接收信号的时频表示,反映信号频率分布随着时间的变化情况. 计算得到的功率谱分布表达式为
式中:j为虚数单位,
图 1
图 1 自由行走的时频图 (雷达频段:6.5~8.0 GHz)
Fig.1 Time-Doppler map for free walking with radar frequency band of 6.5~8.0 GHz
图 2
沿着慢时间对步态信号进行切分得到子信号,这些子信号时长约为200 ms,表示步态短时间内的特性. 在慢时间上,对子信号每一个距离单元上的信号进行傅里叶变换得到多普勒频率和相位. 相比于相位,多普勒频率更直观地展示了目标行走时各个身体部分的震动情况,因此优先保留频率而不是相位信息来与空间距离信息共同构成二维RDM. 这样,属于同一个步态信号的多个RDM共同表征雷达信号中信息的动态变化过程. 典型的步态信号产生的一组RDM如图3所示. 图中,r为距离单元. 可以看到,每张图表示当前子信号记录的时间段内频率在各个距离单元上的分布状况,具有较为明显的纹理和形状特征.
图 3
2. 研究方法
本研究所提算法以对步态信号进行慢时间分割得到的一组RDM作为输入,通过HOG特征提取和LSTM时序建模获取识别结果,算法逻辑框图如图4所示.
图 4
图 4 基于慢时间分割的步态识别算法框图
Fig.4 Algorithm block diagram for gait recognition algorithm based on slow-time segmentation
2.1. 特征提取
在进行灰度化后,HOG算法运用Gamma校正法调节图像的对比度,减轻传播路径衰减导致的RDM上远距离反射信号能量降低的影响:
式中:
其中,
在获得像素的梯度信息后,将整个图像分割成若干个等大小的细胞单元(cell),统计每个单元的梯度直方图,如图5所示. 为了压缩各单元的梯度变化范围,把细胞单元进一步组合成感知区域更大的块(block),对块内细胞单元的梯度直方图进行串联并归一化,形成当前块的HOG描述符. 将整个RDM的描述符拼接后便可以得到最终供分类使用的HOG特征.
图 5
2.2. 时序建模
在人工智能领域中,差分自回归移动平均模型(auto-regressive integrated moving average model,ARIMA)[23]和隐马尔科夫模型(hidden Markov model,HMM)[24]等传统的时序建模算法被广泛应用于各种任务中.近些年来,LSTM[25-26]在许多场合都展现出了更佳的表现. 作为循环神经网络(recurrent neural networks,RNN)的特例,LSTM利用细胞状态(cell state)隐状态(hidden state)在单元间的传递来存储信息,因此对长间隔的时序信息具有更好的建模效果.LSTM单元的信息流动情况如图6所示.
图 6
具体来说,LSTM通过3个门结构:遗忘门、输入门和输出门来决定对细胞状态的更新和构建输出. 遗忘门决定须从细胞单元中丢弃的信息,遗忘信号的表达式为
式中:
输入门通过对外部输入信息进行改造来构成细胞状态的输入信号:
式中:
利用式(6)~(8)计算得到的
式中:
式中:
3. 实 验
实验目的是通过实测数据来验证算法对4个目标的步态识别性能.
3.1. 数据采集
图 7
实验目标共有4人,信息如表1所示. 不同于前人论文中那些相互之间具有较大生物学区分度的实验目标[11-13],本研究所选取的目标年龄相仿且身体健康,因此步态特征较为接近,相对而言更具有挑战性. 系统探测范围设定为0~5 m,出于对典型行走动作的多普勒频率和采样定理的考虑,帧率设置为250帧/s. 对于每个目标来说,在雷达扫描时要求其独自在实验空间中自由行走,每个样本记录时长为2 s(2 s足够进行一次迈步),共收集534个步态样本. 沿着慢时间轴对样本信号进行分割,分割长度为100点,前后重叠50点,产生9个子信号. 须声明的是,分割时的参数是对计算量、时间分辨率和频率分辨率权衡考虑的结果,代表一种可行值. 对于子信号,利用奇异值分解(singular value decomposition,SVD)算法[27]滤除其位于低秩空间中的静态和低频杂波后生成一组RDM,在进行灰度化后将每个RDM的尺寸调整为64×32以降低计算复杂度,这样每个步态样本包括9张前后存在时序关系的RDM,以提供给后续的识别模型进行性能统计评估.
表 1 实验目标的物理特征
Tab.1
目标 | 身高/cm | 体重/kg | 目标 | 身高/cm | 体重/kg | |
目标1 | 170 | 55 | 目标3 | 181 | 75 | |
目标2 | 179 | 80 | 目标4 | 173 | 54 |
3.2. 性能评估
将数据集中4个实验目标,共2 136个样本依照7∶3的比例分为训练集和测试集,其中训练集用于交叉验证获取最优模型参数,测试集用于测试模型在真实数据下的实际表现. 在5折交叉验证下,原始训练集被随机分成5组,在每次迭代时其中4组作为训练集,剩余1组作为验证集,将5次迭代得到的平均性能作为模型的评价指标. 设定学习率(learning rate,LR)为3×10−5,迭代期数(epoch)为100. 模型的参数配置及其评估准确率如表2所示.
表 2 HOG及LSTM模型参数对比
Tab.2
HOG | LSTM | ||||
细胞尺寸 | 块尺寸 | 单元数 | 层数 | 准确率/% | |
8×8 | 3×3 | 32 | 1 | 76.45 | |
2 | 75.52 | ||||
64 | 1 | 77.26 | |||
2 | 77.66 | ||||
128 | 1 | 79.67 | |||
2 | 78.86 | ||||
12×12 | 2×2 | 32 | 1 | 70.70 | |
2 | 70.23 | ||||
64 | 1 | 71.64 | |||
2 | 71.04 | ||||
128 | 1 | 71.71 | |||
2 | 71.30 |
细胞尺寸和图像的感知域息息相关,由于实验中的RDM尺寸较小(64×32),过大的细胞尺寸会降低模型对细节信息的捕捉能力,导致识别性能下降,因此8×8的细胞尺寸和3×3的块尺寸效果较好.小尺寸带来的负面效果是对同样大小的图像区域须用更长的HOG描述符来进行描述,意味着特征维度的增加以及整个模型计算复杂度的提升. 时序建模网络的性能大致随着LSTM网络中单元数的提升而提高,但是LSTM层数的增加往往会带来更多的参数,在数据集较小的情况下会增加系统的不稳定性. 由表2的评估准确率可以看出,最优模型参数的评估准确率为79.67%. 在对应最优模型参数下,合并训练集和验证集,重新进行训练并在测试集上进行预测. 训练过程和在测试集上的混淆矩阵分别如图8和表3所示. 图中,
表 3 模型在测试集上的混淆矩阵
Tab.3
真实值 | 预测值 | FNR | |||
目标1 | 目标2 | 目标3 | 目标4 | ||
目标1 | 87.1% | 2.9% | 4.7% | 5.3% | 12.9% |
目标2 | 5.1% | 87.1% | 5.2% | 2.6% | 12.9% |
目标3 | 7.6% | 6.9% | 66.5% | 19.0% | 33.5% |
目标4 | 14.0% | 2.5% | 8.3% | 75.2% | 24.8% |
FPR | 26.7% | 12.3% | 18.2% | 26.9% | − |
图 8
图 8 训练集和测试集的分类准确率和损失
Fig.8 Classification accuracy and loss for training and testing sets
由图8中训练过程的准确率、损失曲线可以看出,随着迭代次数的提升,训练集准确率平稳上升,测试集准确率在到达约79.10%时便开始停滞不前;训练集和测试集之间的损失计算差距在60轮后加速增大,模型的泛化能力趋于下降. 因此,在实际应用时须控制模型的训练迭代次数,有必要牺牲一定的训练集表达性能来尽可能保留足够的泛化能力. 如表3所示为上述训练的模型在测试集上的分类表现,以混淆矩阵的形式给出各目标身份识别的精确率(precision)、漏警率(false negative rate,FNR)和虚警率(false positive rate,FPR). 比如,87.1%表示真实值为“目标1”的样本中有87.1%被模型识别成了“目标1”. 算法在目标2处表现较好,展现出较为理想的效果;对目标3的识别精确率较低(66.5%)、漏警率较高(33.5%),原因在于其行走的特征不突出,容易将其归为其他类别;目标1、4的行走状况变化较大,涵盖了其他目标的步态特性,因此容易误导其他目标的识别并产生较高的虚警率(分别为26.7%、26.9%). 总的来说,在实验环境中,所提算法在物理特征相近的目标之间表现出了较好的识别能力,且对目标行走条件的限制较少,更贴近实际应用的需求.
4. 结 语
所提出的基于慢时间分割的步态识别算法的创新点在于完整的保留了雷达信号中的时间、空间距离和多普勒频率的信息,而且无须限制目标的行走角度与路线. 在基于室内场景真实数据的实验中,对4个目标的验证准确率和测试准确率分别为79.67%、79.10%,展示了超宽带雷达在室内监控领域的应用前景.
接下来将一方面着重关注提高模型的泛化能力,通过优化结构或各部分算法进一步减轻过拟合现象;另一方面注重探索多人同时在场时的步态识别方法.
参考文献
Intelligent multi-camera video surveillance: a review
[J].DOI:10.1016/j.patrec.2012.07.005 [本文引用: 1]
A review of accelerometry-base-dwearable motion detectors for physical activity mon-itoring
[J].DOI:10.3390/s100807772 [本文引用: 1]
Radar signal processing for elderly fall detection: the future for in-home monitoring
[J].DOI:10.1109/MSP.2015.2502784 [本文引用: 1]
Micro-Doppler effect in radar: phenomenon, model, and simulation study
[J].
Human activity classification based on micro-Doppler signatures using a support vector machine
[J].DOI:10.1109/TGRS.2009.2012849 [本文引用: 1]
Fall detection using deep learning in range-Doppler radars
[J].
Deep convolutional autoencoder for radar-based classification of similar aided and unaided human activities
[J].DOI:10.1109/TAES.2018.2799758 [本文引用: 1]
Gait analysis methods: an overview of wearable and non-wearable systems, highlighting clinical applications
[J].DOI:10.3390/s140203362 [本文引用: 1]
Gait classification of young adults, elderly non-fallers, and elderly fallers using micro-doppler radar signals: simulation study
[J].DOI:10.1109/JSEN.2017.2678484 [本文引用: 2]
A humangait classification method based on radar Doppler spectrograms
[J].
Toward unobtrusive in-home gait analysis based on radar micro-doppler signatures
[J].
History of ultra wideband commun-ications and radar
[J].
微动目标雷达特征提取、成像与识别研究进展
[J].
Research progresses in radar feature extraction, imaging, and recognition of target with micro-motions
[J].
Prediction and modeling for the time-evolving ultra-wide band channel
[J].DOI:10.1109/JSTSP.2007.906662 [本文引用: 1]
Deep conv-olutional neural networks for computeraided detection: CNN architectures, dataset characteristics and transfer learning
[J].DOI:10.1109/TMI.2016.2528162 [本文引用: 1]
基于小波变换与差分自回归移动平均模型的微博话题热度预测
[J].
Topic popularity prediction of microblog based on wavelet transformation and ARIMA
[J].
BCFtools/RoH: a hidden Markov model approach for detecting autozygosity from next-generation sequencing data
[J].DOI:10.1093/bioinformatics/btw044 [本文引用: 1]
Analysis of clutter reduction techniques for through wall imaging in UWB range
[J].DOI:10.2528/PIERB09060903 [本文引用: 1]
/
〈 |
|
〉 |
