浙江大学学报(工学版), 2020, 54(5): 931-939 doi: 10.3785/j.issn.1008-973X.2020.05.010

机械工程

基于一维卷积神经网络的螺旋铣刀具磨损监测

汪海晋,, 尹宗宇, 柯臻铮,, 郭英杰, 董辉跃

Wear monitoring of helical milling tool based on one-dimensional convolutional neural network

WANG Hai-jin,, YIN Zong-yu, KE Zhen-zheng,, GUO Ying-jie, DONG Hui-yue

通讯作者: 柯臻铮,男,工程师,硕士. orcid.org/0000-0003-2995-0061. E-mail: kzzcaen@zju.edu.cn

收稿日期: 2019-11-30  

Received: 2019-11-30  

作者简介 About authors

汪海晋(1986—),男,助理研究员,从事航空难加工材料高效加工技术研究.orcid.org/0000-0003-4107-0745.E-mail:wanghaijin@zju.edu.cn , E-mail:wanghaijin@zju.edu.cn

摘要

基于传统机器学习的螺旋铣刀具磨损监测方法需要复杂的特征提取和丰富的经验知识,不同磨损阶段具有相同的错误分类代价,针对这些问题,结合电流信号一维性特点,提出基于一维卷积神经网络(1D CNN)和代价敏感学习的螺旋铣刀具磨损监测方法. 采集机器人螺旋铣末端执行器主轴、公转轴和进给轴电流作为监测信号,并采用滑动窗口法进行样本划分,在降低网络容量的同时增加样本数量和多样性;在网络损失函数中引入代价矩阵并增加急剧磨损阶段的错误分类代价,使得1D CNN具有代价敏感性;直接将电流时域信号输入1D CNN,网络可以自动提取刀具磨损特征,并将特征提取和不同磨损阶段分类融合在一起. 试验结果表明,在机器人螺旋铣系统中,该方法的刀具磨损监测准确率为99.29%,在急剧磨损阶段的查全率为99.60%.

关键词: 螺旋铣 ; 刀具磨损监测 ; 电流信号 ; 一维卷积神经网络(1D CNN) ; 代价敏感学习

Abstract

Helical milling tool wear monitoring methods based on traditional machine learning require complex feature extraction and rich experience, and different wear stages have the same misclassification cost. A new method based on the one-dimensional convolutional neural network (1D CNN) and cost-sensitive learning was introduced, aiming at the above problems and considering the characteristics of one dimension of current signals. Current signals are acquired through spindle, revolution shaft and feed shaft of robotic helical milling end-effector respectively as monitoring signals, and samples are divided using sliding window method to reduce network capacity and increase sample numbers and diversity at the same time. The cost matrix is introduced into the network loss function and the misclassification cost of severe wear stage is increased to make 1D CNN cost sensitive. The time domain current signals are input into 1D CNN directly, and the network can extract tool wear features automatically and unify feature extraction and classification of different wear stages together. Experiment results demonstrate that the tool wear monitoring accuracy of the proposed method is 99.29% and the recall of severe wear stage is 99.60% in the robotic helical milling system.

Keywords: helical milling ; tool wear monitoring ; current signal ; one-dimensional convolutional neural network (1D CNN) ; cost sensitive learning

PDF (1147KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

汪海晋, 尹宗宇, 柯臻铮, 郭英杰, 董辉跃. 基于一维卷积神经网络的螺旋铣刀具磨损监测. 浙江大学学报(工学版)[J], 2020, 54(5): 931-939 doi:10.3785/j.issn.1008-973X.2020.05.010

WANG Hai-jin, YIN Zong-yu, KE Zhen-zheng, GUO Ying-jie, DONG Hui-yue. Wear monitoring of helical milling tool based on one-dimensional convolutional neural network. Journal of Zhejiang University(Engineering Science)[J], 2020, 54(5): 931-939 doi:10.3785/j.issn.1008-973X.2020.05.010

由碳纤维增强复合材料(carbon fiber reinforced plastics, CFRP)和钛合金组成的CFRP/Ti叠层结构在质量较轻的同时具有比2种材料更优良的综合性能,在航空制造业得到广泛应用[1]. CFRP/Ti叠层的连接方式以机械连接为主,为了保证叠层孔的相对位置精度、孔径精度和加工效率,常采用一体化制孔,但2种材料性质差异较大,在传统钻孔时轴向力较大,易产生毛刺、撕裂、分层等加工缺陷[2]. 螺旋铣是新型制孔工艺,能有效减小轴向力,从而改善加工质量,在CFRP/Ti叠层结构制孔中已得到初步应用,但在制孔时刀具磨损严重[3],为了保证孔壁质量和尺寸精度,有必要采用刀具磨损监测.

实现刀具磨损监测的方法有直接法和间接法2种. 直接法中最典型的是机器视觉法[4],具有直观、准确率高的优点,但须停机测量,效率较低. 间接法是指通过采集刀具加工过程中的相关信号,进行信号处理并提取出能表征刀具磨损的特征,然后利用机器学习模型进行监测. 监测信号有振动信号[5]、力信号[6]和电流信号[7]等,其中电流信号采集方便,适宜工业应用. 用于刀具磨损监测的传统机器学习模型有支持向量机(support vector machine, SVM)[8]和人工神经网络(artificial neural network, ANN)[9]等. 传统机器学习模型存在2点不足:1)须先对采集到的信号进行复杂的信号处理,然后手工提取特征,需要丰富的经验知识,费时费力;2)将特征提取和分类作为2个部分分隔开,难以得到最优解.

深度学习在计算机视觉、语音识别、自然语言处理等领域取得了巨大成功,其中应用最广泛的就是卷积神经网络(convolution neural network, CNN)[10]. CNN与传统机器学习模型相比最大的优点是将特征提取和分类融合在一起,网络能从输入数据中自动提取特征. 近年来,也有学者将CNN应用到刀具磨损监测,但应用的是标准的二维卷积神经网络(two dimensional convolution neural network, 2D CNN),须先将原始一维时域信号变换到频域、时频域或者拼接多个一维时域信号得到二维图像信息,再应用2D CNN进行监测[11-13].

一维卷积神经网络(one dimensional convolution neural network, 1D CNN)与2D CNN的不同点在于卷积核尺寸,与后者相比,1D CNN具有如下优点:1)一维卷积只需向量运算,无需复杂的矩阵运算,大大降低运算开销,易保证实时性和低硬件成本;2)无需对原始信号进行变换处理,直接在时域上学习;3)1D CNN模型容量较低、参数较少,能在样本和迭代次数更少的情况下进行训练[14]. 1D CNN已在心电图监测[15]、建筑结构健康监测[16]、机械故障诊断[17]等领域得到应用,但在刀具磨损监测领域还鲜有应用.

刀具磨损监测领域还普遍存在2个问题:1)刀具处于初期磨损和急剧磨损阶段的样本数少于正常磨损阶段,存在样本类别不平衡问题;2)急剧磨损阶段的错误分类代价应大于初期磨损和正常磨损阶段的错误分类代价. 代价敏感学习不改变原始数据集的数据分布,是从算法层面解决上述问题的的有效方法.Zhang等[18]应用代价敏感深度置信网络提高枪钻的磨损监测准确率,Xu等[19]将增量式代价敏感支持向量机应用于端铣刀的断刀监测,有效缓解类别不平衡问题.

本研究以机器人螺旋铣系统中电流时域信号为监测信号,采用1D CNN模型进行自动特征提取和分类,对螺旋铣刀具的磨损状态进行监测. 为了解决样本类别不平衡和不同分类错误具有相同的代价的问题,通过在网络损失函数中引入代价矩阵并增加急剧磨损阶段的错误分类代价,进一步提高监测准确率和急剧磨损阶段的查全率.

1. 螺旋铣工艺

图1所示,螺旋铣由3种运动复合而成,即刀具绕自身轴线的自转运动、刀具绕孔中心的公转运动以及刀具沿孔中心轴线的进给运动,刀具中心的运动轨迹为螺旋线[20]. 通过改变偏心距,采用同一把刀具便能加工出不同直径的孔,提高刀具利用效率;偏心加工方式有利于切屑的排出和刀具的散热,刀具寿命和加工质量均得到提高.

图 1

图 1   螺旋铣运动示意图

Fig.1   Schematic of helical milling kinematics


螺旋铣刀具主要由侧刃和端刃组成,如图2所示. 在对CFRP/Ti叠层材料进行螺旋铣孔时,刀具磨损严重. 侧刃为间歇性切削,散热性较好,切削体积较小,磨损较轻;端刃为持续性切削,切削体积较大,故螺旋铣刀具的磨损主要发生在端刃. 本研究采用端刃后刀面参数 ${\rm{VB}}$作为判断螺旋铣刀具磨损程度的标准. 分为3个磨损阶段,VB≤0.1 mm对应初期磨损,0.1 mm<VB≤0.2 mm对应正常磨损,VB>0.2 mm对应急剧磨损.

图 2

图 2   硬质合金涂层螺旋铣孔专用刀具

Fig.2   Carbide tool of helical milling


2. 一维卷积神经网络

1D CNN网络结构和2D CNN类似,包括卷积层、池化层、全连接层和输出层等部分. 通过卷积层和池化层的交替使用,神经网络从输入信号中自动逐层提取特征,且越往后层所提取特征的抽象程度越高;将提取的特征送入全连接层和输出层进行分类,因此1D CNN能将特征提取和分类融合在一起.

2.1. 卷积层

卷积层由若干卷积核卷积运算得到的特征图组成,卷积核具有局部感知和参数共享的特性,在学习到多种特征表示的同时能大幅减少模型参数量. 1D CNN的输入是一维向量,因此网络的卷积核也是一维的,一维卷积运算可以表示为

$x_k^l = \sum\limits_{i = 1}^{{N_{l - 1}}} {{\rm{conv1D}} \ \left( {w_{ik}^{l - 1},s_i^{l - 1}} \right) + b_k^l} .$

式中: $x_k^l$$b_k^l$分别为第l层第k个神经元的输入和偏置, $w_{ik}^{l - 1}$为第l−1层第i个神经元与第l层第k个神经元之间的卷积核, $s_i^{l - 1}$为第l−1层第i个神经元的输出, ${N_{l - 1}}$为第l−1层神经元个数, ${\rm{conv1D \ (\cdot)}}$为一维卷积运算.

为了增加网络的非线性,在每个卷积操作之后通常还会应用激活函数. 为了防止梯度消失,加速网络的收敛,激活函数采用修正线性单元(rectified linear unit, ReLU),表达式为

$f\left( x \right) = \max \ \left( {0,x} \right).$

因此卷积层中每个神经元的最终输出为

$s_k^l = f(x_k^l).$

2.2. 池化层

池化实际上是降采样操作,通过使用某一位置相邻区域的总体统计特征作为网络在该位置的输出来减少特征图的尺寸和网络的参数量,同时可以有效避免网络过拟合. 常用的池化有最大值池化和均值池化,本研究采用最大值池化,即取某位置相邻区域内的最大值作为该位置的最终输出:

$s_k^l = \mathop {\max }\limits_{\left( {k - 1} \right)H + 1 \leqslant j \leqslant kH} \left( {s_j^{l - 1}} \right).$

式中:H为卷积核宽度.

2.3. 批标准化

为了避免各层神经元的内部协变量变化和梯度弥散,同时加速网络收敛速度,可以使用批标准化(batch normalization, BN)对每一隐含层进行标准化处理,使得每一层都具有相同的均值为0,方差为1的高斯分布:

$x_i' = \frac{{{x_i} - {\mu _{\rm{B}}}}}{{\sqrt {\sigma _{\rm{B}}^2 + \varepsilon } }},\;\; {y_i} = \gamma x_i' + \beta .$

式中: ${\mu _{\rm{B}}}$${\sigma _{\rm{B}}}$分别为批(batch)数据的均值和标准差; $\varepsilon $为避免分母为零的无穷小数; ${x_i}$$x_i'$分别为第 $i$个神经元批标准化前的输入和批标准化的中间输出; $\gamma $$\beta $分别为为了恢复网络表达能力引入的尺度变换因子和偏移因子,由网络学习得到; ${y_i}$为神经元批标准化后的最终输出.

3. 基于1D CNN的刀具磨损监测

3.1. 信号采集与预处理

电流信号采集方便,对加工设备无须做任何改装,在采集时不干扰加工过程,不受加工环境中切屑、油渍、振动等的干扰,因此本研究以电流作为监测信号. 监测电流信号实质上可以归为对力信号的监测范畴,李宏坤等[21]通过建立电流信号与切削力之间的数学模型,得出在理论上可以使用电流增量代替切向铣削力以反映刀具的磨损状态的结论. 三相交流电由三相频率相同、振幅相等、相位互差120°的交流电组成,故测量其中任意一相电流即可. 本研究分别采集螺旋铣末端执行器主轴、公转轴和进给轴3个轴伺服驱动器的U相电流作为监测信号.

若将加工一个孔采集的的整个时域信号作为网络输入,则网络输入层尺寸较大,会增加网络的容量和复杂度,不仅存在过拟合风险,也会大幅增加网络运行时间. 实际上,以加工一个孔的部分信号作为网络输入即可,因此,可以采用滑动窗口法将加工一个孔的信号按照一定步长划分为多个长度等于窗长的样本,如图3所示,不仅降低了网络输入层尺寸,也增加了样本的数量和多样性. 若原始信号长度为L,滑动窗口大小为W,步长为S,则一段信号划分得到的样本个数为

图 3

图 3   滑动窗口法进行样本划分示意图

Fig.3   Schematic diagram of sample division using sliding window method


$M = \left\lfloor {\frac{{L - W}}{S}} \right\rfloor + 1.$

式中: $\left\lfloor {} \right\rfloor $代表向下取整,若 $S < W$则相邻2个滑动窗口间存在重叠,否则不存在重叠.

电流信号中存在的少量噪声有利于防止网络过拟合和提高网络的鲁棒性[21],因此本研究不对电流信号进行降噪预处理.

3个轴间的电流数值相差较大,还须经过标准化处理:

$z_i' = ({{{z_i} - {\mu _z}}})/{\sigma _z}.$

式中: ${\mu _z}$${\sigma _z}$分别为输入信号z的均值和标准差, ${z_i}$$z_i'$分别为标准化前的原始信号和标准化后的网络最终输入.

3.2. 网络结构

与图像信号的三通道类似,可以将3个轴的电流视为3个通道作为网络的输入,网络结构图如图4所示. 在2D CNN中一般采用小卷积核,因为通过级联多层小卷积核不仅可以获得和大卷积核相同的感受野,还能增强网络非线性表达能力,同时降低卷积参数量. 例如假设输入和输出通道数均为C,级联2层3×3卷积核具有和5×5卷积核相同的感受野,但级联2层3×3卷积核的参数量为18C2,而使用5×5卷积核的参数量为25C2. 不过,1D CNN卷积核尺寸是标量,2D CNN卷积核是二维矩阵,因此在1D CNN中上述规律并不成立,如级联2层尺寸为3的卷积核的参数量为6C2,而尺寸为5的卷积核的参数量为5C2,因此在1D CNN中应使用大的卷积核. 本研究第1层卷积层采用尺寸为21的大卷积核,之后卷积核尺寸逐层降低,且所有卷积层的步长均为2,使特征图尺寸减半. 每层卷积层后均接卷积核尺寸为2、步长为2的最大值池化层,再次使特征图尺寸减半. 第1层卷积层通道数为32,网络后层每层通道数依次扩大2倍或保持不变. 最后一层池化层输出尺寸为3×128,展平成384维向量形式,最后接2层全连接层进行分类.

图 4

图 4   1D CNN网络结构

Fig.4   Network structure of 1D CNN


在每层卷积操作之后,激活函数之前均添加了BN层. 为了避免网络过拟合,在最后一层池化层后的展平层使用随机失活(dropout)技巧,即在训练过程中将隐含层各个神经元的输出以 $p = 0.5$的概率置零,从而降低神经元间的相互依赖性,降低结构风险,网络具体参数如表1所示.

表 1   1D CNN网络结构参数

Tab.1  Network structure parameters of 1D CNN

操作 卷积核 步长 通道数 激活函数 输出尺寸
卷积1 21 2 32 ReLU 790×32
池化1 2 2 32 395×32
卷积2 16 2 64 ReLU 190×64
池化2 2 2 64 95×64
卷积3 12 2 64 ReLU 42×64
池化3 2 2 64 21×64
卷积4 10 2 128 ReLU 6×128
池化4 2 2 128 3×128
展平 384
随机失活 192
全连接1 ReLU 128
全连接2 Softmax 3

新窗口打开| 下载CSV


3.3. 损失函数和网络训练

神经网络分类任务中最常用的损失函数是交叉熵损失函数:

${{J}} = - \frac{1}{N}\sum\limits_{n = 1}^N {{{{d}}_n}\lg\; {{{{\rm{e}}^{{y_n}}}}}\Big/{{\sum\nolimits_{i = 1}^K {{{\rm{e}}^{{y_i}}}} }}} .$

式中: ${{{d}}_n}$${y_n}$分别为第n个样本的真值向量和模型预测值,N为总样本数,K为总类别数.

交叉熵损失函数隐式地假设所有的分类错误具有相同的代价,因此在采用标准交叉熵损失函数时模型为代价不敏感模型. 但是,在刀具磨损监测领域普遍存在以下2个问题:1)处于初期磨损和急剧磨损2个阶段的样本数一般少于处于正常磨损阶段的样本数,存在类别不平衡问题,导致样本数少的类别在损失函数中比重较小,无法得到充分训练,模型在分类时会倾向于样本数多的类别;2)实际上不同分类错误所造成的代价或损失是不同的. 若将处于初期磨损或正常磨损阶段的刀具错误分类为急剧磨损,造成的代价是须提前更换刀具,刀具寿命没有得到充分利用. 若将处于急剧磨损阶段的刀具错误分类为初期磨损或正常磨损阶段,造成的代价则是从该孔开始加工质量不合格,增加时间成本和物料成本,代价远大于前种分类错误.

代价敏感学习是从算法层面上解决上述问题的有效方法. 代价敏感学习的核心是通过构建代价矩阵C,对不同的分类错误施加不同的惩罚或代价:

${{C}} = \left[ {\begin{array}{*{20}{c}} {{c_{1,1}}}&{{c_{1,2}}}& \cdots &{{c_{1,K}}} \\ {{c_{2,1}}}&{{c_{2,2}}}& \cdots &{{c_{2,K}}} \\ \vdots & \vdots & & \vdots \\ {{c_{K,1}}}&{{c_{K,2}}}& \cdots &{{c_{K,K}}} \end{array}} \right].$

式中: ${c_{p,q}}$为将类别p错误分类为类别q的代价,数值越大表示该类别的错误分类代价越大,且有 ${c_{p,p}} = 0$.

通过将代价矩阵C融入到交叉熵损失函数中,可以得到代价敏感的交叉熵损失函数[22],从而得到代价敏感1D CNN模型:

${{J}} = - \frac{1}{N}\sum\limits_{n = 1}^N {{{{d}}_n}\lg\; \frac{{{c_{p,n}}{{\rm{e}}^{{y_n}}}}}{{\sum\nolimits_{j = 1}^K {{c_{p,j}}{{\rm{e}}^{{y_j}}}} }}} .$

式中: $p = \arg \max \ \left( {{{{d}}_n}} \right)$为第n个样本的实际类别.

采用基于梯度下降法的误差反向传播算法对网络进行训练. 学习率若设置过大,网络会振荡不易收敛,若过小则收敛缓慢,增加训练时间,本研究取初始学习率为0.001,之后学习率按指数方式衰减. 采用Adam作为优化器,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,参数更新较平稳. 批大小为256,共迭代50次,并采用早停策略防止网络过拟合. 整个模型基于深度学习开源框架TensorFlow,在GTX 1060Ti GPU上进行训练和测试.

4. 试验验证

4.1. 试验设置

在机器人螺旋铣系统中进行试验验证. 试验系统主要由KUKA KR360型工业机器人、螺旋铣末端执行器、MIK-DJI-30A和MIK-DJI-1A霍尔电流传感器、Dino-Lite超景深三维显微镜、Smacq USB 1252信号采集卡、试验件和计算机等组成,如图5所示. 螺旋铣末端执行器如图6所示,主要由主轴、公转轴、进给轴和压脚等组成. 工业机器人带动末端执行器到达待加工位置,压脚伸出并压紧工件,3个轴同时运动完成螺旋铣孔.

图 5

图 5   机器人螺旋铣系统

Fig.5   Robotic helical milling system


图 6

图 6   螺旋铣末端执行器

Fig.6   Helical milling end-effector


螺旋铣刀具具体参数如表2所示,螺旋铣刀具有4个圆周对称分布的端刃,本研究每次只取磨损最严重的一个端刃进行测量.

表 2   螺旋铣刀具参数

Tab.2  Parameters of helical milling tool

材料 前角/(°) 后角角/(°) 螺旋角/(°) 直径/mm 悬长/mm 总长/mm
YG8 5 10 40 7.5 28 80

新窗口打开| 下载CSV


CFRP板材料为QY9611-T700,厚度为6.0 mm,钛合金材料为TC4-DT,厚度为8.5 mm. CFRP层间强度较低、断裂应变较小,可以高速切削;钛合金导热性能较差、切削温度较高,应低速切削,因此螺旋铣削CFRP/Ti叠层材料采用变参数加工方式,并在距CFRP出口2.0 mm处转变加工参数,防止切入钛合金时切削速度过大对刀具和工件造成破坏. 为了避免影响复材性能,试验在干切削工况下进行,采用气冷方式,具体加工参数如表3所示. 表中,ns为主轴转速,nr为公转轴转速,vf为进给速度,e为偏心量.

表 3   CFRP/Ti叠层螺旋铣加工参数

Tab.3  Helical milling parameters of CFRP/Ti stacks

材料 ns/( ${\rm{r}} \cdot {\min ^{ - 1}}$) nr/( ${\rm{r}} \cdot {\min ^{ - 1}}$) vf /( ${\rm{mm}} \cdot {{\rm{s}}^{{\rm{ - 1}}}}$) e/mm
CFRP 10 000 720 1.0 1.0
钛合金 2 000 720 0.4 1.0

新窗口打开| 下载CSV


4.2. 数据分析

CFRP/Ti叠层为变参数加工方式,工件材料变化和加工参数变化都将影响到电流信号. 以刀具正常磨损阶段的主轴电流信号为例,如图7所示. 图中,I为电流. 可以看出,CFRP层电流信号的波动程度和均值都大于钛合金层电流信号,若将CFRP层电流信号和钛合金层电流信号混合作为模型的输入,必定会影响到刀具磨损监测效果,因此应选择其中一层材料的电流信号作为监测信号. 钛合金层电流波动较大,有利于刀具磨损监测,且在加工钛合金层时进给速度较小,记录的信号长度更长,划分得到的样本数更多,因此本研究只以加工钛合金层电流为监测信号,并截取端刃完全切入钛合金层和端刃刚切出钛合金层中间的18 s信号进行记录. 采样频率设为800 Hz,因此加工一个孔记录的信号共有14 400个数据点. 将各磨损阶段采集到的电流信号按照3.1节所述方法进行样本划分,取 $W = 1\;600$$S = $ 800,即每个样本包含2 s电流信号,每2个相邻样本间存在1 s信号的重叠量,因此加工一个孔记录的信号可以划分得到17个样本.

图 7

图 7   正常磨损阶段主轴电流信号

Fig.7   Current signals of normal wear stage


共采集5把螺旋铣刀具全生命周期的加工电流信号,将其中3把刀具的电流信号经过样本划分后得到的2 567个样本作为训练集对模型进行训练,将剩下2把刀具的电流信号经过样本划分后得到的1 700个样本作为测试集对模型的泛化性能进行测试,本研究建立的电流信号数据集基本情况如表4所示. 表中,S1、S2、S3分别为初期磨损阶段、正常磨损阶段和急剧磨损阶段.

表 4   电流信号数据集样本数量

Tab.4  Sample size of current signal dataset

数据集 训练集 测试集
S1 561 374
S2 1 258 833
S3 748 493
合计 2 567 1 700

新窗口打开| 下载CSV


4.3. 试验结果

在分类问题中可以将样本根据其实际类别与模型预测结果间的关系划分为真正例(true positive, TP),假正例(false positive, FP),真反例(true negative, TN)与假反例(false negative, FN)4种情况,然后采用混淆矩阵的形式对模型的预测结果进行直观展示[23]. 以二分类问题为例,其分类结果的混淆矩阵如表5所示.

表 5   二分类结果的混淆矩阵

Tab.5  Confusion matrix of binary classification result

实际类别 预测结果
正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)

新窗口打开| 下载CSV


在得到分类结果的混淆矩阵后,可以计算出准确率(accuracy, A)、查准率(precision, P)、查全率(recall, R)与F1分数4个指标从不同角度全面评价模型. 准确率表示分类正确的样本数占样本总数的比例,衡量模型在所有类别上的整体分类效果. 另外3个指标衡量每一类别的分类效果,其中查准率为被分类为某类别的样本中实际类别为该类别样本的比例;查全率为在所有实际类别为某类别的样本中被正确分类为该类别的样本的比例;查准率和查全率是一对矛盾的指标,当一个指标数值较大时另一个指标数值必定较小;F1分数为查准率和查全率的调和平均值,综合评价每一类别的分类效果.4个指标的计算公式如下:

$A = \frac{{{\rm{TP + TN}}}}{{{\rm{TP}} + {\rm{TN}} + {\rm{FP}} + {\rm{FN}}}},$

$P = {{{\rm{TP}}} / {\left( {{\rm{TP}} + {\rm{FP}}} \right)}},$

$R = {{{\rm{TP}}} / {\left( {{\rm{TP}} + {\rm{FN}}} \right)}},$

${F_1} = {{2PR}}/({{P + R}}).$

为了验证基于1D CNN模型的螺旋铣刀具磨损监测方法的可行性,采用SVM和ANN神经网络2种传统机器学习模型进行对比试验. 手工提取的特征有时域中的均值、标准差、裕度、峭度和歪度,频域特征中的重心频率、均方根频率和频率标准差,时频域特征为电流信号经4层db3小波包分解后前8个频带的能量百分比. 因存在随机误差,每种模型均单独训练和测试5次,试验结果如图8所示. 图中,T为试验次数. 可以看出,1D CNN模型的识别准确率均大于99.00%,SVM、ANN神经网络模型的准确率分别约为96.00%、94.50%,验证了本研究方法的可行性和1D CNN模型强大的特征提取与分类能力.

图 8

图 8   不同监测模型的准确率

Fig.8   Accuracy of different monitoring models


损失函数采用标准交叉熵损失的代价不敏感1D CNN模型在测试集上的混淆矩阵和各磨损阶段的评价指标分别如表67所示. 可以看出,初期磨损阶段的样本数最少,有4个样本被错误分类为正常磨损,查准率和查全率分别为99.20%、98.93%,螺旋铣刀具端刃初期磨损如图9(a)所示;正常磨损阶段的样本数最多,且只有2个分类错误的样本,因此查全率在3个磨损阶段中最高,为99.76%,螺旋铣刀具端刃正常磨损如图9(b)所示;急剧磨损阶段的查准率在3个磨损阶段中最高,为99.79%,分别有2、6个样本被错误分类为初期磨损和正常磨损,因此查全率最低,为98.38%,螺旋铣刀具端刃急剧磨损如图9(c)所示. 3个磨损阶段的F1分数相差不大,正常磨损阶段的稍高. 准确识别刀具是否处于急剧磨损阶段是刀具磨损监测的主要目的,但急剧磨损阶段被错误分类的样本数最多,查全率最低,因此有必要进一步优化模型.

表 6   代价不敏感1D CNN混淆矩阵

Tab.6  Confusion matrix of cost insensitive 1D CNN

实际类别 预测结果
S1 S2 S3
S1 370 4 0
S2 1 831 1
S3 2 6 485

新窗口打开| 下载CSV


表 7   代价不敏感1D CNN评价指标

Tab.7  Evaluation criteria of cost insensitive 1D CNN

类别 A/% P/% R/% F1/%
S1 99.18 99.20 98.93 99.06
S2 99.18 98.81 99.76 99.28
S3 99.18 99.79 98.38 99.08

新窗口打开| 下载CSV


图 9

图 9   螺旋铣刀具3个磨损阶段

Fig.9   Three wear stages of helical milling tool


将急剧磨损阶段被错误分类为正常磨损和初期磨损阶段的代价分别设置为其他磨损阶段被错误分类代价的2倍和3倍,代价敏感1D CNN模型在测试集上的混淆矩阵和各磨损阶段的评价指标分别如表89所示. 可以看出,在增加急剧磨损阶段的错误分类代价之后,该磨损阶段仅有2个样本被错误分类为正常磨损,查全率由93.38%提升到99.60%,在3个磨损阶段中最高. 模型整体准确率由99.18%提升到99.29%,3个磨损阶段的F1分数均得到提升. 不过急剧磨损阶段的查准率由99.79%降低到98.99%,这是提升其查全率不可避免的代价. 综合看来,采用代价敏感学习提升了急剧磨损阶段的查全率和模型整体准确率,提升了螺旋铣刀具磨损监测的实际意义.

表 8   代价敏感1D CNN混淆矩阵

Tab.8  Confusion matrix of cost sensitive 1D CNN

实际类别 预测结果
S1 S2 S3
S1 370 3 1
S2 2 827 4
S3 0 2 491

新窗口打开| 下载CSV


表 9   代价敏感1D CNN评价指标

Tab.9  Evaluation criteria of cost sensitive 1D CNN

类别 A/% P/% R/% F1/%
S1 99.29 99.46 98.93 99.21
S2 99.29 99.40 99.28 99.34
S3 99.29 98.99 99.60 99.29

新窗口打开| 下载CSV


4.4. 特征可视化

为了验证1D CNN对原始时域信号的特征提取能力,采用主成分分析(principal component analysis, PCA)对模型倒数第2层全连接层学习到的特征进行降维和可视化,结果如图10所示. 图中,PC1、PC2分别为降维后的第1、2主成分. 可以看出,同一磨损阶段的数据能很好地聚集在一起,不同磨损阶段的数据具有较好的可分性,验证了1D CNN能从原始时域信号中自适应提取有效的特征以实现精确的刀具磨损监测.

图 10

图 10   学习特征主成分分析

Fig.10   Principal component analysis of learned features


5. 结 论

(1)以电流信号为监测信号进行螺旋铣刀具磨损状态监测是可行的,具有实际应用价值.

(2)1D CNN具有强大的自适应特征提取能力和将特征提取与分类融合在一起的特性,与传统机器学习模型相比具有更好的监测效果,准确率大于99.00%.

(3)采用代价敏感学习可以有效缓解样本类别不平衡和不同磨损阶段具有相同的错误分类代价的问题,模型整体准确率由99.18%提高到99.29%,急剧磨损阶段的查全率由98.38%提高到99.60%,提升了螺旋铣刀具磨损监测的实际意义.

参考文献

PARK K H, BEAL A, KIM D W, et al

Tool wear in drilling of composite/titanium stacks using carbide and polycrystalline diamond tools

[J]. Wear, 2011, 271 (11/12): 2826- 2835

[本文引用: 1]

陈燕, 葛恩德, 傅玉灿, 等

碳纤维增强树脂基复合材料制孔技术研究现状与展望

[J]. 复合材料学报, 2015, 32 (2): 301- 316

[本文引用: 1]

CHEN Yan, GE En-de, FU Yu-can, et al

Review and prospect of drilling technologies for carbon fiber reinforced polymer

[J]. Acta Materiae Compositae Sinica, 2015, 32 (2): 301- 316

[本文引用: 1]

PEREIRA R B D, BRANDÃO L C, PAIVA A P, et al

A review of helical milling process

[J]. International Journal of Machine Tools and Manufacture, 2017, 120: 27- 48

DOI:10.1016/j.ijmachtools.2017.05.002      [本文引用: 1]

KLANCNIK S, FICKO M, BALIC J, et al

Computer vision-based approach to end mill tool monitoring

[J]. International Journal of Simulation Modelling, 2015, 14 (4): 571- 583

DOI:10.2507/IJSIMM14(4)1.301      [本文引用: 1]

GIERLAK P, BURGHARDT A, SZYBICKI D, et al

On-line manipulator tool condition monitoring based on vibration analysis

[J]. Mechanical Systems and Signal Processing, 2017, 89: 14- 26

DOI:10.1016/j.ymssp.2016.08.002      [本文引用: 1]

NOURI M, FUSSELL B K, ZINITI B L, et al

Real-time tool wear monitoring in milling using a cutting condition independent method

[J]. International Journal of Machine Tools and Manufacture, 2015, 89: 1- 13

DOI:10.1016/j.ijmachtools.2014.10.011      [本文引用: 1]

ZHOU Y Q, XUE W

Review of tool condition monitoring methods in milling processes

[J]. The International Journal of Advanced Manufacturing Technology, 2018, 96: 2509- 2523

DOI:10.1007/s00170-018-1768-5      [本文引用: 1]

LIN X K, ZHOU B, ZHU L

Sequential spindle current-based tool condition monitoring with support vector classifier for milling process

[J]. The International Journal of Advanced Manufacturing Technology, 2017, 92 (9−12): 3319- 3328

DOI:10.1007/s00170-017-0396-9      [本文引用: 1]

PATRA K, JHA A K, SZALAY T, et al

Artificial neural network based tool condition monitoring in micro mechanical peck drilling using thrust force signals

[J]. Precision Engineering, 2017, 48: 279- 291

DOI:10.1016/j.precisioneng.2016.12.011      [本文引用: 1]

沈延斌, 陈岭, 郭浩东, 等

基于深度学习的放置方式和位置无关运动识别

[J]. 浙江大学学报: 工学版, 2016, 50 (6): 1141- 1148

[本文引用: 1]

SHEN Yan-bin, CHEN Ling, GUO Hao-dong, et al

Deep learning based activity recognitionindependent of device orientation and placement

[J]. Journal of Zhejiang University: Engineering Science, 2016, 50 (6): 1141- 1148

[本文引用: 1]

ZHAO R, YAN R Q, CHEN Z H, et al

Deep learning and its applications to machine health monitoring

[J]. Mechanical Systems and Signal Processing, 2019, 115: 213- 237

DOI:10.1016/j.ymssp.2018.05.050      [本文引用: 1]

AGHAZADEH F, TAHAN A, THOMAS M

Tool condition monitoring using spectral subtraction and convolutional neural networks in milling process

[J]. The International Journal of Advanced Manufacturing Technology, 2018, 98 (9−12): 3217- 3227

DOI:10.1007/s00170-018-2420-0     

TERRAZAS G, MARTÍNEZ-ARELLANO G, BENARDOS P, et al

Online tool wear classification during dry machining using real time cutting force measurements and a CNN approach

[J]. Journal of Manufacturing and Materials Processing, 2018, 2 (4): 72

DOI:10.3390/jmmp2040072      [本文引用: 1]

KIRANYAZ S, INCE T, ABDELJABER O, et al. 1-D convolutional neural networks for signal processing applications [C]// 2019 IEEE International Conference on Acoustics, Speech and Signal Processing. United Kingdom: IEEE, 2019: 8360-8364.

[本文引用: 1]

GIANNAKAKIS G, TRIVIZAKIS E, TSIKNAKIS M, et al. A novel multi-kernel 1D convolutional neural network for stress recognition from ECG [C]// International Conference on Affective Computing and Intelligent Interaction Workshops and Demos. United Kingdom: ACⅡW, 2019: 1-4.

[本文引用: 1]

ZHANG Y Q, MIYAMORI Y, MIKAMI S C, et al

Vibration-based structural state identification by a 1-dimensional convolutional neural network

[J]. Computer-Aided Civil and Infrastructure Engineering, 2019, 34 (9): 822- 839

DOI:10.1111/mice.12447      [本文引用: 1]

WU C Z, JIANG P C, DING C, et al

Intelligent fault diagnosis of rotating machinery based on one-dimensional convolutional neural network

[J]. Computers in Industry, 2019, 108: 53- 61

DOI:10.1016/j.compind.2018.12.001      [本文引用: 1]

ZHANG C, TAN K C

A cost-sensitive deep belief network for imbalanced classification

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30 (1): 109- 122

DOI:10.1109/TNNLS.2018.2832648      [本文引用: 1]

XU G, ZHOU H, CHEN J

CNC internal data based incremental cost-sensitive support vector machinemethod for tool breakage monitoring in end milling

[J]. Engineering Applications of Artificial Intelligence, 2018, 74: 90- 103

DOI:10.1016/j.engappai.2018.05.007      [本文引用: 1]

董辉跃, 朱灵盛, 章明, 等

飞机蒙皮切边的螺旋铣削

[J]. 浙江大学学报:工学版, 2015, 49 (11): 2033- 2039

[本文引用: 1]

DONG Hui-yue, ZHU Ling-sheng, ZHANG Ming, et al

Orbital milling method of aircraft skins trimming

[J]. Journal of Zhejiang University: Engineering Science, 2015, 49 (11): 2033- 2039

[本文引用: 1]

李宏坤, 郝佰田, 代月帮, 等

基于压缩感知和加噪堆栈稀疏自编码器的铣刀磨损程度识别方法研究

[J]. 机械工程学报, 2019, 55 (14): 1- 10

[本文引用: 2]

LI Hong-kun, HAO Bai-tian, DAI Yue-bang, et al

Wear status recognition for milling cutter based on compressed sensing and noise stacking sparse auto-encoder

[J]. Journal of Mechanical Engineering, 2019, 55 (14): 1- 10

[本文引用: 2]

KHAN S H, HAYAT M, BENNAMOUN M, et al

Cost-sensitive learning of deep feature representations from imbalanced data

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 29 (8): 3573- 3587

[本文引用: 1]

SHAIKH N H, ALI G, SHAH M A, et al

Result analysis and performance evaluation of ACENET through confusion matrix technique on standard dataset

[J]. Australian Journal of Basic and Applied Sciences, 2010, 4 (5): 851- 858

[本文引用: 1]

/