<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 MCGAN网络结构图

Fig.1 Diagram of MCGAN network structure

2.1. MCGAN目标函数

为了提高生成细胞图像的亮度及边缘清晰度，在pix2pix目标函数的基础上引入梯度相似性损失函数 ${L_{{\rm{GS}}}}$，其输出范围为[0，1.0]，越接近0图像生成质量越好，本文将 ${L_{{\rm{GS}}}}$最小化，并从过亮度、对比度、梯度结构共3个方面评估生成图像和真实图像的相似性，保证图像生成质量. 提取原图和生成图像的梯度计算采用Sobel算子，包括垂直边缘算子和水平边缘算子，梯度幅值计算公式为

(5) ${G_{\boldsymbol{x}}}\left( {{{i}},{{j}}} \right) = \frac{{\partial {\boldsymbol{x}}\left( {{{i}},{{j}}} \right)}}{{\partial {{i}}}}+\frac{{\partial {{x}}\left( {{{i}},{{j}}} \right)}}{{\partial {{j}}}}.$

式中： ${{\partial {\boldsymbol{x}}\left( {{{i}},{{j}}} \right)}}/{{\partial {{i}}}}$、 ${{\partial {\boldsymbol{x}}\left( {{{i}},{{j}}} \right)}}/{{\partial {{j}}}}$分别为使用水平、垂直边缘算子计算得到的梯度分量； $ {i}$、 ${j} $分别为图像水平方向、竖直方向上的像素. 梯度相似性（gradient similarity，GS）定义为

(6) $V\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = {\left[ {l\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)} \right]^\alpha }{\left[ {c\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)} \right]^\beta }{\left[ {e\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)} \right]^\gamma }.$

(7) $l\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = \frac{{2{u_{\boldsymbol{x}}}+{u_{\boldsymbol{g}}}+{c_1}}}{{u_{\boldsymbol{x}}^2+u_{\boldsymbol{g}}^2+{c_1}}},$

(8) $c\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = \frac{{2{\sigma _{\boldsymbol{x}}}\sigma _{\boldsymbol{g}}+{c_2}}}{{{\sigma _{\boldsymbol{x}}}^2+\sigma _{\boldsymbol{g}}^2+{c_2}}},$

(9) $e\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = \frac{{{2\displaystyle\sum\limits_{{j}} {\displaystyle\sum\limits_{{i}}} {G_{\boldsymbol{x}}}\left( {{{i}},{{j}}} \right)} {G_{\boldsymbol{g}}}\left( {{{i}},{{j}}} \right)+{c_3}}}{{{\displaystyle\sum\limits_{{j}}{\displaystyle\sum\limits _{{i}}} {{\left[ {{G_{\boldsymbol{x}}}\left( {{{i}},{{j}}} \right)} \right]}^2}+{\displaystyle\sum\limits_{j}{\displaystyle\sum\limits_{{i}}} {{\left[ {{G_{\boldsymbol{g}}}\left( {{{i}},{{j}}} \right)} \right]}^2}} +{c_3}} }}.$

式中： $ l\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)$为真实图像x、生成图像g的亮度函数； $ c\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)$为对比度函数； $ e\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right)$为梯度结构函数； ${{u_{\boldsymbol{x}}}}$、 ${{u_{\boldsymbol{g}}}}$为图像的平均像素值； $ {{\sigma _{\boldsymbol{x}}}}$、 $ {{\sigma _{\boldsymbol{g}}}}$为图像像素值的标准差； $ c_1$、 $ c_2$、 $ c_3$为常数，用于避免分母为0；α、β、γ为常数，用于调整各分量的重要程度. 由式（5）~（9）可得，梯度相似性损失函数为

(10) ${L_{{\rm{GS}}}}\left( H \right){\rm{ = 1}} - \frac{{\rm{1}}}{N}\sum\limits_{H{\rm{ = 1}}}^H {V\left( H \right)} .$

式中：N为图像中像素个数，H为像素块的中间像素值. 在细胞检测阶段，采用交叉熵损失函数为

(11) ${L_{{\rm{class}}}} = \frac{1}{W}\sum\limits_i {{L_i}} - \sum\limits_{c = 1}^K {{y_{ic}}\log \left( {{p_{ic}}} \right)} .$

式中：W为最小训练批次；K为类别的数量； ${y_{{\rm{ic}}}}$取0或1，如果该类别与样本类别相同则为1，否则为0； ${p_{{\rm{ic}}}}$为样本属于类别c的概率.

综上，MCGAN网络的目标函数为：

(12) $ \begin{split} \mathop {\min }\limits_G \mathop {{\rm{max}}}\limits_D V\left( {G,D} \right) =& {L_{{\rm{CGAN}}}}\left( {G,D} \right)+{\lambda _{\rm{1}}}{L_{{\rm{L1}}}}\left( G \right)+\\ & {\lambda _{\rm{2}}}{L_{{\rm{GS}}}}\left( G \right)+{L_{{\rm{class}}}}. \end{split} $

式中： ${\lambda _{\rm{1}}}$、 ${\lambda _{\rm{2}}}$为常数项.

2.2. MCGAN生成器结构

MCGAN生成器结构如图2中所示。

图 2

图 2 MCGAN生成器结构图

Fig.2 Diagram of MCGAN generator structure

由图2可知，生成器由编码器和解码器组成，生成器首先输入细胞位置掩膜和梯度掩膜，经过8层卷积和8层反卷积，其中卷积层激活函数采用带泄露的整流函数（leaky rectified linear units，LReLU），梯度设置为0.2，为了加速网络的收敛，在每层卷积后都使用批量归一（batch-normalization，BN）；反卷积层激活函数采用线性修正单元（rectified linear units，ReLU），最后一层使用双曲正切作为激活函数生成图像，并在每次反卷积过后都使用模块提取到的特征图和与之相应成镜像关系的卷积层特征图进行跳跃连接（skip-connect），对应特征图直接叠加后传入下一层，融合深层和浅层的特征. 原始的条件GAN输入的是条件y与噪声向量z共2种信息，在本文的生成器中只使用条件信息，因此不能生成多样性的结果，在训练时，本文在生成器的前4层反卷积输出时使用随机丢弃部分参数（dropout），不仅能防止网络过拟合，还在一定程度上增加了生成样本的多样性.

2.3. MCGAN鉴别器结构

MCGAN鉴别器与原始GAN仅输入生成图像和真实图像不同，它是把掩膜图像与生成细胞图像、掩膜图像与真实细胞图像一起成对输入鉴别器中鉴别真假，以此保证生成细胞图像与输入细胞位置掩膜的信息一致. 为了提高鉴别器对生成细胞样本不同尺度上细节信息上的鉴别能力，本文对现有条件生成对抗网络鉴别器做出以下2点改进. 1）将现有条件GAN的鉴别器中卷积操作全部替换成多尺度卷积操作（M-conv），如图3（a）所示. 对输入图片分别使用1×1、3×3、5×5共3种不同尺度的卷积核提取特征，采用级联的方式拼接这些包含多尺度信息的特征图，接着输入尺寸为1×1的卷积核进行特征映射，生成新的特征图，输入下一层. 2）在鉴别器中加入多尺度池化结构模块（MPS-block），该模块如图3（b）所示. 具体操作为将前一多尺度卷积操作的特征图，分别通过4种不同核大小的池化操作；为了维护全局特性的权重，在每个池化操作后分别用1×1卷积，将对应级别的通道数量降为原本的1/N；通过双线性插值直接对低维特征图进行上采样，得到与原始特征映射相同尺寸的特征图；将不同级别的特征在倒数第一个维度上进行拼接，作为最终多尺度池化的全局特性输入到下一层.

图 3

图 3 多尺度操作结构图

Fig.3 Diagram of multi-scale operation structure

大多数现有鉴别器在提取原图与生成图像特征进行鉴别时几乎都只使用较小或较大的感受野，并在一个维度上进行学习，但实际上，图像的结构信息往往是不同尺度的，单一尺度的特征提取不足以完全鉴别图像的高频纹理区域. 改进鉴别器的作用：通过不同尺度卷积和池化操作，融合不同尺度的特征，提高鉴别器对生成图像微观纹理和宏观几何特征的鉴别能力，促进生成器生成细节信息更逼真的细胞样本以提高细胞分类检测的精度. 鉴别器最后一层为全连接，其输出为真假二分类问题，故激活函数采用Sigmoid函数.

2.4. MCGAN分类检测器结构

全卷积神经网络（full convolutional neural network，FCNN）^[15]是将卷积神经网络（convolutional neural network，CNN）^[16]的全连接层全部替换为卷积层得来的，由于CNN在对图像进行分类时不能识别图片中特定部位的物体，只能得到输入图像属于某一类的概率，不能满足细胞分类检测需求. 本文将CNN中的全连接层替换为卷积层，采用反卷积层对网络最后一个卷积层提取到的特征图进行上采样，使它恢复到与输入图像相同的尺寸，实现对图像的每个像素值都产生一个预测，同时保留原始输入图像中的空间信息，在上采样的特征图上进行逐像素分类. 为了得到更精确的分类结果，在全卷积网络中每次反卷积过后都使用跳跃连接来融合图像浅层和深层的特征，具体结构同MCGAN中的生成器结构一致. 网络测试时，在细胞分类检测器的输出后面加入聚类算法，通过聚类算法得到标定图与检测图中每类细胞的个数、中心位置，比对2个图片中细胞的位置、个数得到每类细胞的准确率（每类细胞的准确率等于分类正确的每类细胞个数除以标定时每类的细胞个数）.

2.5. 聚类算法

检测网络在对细胞样本进行训练时，损失函数使用交叉熵损失，在标定图输入检测网络前先做预处理，将标定图上红细胞与5类白细胞密度图像素依次改为背景为0，红细胞为1，中性粒细胞为2，嗜酸性粒细胞为3，嗜碱性粒细胞为4，淋巴细胞为5，单核细胞为6，共7类，将预处理后的密度图作为网络的标定图. 细胞图像输入检测网络得到检测密度图后，将像素为1、2、3、4、5、6的区域做聚类，聚类算法遵循：1）就近原则，将像素值相同且距离a（本文a=5）像素以内的点分为同一类；2）连通性原则，若2个像素值相同的点连线上的像素值均高于0则表示2个像素点连通，中间没有背景区域. 通过聚类算法得到检测图每类细胞的中心坐标后，将此坐标在标定图中找出，判断该点的像素值是否与检测图中聚类得到点的像素值一致，若一致则分类准确，不一致则分类错误，以此得到每类细胞的准确率.

3. 血细胞分类检测实验

3.1. 实验设备

实验采用Linux操作系统，基于tensorflow1.13的深度学习框架，在显卡配置为4块NVIDIA，2080Ti-11G，内存为DDR4-3000-32G的设备中开展对比实验.

3.2. 数据集建立与预处理

数据集建立与标定工作与广西医科大学第二附属医院检验科共同完成，随机选取100位患者的血细胞分析样本，经过制片、染色、推片等操作制备外周血细胞染色玻片共100张，采集用光学显微镜调整不同亮度、角度情况下的细胞图像共4 000张（分辨率256×256），并在医院专业人员指导下完成数据集标定工作. 记录每张图片中每个细胞中心的位置，生成对应的位置掩膜，具体操作过程：用半径为8像素的实心圆将红细胞中心位置标记为RGB（255，255，255）；用半径为15像素的实心圆将5类白细胞中心位置分别标记为中性粒细胞RGB（0，255，255），嗜酸性粒细胞RGB（255，0，0），嗜碱性粒细胞RGB（255，0，255），淋巴细胞RGB（0，255，0），单核细胞RGB（255，255，0），该位置掩膜同样作为检测与分类网络的标定信息.

3.3. 网络训练

网络训练分2个阶段进行：1）细胞图像生成阶段，2）细胞图像分类检测阶段.

3.3.1. 细胞图像生成阶段

将4 000张图像样本的50%作为数据集，其中训练集、测试集、验证集的比例为6∶2∶2，同时将随机生成的位置掩膜与梯度掩膜的15 000张图像以1∶1∶1加入实验的训练集、验证集、测试集中。训练时生成器输入细胞位置掩膜和梯度掩膜图像分辨率为256×256，并做平移、镜像、旋转等数据增强操作，每训练100次，从验证集中随机选取批处理大小（batch_size）张图像做验证，保存验证生成的图像，训练采用亚当优化器. 实验参数设置选取策略如下。1）随机丢弃参数的系数按照惯例设为0.5。2）为了保证每次验证生成细胞样本多样性将批处理大小设置为1。3）学习率的范围一般为[0.0001，0.01]，对于较小的批处理大小，为了避免异常值对结果造成的巨大扰动，要设置较小的学习率，因此本文设置为0.000 1。4）损失函数相关常数项设置；在提取原图与生成图像的梯度时认为亮度、对比度、梯度各分量重要程度一致，故α、β、γ均设置为1， $ c_1$、 $ c_2$、 $ c_3$按照惯例设置为 $ c_1=0.01$、 $ c_2=0.03$、 $ c_3=0.01$。5）各损失函数项系数设置；逐像素损失项 ${L_{{\rm{L1}}}}$在网络训练中起主导作用，系数太小将使网络收敛过慢，太大将使生成图像多样性不足，为此分别取 ${\lambda _{\rm{2}}}$=1、5、10、15做对比实验，其生成器收敛时迭代次数与生成图像加入检测网络U-Net后细胞图像分类检测准确率如表1所示. 表中，I为生成器收敛时的迭代次数，P为生成图像加入检测网络U-Net后细胞图像分类检测准确率，准确率等于分类正确的细胞个数除以细胞总数.

表 1 不同 ${\lambda _{\rm{2}}}$实验结果对比

Tab.1 Comparison of different values of ${\lambda _{\rm{2}}}$

${\lambda _2}$	I	P/%
1	100 000	92.4
5	70 000	93.7
10	50 000	94.7
15	40 000	94.1

由表1可知，当 ${\lambda _{\rm{2}}}$=10时生成的图像加入检测网络后准确率提升最大，且与 ${\lambda _{\rm{2}}}$=1、5相比收敛速度要快，故取 ${\lambda _{\rm{2}}}$=10；其他项损失函数在实验中的重要程度一致，因此其余损失项系数均设为1，即 ${\lambda _{\rm{2}}}{\rm{ = 1}}$.生成器与鉴别器在对抗学习中实现真实感细胞图像的生成.

3.3.2. 细胞图像检测阶段

将阶段1）生成的细胞图像与真实图像的50%一起作为训练集，实验参数设置选取策略：学习率设置为0.000 1；损失函数采用交叉熵损失函数，本文中类别K=7，表示背景和6类细胞；为了加速网络训练设置W=5. 将细胞图像生成阶段验证和测试生成的图像与真实图像一起送入检测器中训练，训练结束后用剩余的真实细胞图像做测试，用聚类算法得到各类细胞的个数及中心坐标，通过与标定图比对得到各类细胞的准确率.

4. 结果与分析

4.1. 细胞图像生成实验

4.1.1. 可视化细胞图像生成结果

分别采用CGAN、pix2pix、pix2pix+MD、MCGAN网络结构作对比实验，当I=5 000、10 000、50 000时各网络生成的图像如图4所示. 由图可知，MCGAN通过输入外周血细胞的位置掩膜和梯度掩膜，可以控制生成细胞的类别和位置，而细胞在形状上与原图存在一定的差异，保证了生成细胞样本的真实性与多样性. 与CGAN、pix2pix对比，pix2pix+MD和MCGAN的生成器与鉴别器的损失收敛得更快，相同迭代次数生成的红细胞在重叠情况下的边缘更加明显，白细胞图像细节信息更加丰富. 各网络的生成器及鉴别器损失函数曲线如图5所示。图中， ${L_{\rm{G}}}$为生成器损失函数， ${L_{\rm{D}}}$为鉴别器损失函数. 由图可知，与CGAN、pix2pix相比，MCGAN的生成器损失曲线收敛更快，损失值在收敛后最小；MCGAN的鉴别器损失值最大. 在生成对抗网络中生成器损失值越小、鉴别器的损失值越大，网络的性能越好，由此证明MCGAN网络性能优于CGAN、pix2pix.

图 4

图 4 细胞图像生成实验对比图

Fig.4 Comparison of cell image generated experiments.

图 5

图 5 网络实验损失函数曲线图

Fig.5 Graph of loss function of each network experiment.

4.1.2. 生成图像质量定量评价

峰值信噪比（peak pignal to poise ratio，PSNR）^[17]、结构相似度（structural similarity index，SSIM）^[18]、FID（feature inception distance）^[19]为真实图像与生成图像的特征向量的距离，通过以上3个指标对生成图像的质量做评估. PSNR的值越大表示生成图像真实性越高，计算公式为

(13) $R\left( {i,j} \right) = 10{\log _{10}}\Biggl({26} {\frac{{{{\left( {{2^n} - 1} \right)}^2}\left( {H W} \right)}}{{\displaystyle\sum\limits_{i = 1}^H {\displaystyle\sum\limits_{j = 1}^W {{{\left( {{\boldsymbol{x}}\left( {i,j} \right) - {\boldsymbol{g}}\left( {i,\;j} \right)} \right)}^2}} } }}} \Biggl){26}.$

式中：n为每像素的比特数，H、W分别为细胞图像的高度、宽度.

SSIM能够有效客观地评估真实图像与生成图像的相似度，评估分别从亮度、对比度和结构共3个方面进行，更加符合人类的视觉效果. SSIM值越大，就说明2张图片的相似度越高，计算公式为

(14) $S\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = \frac{{\left( {2{u_{\boldsymbol{x}}}{u_{\boldsymbol{g}}}+{c_1}} \right)\left( {2{\sigma _{{\boldsymbol{xg}}}}+{c_2}} \right)}}{{\left( {u_{\boldsymbol{x}}^2+u_{\boldsymbol{g}}^2+{c_1}} \right)\left( {\sigma _{\boldsymbol{x}}^2+\sigma _{\boldsymbol{g}}^2+{c_2}} \right)}}.$

式中： $ {\sigma _{\boldsymbol{x}}^2}$、 $ {\sigma _{\boldsymbol{g}}^2}$分别为x、g的方差； $ {{\sigma _{{\boldsymbol{{\boldsymbol{xg}}}}}}}$为x、g的协方差； $ {c_1} = {\left( {{k_1}L} \right)^2}$、 $ {c_2} = {\left( {{k_2}L} \right)^2}$，其中L为图像像素的动态范围， $ k_1= $ $ 0.01$， $ k_2=0.03$.

当生成的样本与真实样本越像时，FID越小. FID的计算公式为

(15) $F\left( {{\boldsymbol{x}},{\boldsymbol{g}}} \right) = \parallel {{\boldsymbol{Z}} _{\boldsymbol{x}}} - {{\boldsymbol{Z}} _{\boldsymbol{g}}}{\parallel ^2}+{{\rm{t}}{\rm{r}}}\left( {{{B}}+{{O}} - 2{{\left( {{{BO}}} \right)}^{0.5}}} \right).$

式中： $\; {{{\boldsymbol{Z}} _{\boldsymbol{x}}}}$、 $ \;{{{\boldsymbol{Z}} _{\boldsymbol{g}}}}$分别为图像x、g特征向量的均值；B、O为真实图像、生成图像的协方差矩阵.

在实验中设置相同的学习率、迭代次数、通道数等，当I=50 000时计算不同网络结构模型生成细胞图像的PNSR、SSIM、FID指标，结果如表2所示. 由表可知，MCGAN的PNSR、SSIM值最大，FID的值最小；与pix2pix相比，MCGAN的PNSR值提高5.27 dB，SSIM值提高0.18，FID值降低19.88（加入多尺度鉴别器PNSR提高4.42 dB，SSIM提高0.14，FID降低了17.03；在此基础上加入梯度相似性损失函数后，PNSR又提高0.85 dB，SSIM提高0.04，FID降低2.85）。由此可知，与其他3个模型相比，MCGAN生成图像的细节更逼真，与真实图像相似性更高.

表 2 不同模型的PNSR、SSIM及FID值对比

Tab.2 Comparison of PNSR, SSIM and FID values for different models

模型	R/dB	S	F
CGAN	13.63	0.56	84.13
pix2pix	18.41	0.69	54.37
pix2pix+MD	22.83	0.83	37.34
MCGAN	23.68	0.87	34.45

4.2. 细胞图像分类检测实验

4.2.1. 可视化分类检测结果

将不同的网络结构模型SSD，YOLOV3，FCRN，Res-Net，U-Net，U-Net+pix2pix，U-Net+pix2pix+MD（鉴别器结构加入多尺度卷积与池化结构）和MCGAN进行对比，测试集从真实外周血细胞样本中选取50%用训练过后不同模型进行测试，检测结果图如图6所示. 在（b）、（c）中，用半径为5像素的圆点将漏检的细胞在输出矩形框检测结果图上标记；在（e）、（f）、（g）、（h）、（i）、（j）中用椭圆框将漏检细胞在输出密度图上标记，用矩形框将误检细胞在输出密度图上标记.

由图6可知，在未加入生成图像训练情况下，使用候选框方法检测的SSD漏检15个，YOLOV3漏检11个；使用密度图方法检测的FCRN漏检8个，误检1个，Res-Net漏检7个，误检1个，U-NET漏检6个，误检1个. 在加入生成图像训练情况下，U-Net+pix2pix漏检5个，生成器和检测器采用U-Net，并在鉴别器加入多尺度卷积和池化结构后漏检2个，此基础上再加入梯度相似性损失函数，MCGAN无漏检. 由此可得，在条件生成对抗网络中加入多尺度鉴别器和梯度损失函数能有效提升细胞图像的检测精度.

图 6

图 6 细胞分类检测实验结果对比图

Fig.6 Comparison of cell classification and detection experimental results.

4.2.2. 不同网络检测准确率对比

细胞分类检测结果如表3所示。表中，T为总的细胞个数. 本文主要研究对血细胞中每类细胞的计数，因此引入2个新的评价指标，细胞的漏检个数M和误检个数e，即有多少个细胞被漏检和多少个细胞被错误检测为不是该细胞的其他类别. 由表可知，SSD、YOLOV3网络中使用矩形框标定方式对细胞图像进行训练，得到的检测准确率普遍低于使用密度图标定的情况，结合图6各网络检测输出图可知使用密度图可以有效改善在细胞黏附遮挡情况下和图像边界处的检测精度；同时在使用密度图标定情况下，U-Net网络与FCRN、Res-Net相比在细胞检测中效果最佳，原因在于U-Net中每一反卷积后都使用跳跃连接，融合了图像深层与浅层特征. 在U-Net中加入MCGAN生成细胞图像数据库训练的情况下细胞的准确率有明显提升，与仅有真实数据库训练情况对比，准确率由90.4%提升到94.7%（其中在加入多尺度鉴别器后准确率提高到94.1%，此基础上再加入梯度相似性损失函数准确率提高到94.7%）.

表 3 不同模型的检测结果对比

Tab.3 Comparison of detection results at different models

模型	P/%	T	M	e
SSD	82.7	84 202	11 883	1 254
YOLOV3	86.5	84 202	10 367	824
FCRN	89.3	84 202	8 910	314
Res-Net	89.7	84 202	8 573	291
U-Net	90.4	84 202	7 903	236
U-Net+pix2pix	92.7	84 202	6 138	172
U-Net+pix2pix+MD	94.1	84 202	5 115	121
MCGAN	94.7	84 202	4 624	76

由于真实数据中白细胞样本较少，为了凸显出在训练时加入生成白细胞样本后准确率的变化情况，在U-Net网络中，将红细胞和其他5类白细胞在加入不同GAN生成细胞样本训练情况下的每类细胞的准确率作对比. RD（Real Databases）为真实细胞图像数据集，RD+CGAN、RD+pix2pix、RD+pix2pix+MD、RD+MCGAN分别为各生成对抗网络生成的细胞图像和真实图像组合数据集，结果如表4所示。表中，P₁、P₂、P₃、P₄、P₅、P₆分别为红细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞、单核细胞的分类检测的准确率.由表可知，在U-Net中加入不同GAN网络生成的图像，检测精度均有提升，证明用生成对抗网络增加检测网络训练集以提高细胞分类检测精度的方法可行. MCGAN网络生成的样本对细胞检测准确率提升效果最好，原因是在MCGAN网络结构中解决了CGAN网络损失函数中缺乏 ${L_{{\rm{L1}}}}$损失项和pix2pix网络中鉴别器结构缺乏对图像多尺度信息的鉴别这2个问题. 在MCGAN实验中，准确率提升最显著的是嗜酸性粒、嗜碱性粒和单核细胞，在只有真实图像数据库RD训练的情况下，测试的精度为88.6%、87.6%、88.1%，在训练时加入MCGAN生成细胞图像后，精度分别上升至98.9%、98.9、99.0%（其中在加入多尺度鉴别器后精度分别提高了8.3、7.9、7.9个单位，此基础上再加入梯度相似性损失函数精度又分别提高了2.0、3.4、3.0个单位），证明MCGAN生成细胞样本有效.

表 4 U-Net网络中各类细胞在不同数据库训练下测试结果对比

Tab.4 Comparison of all kinds of cells detection results in U-Net under different database training　　　　　　　　　　 %

训练集	P₁	P₂	P₃	P₄	P₅	P₆
RD	90.5	91.3	88.6	87.6	90.9	88.1
RD+CGAN	91.0	91.7	90.7	88.7	91.9	89.1
RD+pix2pix	92.2	93.1	91.7	89.9	93.5	91.0
RD+pix2pix+MD	94.1	96.9	96.9	95.5	96.7	96.0
RD+MCGAN	94.7	99.1	98.9	98.9	98.9	99.0

5. 结　语

通过研究生成血细胞图像质量对血细胞检测精度的影响，提出基于MCGAN的血细胞分类检测方法。将所提方法应用于血细胞图像生成实验中，并将生成的血细胞图像加入分类检测网络的训练集中，与现有图像生成与检测方法对比，所提方法的优势在于：1）在血细胞图像生成阶段，所提算法生成的血细胞图像从视觉和评价指标上均优于现有条件生成对抗网络算法；2）在分类检测模型上，通过与当前主流的SSD、YOLOV3、FCRN、Res-Net、U-Net检测网络模型对比实验得到，增加生成细胞样本的细节信息和多样性，细胞的分类检测准确率有明显提升. 在未来研究工作中，将从以下2个方面改进以此降低细胞的漏检率与误检率：1）由于漏检细胞与误检细胞主要集中在细胞粘连严重的情况下，考虑增加粘连样本进行训练；2）进行细胞检测网络的结构优化，增加网络的深度，提高检测网络在细胞粘连情况下的检测精度.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

王亚品, 曹益平, 付光凯, 等

基于深度卷积神经网络的人体外周血白细胞显微图像分类

[J]. 光电子·激光, 2019, 30 (5): 546- 555

WANG Ya-pin, CAO Yi-ping, FU Guang-kai, et al

Human peripheral blood leukocyte microscopic image classification based on deep convolutional neural network

[J]. Journal of Optoelectronics·Laser, 2019, 30 (5): 546- 555

[2]

REN S, HE K, GIRSHICK R, et al

Faster R-CNN: towards real-time object detection with region proposal networks

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39 (6): 1137- 1149

DOI:10.1109/TPAMI.2016.2577031 [本文引用: 1]

[3]

LIU W, ANGUELOY D, ERHAN D, et al. SSD: single shot multibox detector[C]// European Conference on Computer Vision. Amsterdam: Springer, 2016: 21-37.

[4]

REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]// Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 779-788.

[5]

REDMON J, FARHADI A. YOLO9000: better, faster, stronger[C]// Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Washington: IEEE, 2017: 6517-6525.

[6]

REDMON J, FARHADI A. YOLOV3: an incremental improvement [EB/OL]. (2018-4-10) [2020-8-18]. https://arxiv.org/pdf/1804.02767.pdf.

DOI:10.3778/j.issn.1002-8331.1904-0268 [本文引用: 1]

[7]

徐晓涛, 孙亚东, 章军

基于YOLO框架的血细胞自动计数研究

[J]. 计算机工程与应用, 2020, 56 (14): 98- 103

XU Xiao-tao, SUN Ya-dong, ZHANG Jun

Automated counting of blood cells based on YOLO framework

[J]. Computer Engineering and Applications, 2020, 56 (14): 98- 103

DOI:10.3778/j.issn.1002-8331.1904-0268 [本文引用: 1]

[8]

刘树杰. 基于卷积神经网络的红细胞检测和计数方法[D]. 广州: 华南理工大学, 2017: 40-57.

LIU Shu-jie. Red blood cell detection and counting based on convolutional neural network[D]. Guangzhou: South China University of Technology, 2017: 40-57.

[9]

HILAL T, KIM G S, KIL T C, et al

Vehicle detection and counting in high-resolution aerial images using convolutional regression neural network

[J]. IEEE Access, 2017, 11 (6): 2220- 2230

[10]

CHEN X, LIN J, XIANG S, et al

Detecting maneuvering target accurately based on a two-phase approach from remote sensing imagery

[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 17 (5): 849- 853

DOI:10.1109/LGRS.2019.2935230 [本文引用: 1]

[11]

GOODFELLOW I J, POUGET A J, MIRZA M, et al

Generative adversarial networks

[J]. Advances in Neural Information Processing Systems, 2014, 3: 2672- 2680

[12]

CUI Y R, LIU Q, GAO C Y, et al

FashionGAN: display your fashion design using conditional generative adversarial nets

[J]. Computer Graphics Forum, 2018, 37 (7): 345- 359

[13]

ISOLA P, ZHU J Y, ZHOU T, et al. Image-to-image translation with conditional adversarial networks[C]// Proceedings of the IEEE conference on computer vision and pattern recognition. Hawaii: IEEE, 2017: 1125-1134.

[14]

RONNEBRGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation[C]// International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich: Springer, 2015: 234-241.

[15]

PRATT H, WILLIAMS B, COENEN F, et al. FCNN: Fourier convolutional neural networks[C]// Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Berlin: Springer, 2017: 786-798.

DOI:10.3969/j.issn.0372-2112.2019.08.018 [本文引用: 1]

[16]

赖小波, 许茂盛, 徐小媚

多分类CNN的胶质母细胞瘤多模态MR图像分割

[J]. 电子学报, 2019, 47 (8): 1738- 1747

LAI Xiao-bo, XU Mao-sheng, XU Xiao-mei

Glioblastoma multiforme multi-modal MR image segmentation using multi-class CNN

[J]. Acta Electronica Sinica, 2019, 47 (8): 1738- 1747

DOI:10.3969/j.issn.0372-2112.2019.08.018 [本文引用: 1]

[17]

段然, 周登文, 赵丽娟, 等

基于多尺度特征映射网络的图像超分辨率重建

[J]. 浙江大学学报: 工学版, 2019, 53 (7): 1331- 1339

DUAN Ran, ZHOU Deng-wen, ZHAO Li-juan, et al

Image super-resolution reconstruction based on multi-scale feature mapping network

[J]. Journal of Zhejiang University: Engineering Science, 2019, 53 (7): 1331- 1339

[18]

王成凯, 杨晓敏, 严斌宇

基于随机森林的红外图像超分辨力算法

[J]. 太赫兹科学与电子信息学报, 2020, 18 (4): 665- 671

DOI:10.11805/TKYDA2019139 [本文引用: 1]

WANG Cheng-kai, YANG Xiao-min, YAN Bin-yu

Infrared image super-resolution algorithm based on random forest

[J]. Journal of Terahertz Science and Electronic Information Technology, 2020, 18 (4): 665- 671

DOI:10.11805/TKYDA2019139 [本文引用: 1]

[19]

胡麟苗, 张湧

基于生成对抗网络的短波红外−可见光人脸图像翻译

[J]. 光学学报, 2020, 40 (5): 75- 84

HU Lin-miao, ZHANG Yong

Facial image translation in short-wavelength infrared and visible light based on generative adversarial network

[J]. Acta Optica Sinica, 2020, 40 (5): 75- 84