<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 Xception模型的主要网络模块示意图

Fig.1 Diagram of main network module of Xception model

通常标准卷积操作将特征图的空间相关性和通道间相关性一并处理，使下一层特征图融合····空间信息和通道信息. 深度可分离卷积则将空间和通道信息处理过程完全分开，其结构如图2所示. 1）Depthwise卷积将每个输入特征通道单独卷积，假设输入特征图数量为a，卷积核大小为 $k \times k$，这样每个输入特征图都将对应一个独立的 $k \times k$卷积核进行卷积，输出a个特征图；2）Pointwise卷积使用 $1 \times 1$的标准卷积来关联特征通道之间的相关性输出特征.

图 2

图 2 深度可分离卷积的结构图

Fig.2 Architecture of depth separable convolution

Xception模型在InceptionV3的基础上进行改进，其深度可分离卷积可以在保留较高准确率的情况下减少大量的模型参数和计算量. 虽然深度可分离卷积减少了参数量，但是Xception模型的总参数量与InceptionV3相差不大，主要原因为Xception模型旨在提高分类效果，在网络其他位置增加了参数量. Xception模型与常用模型在ImageNet数据集上的分类准确率结果^[18]如下：VGG-16、ResNet-152、InceptionV3以及Xception的准确率分别为71.5%、77.0%、78.2%、79.0%.

1.2. SE-Net模型简介

SE-Net（Squeeze-and-Excitation Networks）模型由Momenta公司研发团队（WMW）的高级研发工程师Hu等^[19]首次提出，该网络获得了2017年ILSVRC挑战赛Image Classification任务的冠军. SE-Net模型并不是一个全新、完整的CNN网络模型，而是一种子结构，可嵌入至其他网络模型中.

SE-Net模型的结构流程如图3所示，主要包含3个重要的步骤，分别是Squeeze（挤压）、Excitation（激励）以及Reweight（重标定）. 假定某个卷积后的特征图大小为 $w \times h \times c$，其中，w、h和c表示特征图的宽、高以及通道数，经过SE-Net的3个操作后将得到维度相同的特征图.

图 3

图 3 SE-Net模块流程图

Fig.3 Flowchart of SE-Net module

1）Squeeze特征压缩. 将c个输入二维特征图经过Global pooling处理转化为实数，得到包含c个实数的一维特征向量，Squeeze计算公式如下：

(1) $ {F_{{\rm{sq}}}}({{{u}}_c}) = \frac{1}{{{W_{{\rm{sq}}}} \times {H_{{{\rm{sq}}}}}}}\sum\limits_{i = 1}^{{W_{{{\rm{sq}}}}}} {\sum\limits_{j = 1}^{{H_{{{\rm{sq}}}}}} {{{{u}}_c}(i,j)} } . $

式中： ${F_{\rm{sq}}}( * )$为Squeeze函数； ${{{u}}_c}$为输入特征中第c通道的特征图； ${W_{{\rm{sq}}}}$与 ${H_{{\rm{sq}}}}$分别为特征图的宽和高； ${{{u}}_c}(i,j)$为特征图在坐标位置 $(i,j)$处的取值.

2）Excitation特征激励. 首先经过上阶段处理后得到具有c个实数的一维特征向量；然后连接2个全连接层和一个Relu层学习权重参数：将第一个全连接层的输出进行一定比例的缩放，将第二个全连接层的输出大小设置为原通道数；最后连接Sigmoid函数生成通道权重. Excitation计算公式如下：

(2) $ {F_{{\rm{ex}}}}({{z}},{{W}}) = \sigma [({{{W}}_2}\; \delta ({{{W}}_1}{{z}}))]. $

式中： ${F_{{\rm{ex}}}}( * )$为Excitation函数； ${{{W}}_1}$、 ${{{W}}_{\rm{2}}}$为学习后的全连接层权重；z为经过Squeeze后的特征向量； $\delta ( * )$为Relu激活函数； $\sigma ( * )$为Sigmoid函数.

3）Reweight特征重标定. 将Excitation输出看作是经过自主学习后的特征权重，将特征权重与原特征图逐通道相乘加权，完成整个特征重标定过程，Reweight公式如下：

(3) $ {F_{{\rm{scale}}}}({{{u}}_c},{s_c}) = {s_c}\;{{{u}}_c}. $

式中： ${F_{{\rm{scale}}}}(*)$为Reweight函数； ${s_c}$为第c个特征图的权重值.

1.3. 多尺度深度分离卷积

为了进一步提升Xception模型的分类精度，对深度可分离卷积进行改进工作，提出一种多尺度深度可分离卷积. 原深度可分离卷积的Depthwise卷积通常使用 $3 \times 3$卷积核，由于单一尺度卷积核的感受野有限，提取到的信息比较单一，这种方式在一定程度上限制了模型分类的性能. 本研究从扩大卷积感受野与提升卷积特征通道丰富性的角度出发，将原Depthwise卷积中的单一 $3 \times 3$卷积核替换为多尺度卷积核. 不同尺度的卷积核意味着可以得到不同尺度的感受野，也表示最后获得的特征是融合了不同尺度的特征，有利于模型识别不同尺度的服装图像，提高分类准确率.

多尺度深度可分离卷积的具体过程如图4所示，分为3个部分.

图 4

图 4 多尺度深度可分离卷积的结构图

Fig.4 Architecture of multi-scale depth separable convolution

1）特征降维. 利用 ${\rm{1}} \times {\rm{1}}$标准卷积把原特征通道压缩成固定数量的特征通道，一是为了进行特征降维以减少计算量，二是为了便于下一步不同尺度卷积核进行单独Depthwise卷积. 假定m为输入特征通道数量，经过特征降维可压缩得到m/4、m/2、m/8和m/8共4种数量的特征图，4种数量之间的比值可自行调整.

2）多尺度的Dethwise卷积. 将上阶段获得的4种数量的特征图进行Depthwise卷积，对应的卷积核大小分别为 $1 \times 1$、 $3 \times 3$、 $5 \times 5$和Max pooling；然后将多尺度卷积的输出特征进行拼接，最后输出m个含有多尺度信息的特征图. Depthwise卷积公式如下：

(4) $ d{({{W}},{{y}})_{(i,j)}} = \sum\limits_{k,l}^{K,L} {{{{W}}_{(k,l)}} \cdot {{{y}}_{(i + k,j + l)}}} . $

式中： $d{( * )_{(i,j)}}$为输出特征图中位置 $(i,j)$的值，K与L为卷积核的宽和高， ${{{W}}_{(k,l)}}$为卷积核中位置 $(k,l)$的值， ${{{y}}_{(i + k,j + l)}}$为输入特征图中位置 $(i + k,j + l)$的值.

3）Pointwise卷积. 此部分与原深度可分离卷积相同，即将多尺度特征通过 $1 \times 1$标准卷积输出，Pointwise卷积公式如下：

(5) $ p{({{W}_{\rm{p}}},{{y}_{\rm{p}}})_{(i,j,n)}} = \sum\nolimits_m^M {{{{W}}_n} \cdot {{{y}}_{(i,j,m)}}}. $

式中： $p{(*)_{(i,j,n)}}$为第n个输出特征图中位置 $(i,j)$的值， ${{{W}}_n}$为第n个 $1 \times 1$ 卷积核， ${{{y}}_{(i,j,\;m)}}$为第m个输入特征图中位置 $(i,j)$的值， $M$为输入特征图数量.

与深度分离卷积相比，所提出的多尺度深度分离卷积主要在最前面增加了一个降维压缩卷积，并将Dethwise卷积的单一卷积核修改为多尺度卷积核，因此增加了部分的参数量和计算量.

1.4. 多尺度SE-Xception模型

多尺度SE-Xception模型结构与Xception模型大体上一致，整体结构如表1所示. 首先，保持前2层标准卷积不变；然后，将Conv_3 ~ Conv_9层中所有的深度分离卷积替换为多尺度深度分离卷积. 同时，在Conv_8和Conv_9层的Relu与多尺度分离卷积之间嵌入SE-Net模块；最后，保留原全局均值池化层GAP_10与全连接层FC_11.

表 1 多尺度SE-Xception模型的整体框架

Tab.1 Framework of multi-scale SE-Xception model

层级序号	残差链接	循环	卷积操作	输出尺寸
Conv_1	−	−	Conv 32，3×3，stride = 2	111×111×32
Conv_2	−	−	Conv 64，3×3	109×109×64
Conv_3	Conv 1×1，stride = 2	−	多尺度深度可分离卷积 128 多尺度深度可分离卷积 128 最大池化 3×3，stride = 2，padding=1	55×55×128
Conv_4	Conv 1×1，stride = 2	−	多尺度深度可分离卷积 256 多尺度深度可分离卷积 256 最大池化 3×3，stride = 2，padding=1	28×28×256
Conv_5	Conv 1×1，stride = 2	−	多尺度深度可分离卷积 728 多尺度深度可分离卷积 728 最大池化 3×3，stride = 2，padding=1	14×14×728
Conv_6_x	直连	×8	多尺度深度可分离卷积 728 多尺度深度可分离卷积 728 多尺度深度可分离卷积 728	14×14×728
Conv_7	Conv 1×1，stride = 2	−	多尺度深度可分离卷积 728 多尺度深度可分离卷积 1024 最大池化 3×3，stride = 2，padding=1	7×7×1 024
Conv_8	−	−	多尺度深度可分离卷积 1536 SE-Net模块	7×7×1 024
Conv_9	−	−	多尺度深度可分离卷积 2048 SE-Net模块	7×7×2 048
GAP_10	−	−	全局均值池化	1×1×2 048
FC_11	−	−	全连接层	1×1×7

2. 实验及结果分析

2.1. 实验数据集

本实验使用2种场景复杂程度不同的公开服装数据集，分别是ACS与DeepFashion数据集. ACS数据集由文献[5]首次公开，主要用于服装图像分类领域，其中的图像主要来源于日常生活. DeepFashion数据集由香港中文大学提供，包含多个子集，适用于服装图像的分类、检索、关键点检测等，其中的图像主要来源于电商平台.

ACS数据集如图5（a）所示，服装所处场景复杂度较高，含有各种各样的环境（室内、室外），同时图像中含有较多的噪声、形变、遮挡以及光线变化等. 该数据集包含blouses、jacket、long dress、suit、T-shirt等15个服装类别，每种类别的服装图像数量差距较大，例如：Long dress含有12 622张，Polo shirt仅有976张，服装图像总数为89 484张，并已对大部分服装的位置区域进行了裁剪预处理. 本研究从ACS数据集的所有服装类别中选取7类作为实验类别，分别为coat、long dress、suit、sweater、T-shirt、uniform以及vest，共36 989张图像，每类随机选取500张作为测试集，剩余图像作为训练集. 7类服装均属于粗粒度类别，且图像数量相对均衡。调整实验类别的原因如下：1）数量不均衡会导致模型预测结果偏向数量较多的类别；2）本研究针对整幅服装图像进行分类，不宜进行细粒度划分，否则容易影响分类准确率.

图 5

图 5 ACS数据集与DeepFashion数据集示例图

Fig.5 Sample graph of ACS dataset and DeepFashion dataset

DeepFashion数据集如图5（b）所示，服装所处场景复杂度较低，背景多为纯色，服装出现形变和遮挡的情况较少，并且每件服装包含多个角度的图像，部分服装进行了服装位置的裁剪. 数据集总共包含80多万张服装图像. 本研究选取其中一个子集作为实验数据集. 同样为了避免类别数量不平衡和细粒度类别对模型的影响，本研究设置9个服装类别，共22 846张图像.

2.2. 实验准备

实验环境的相关设置如下：工作站操作系统为Windows 10，12 G显存Nvidia GeForce GTX 1080Ti显卡一块，CPU为Intel（R）Xeon（R）E5-2620 v4，python版本3.6.3，深度学习框架安装pytorch 1.0.0，TensorFlow版本为1.12.0. 为了方便实验模型可视化与实验对比，另外安装tensorboradX可视化工具.

实验使用GPU加快模型计算速度，减少训练时间，选择小批次带动量参数的随机梯度下降法（stochastic gradient descent，SGD）作为模型参数优化器（Optimizer），动量参数为0.9；损失函数采用交叉熵损失（Cross entropy loss）；训练周期（Epoch）为50次；每批次（Batchsize）训练的图像数量为32张；学习率更新采用固定周期缩减策略，将初始学习率设置为0.01，当训练周期大于30时，学习率缩小为原来的1/10，即30个周期后的学习率为0.001；为了扩大数据集并增强模型泛化能力，在训练模型时，使用3种数据增强方法：1）统一调整图像尺寸为 $256 \times 256$；2）随机裁剪尺寸为 $224 \times $224；3）随机水平翻转图像. 为了加快模型的收敛速度，对图像中的像素值作归一化和标准化处理.

2.3. 实验结果与分析

为了验证所提出的SE-Xception多尺度分离卷积模型的有效性，将此模型与常用于服装图像分类的CNN分类模型VGGNet、ResNet以及Xception作对比分析. 在ACS数据集上使每个模型从头开始训练参数，直至收敛，并且确保各个模型在相同条件下完成训练. 在模型训练过程中，训练集每迭代完成1个周期，对测试数据集进行1次测试，输出并记录分类准确率，以便直观地监控模型在迭代过程中的分类性能变化情况.

如图6所示为不同模型在ACS数据集上的损失变化情况，E为迭代周期，O为损失值. 由图6可知，在VGG16、Resnet50以及Xception 3种不同类型的模型中，Xception模型损失值的下降速度和收敛速度最快；在Xception、多尺度Xception、多尺度SE-Xception 3种同类型的模型中，模型的损失曲线相似，变化规律与波动幅度基本一致. 实验结果表明：与常用模型相比，Xception模型的表现更为优秀；虽然多尺度SE-Xception模型的结构比Xception模型复杂，且参数量和计算量更大，但是不会影响模型损失值的下降速度和收敛速度.

图 6

图 6 不同模型在ACS数据集上的损失变化曲线对比

Fig.6 Comparison of loss change curves of different models on ACS dataset

如图7所示为不同模型在ACS数据集上的准确率变化情况，R为分类准确率. 可知，在前30个迭代周期内，所有模型的准确率曲线波动幅度都比较大，整体呈上升趋势；当训练至30个周期后，学习率调整为0.001，各模型的准确率开始有了明显的提高，而且渐渐趋于稳定. 各曲线收敛后，从图中可以观察到2个比较明显的高度差. 第一个位于VGG模型曲线与Xception模型曲线之间，准确率相差约4.82%；第二个位于Xceotion模型曲线与多尺度SE-Xception模型曲线之间，准确率相差约3.69%.

图 7

图 7 不同模型在ACS数据集上的准确率变化曲线对比

Fig.7 Comparison of accuracy rate change curves of different models on ACS datasets

第一个高度差产生的原因如下：1）Xception模型本身是一种比较新颖、优秀的深度卷积模型，结构中的深度可分离卷积有效地提高了分类准确率；2）Xception模型吸收了其他经典模型的优点，例如：采用 ${\rm{3}} \times {\rm{3}}$小卷积核、残差链接以及批归一化处理等. 第二个高度差产生的原因如下：1）多尺度可分离卷积提高了特征信息的丰富度. 多尺度Xception模型仅修改了Xception模型结构中的深度可分离卷积，其他条件完全一致，分类准确率得到明显提高，表明多尺度深度可分离卷积有效地提高了模型提取特征的能力，丰富的特征使模型的分类性能有了比较大的提升，改进效果明显. 2）SE-Net模块增强了有用特征，削弱了无用特征，使模型表现得更稳定. 从图7可知，在20个迭代周期以后，多尺度SE-Xception模型的准确率略高于多尺度Xception模型，且曲线波动幅度相对较小，因此，多尺度SE-Xception模型更稳定. 实验结果证明，多尺度SE-Xception模型比其他深度卷积模型的分类效果更好.

为了对比不同组合的卷积核对服装图像分类效果的影响，进行5组对比实验，分类结果如表2所示. 实验结果显示：1）分类准确率整体上随着卷积核尺度的增加呈上升趋势；2）当单个 $3 \times 3$卷积核增加至 $3 \times 3$、 $5 \times 5$双卷积核时，R值的增幅尤为明显；3）单独增加 ${\rm{1}} \times {\rm{1}}$卷积和最大池化也能一定程度上提升R值；4）采用 $1 \times 1$、 $3 \times 3$、 $5 \times 5$这3种卷积核尺度和最大池化组合得到的分类准确率最高. 实验结果表明，多尺度深度可分离卷积能够提升模型提取特征信息的能力，从而提高分类准确率.

表 2 不同组合的卷积核实验结果对比

Tab.2 Comparison of experimental results of convolution kernel with different combinations

卷积核组合	R/%
$3 \times 3$	74.65
$3 \times 3$， $5 \times 5$	76.12
$1 \times 1$， $3 \times 3$，最大池化	75.70
$1 \times 1$， $5 \times 5$，最大池化	75.58
$1 \times 1$， $3 \times 3$， $5 \times 5$，最大池化	78.34

为了进一步分析多尺度SE-Xception模型的场景适用性和应用范围，增加场景复杂度较低的Deepfashion服装数据集进行对比实验，结果如表3所示. 表中，R_DF为对Deepfashion数据集分类准确率，R_ACS为对ACS数据集分类准确率，R_DEC为从简单场景转向复杂场景所下降的准确率. 实验结果显示：1）在DeepFashion和ACS数据集上，多尺度SE-Xception模型的分类准确率分别高出Xception模型1.46%和3.69%；2）当服装场景复杂度从低转向高时，Xception模型和多尺度SE-Xception模型的准确率均出现不同程度的下降，分别下降了1.80%和4.03%. 实验结果证明：本文模型不论在简单场景或是在复杂场景中，都能够提高服装图像的分类准确率，具有普适性；本文模型的分类准确率更加稳定，能够在复杂场景下保持较高的准确率.

表 3 Xception模型与多尺度SE-Xception模型在不同数据集上的实验结果对比

Tab.3 Comparison of experimental results between Xception model and multi-scale SE-Xception model in different datasets %

CNN模型	R_DF	R_ACS	R_DEC
Xception_Net	78.68	74.65	4.03
Multi_SE_Xception_Net	80.14	78.34	1.80

不同模型的分类准确率对比结果如表4所示. 实验结果显示：VGG-16模型在测试集上的分类准确率最低，平均准确率为69.82%；多尺度SE-Xception模型的分类准确率最高，平均准确率为78.34%. 可知，提出的多尺度SE-Xception服装图像分类模型是一种性能优良的网络模型.

表 4 不同模型在ACS数据集上的平均分类准确率对比

Tab.4 Comparison of average classification accuracy of different models on ACS datasets

CNN模型	R/%
VGG16_Net	69.82
Resnet50_Net	73.53
Xception_Net	74.65
Multi_Xception_Net	77.58
Multi_SE_Xception_Net	78.34

3. 结　语

本文提出了一种多尺度SE-Xception服装图像分类算法. 在ACS数据集上的实验结果表明，相比于其他常用模型，多尺度SE-Xception模型的分类效果最好，损失值的下降速度和收敛速度相对较快；在模型中嵌入SE-Net能够提升一定的准确率，使模型更加稳定. 实验结果表明，卷积核尺度数量与分类准确率正相关，多尺度深度可分离卷积的效果优于单尺度. 关于不同场景复杂度的实验结果表明，多尺度SE-Xception模型在复杂度较高的场景下能够保持较高的分类准确率，具有良好的鲁棒性.所提模型的结构相比于Xception模型更加复杂，增加了一定的参数量和计算量，如何减少参数量和计算量有待进一步研究.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

中国电子商务研究中心. 2015—2016年度中国服装电商行业报告[R/OL]. (2016-12-26)[2018-12-17]. http://www.100ec.cn/zt/fzyxbg/.

[2]

OJALA T, PIETIKAINEN M, HARWOOD D. Performance evaluation of texture measures with classification based on Kullback discrimination of distributions [C] // Proceedings of 12th International Conference on Pattern Recognition. Jerusalem: IEEE, 1994: 582-585.

DOI:10.1023/B:VISI.0000029664.99615.94 [本文引用: 1]

[3]

LOWE D G

Distinctive image features from scale-invari-ant keypoints

[J]. International Journal of Computer Vision, 2004, 60 (2): 91- 110

[4]

DALAL N, TRIGGS B. Histograms of oriented gradients for human detection [C] // Computer Vision and Pattern Re-cognition. San Diego: IEEE, 2005: 886-893.

[5]

BOSSARD L, DANTONE M, LEISTNER C, et al. Apparel classification with style [C] // Asian Conference on Com-puter Vision. Daejeon: Springer, 2012: 321-335.

[本文引用: 2]

[6]

HUO P, WANG Y, LIU Q. A part-based and feature fus-ion method for clothing classification [C] // Pacific Rim Conference on Multimedia. Xi’an: Springer, 2016: 231-241.

[7]

SURAKARIN W, CHONGSTITVATANA P. Predicting types of clothing using SURF and LDP based on bag of features [C] // International Conference on Electrical Engineering/Electronics. Hua Hin: IEEE, 2015: 1-5.

DOI:10.3724/SP.J.1089.2019.17380 [本文引用: 1]

[8]

吴苗苗, 刘骊, 付晓东, 等

款式特征描述符的服装图像细粒度分类方法

[J]. 计算机辅助设计与图形学学报, 2019, 31 (5): 780- 791

WU Miao-miao, LIU Li, FU Xiao-dong, et al

Fine-grained clothing image classification by style feature description

[J]. Journal of Computer-aided Design and Computer Graphics, 2019, 31 (5): 780- 791

DOI:10.3724/SP.J.1089.2019.17380 [本文引用: 1]

[9]

LIU Z, LUO P, QIU S, et al. DeepFashion: Powering ro-bust clothes recognition and retrieval with rich annotations [C] // 2016 the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 1096-1104.

[10]

DONG C Y, SHI Y Q, TAO R. Convolutional neural ne-tworks for clothing image style recognition [C] // 2018 International Conference on Computational, Modeling, Simulation and Mathematical Statistics. Pennsylvania: CMSMS, 2018: 592-597.

DOI:10.3969/j.issn.1000-386x.2017.04.043 [本文引用: 1]

[11]

包青平, 孙志锋

基于度量学习的服装图像分类和检索

[J]. 计算机应用与软件, 2017, 34 (4): 255- 259

BAO Qing-ping, SUN Zhi-feng

Clothing image classification and retrieval based on metric learning

[J]. Computer Applications and Software, 2017, 34 (4): 255- 259

DOI:10.3969/j.issn.1000-386x.2017.04.043 [本文引用: 1]

[12]

张振焕, 周彩兰, 梁媛

基于残差的优化卷积神经网络服装分类算法

[J]. 计算机工程与科学, 2018, 40 (2): 354- 360

DOI:10.3969/j.issn.1007-130X.2018.02.023 [本文引用: 1]

ZHANG Zhen-huan, ZHOU Cai-lan, LIANG Yuan

An optimized clothing classification algorithm based on residual convolutional neural network

[J]. Computer Engineering and Science, 2018, 40 (2): 354- 360

DOI:10.3969/j.issn.1007-130X.2018.02.023 [本文引用: 1]

[13]

厉智, 孙玉宝, 王枫, 等

基于深度卷积神经网络的服装图像分类检索算法

[J]. 计算机工程, 2016, 42 (11): 309- 315

DOI:10.3969/j.issn.1000-3428.2016.11.053 [本文引用: 1]

LI Zhi, SUN Yu-bao, WANG Feng, et al

Clothing image classification and retrieval algorithm based on deep convolutional neural network

[J]. Computer Engineering, 2016, 42 (11): 309- 315

DOI:10.3969/j.issn.1000-3428.2016.11.053 [本文引用: 1]

[14]

KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C] // Advances in Neural Information Processing Systems 25 (NIPS 2012). Nevada: NIPS, 2012: 1097-1105.

[15]

SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. (2015-04-10)[2018-12-17]. https://arxiv.org/abs/1409.1556.

[16]

SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C] // 2015 the IEEE Conference on Computer Vision and Pattern Recognition. Boston: IEEE, 2015: 1-9.

[17]

HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C] // 2016 the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 770-778.

[18]

CHOLLET F. Xception: deep learning with depthwise separable convolutions [C] // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 1251-1258.

[本文引用: 2]

[19]

HU J, SHEN L, SUN G. Squeeze-and-excitation networks [C] // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 7132-7141.