浙江大学学报(工学版), 2025, 59(10): 2221-2228 doi: 10.3785/j.issn.1008-973X.2025.10.023

信息与通信工程

基于多通道卷积方式的土壤重金属镍含量定量预测

付承彪,, 庄清源, 田安红,

1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650504

2. 昆明理工大学 国土资源工程学院,云南 昆明 650093

Quantitative prediction of soil heavy metal nickel content based on multi-channel convolution method

FU Chengbiao,, ZHUANG Qingyuan, TIAN Anhong,

1. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650504, China

2. Faculty of Land Resources Engineering, Kunming University of Science and Technology, Kunming 650093, China

通讯作者: 田安红,女,教授. orcid.org/0000-0002-8852-9106. E-mail:tah@kust.edu.cn

收稿日期: 2024-08-31  

基金资助: 国家自然科学基金资助项目(42361007,42067029);云南省科技厅项目(202205AC160005);云南省“兴滇英才支持计划”青年人才项目(KKXX202303001).

Received: 2024-08-31  

Fund supported: 国家自然科学基金资助项目(42361007,42067029);云南省科技厅项目(202205AC160005);云南省“兴滇英才支持计划”青年人才项目(KKXX202303001).

作者简介 About authors

付承彪(1982—),男,副教授,从事遥感图像研究.orcid.org/0000-0002-4019-1839.E-mail:fcb@kust.edu.cn , E-mail:fcb@kust.edu.cn

摘要

为了捕捉土壤光谱中复杂的非线性关系,提出基于卷积神经网络的光谱多通道卷积方法,进行土壤重金属镍含量预测. 以某污染农田土壤为研究对象,采集122个土壤光谱样本,利用Kennard-Stone算法将样本划分为校准集和验证集. 采用Savitzky-Golay平滑与标准正态变换进行原始土壤光谱数据预处理,使用改进的相关系数法($ p $=0.01)提取296个特征波段. 采用包括ResNet、VGG、Inception和MobileNet在内的4种深度学习方法进行不同通道策略(单通道(MTF)、双通道(MTF-GASF)、多通道(MC))下的重金属镍含量预测. 在不增加模型复杂度的情况下,提出用于提升轻量化模型MC-MobileNet预测土壤镍含量精度的方法. 以决定系数、均方根误差和相对预测偏差为评估指标,进行不同模型的预测性能综合评估. 结果表明,使用多通道卷积方法后,所有模型的预测性能均有提升,模型过拟合情形得到缓解,模型相对预测偏差均大于2.5.

关键词: 卷积神经网络 ; 可见近红外光谱 ; 土壤镍含量 ; 多通道建模 ; 深度学习

Abstract

In order to capture the complex non-linear relationships in soil spectra, a spectral multi-channel convolution method based on convolutional neural networks was proposed, and the soil heavy metal nickel content was predicted. One hundred and twenty-two soil spectral samples were collected from polluted agricultural soils in an area. The Kennard-Stone algorithm was used to divide the samples into calibration sets and verification sets. The Savitzky-Golay smoothing and the standard normal transformation were used to preprocess the original soil spectral data, and an improved correlation coefficient method ($ p $=0.01) was used to extract 296 characteristic bands. Four deep learning methods, including ResNet, VGG, Inception, and MobileNet, were employed to predict the content of heavy metal nickel under different channel strategies: single-channel (MTF), dual-channel (MTF-GASF), and multi-channel (MC). Without increasing the model complexity, a method was proposed to enhance the prediction accuracy of the lightweight model MC-MobileNet for soil nickel content. In order to comprehensively evaluate the prediction performance of different models, three indicators, including determination coefficient, root mean square error and relative predictive deviation, were used for evaluation. Results showed that the prediction performance of all models was improved after using the multi-channel convolution method, the model overfitting scenario was mitigated, and the models under the multi-channel strategy exhibited a relative predictive deviation greater than 2.5.

Keywords: convolutional neural network ; visible and near-infrared spectroscopy ; nickel content in soil ; multi-channel modeling ; deep learning

PDF (6237KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

付承彪, 庄清源, 田安红. 基于多通道卷积方式的土壤重金属镍含量定量预测. 浙江大学学报(工学版)[J], 2025, 59(10): 2221-2228 doi:10.3785/j.issn.1008-973X.2025.10.023

FU Chengbiao, ZHUANG Qingyuan, TIAN Anhong. Quantitative prediction of soil heavy metal nickel content based on multi-channel convolution method. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(10): 2221-2228 doi:10.3785/j.issn.1008-973X.2025.10.023

镍(Ni)是过渡金属元素,在生态环境中分布广泛,正在成为主要的环境污染物[1]. 在自然条件下,岩石或矿石的风化与侵蚀作用导致镍释放到环境中[2-3]. 电镀作业、垃圾填埋处理、颜料生产制造、工业废水的排放等人为活动也会导致镍元素释放并沉积到陆地生态系统中[4-5]. 在重度镍污染的土壤环境中生长的农作物会出现生长受阻、根系发育异常、叶片枯萎等问题,最终影响产量和质量[6-7]. 镍会通过食物链、皮肤接触进入人体,威胁人类的健康[8-9]. 镍元素在自然环境中不可降解,镍污染逐渐成为人们所关注的问题[10].

快速测定土壤中镍元素含量(镍在土壤中的质量分数)的常用分析方法包括色谱法和原子光谱法. 这些方法虽然检测精度高,但从拿到土壤样本到最终得出准确镍含量报告的周期长并且人力物力的投入较大. 在进行重金属元素含量检测时,传统分析方法要求为每种元素配备特定的元素灯以实现精准识别,使分析的复杂性与成本增加[11-12]. 相比传统方法,高光谱遥感技术的成本低、效率高、准确度高[13-14],已被广泛用于土壤重金属含量估算中. Sun等[15]构建融合5种机器学习算法的级联检索框架,利用卫星搭载的高光谱成像系统实现了农田土壤镍含量稳定且准确的分析与测定. 为了缓解环境因素产生的局部空间扰动效应,Wang等[16]提出基于分层残差校正的高光谱反演方法,提高了土壤重金属含量反演模型的预测精度. Tan等[17]进行机载高光谱数据分解,采用随机森林模型预测土壤铜(Cu)、铬(Cr)和铅(Pb)的含量,得到最佳模型的预测性能. Zou等[18]综合各模型的优势构建Stacking模型并验证其稳定性和精确性. Wang等[19]通过高光谱图像实现大面积的重金属空间分布映射和重金属含量估算. 土壤光谱数据常伴随有噪声和基线漂移,对反演建模不利. 采用适当的光谱预处理技术能够消除这些不利因素,提升模型精度. Liu等[20]使用5种光谱预处理变换(一阶导数、二阶导数、Savitzky-Golay(SG)平滑、对数变换以及多元散射校正)设计出24种组合预处理方案,结果表明SG平滑作为组合的基础变换能够有效增加频谱信息,提升土壤重金属含量的预测精度. 土壤光谱数据维度高且冗余特征多,增加了建模难度,先提取特征波段能够让模型更有效地学习光谱特征. Wang等[21]使用竞争性自适应重加权采样方法(competitive adaptive reweighted sampling, CARS)提取具有较高相关性的光谱频带. Arif等[22]利用皮尔逊相关系数法提取土壤敏感波段,成功构建了有效反演土壤镉(Cd)和Pb含量的模型.

随着深度学习技术的不断进步,模型在挖掘输入数据深层特征细节方面的能力日益增强. 与此同时,采用多通道并行处理任务的方法也日益受到重视并获得了广泛应用. Zheng等[23]构建多通道深度卷积神经网络(CNN),用于生成焓含量的预测任务,结果表明多通道卷积能够进行各个通道的有效提取,显著增强了模型的特征表示能力. Tsakiridis等[24]利用不同光谱变换并采用多通道输入方式的一维卷积建模方法对土地利用与土地覆盖面积框架调查(land use and coverage area frame survey,LUCAS)土壤光谱库(soil spectral libraries,SSL)中的10个物理化学性质进行多任务预测,结果表明相比其他CNN,多通道卷积显示出最佳性能,其黏土含量、土壤有机碳、总氮的决定系数分别为0.86、0.86、0.83. 多通道策略能够实现数据在不同尺度下特征的融合与互补,有效解决单通道处理模式下可能存在的数据特征提取不充分、信息表征单一以及难以捕捉复杂特征关联等局限性. 本研究1)使用SG卷积平滑和标准正态变换(standard normal variate,SNV)进行光谱数据预处理,结合改进的相关系数法提取光谱数据有效特征波长;2)评估多通道(multi-channel,MC)卷积的方式建立的MC-ResNet、MC-VGG、MC-Inception和MC-MobileNet模型预测土壤镍含量的性能;3)探讨多通道策略下不同模型的参数量及推理时间,提出提升轻量化模型预测精度的方法.

1. 材料与方法

1.1. 研究区域概况和数据收集

云南墨江金镍矿床属于大型原生金矿床,伴生中型规模的镍矿,富含银、钴、硒、硫等多种有益元素. 该矿床位于墨江县与元江县交界处,距离哀牢山中南段直线约10 km,具有独特的地质特征和复杂的成矿背景. 早期的粗放式开采对矿区及其周边的土壤环境造成了负面影响. 研究区域附近有一条细长的河流,当地居民主要利用该河流的水源进行土地灌溉作业,该区域四面环山、北高南低,如图1所示.

图 1

图 1   研究区域

Fig.1   Study area


采样土壤位于研究区内河流的两侧,采样点共122个,土壤样本采集时间为2022年2月11日至15日,样本采集深度为0~20 cm. 将采集的土壤样本带回实验室后,剔除土壤中的石块、杂草并进行自然风干. 研磨干燥后的样本过2 mm筛子后平均分成2份,分别用于土壤光谱反射率和土壤镍含量的测定. 土壤镍元素含量的测定采用电感耦合等离子发射光谱法. 土壤的光谱反射率测定使用FieldSpec3型光谱仪(波段范围:350~2 500 nm. 其中波段350~1 000 nm的采样间隔为1.4 nm,光谱分辨率为3 nm;波段1 000~2 500 nm的采样间隔为2 nm,光谱分辨率为10 nm)在暗室中进行,仪器测量前均经过黑白校正. 样本均使用光谱仪重复测定10次,将10次的平均值作为该样本的代表性光谱. 如图2所示为土壤光谱反射率误差带,其中$ \rho $$ \lambda $分别为光谱反射率和光谱波长. 可以看出,光谱曲线在$ \lambda $=1 400、1 900和2 200 nm的附近出现显著的凹陷特征,这些波段附近具有较为明显的水分吸收峰[25],通常认为该吸收带是羟基(OH)谱带和H2O谱带,以及黏土矿物中金属OH震荡的倍频与合频造成的[26].

图 2

图 2   土壤光谱反射率误差带

Fig.2   Error band of soil spectral reflectance


1.2. 光谱数据预处理和特征提取方法

SG平滑通过设置窗口大小和多项式阶数去除光谱数据中的噪声,减小数据的波动[27]. 为了减少光谱数据中多重散射效应,使用SNV优化经过SG平滑处理后的光谱数据[28]. 高光谱数据具有高维度特性,为了提高深度学习模型提取特征的效率,使用改进的相关系数法[29]进行如算法1所示的特征波长提取. 组合SG平滑和SNN进行原始光谱预处理,设置SG平滑的窗口大小和多项式阶数分别为5和2[30-32]. 使用改进的相关系数法对预处理后的光谱数据进行特征波长提取,作为多通道的前置数据.

算法1  相关系数法

定义 原始输入光谱数据X,阈值p<0.01.

1. 输入X,筛选出符合通过p值检验的相关波段X1

2. 对X进行一阶导数处理,再筛选出通过p值检验的相关波段X2

3. 对X进行二阶导数处理,再筛选出通过p值检验的相关波段X3

4. 按照$ {W}=\left({{X}}_{{2}} \cup {X}_{{3}}\right) \cap {{X}}_{{1}} $求出特征波段$ {{X}}_{{{\mathrm{f}}}} $

5. 将$ {{X}}_{{{\mathrm{f}}}} $作为预测模型的输入.

1.3. 多通道数据准备

光谱数据经过预处理及特征波段提取后,利用马尔可夫迁移场(Markov transition field,MTF)、格拉姆角和场(Gram angular summation field,GASF)、格拉姆角差场(Gramian angular difference field,GADF)进行进一步处理,再将数据做二维映射,之后进行单通道和双通道以及多通道的实验.

MTF:对于给定的光谱序列$ X=\{{x}_{1},{x}_{2},\cdots,{x}_{t}\} $,将$ X $划分成$ Q $个分位数段,每个分位数段光谱数据量相同,将$ X $中的$ {x}_{i} $映射到对应的$ Q $个分位数段中的离散状态编号$ {q}_{i} $,得到大小为$ Q\times Q $ 的矩阵$ \boldsymbol{P} $.$ \boldsymbol{P} $进行规范化以符合概率性质:

$ \begin{array}{c}{\boldsymbol{P}}=\left[\begin{array}{ccc}{p}_{11}& \cdots & {p}_{1Q}\\{p}_{21}& \cdots & {p}_{2Q}\\\vdots & & \vdots\\{p}_{Q1}& \cdots & {p}_{QQ}\end{array}\right].\end{array} $

根据矩阵$ \boldsymbol{P} $给出MTF表达式[33]

$ {\boldsymbol{M}} = \left[ \begin{array}{ccc}{p}_{ij}|{x}_{1}\in {q}_{i},{x}_{1}\in {q}_{j} & \cdots & {p}_{ij}|{x}_{1}\in {q}_{i},{x}_{n}\in {q}_{j}\\\vdots & & \vdots\\{p}_{ij}|{x}_{n}\in {q}_{i},{x}_{1}\in {q}_{j} & \cdots & {p}_{ij}|{x}_{n}\in {q}_{i},{x}_{n}\in {q}_{j}\end{array} \right], $

$ {\mathrm{s.t.}}\sum _{j}{p}_{ij}=1. $

式中:$ {p}_{ij} $为区间$ {q}_{i} $转移到区间$ {q}_{j} $的概率.

GASF和GADF:GASF通过使用极坐标系的矩阵将数据编码为图像,从而保留数据的位置信息[34-36]. 对给定光谱序列$ X=\{{x}_{1},{x}_{2},\cdots,{x}_{t}\} $进行归一化处理,使得$ X $中的元素都落在$ [-\mathrm{1,1}] $符合极坐标的数据范围:

$ {\tilde{x}}_{i}=\frac{({x}_{i}-\mathrm{m}\mathrm{a}\mathrm{x}\;(X))+({x}_{i}-\mathrm{m}\mathrm{i}\mathrm{n}\;\left(X\right))}{\mathrm{m}\mathrm{a}\mathrm{x}\left(X\right)-\mathrm{m}\mathrm{i}\mathrm{n}\left(X\right)}. $

利用极角$ {\phi }_{i} $计算序列中任意2个点之间的GASF:

$ {\bf{GASF}}=\left[\mathrm{cos}\left({\phi }_{i}+{\phi}_{j}\right)\right]_{t \times t}. $

以及GADF:

$ {\bf{GADF}}=\left[\mathrm{sin}\left({{\phi }}_{{i}}-{{\phi }}_{{j}}\right)\right]_{{t\times t}}. $

对光谱数据分别进行MTF和GASF以及GADF映射,映射后的数据大小为$ 224\times 224 $. 为了使描述简洁,定义仅使用MTF映射操作的模型前缀为MTF(单通道),MTF映射结果和GASF映射结果进行拼接操作后的模型前缀为MTF-GASF(双通道),MTF、GASF、GADF进行拼接操作后的模型前缀为MC(多通道).

1.4. 建模方法

ResNet-18(简称ResNet)引入残差模块,通过跳跃连接和残差块,克服了普通卷积神经网络训练过程中的梯度消失和爆炸的问题,与传统的卷积层或者全连接层相比,降低了信息丢失的风险[37].

VGG-16网络(简称VGG)使用较小的卷积核(核大小为1)和步幅为1的卷积操作,多个卷积层以及池化层的堆叠逐步缩小了特征图的尺寸,比一般的CNN深度更深,能够学习到更加复杂的数据模式[38].

Inception-V3网络(简称Inception)引入Inception模块,使用核大小为1、3、5的卷积核和最大池化. 通过多尺度卷积核和并行结构,学习目标多尺度和多层次的特征,提高网络的表征能力,减少参数数量[39].

MobileNet-V3网络(简称MobileNet)结合MobileNet-V1的深度可分离结构和MobileNet-V2的逆残差结构,加入注意力机制模块来调整每个通道的权重,使用激活函数h-swish提高网络模型精度[40-41].

将以上4种深度学习网络模型作为特征提取的主干网络,进行土壤镍含量的预测输出,不同通道输入策略下的模型训练流程如图3所示.

图 3

图 3   不同通道输入策略下各模型训练流程图

Fig.3   Training flowchart of each model under different channel input strategies


1.5. 建模评估方式

使用决定系数$ {{R}}^{2} $、均方根误差$ \mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E} $和相对预测偏差$ \mathrm{R}\mathrm{P}\mathrm{D} $综合评估模型的预测性能[42],其中$ {{R}}_{\mathrm{c}}^{2} $$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{c}} $$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{c}} $均为校准集指标,$ {{R}}_{\mathrm{v}}^{2} $$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{v}} $$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{v}} $均为验证集指标. 一般来说,较好的定量预测模型的$ {{R}}^{2} $和RPD较大,RMSE较小. $ {{R}}^{2} $的取值范围为0~1,该指标越接近于1表示模型的稳定性越强;$ \mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E} $越接近于0表示模型的预测越准确. $ \mathrm{R}\mathrm{P}\mathrm{D} < 1.0 $,表示模型的预测能力极差;$ 1.0\leqslant \mathrm{R}\mathrm{P}\mathrm{D} < 1.4 $,表示模型的预测能力很差;$ 1.4\leqslant \mathrm{R}\mathrm{P}\mathrm{D} < 1.8 $,表示模型的预测能力一般;$ 1.8\leqslant \mathrm{R}\mathrm{P}\mathrm{D} < 2.0 $,表示模型的预测能力较强;$ \mathrm{R}\mathrm{P}\mathrm{D}\geqslant 2.5 $,表示模型的预测性能极强.

1.6. 实验设备参数

所有模型在Python3.7中使用Pytorh1.7.0框架实现. 所有实验均在单台机器上进行,机器规格信息如下:(CPU)12th Gen Intel(R) Core(TM) i5-12600KF 3.70 GHz; (RAM) 32 GB; (GPU) NVIDIA GeForce GTX 4060Ti.

2. 实验及结果分析

2.1. 土壤中镍含量统计特征

利用Kennard-Stone(KS)算法划分122个样本,其中90个训练样本用于模型的训练,32个验证样本用于评估模型预测土壤样本中镍含量的性能. 样本划分结果如表1所示,其中nd为数据集样本数量,$ {{{w}} }_{{\mathrm{Ni}}} $为土壤中镍元素含量,$ {{{C}}}_{\mathrm{v}} $为变异系数.

表 1   土壤重金属镍含量样本数据集的参数统计

Tab.1  Statistical analysis of parameters for nickel content in soil heavy metal samples dataset

数据集ndwNi/10−6Cv/%
最小值最大值平均值标准差
全部12220.11051315.89304.5796.42
校准9020.11051270.66293.92108.59
验证3224.6935443.11297.9067.23

新窗口打开| 下载CSV


2.2. 数据预处理、波段筛选和通道映射结果

分别对训练数据和测试数据进行SG平滑和标准正态变换预处理. 使用改进的相关系数法提取特征波长将设置$ p=0.01 $,筛选出如图4加粗标记所示的296个波段. 可以看出,筛选出的波段主要分布在3个区域:350~500、1 000~1 500、1 750~2 500 nm. 将筛选出的一维光谱数据按照MTF、GASF、GADF分别进行映射,可视化结果如图5所示.

图 4

图 4   改进的相关系数法光谱波段筛选结果

Fig.4   Spectral band selection results based on improved correlation coefficient method


图 5

图 5   光谱波段筛选后不同策略下的通道映射结果

Fig.5   Channel mapping results under different strategies after spectral band selection


2.3. 模型的预测性能

为了体现地面光谱使用多通道卷积方法预测土壤镍含量模型的优越性,对比4个深度学习模型分别以3种通道为输入时的性能,结果如表2所示. 可以看出,虽然单通道输入校准集的精度较高,但是在验证集上却表现不佳. MTF- Inception出现过拟合:$ {{R}}_{\mathrm{c}}^{2} $=0.992,$ {{R}}_{\mathrm{v}}^{2} $=0.814. 当使用双通道输入策略时,各个模型在验证集上的表现均有所提升,Inception的过拟合情况得到缓解. 当使用多通道输入策略时,各模型对于重金属镍含量的预测效果达到最佳.

表 2   不同策略下的深度学习模型预测性能对比

Tab.2  Comparative analysis of deep learning model prediction performance under different strategies

模型$ {{R}}_{\mathrm{c}}^{2} $$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{c}} $$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{c}} $$ {{R}}_{\mathrm{v}}^{2} $$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{v}} $$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{v}} $
MTF-ResNet0.96738.0779.5250.853114.3872.604
MTF-VGG0.93072.0664.4530.796134.7182.211
MTF-Inception0.99223.28413.7080.814128.4702.319
MTF-MobileNet0.92176.0004.1230.770143.0222.083
MTF-GASF-ResNet0.87795.5934.0540.872106.3792.800
MTF-GASF-VGG0.86687.3133.8030.839119.7182.488
MTF-GASF-Inception0.91953.5047.5210.833121.7772.446
MTF-GASF-MobileNet0.95254.5716.3540.799133.5302.231
MC-ResNet0.92077.8504.6810.90193.5733.184
MC-VGG0.90973.9144.8880.850115.2642.585
MC-Inception0.91974.9524.2210.854113.7732.618
MC-MobileNet0.94261.4965.0960.844117.8412.528

新窗口打开| 下载CSV


多通道策略下不同深度学习模型预测土壤镍含量的性能表现如图6所示,其中wNi,mwNi,p分别为土壤样本镍含量的实测值和模型预测值. 可以看出,MC-ResNet相比于其他采用同等通道策略的模型预测精度更好,该模型预测点的拟合线相比其他模型更加靠近1∶1线. 还可以看出,MC-VGG与MC-Inception预测性能相当,MC-MobileNet的预测性能较弱. 多通道策略的所有模型$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{v}} $均大于2.5,具有极强的预测能力,表明多通道的输入策略能够增强输入数据特征的丰富度,促进模型学习到更多数据特征,提升模型的预测性能.

图 6

图 6   多通道策略下4种深度学习模型预测土壤镍含量的散点图

Fig.6   Scatter plots of soil nickel content predicted by four deep learning models under multi-channel strategy


2.4. 模型参数

多通道策略下不同模型的参数统计如表3所示,其中$ {N}_{\mathrm{p}} $为模型参数量,$ {F}_{\mathrm{r}} $为模型浮点运算次数,$ {t}_{\mathrm{i}} $为模型平均推理时间. 虽然MobileNet的推理时间和参数量远小于其他模型,但是预测镍含量的性能不如其他模型. 为了提升MC-MobileNet的预测精度,利用知识蒸馏技术[43],将镍含量预测性能较好的ResNet与轻量化模型MobileNet结合,形成组合模型如图7所示ResMobileNet. 可以看到,ResNet学到的知识被传递给MobileNet,使得MobileNet的精度提升,模型的总损失由损失1与损失2相加构成,损失函数采用均方根误差度量. 如图8所示为该组合模型预测土壤镍含量的散点图,ResMobileNet的$ {{R}}_{\mathrm{v}}^{2} $$ {\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{v}} $相较于MobileNet分别提升了0.033、0.328,$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{v}} $下降了13.548. ResMobileNet推理时仅采用MobileNet,不会增加模型的复杂度,推理时间不会有明显变化. 这一结果不仅为未来模型的轻量化部署与现场快速测定镍含量提供了新的思路,也表明该方法在实际应用中具有较高的可行性.

表 3   多通道策略下不同深度学习模型的参数统计

Tab.3  Parameter statistics of different deep learning models under multi-channel strategy

模型$ {N}_{\mathrm{p}}/{10}^{6} $$ {F}_{\mathrm{r}}/{10}^{6} $$ {t}_{\mathrm{i}}/{\mathrm{s}} $
ResNet11.1858 355.920.190 3
VGG14.72491 096.231.426 1
Inception21.7690 756.260.846 9
MobileNet0.571 370.960.112 6
ResMobileNet0.571 370.960.109 5

新窗口打开| 下载CSV


图 7

图 7   结合2种深度学习网络的模型架构图

Fig.7   Model architecture diagram combining two deep learning networks


图 8

图 8   组合模型预测土壤镍含量的散点图

Fig.8   Scatter plot of soil nickel content predicted by combined model


3. 结 语

本研究探讨使用多通道卷积的方式预测土壤重金属镍含量的可能性. 利用Kennard-Stone算法将土壤样本数据集划分成校准集和验证集. 采用Savitzky-Golay卷积平滑和SNV作为土壤光谱的预处理方式,利用改进的相关系数法筛选出土壤光谱的特征波段作为各深度学习模型的输入,探讨模型复杂度. 结果表明,多通道卷积能够显著改善模型过拟合的情况,提升模型的预测精度. 在4种深度学习模型的3种通道策略对比实验中,MC-ResNet的表现最佳,其$ {{R}}_{\mathrm{v}}^{2} $$ {\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{v}}\mathrm{和}{\mathrm{R}\mathrm{P}\mathrm{D}}_{\mathrm{v}} $分别为0.901和93.573和3.184. 为了更好地适应实际测定和部署需求,分别对多通道策略下的深度学习模型进行参数量和推理时间测定,提出知识蒸馏训练的组合模型,在不增加模型参数量的情况下提升了MC-MobileNet的预测精度. 本研究为实时评估区域土壤镍含量情况提供了新思路,未来将进一步探索多任务场景下的建模方法,以实现多种土壤重金属元素含量的联合预测,提升模型的泛化能力与实际应用价值.

参考文献

PANAGOPOULOS I, KARAYANNIS A, KOLLIAS K, et al

Investigation of potential soil contamination with Cr and Ni in four metal finishing facilities at Asopos industrial area

[J]. Journal of Hazardous Materials, 2015, 281: 20- 26

DOI:10.1016/j.jhazmat.2014.07.040      [本文引用: 1]

KHAN M Y A, GANI K M, CHAKRAPANI G J

Spatial and temporal variations of physicochemical and heavy metal pollution in Ramganga River—a tributary of River Ganges, India

[J]. Environmental Earth Sciences, 2017, 76 (5): 231

DOI:10.1007/s12665-017-6547-3      [本文引用: 1]

KUMAR A, JIGYASU D K, SUBRAHMANYAM G, et al

Nickel in terrestrial biota: comprehensive review on contamination, toxicity, tolerance and its remediation approaches

[J]. Chemosphere, 2021, 275: 129996

DOI:10.1016/j.chemosphere.2021.129996      [本文引用: 1]

HERRERO M, ROVIRA J, NADAL M, et al

Risk assessment due to dermal exposure of trace elements and indigo dye in jeans: migration to artificial sweat

[J]. Environmental Research, 2019, 172: 310- 318

DOI:10.1016/j.envres.2019.02.030      [本文引用: 1]

KHAN M A, WEN J

Evaluation of physicochemical and heavy metals characteristics in surface water under anthropogenic activities using multivariate statistical methods, Garra River, Ganges Basin, India

[J]. Environmental Engineering Research, 2021, 26 (6): 200280

[本文引用: 1]

LI J, HU H W, MA Y B, et al

Long-term nickel exposure altered the bacterial community composition but not diversity in two contrasting agricultural soils

[J]. Environmental Science Pollution Research, 2015, 22: 10496- 10505

DOI:10.1007/s11356-015-4232-1      [本文引用: 1]

SHAHZAD B, TANVEER M, REHMAN A, et al

Nickel; whether toxic or essential for plants and environment: a review

[J]. Plant Physiology Biochemistry, 2018, 132: 641- 651

DOI:10.1016/j.plaphy.2018.10.014      [本文引用: 1]

RENU K, CHAKRABORTY R, MYAKALA H, et al

Molecular mechanism of heavy metals (lead, chromium, arsenic, mercury, nickel and cadmium)-induced hepatotoxicity: a review

[J]. Chemosphere, 2021, 271: 129735

DOI:10.1016/j.chemosphere.2021.129735      [本文引用: 1]

GUPTA N, YADAV K K, KUMAR V, et al

Evaluating heavy metals contamination in soil and vegetables in the region of North India: levels, transfer and potential human health risk analysis

[J]. Environmental Toxicology Pharmacology, 2021, 82: 103563

DOI:10.1016/j.etap.2020.103563      [本文引用: 1]

EL-NAGGAR A, AHMED N, MOSA A, et al

Nickel in soil and water: sources, biogeochemistry, and remediation using biochar

[J]. Journal of Hazardous Materials, 2021, 419: 126421

DOI:10.1016/j.jhazmat.2021.126421      [本文引用: 1]

PYO J, HONG S M, KWON Y S, et al

Estimation of heavy metals using deep neural network with visible and infrared spectroscopy of soil

[J]. Science of the Total Environment, 2020, 741: 140162

DOI:10.1016/j.scitotenv.2020.140162      [本文引用: 1]

SHEN Q, XIA K, ZHANG S, et al

Hyperspectral indirect inversion of heavy-metal copper in reclaimed soil of iron ore area

[J]. Spectrochimica Acta Part A: Molecular Biomolecular Spectroscopy, 2019, 222: 117191

DOI:10.1016/j.saa.2019.117191      [本文引用: 1]

PALTSEVA A A, DEEB M, DI IORIO E, et al

Prediction of bioaccessible lead in urban and suburban soils with Vis-NIR diffuse reflectance spectroscopy

[J]. Science of The Total Environment, 2022, 809: 151107

DOI:10.1016/j.scitotenv.2021.151107      [本文引用: 1]

SUN W, LIU S, ZHANG X, et al

Performance of hyperspectral data in predicting and mapping zinc concentration in soil

[J]. Science of the Total Environment, 2022, 824: 153766

DOI:10.1016/j.scitotenv.2022.153766      [本文引用: 1]

SUN Y, CHEN S, DAI X, et al

Coupled retrieval of heavy metal nickel concentration in agricultural soil from spaceborne hyperspectral imagery

[J]. Journal of Hazardous Materials, 2023, 446: 130722

DOI:10.1016/j.jhazmat.2023.130722      [本文引用: 1]

WANG Y, ZOU B, LI S, et al

A hierarchical residual correction-based hyperspectral inversion method for soil heavy metals considering spatial heterogeneity

[J]. Journal of Hazardous Materials, 2024, 479: 135699

DOI:10.1016/j.jhazmat.2024.135699      [本文引用: 1]

TAN K, WANG H, CHEN L, et al

Estimation of the spatial distribution of heavy metal in agricultural soils using airborne hyperspectral imaging and random forest

[J]. Journal of Hazardous Materials, 2020, 382: 120987

DOI:10.1016/j.jhazmat.2019.120987      [本文引用: 1]

ZOU Z, WANG Q, WU Q, et al

Inversion of heavy metal content in soil using hyperspectral characteristic bands-based machine learning method

[J]. Journal of Environmental Management, 2024, 355: 120503

DOI:10.1016/j.jenvman.2024.120503      [本文引用: 1]

WANG Y, ZHANG X, SUN W, et al

Effects of hyperspectral data with different spectral resolutions on the estimation of soil heavy metal content: from ground-based and airborne data to satellite-simulated data

[J]. Science of the Total Environment, 2022, 838: 156129

DOI:10.1016/j.scitotenv.2022.156129      [本文引用: 1]

LIU J, HAN J, XIE J, et al

Assessing heavy metal concentrations in earth-cumulic-orthic-anthrosols soils using Vis-NIR spectroscopy transform coupled with chemometrics

[J]. Spectrochimica Acta Part A: Molecular Biomolecular Spectroscopy, 2020, 226: 117639

DOI:10.1016/j.saa.2019.117639      [本文引用: 1]

WANG X, ZHAO C, LI Z, et al

Modeling risk assessment of soil heavy metal pollution using partial least squares and fuzzy logic: a case study of a gully type coal-based solid waste dumpsite

[J]. Environmental Pollution, 2024, 352: 124147

DOI:10.1016/j.envpol.2024.124147      [本文引用: 1]

ARIF M, QI Y, DONG Z, et al

Rapid retrieval of cadmium and lead content from urban greenbelt zones using hyperspectral characteristic bands

[J]. Journal of Cleaner Production, 2022, 374: 133922

DOI:10.1016/j.jclepro.2022.133922      [本文引用: 1]

ZHENG X, ZHENG P, ZHENG L, et al

Multi-channel convolutional neural networks for materials properties prediction

[J]. Computational Materials Science, 2020, 173: 109436

DOI:10.1016/j.commatsci.2019.109436      [本文引用: 1]

TSAKIRIDIS N L, KERAMARIS K D, THEOCHARIS J B, et al

Simultaneous prediction of soil properties from VNIR-SWIR spectra using a localized multi-channel 1-D convolutional neural network

[J]. Geoderma, 2020, 367: 114208

DOI:10.1016/j.geoderma.2020.114208      [本文引用: 1]

张东, 塔西甫拉提·特依拜, 张飞, 等

分数阶微分在盐渍土高光谱数据预处理中的应用

[J]. 农业工程学报, 2014, 30 (24): 151- 160

DOI:10.3969/j.issn.1002-6819.2014.24.018      [本文引用: 1]

ZHANG Dong, TASHPOLAT·Tiyip, ZHANG Fei, et al

Application of fractional differential in preprocessing hyperspectral data of saline soil

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30 (24): 151- 160

DOI:10.3969/j.issn.1002-6819.2014.24.018      [本文引用: 1]

王敬哲, 塔西甫拉提·特依拜, 张东

基于分数阶微分的荒漠土壤铬含量高光谱检测

[J]. 农业机械学报, 2017, 48 (5): 152- 158

DOI:10.6041/j.issn.1000-1298.2017.05.018      [本文引用: 1]

WANG Jingzhe, TASHPOLAT·Tiyip, ZHANG Dong

Spectral detection of chromium content in desert soil based on fractional differential

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48 (5): 152- 158

DOI:10.6041/j.issn.1000-1298.2017.05.018      [本文引用: 1]

TIECHER T, MOURA-BUENO J M, CANER L, et al

Improving the quantification of sediment source contributions using different mathematical models and spectral preprocessing techniques for individual or combined spectra of ultraviolet–visible, near- and middle-infrared spectroscopy

[J]. Geoderma, 2021, 384: 114815

DOI:10.1016/j.geoderma.2020.114815      [本文引用: 1]

BA Y, LIU J, HAN J, et al

Application of Vis-NIR spectroscopy for determination the content of organic matter in saline-alkali soils

[J]. Spectrochimica Acta Part A: Molecular Biomolecular Spectroscopy, 2020, 229: 117863

DOI:10.1016/j.saa.2019.117863      [本文引用: 1]

JI R, ZHAO Y, LI M, et al

Research on prediction model of soil nitrogen content based on encoder-CNN

[J]. Spectroscopy and Spectral Analysis, 2022, 42 (5): 1372- 1377

[本文引用: 1]

SABETIZADE M, GORJI M, ROUDIER P, et al

Combination of MIR spectroscopy and environmental covariates to predict soil organic carbon in a semi-arid region

[J]. CATENA, 2021, 196: 104844

DOI:10.1016/j.catena.2020.104844      [本文引用: 1]

SUN C, XUE Z, ZHANG L, et al

Local peak Savitzky-Golay for spatio-temporal reconstruction of Landsat NDVI time series: a case study over the Qinghai-Tibet Plateau

[J]. IEEE Journal of Selected Topics in Applied Earth Observations Remote Sensing, 2024, 17: 13439- 13455

DOI:10.1109/JSTARS.2024.3432797     

TAVAKOLI H, CORREA J, SABETIZADE M, et al

Predicting key soil properties from Vis-NIR spectra by applying dual-wavelength indices transformations and stacking machine learning approaches

[J]. Soil Tillage Research, 2023, 229: 105684

DOI:10.1016/j.still.2023.105684      [本文引用: 1]

WANG Z, OATES T. Encoding time series as images for visual inspection and classification using tiled convolutional neural networks [C]// AAAI Workshop Papers 2015. [S.l.]: AAAI, 2015: 40–46.

[本文引用: 1]

WAN M, YAN T, XU G, et al

MAE-NIR: a masked autoencoder that enhances near-infrared spectral data to predict soil properties

[J]. Computers Electronics in Agriculture, 2023, 215: 108427

DOI:10.1016/j.compag.2023.108427      [本文引用: 1]

LI Y, CHEN Z, ZHANG F, et al

Research on detection of potato varieties based on spectral imaging analytical algorithm

[J]. Spectrochimica Acta Part A: Molecular Biomolecular Spectroscopy, 2024, 311: 123966

DOI:10.1016/j.saa.2024.123966     

LI Y, SUN H, ZHENG Y, et al

Combined gramian angular difference field image coding and improved mobile vision transformer for determination of apple soluble solids content by Vis-NIR spectroscopy

[J]. Journal of Food Composition Analysis, 2024, 131: 106200

DOI:10.1016/j.jfca.2024.106200      [本文引用: 1]

CHEN X, LIU H, LI J, et al

A geographical traceability method for Lanmaoa asiatica mushrooms from 20 township-level geographical origins by near infrared spectroscopy and ResNet image analysis techniques

[J]. Ecological Informatics, 2022, 71: 101808

DOI:10.1016/j.ecoinf.2022.101808      [本文引用: 1]

SUJATHA R, CHATTERJEE J M, JHANJHI N, et al. Performance of deep learning vs machine learning in plant leaf disease detection [J]. Microprocessors Microsystems 2021, 80: 103615.

[本文引用: 1]

LU B, TIAN F, CHEN C, et al

Identification of Chinese red wine origins based on Raman spectroscopy and deep learning

[J]. Spectrochimica Acta Part A: Molecular Biomolecular Spectroscopy, 2023, 291: 122355

DOI:10.1016/j.saa.2023.122355      [本文引用: 1]

李运堂, 李恒杰, 张坤, 等

基于新型编码解码网络的复杂输电线识别

[J]. 浙江大学学报: 工学版, 2024, 58 (6): 1133- 1141

[本文引用: 1]

LI Yuntang, LI Hengjie, ZHANG Kun, et al

Recognition of complex power lines based on novel encoder-decoder network

[J]. Journal of Zhejiang University: Engineering Science, 2024, 58 (6): 1133- 1141

[本文引用: 1]

陈思羽, 朱红媛, 于添, 等

基于Opt-MobileNetV3的大豆种子异常籽粒识别研究

[J]. 农业机械学报, 2023, 54 (Suppl. 2): 359- 365

[本文引用: 1]

CHEN Siyu, ZHU Hongyuan, WANG Junfa, et al

Abnormal soybean grains recognition based on Opt-MobileNetV3

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54 (Suppl. 2): 359- 365

[本文引用: 1]

夏芳, 彭杰, 王乾龙, 等

基于省域尺度的农田土壤重金属高光谱预测

[J]. 红外与毫米波学报, 2015, 34 (5): 593- 599

DOI:10.11972/j.issn.1001-9014.2015.05.014      [本文引用: 1]

XIA Fang, PENG Jie, WANG Qianlong, et al

Prediction of heavy metal content in soil of cultivated land: hyperspectral technology at provincial scale

[J]. Journal of Infrared and Millimeter Waves, 2015, 34 (5): 593- 599

DOI:10.11972/j.issn.1001-9014.2015.05.014      [本文引用: 1]

ZHANG Y, YAN Z, SUN X, et al

Learning efficient and accurate detectors with dynamic knowledge distillation in remote sensing imagery

[J]. IEEE Transactions on Geoscience Remote Sensing, 2021, 60: 5613819

[本文引用: 1]

/