浙江大学学报(工学版), 2026, 60(4): 751-762 doi: 10.3785/j.issn.1008-973X.2026.04.007

计算机技术

多尺度图卷积下的水漂垃圾轨迹预测模型

马龙,, 候永琪,, 吴佰靖, 高丽, 邓建伟, 闫光辉

1. 兰州交通大学 电子与信息工程学院,甘肃 兰州 730070

2. 甘肃省水利科学研究院,甘肃 兰州 730000

Water-floating garbage trajectory prediction model based on multi-scale graph convolution

MA Long,, HOU Yongqi,, WU Baijing, GAO Li, DENG Jianwei, YAN Guanghui

1. School of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China

2. Gansu Provincial Institute of Water Resources, Lanzhou 730000, China

收稿日期: 2025-04-22  

基金资助: 国家自然科学基金资助项目(62366028);甘肃省水利科学研究院项目基金(LZJT524289).

Received: 2025-04-22  

Fund supported: 国家自然科学基金资助项目(62366028);甘肃省水利科学研究院项目基金(LZJT524289).

作者简介 About authors

马龙(1983—),男,副教授,博士生,从事水利大数据、人工智能研究.orcid.org/0009-0004-3475-3710.E-mail:malong@mail.lzjtu.cn , E-mail:malong@mail.lzjtu.cn

摘要

针对水漂垃圾轨迹预测中单一尺度下时空异质性建模不足,导致预测结果不确定性高的问题,提出多尺度自适应图卷积模型MAGC-Trajectory. 构建自适应门控图卷积模块,将时空先验约束的静态邻接关系与数据驱动的动态拓扑结构进行跨域融合,提升模型对垃圾漂移的时序关系和轨迹波动的捕捉能力;设计多尺度时空交互模块,对空间特征进行时间尺度解耦,并与时序特征加权融合,增强垃圾轨迹时空异质性的表征能力;提出改进非线性学习层,使用可学习的自适应激活函数强化不同尺度时空特征的全局融合,生成具有统一表征的漂移轨迹高阶特征;设计概率预测层,使用均值-方差估计轨迹分布区间,量化预测结果的不确定性,提供更加鲁棒的预测轨迹. 在水漂垃圾轨迹数据集上的实验表明,相较于基准模型,所提模型的MAE、RMSE分别降低了0.000 2、0.000 5. 所提方法能够从决策上助力研究区域的水漂垃圾污染治理工作.

关键词: 水漂垃圾 ; 轨迹预测 ; 图卷积 ; 自适应邻接矩阵 ; 时空特征融合 ; 概率预测

Abstract

In response to the insufficient modeling of spatiotemporal heterogeneity under a single scale in water-floating garbage trajectory prediction, which often leads to high uncertainty in results, a multi-scale adaptive graph convolutional model (MAGC-Trajectory) was proposed. First, an adaptive gated graph convolution module was developed. Static adjacency relationships imposed by spatiotemporal priors were cross-domain integrated with data-driven dynamic topological structures. This enhanced the model’s ability to capture temporal dependencies of garbage drift and fluctuations of its trajectories. Next, a multi-scale spatiotemporal interaction module was designed. Spatial features were decoupled along different temporal scales. They were then fused in a weighted manner with temporal features. This strengthened the representation of spatiotemporal heterogeneity in garbage trajectories. Meanwhile, an improved nonlinear learning layer was introduced. A learnable adaptive activation function was employed to reinforce global fusion of multiscale spatiotemporal features. This resulted in high-order drift trajectory features with a unified representation. Lastly, a probabilistic prediction layer was constructed. Mean-variance estimation was utilized to estimate the trajectories’ distribution interval. This quantified predictive uncertainty and thus provided more robust predicted trajectories. Experiments were conducted on the water-floating garbage trajectory dataset. Results showed that, compared with the baseline model, the proposed approach reduced MAE by 0.000 2 and RMSE by 0.000 5. These improvements provide actionable support for decision-making in mitigating water-floating garbage pollution within the study area.

Keywords: water-floating garbage ; trajectory prediction ; graph convolution ; adaptive adjacency matrix ; spatiotemporal feature fusion ; probabilistic prediction

PDF (1501KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马龙, 候永琪, 吴佰靖, 高丽, 邓建伟, 闫光辉. 多尺度图卷积下的水漂垃圾轨迹预测模型. 浙江大学学报(工学版)[J], 2026, 60(4): 751-762 doi:10.3785/j.issn.1008-973X.2026.04.007

MA Long, HOU Yongqi, WU Baijing, GAO Li, DENG Jianwei, YAN Guanghui. Water-floating garbage trajectory prediction model based on multi-scale graph convolution. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(4): 751-762 doi:10.3785/j.issn.1008-973X.2026.04.007

中国作为全球水资源紧缺国家,人均水资源占有量仅为世界平均水平的28%[1]. 在快速城市化进程中,水漂垃圾污染在河湖及近海水域频发,严重威胁供水安全与水生态健康,造成巨额经济损失[2]. 当前治理依赖物理拦截与人工打捞,存在成本高、效率低的问题,会因缺乏漂移路径精准预判而陷入被动应对困境. 因此,构建高时空分辨率的水漂垃圾轨迹预测模型,对精准溯源、优化治理及提升环境管理效能具有重要意义.

现有水漂垃圾轨迹预测方法可以分为4类:1)水动力学方法,物理可解释性强,但对边界条件敏感,复杂地形下易因网格误差放大预测偏差[3];2)以马尔可夫链为代表的统计方法,能够基于历史数据统计特性建立状态转移规律[4],但其线性平稳假设难以适配垃圾轨迹的滞留、聚集、方向突变等非线性特征[5],河道场景精度受限;3)以支持向量机为代表的机器学习算法[6],通过核函数与集成学习突破非线性建模瓶颈,但面对高度复杂轨迹数据,核函数映射能力不足,难以找到最优特征空间;4)深度学习方法,通过端到端学习实现从人工特征工程到数据驱动表征的转变,在时序关系刻画上具有优势[7]. 循环神经网络(recurrent neural network,RNN)模型通过隐藏状态的循环连接,能够把历史信息带到当前时刻以捕捉轨迹的长短期依赖关系[8],刘凇佐等[9]将粒子群优化算法(particle swarm optimization,PSO)与门控循环单元(gated recurrent unit,GRU)结合,基于北大西洋漂流浮标数据验证了该模型具有一定的精度与时效性. Transformer的注意力机制可捕捉垃圾漂移轨迹的长时依赖关系,吴跃高等[10]提出的Seq2Seq-CA模型融合了拼接注意力机制提升了船舶轨迹预测精度,但注意力机制计算上的二次复杂度限制了其在水漂垃圾实时预测中的应用. 随着对时空依赖性建模需求的深化,Bai等[11]通过串联Transformer与图注意力网络(graph attention networks,GAT)捕捉时序与空间依赖,在交通流预测中表现优异. 但深度图网络易出现过平滑问题,导致异质性区域轨迹波动特征被均质化[12]. 近年来模型动态化与自适应能力成研究热点[13],Zhou等[14]提出自适应图卷积循环网络(adaptive graph convolutional recurrent network,AGCRN),引入可学习邻接矩阵与门控单元,提升了时空建模能力. 然而水漂垃圾轨迹的空间关联具有时变特性,基于节点相似度的自适应矩阵在捕捉动态关联[15]的同时引入了冗余边,削弱了模型对关键节点的聚焦能力. Liu等[16]结合多图融合与自注意力机制构建船舶动态模型,在天津港附近水域预测效果良好;Zhao等[17]通过将K跳图卷积与长短期记忆网络(long short-term memory,LSTM)融合,提升了船舶轨迹的预测效果. 但垃圾轨迹时空特征的跨尺度交织性使得套用传统分离式建模易产生特征解耦误差[18].

针对上述问题,本研究提出基于多尺度自适应图卷积的水漂垃圾轨迹预测(multi-scale adaptive graph convolution model for floating garbage trajectory prediction,MAGC Trajectory)模型. 在时空异质性动态建模方面,设计了自适应门控图卷积模块,融合时空先验约束的静态拓扑与水流突变驱动的动态拓扑,实现时空异质因子的差异化表征. 将该模块运用到多尺度图卷积网络,避免了时空建模割裂和深度图卷积网络过平滑问题;在多尺度误差积累抑制方面,构建多尺度时空交互模块,通过时空路由层将空间语义解耦至多尺度时间特征流,阻断误差在模型多尺度特征间的级联放大,提升预测鲁棒性;在此基础上,引入改进非线性学习层,以可学习的自适应激活函数整合多尺度时空特征,缓和多尺度特征间的冲突性干扰. 最后,结合概率预测层量化复杂环境下的漂移路径不确定性区间,提高预测结果的可靠性[19].

1. 本研究MAGC-Trajectory方法

1.1. 图卷积方法

水漂垃圾运动轨迹受多方面的因素干扰,河道地形蜿蜒曲直,错综复杂,其弯曲程度和宽窄会影响河道环境,进而使得水漂垃圾的运动状态及运动轨迹的规律难以捉摸. 水漂垃圾及其所处环境可使用图结构建模. 在以时序关系为基础构建图结构时,设$ \boldsymbol{G}=\langle \boldsymbol{V,E,A}\rangle $,其中$ \boldsymbol{V}=[{v}_{1},{v}_{2},\cdots ,{v}_{n}] $表示不同特征下同一时间的节点数据,$ n $表示节点(时间步)的个数,$ \boldsymbol{E}=[{e}_{1},{e}_{2},\cdots ,{e}_{m}] $表示边的集合向量,反映不同时间节点的链接关系,$ m $表示边的个数,$ \boldsymbol{A}\in {{R}}^{N\times M} $,若节点$ {v}_{i} $$ {v}_{j} $之间没有关系,则$ {A}_{ij}=0 $,反之则为有关系. 目前主流的图卷积方法可以分为谱域图卷积方法以及空域图卷积方法.

1)谱域图卷积基于图拉普拉斯矩阵的谱分解,通过图的频率域特性对信号进行卷积[20]. 谱域图卷积表达式如下:

$\boldsymbol{y}=g_\theta * \boldsymbol{X}=\boldsymbol{U} g_\theta(\boldsymbol{\varLambda}) \boldsymbol{U}^{\mathrm{T}} \boldsymbol{X} , $

$\boldsymbol{L}=\boldsymbol{I}-\boldsymbol{D}^{-1 / 2} \boldsymbol{A} \boldsymbol{D}^{-1 / 2} , $

$ \boldsymbol{U} {\boldsymbol{\varLambda}} \boldsymbol{U}^{\mathrm{T}}=\boldsymbol{L} . $

式中:$ \boldsymbol{y} $为输出图信号;$ {g}_{\theta }({\boldsymbol{\varLambda}}) $为图滤波器;参数$ \theta $表示滤波器参数;$ \boldsymbol{L} $为对称归一化拉普拉斯矩阵,包含水漂垃圾图结构数据的节点连接信息;$ \boldsymbol{I} $为单位矩阵;$ \boldsymbol{A} $为邻接矩阵;$ \boldsymbol{D} $为度矩阵,反映了每个节点邻域连接信息,这使得拉普拉斯矩阵能够更好地捕捉图的拓扑结构;$ \boldsymbol{U} $$ {\boldsymbol{\varLambda}} $为拉普拉斯矩阵$ \boldsymbol{L} $的特征分解结果,$ \boldsymbol{U} $为特征向量矩阵,$ {\boldsymbol{\varLambda}} $为对角特征值矩阵;$ {\boldsymbol{U}}^{\mathrm{T}}\boldsymbol{X} $为图数据$ \boldsymbol{X} $在谱域的表示;$ \boldsymbol{U}{g}_{\theta }({\boldsymbol{\varLambda}}){\boldsymbol{U}}^{\mathrm{T}} $表示对信号进行滤波并回到空间域.

直接求谱分解计算代价较高,通常用切比雪夫多项式将$ {g}_{\theta }\ast \boldsymbol{X} $展开来近似计算,只涉及K-跳邻接的稀疏乘法. 表达式如下:

$ {g}_{\theta }\ast \boldsymbol{X}\approx \sum\limits_{k=0}^{K}{\theta }_{k}{T}_{k}({\tilde{\boldsymbol{L}}})\boldsymbol{X}. $

式中:$ {T}_{k}(\cdot ) $为图拉普拉斯矩阵的切比雪夫多项式,$ {\theta }_{k} $为待学习的参数,$ {\tilde{\boldsymbol{L}}} $为归一化的拉普拉斯矩阵.

$ {\tilde{\boldsymbol{L}}}=2\boldsymbol{L}/{\lambda }_{\max }-\boldsymbol{I}. $

式中:$ {\lambda }_{\max } $为对角特征值矩阵的最大特征值. 谱域图卷积具有数学上的严谨性,通过特征变换更容易捕获时序依赖,但存在计算代价高且不易泛化到不同图的问题.

2)空域图卷积通过节点及其邻居的信息聚合,实现对图结构数据的特征提取. 在图的邻接关系上操作,利用邻接矩阵$ \boldsymbol{A} $和节点特征矩阵$ \boldsymbol{X} $,通过聚合节点的局部邻域信息实现卷积操作[21].

空域图卷积表达式如下:

$ \boldsymbol{H}=\sigma (\boldsymbol{A}'\boldsymbol{X}\boldsymbol{W}). $

式中:$ \boldsymbol{A}'={\boldsymbol{D}}^{-1/2}(\boldsymbol{A}+\boldsymbol{I }){\boldsymbol{D}}^{-1/2} $为对称归一化的邻接矩阵;$ \boldsymbol{X}\in {{R}}^{N\times F} $$ N $为节点数,$ F $为每个节点特征维数;$ \boldsymbol{W} $为训练权重矩阵;$ \sigma $为激活函数;$ \boldsymbol{H} $为输出特征矩阵. 空域图卷积的方法更直观,直接操作邻接关系,能准确建模不同因素之间的图结构关系.

1.2. MAGC-Trajectory整体流程

图1所示为提出的MAGC-Trajectory方法. 在自适应门控图卷积(adaptive gated graph convolution,AGGC)模块中,轨迹数据经因果卷积进行维度变换,以挖掘潜在特征表示,将预定义邻接矩阵与基于节点相似度计算得到的自适应邻接矩阵通过门控机制进行融合,构建自适应门控邻接矩阵,并应用到谱域、空域图卷积中,加强模型时间、空间特征的捕获能力;在多尺度时空特征生成模块中,并行地应用4个具有不同感受野的谱域AGGC模块和1个空域AGGC模块,生成4个时间特征及1个空间特征,以捕获时间、空间依赖关系;在时空特征融合层(spatiotemporal feature fusion layer,STFFL)中设计时空路由层(spatiotemporal routing layer,STRL)与双向特征融合层(bidirectional feature fusion layer,Bi-FFL),空间特征图作为动态路由的引导信号,分别与4个尺度的时间特征图进行加权融合,生成4个融合空间信息的时空特征图,实现空间结构对多尺度时间特征的动态引导与精细化调制;双向特征融合层对4个融合后的时空特征图进行信息交换与整合,进一步提炼跨尺度的时空依赖信息,实现对漂移轨迹中多尺度时空模式的统一建模. 改进非线性学习层(enhanced nonlinear learning layer,ENLL)接收整合特征,通过动态调整激活函数,能够自适应地平衡全局与局部模式的表示,增强模型对轨迹中复杂非线性关系的刻画能力. 最后,设计概率预测层(probabilistic forecasting layer,PFL)为输出提供不确定性量化,能更全面地反映水漂垃圾在真实环境下的动态变化并提高预测的可靠度.

图 1

图 1   水漂垃圾轨迹多尺度自适应图卷积模型(MAGC-Trajectory)

Fig.1   Multi-scale adaptive graph convolution model for floating garbage trajectory(MAGC-Trajectory)


1.3. 多尺度时空特征生成

图2所示为多尺度时空特征生成模块结构示意图. 为了实现对水漂垃圾轨迹中宏观运动趋势与局部漂移模式的精细捕捉,使用谱域AGGC和空域AGGC设计多尺度时空特征生成模块[22]. 输入数据通过因果卷积提取漂移轨迹的多尺度时间与空间特征. 多尺度特征生成模块输出1个空间特征以及4个多尺度时序特征共5个特征:$ {\boldsymbol{H}}_{\mathrm{S}}\in {{R}}^{B\times N\times T} $$ {\boldsymbol{H}}_{\mathrm{T}}\in {{R}}^{B\times T\times N} $$ {\boldsymbol{H}}_{\mathrm{T}/2}\in {\bf{R}}^{B\times (T/2)\times N} $$ {\boldsymbol{H}}_{\mathrm{T}/4}\in {{R}}^{B\times (T/4)\times N} $$ {\boldsymbol{H}}_{\mathrm{T}/8}\in {{R}}^{B\times (T/8)\times N} $,其中$ B $为批次数,$ T $为时间步数,$ N $为每个时间步的特征维度.

图 2

图 2   多尺度时空特征生成模块结构示意图

Fig.2   Structure diagram of multi-scale spatiotemporal feature generation module


图3所示为本研究设计的自适应门控图卷积方法. 通过切比雪夫图卷积捕获时序依赖关系;通过空域图卷积来捕获空间依赖关系,实现轨迹数据中的多变量之间的融合. 首先,设输入数据为$ \boldsymbol{H}\in {{R}}^{B\times T\times N} $,通过不同空洞率的因果卷积获得不同尺度下的特征表示,以捕获水漂垃圾漂移过程中的长短期时序依赖关系. 以谱域AGGC为例,先对$ \boldsymbol{H} $使用因果卷积:

图 3

图 3   自适应门控图卷积

Fig.3   Adaptive gated graph convolution


$ \boldsymbol{H}_{\mathrm{C}}^{}=\mathrm{causal}\_ \mathrm{conv}(\boldsymbol{H}). $

式中:$ \mathrm{causal}\_ \mathrm{conv} $为1×1因果卷积,$ \boldsymbol{H}_{\mathrm{C}}^{}\in {\bf{R}}^{B\times T\times N} $为因果特征. 对于每一个批次$ {B}_{i} $,若将时间步数$ T $作为图的节点数,每一个节点可表示为$ {\boldsymbol{h}}_{t}\in {{R}}^{1\times 1\times N} $,则批次内任意2个节点$ i $$ j $之间的余弦相似度$ {S}_{ij} $定义为

$ {S}_{ij}=\frac{{{\boldsymbol{h}}}_{i}\cdot {{\boldsymbol{h}}}_{j}}{\|{{\boldsymbol{h}}}_{i}\| \;\|{{\boldsymbol{h}}}_{j}\|}. $

特征矩阵$ \boldsymbol{H}_{\mathrm{C}}^{} $的一个批次依据式(8)得到自适应图:

$ {{\boldsymbol{M}}_{\rm{A}}} = \left[ {\begin{array}{*{20}{c}}{{S_{11}}}&{{S_{12}}}& \cdots &{{S_{1T}}}\\{{S_{21}}}&{{S_{22}}}& \cdots &{{S_{2T}}}\\ \vdots & \vdots &{}& \vdots \\{{S_{T1}}}&{{S_{T1}}}& \cdots &{{S_{TT}}}\end{array}} \right]. $

预定义邻接矩阵$ {\boldsymbol{M}}_{\mathrm{P}}\in {{R}}^{T\times T} $为单位矩阵,并与自适应邻接矩阵$ {\boldsymbol{M}}_{\mathrm{A}} $通过门控机制交互融合形成$ {\boldsymbol{M}}_{\mathrm{AG}} $.

$ {\boldsymbol{y}}_{\mathrm{A}}=\tanh \;({\boldsymbol{W}}_{\mathrm{A}}\cdot {\boldsymbol{M}}_{\mathrm{A}}), $

$ {\boldsymbol{y}}_{\mathrm{P}}=\tanh \;({\boldsymbol{W}}_{\mathrm{P}}\cdot {\boldsymbol{M}}_{\mathrm{P}}). $

$ {\boldsymbol{M}}_{\mathrm{A}} $$ {\boldsymbol{M}}_{\mathrm{P}} $分别通过权重矩阵$ {\boldsymbol{W}}_{\mathrm{A}} $$ {\boldsymbol{W}}_{\mathrm{P}} $进行线性变换得到特征$ {\boldsymbol{y}}_{\mathrm{A}} $$ {\boldsymbol{y}}_{\mathrm{P}} $,然后通过双曲正切激活函数捕获水漂垃圾轨迹数据中节点特征间的非线性关系. 此外,z为门控权重,控制特征融合强度:

$ \boldsymbol{z}=\sigma ({\boldsymbol{W}}_{\mathrm{z}}\cdot ({\boldsymbol{M}}_{\mathrm{A}}||{\boldsymbol{M}}_{\mathrm{P}})). $

式中:z为门控权重;$ || $表示将$ {\boldsymbol{M}}_{\mathrm{A}} $$ {\boldsymbol{M}}_{\mathrm{P}} $在最后一个维度上进行拼接操作,然后通过权重矩阵$ {\boldsymbol{W}}_{\mathrm{z}} $进行线性变换;$ \sigma $表示$ \mathrm{Sigmoid} $激活函数,将输出值限制在$ [0,1.0] $,表示节点之间依赖关系的强弱.

通过门控权重$ \boldsymbol{z} $$ {\boldsymbol{y}}_{\mathrm{A}} $$ {\boldsymbol{y}}_{\mathrm{P}} $加权求和:

$ {\boldsymbol{M}}_{\mathrm{F}}=\boldsymbol{z}\cdot {\boldsymbol{y}}_{\mathrm{A}}+(\boldsymbol{J}-\boldsymbol{z})\cdot {\boldsymbol{y}}_{\mathrm{P}}. $

式中:$ \boldsymbol{J} $为全1矩阵;$ {\boldsymbol{M}}_{\mathrm{F}}\in {{R}}^{T\times T} $为融合水漂垃圾先验知识与轨迹数据自身特征的自适应门控邻接矩阵,既抑制了$ {\boldsymbol{M}}_{\mathrm{A}} $中冗余边的产生,又通过$ {\boldsymbol{M}}_{\mathrm{P}} $保留水漂垃圾漂流过程中的先验知识,增强了邻接矩阵的高效性和准确性. 将每一个批次的$ {\boldsymbol{M}}_{\mathrm{F}} $组合得到的$ \boldsymbol{S}\in {{R}}^{B\times T\times T} $,应用到图卷积方法构成AGGC:

$ {\boldsymbol{H}}_{\mathrm{T}}=\mathrm{GCN}(\boldsymbol{H}_{\mathrm{C}}^{},\boldsymbol{S}). $

式中:$ {\boldsymbol{H}}_{\mathrm{T}} $为谱域AGGC模块的输出特征.

1.4. 多尺度时空特征交互

图4所示,多尺度时空交互模块通过Bi-FFL与STRL实现对异质性特征的解析. 其中,STRL将空间特征映射至不同时间尺度域,提取各尺度对应的空间语义分量,并通过路由系数动态调节空间分量在时间维度的投影,在保留时序特征动态变化模式的同时,融入空间分布信息,使模型能够同步考量空间与时间维度的相互依赖关系. 为了高效融合多尺度时空特征,Bi-FFL以4个时空特征为输入,通过特征贡献度加权的双向特征交互机制充分整合多尺度信息,在提升时空表征精度的同时,有效抑制传统方法中误差随尺度传导的级联放大效应.

图 4

图 4   时空特征融合层结构示意图

Fig.4   Structure diagram of spatiotemporal feature fusion layer


图4(b)所示,时空路由层将空间特征嵌入到时序特征中以形成水漂垃圾时空特征:首先,对空间特征$ {\boldsymbol{H}}_{\mathrm{S}} $进行转置,使其维度与时间特征对齐. 通过线性变换,将空间特征$ \boldsymbol{H}_{\mathrm{S}}^{\mathrm{T}} $和时间特征$ {\boldsymbol{H}}_{\mathrm{T}/i} $分别映射到各自尺度的子空间:

$ \boldsymbol{S}=\text { Linear}_{\text {share }}\left(\boldsymbol{H}_{\mathrm{S}}^{\mathrm{T}}\right) . $

$ \boldsymbol{T}_i=\operatorname{Linear}_{\text {share}}\left(\boldsymbol{H}_{\mathrm{T} / i}\right);\; i \in\{1,2,3,4\} . $

式中:$ \boldsymbol{S}\in {{R}}^{B\times T\times {{C}_{\mathrm{space}}}} $$ {\boldsymbol{T}}_{i}\in {{R}}^{B\times T\times {{C}_{\mathrm{time}}}} $CspaceCtime分别对应子空间特征通道维度大小;$ {\mathrm{Linear}}_{\mathrm{share}} $为共享线性层,用于映射子空间,获取时空特征的潜在表示并且保留时空信息的完整性. 通过计算空间子空间与时间子空间之间的相似性,确定路由系数$ \boldsymbol{C} $,实现水漂垃圾时空特征的精细融合.

$ \boldsymbol{C}_i=\sigma\left(\text { Linear}_{\text{routing }}\left(\operatorname{resized}(\boldsymbol{S}) \| \boldsymbol{T}_i\right)\right)\; . $

式中:$ {\boldsymbol{C}}_{i}\in {{R}}^{B\times (T/i)\times 1},i\in \{1,2,3,4\} $$ {\mathrm{Linear}}_{\mathrm{routing}} $为路由层;$ \mathrm{resized}(\cdot ) $表示降采样操作;$ || $表示在最后一个维度上的拼接操作,用于将路由系数限制在$ [0,1.0] $. 使用路由系数$ \boldsymbol{C} $对空间子空间和时间子空间进行加权融合,并通过线性层映射调整维度再应用ReLU激活函数和批归一化层(batch normalization,BN),以增强融合后的水漂垃圾时空特征的非线性表达能力和稳定性:

$ {\boldsymbol{H}}_{\mathrm{ST}/i}=\mathrm{BN}(\mathrm{ReLU}({\mathrm{Linear}}_{\mathrm{fusion}}(\mathrm{resized}(\boldsymbol{S})\odot {\boldsymbol{C}}_{i}||{\boldsymbol{T}}_{i}\odot {\boldsymbol{C}}_{i}))). $

式中:$ {\mathrm{Linear}}_{\mathrm{fusion}} $为线性层,用于将加权后的特征映射到最终的嵌入维度,$ \odot $表示逐元素乘法. 4个时空特征分别为$ {\boldsymbol{H}}_{\mathrm{ST}}\in {{R}}^{B\times T\times N} $$ {\boldsymbol{H}}_{\mathrm{ST}/2}\in {{R}}^{B\times (T/2)\times N} $$ {\boldsymbol{H}}_{\mathrm{ST}/4}\in {{R}}^{B\times (T/4)\times N} $$ {\boldsymbol{H}}_{\mathrm{ST}/8}\in {{R}}^{B\times (T/8)\times N} $.

图4(a)中Bi-FFL所示,在时空特征融合方式中,每个特征接受2个上级输入,通过将特征上采样或下采样以适配维度,对输入特征$ {\boldsymbol{H}}_{\mathrm{ST}} $加权,通过除以加权因子$ {w} $之和来将其大小缩放到$ [0,1.0] $$ \varepsilon =0.000\;1 $用来避免数值不稳定,$ \mathrm{resized}(\cdot ) $表示降采样操作. 以H'ST/2H''ST/2为例,其表达式如下:

$ \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime}=\operatorname{conv}\left(\frac{{w}_1 \cdot \boldsymbol{H}_{\mathrm{ST} / 2}+{w}_2 \cdot \operatorname{resized}\left(\boldsymbol{H}_{\mathrm{ST}}\right)}{{w}_1+{w}_2+\varepsilon}\right)\; , $

$ \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime \prime} = \operatorname{conv}\left( \dfrac{{w}_1^{\prime} \cdot \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime} + {w}_2^{\prime} \cdot \operatorname{resized}\left(\boldsymbol{H}_{\mathrm{ST} / 4}^{\prime \prime}\right)}{{w}_1^{\prime} + {w}_2^{\prime} + \varepsilon} \right) . $

1.5. 改进非线性学习层ENLL

提出基于KAN(kolmogorov-arnold network)[23]的改进非线性学习层ENLL,其可学习激活函数使其在处理高度非线性、跨尺度的轨迹特征时具有更强的拟合能力和灵活性,它能更好地协调大尺度趋势与微尺度扰动,从而缓解特征冲突,减少轨迹预测失真.

图5所示为MLP与KAN结构对比. 在多层感知机中,点代表输入的水漂垃圾特征数据,边代表权重,曲线代表固定的激活函数,而KAN在每个点均能够汇总可学习激活函数的输出且不进行任何非线性变换.

图 5

图 5   MLP与KAN结构对比

Fig.5   Structure comparison between MLP and KAN


$ \mathrm{MLP}(\boldsymbol{x})=({\boldsymbol{W}}_{{L}}\cdot \sigma \cdot {\boldsymbol{W}}_{{L}-1}\cdot \sigma \cdots {\boldsymbol{W}}_{1}\cdot \sigma \cdot {\boldsymbol{W}}_{0}\cdot \sigma ), $

$ \mathrm{KAN}(\boldsymbol{x})=({\varPhi }_{{L}}\cdot {\varPhi }_{{L}-1} \cdots {\varPhi }_{1}\cdot {\varPhi }_{0}). $

式中:$ \boldsymbol{W} $表示线性权重参数,$ \sigma $表示非线性激活函数,$ \varPhi $表示可学习的激活函数.

KAN的核心计算开销来源于其可学习的激活函数,当网络宽度较大、深度增加,或者每个激活函数使用的B样条基函数数量较多时,这些操作会变得非常密集,降低整体模型的实时性. 因此,ENLL在原始KAN的基础上优化了隐藏层宽度、网络深度以及激活函数基函数的初始化策略,以适应水漂垃圾轨迹数据的维度和时空尺度特性,在保证模型容量的同时提升计算效率与泛化能力.

综上,与传统的多层感知器相比,ENLL能够更好地处理水漂垃圾轨迹中如河道地形和水流波动这类高度非线性特征造成的影响. 在保持整体轨迹平滑性的同时,通过动态调整激活函数,使得模型能够精确捕捉细小的波动和变化,从而提高了水漂垃圾轨迹预测的准确性与灵活性.

1.6. 概率预测层

在水漂垃圾轨迹预测任务中,垃圾的具体漂流位置随时间动态改变,模型预测的单一确定性结果往往存在较大误差,导致了预测位置不确定性高的问题. 本研究设计概率预测层,采用均值-方差估计方法来捕捉观测中的随机不确定性,提供比确定性预测更为全面的信息. 设数据集$ {D}=\{{\boldsymbol{x}}_{t},{{y}}_{t}\}_{t=1}^{T} $,其中$ {\boldsymbol{x}}_{t}\in {{R}}^{D} $表示$ t $时刻的输入特征,包含影响水漂垃圾运动的多维环境信息,而$ {{y}}_{t} $为对应的水漂垃圾位置或轨迹信息. 神经网络只须通过2个神经元输出用于估计目标概率分布的均值$ {\hat{\mu }}_{t} $与方差$ \hat{\sigma }_{t}^{2}\in (0,1.0) $,从而描述水漂垃圾位置的预测分布. 由于传统的均方根误差(root mean square error,RMSE)难以有效捕捉时间序列预测中的不确定性,为了量化模型的预测不确定性,采用负对数似然(negative log likelihood,NLL)作为训练损失. 通过将观测值$ {\boldsymbol{y}}_{t} $作为目标分布的样本,NLL表达式如下:

$ \mathrm{NLL}=0.5\left(\log\; (2{\text{π}} \hat{\sigma }_{t}^{2})+\frac{{({{y}_{t}}-{{\mu }_{t}})}^{2}}{\hat{\sigma }_{t}^{2}}\right). $

每一次前向传播会输出一个正态分布,其均值为$ {\hat{\mu }}_{t} $,方差为$ \hat{\sigma }_{t}^{2} $$ M $次传播后构成一个均匀加权的正态分布混合体. 混合均值$ {\hat{\mu }}_{t,\mathrm{mix}} $和方差$ \hat{\sigma }_{t,\mathrm{mix}}^{2} $表达式如下:

$ {\hat{\mu }}_{t,\mathrm{mix}}=\frac{1}{M}\sum\limits_{i=1}^{M}{{\hat{{\mu }}}}_{t,i}, $

$ \hat{\sigma }_{t,\mathrm{mix}}^{2}=\frac{1}{M}\sum\limits_{i=1}^{M}({\hat{{\sigma }}}_{t,i}^{2}+{\hat{{\mu }}}_{t,i}^{2})-\hat{{\mu }}_{t,\mathrm{mix}}^{2}. $

使用均值和方差估算轨迹预测的区间:$ {\hat{y}}_{t}={\hat{\mu }}_{t,\mathrm{mix}} $,下界$ {\hat{L}}_{t}={\hat{\mu }}_{t,\mathrm{mix}}-z{\hat{\sigma }}_{t,\mathrm{mix}} $,上界$ {\hat{U}}_{t}={\hat{\mu }}_{t,\mathrm{mix}}+ z{\hat{\sigma }}_{t,\mathrm{mix}} $,其中z为正态分布的标准得分,对于95%的预测区间($ P({L}_{t} \lt {y}_{t} \lt {U}_{t})=0.95 $),选择$ z=1.96 $来计算.

2. 实验设计与验证

2.1. 数据集介绍

图6(a)所示,鹦鸽嘴水库位于张掖市肃南县梨园河中游,距临泽县城约41 km. 如图6(b)所示展示了流经兰州市城区的黄河部分河段. 2处水域均是所在区域内重要的水源地与生态节点. 水域内水漂垃圾的运动轨迹均受到风速、水流速度、河道地形及气象条件等多重因素的交互影响,呈现出高度随机与不可预测的特征,给监测数据的获取和分析带来较大挑战. 将垃圾轨迹的时空变化视为风速、水流、地形及气象条件动态耦合作用的综合结果,通过分析轨迹的漂移模式与速度波动,实现环境要素的隐式融合计算,无需解耦各因素独立建模. 基于此,为了揭示水漂垃圾的运动规律并制定相应的治理策略,通过GPS定位器采集水漂垃圾的运动轨迹,并计算其经向速度、纬向速度、经向加速度与纬向加速度4个运动学因素,结合经度与纬度信息,构建了包含6个要素的多因素轨迹数据集. 经纬度定位器主芯片为ML307A,使用SIM卡实现定位. 按照美国国家海洋和大气管理局(national oceanic and atmospheric administration,NOAA)大西洋海洋与气象实验室的全球漂流器数据集的制作标准[24]处理原始轨迹数据,并分别计算其经纬度方向上的分解速度和加速度. 共采取了长度不一的50条水漂垃圾轨迹数据,其中训练集、测试集、验证集划分比例为6∶2∶2,任选出6条验证轨迹用于展示. 轨迹1、2、3、4采集自鹦鸽嘴水库,轨迹5、6采集自黄河兰州段.

图 6

图 6   鹦鸽嘴水库及黄河兰州段卫星图

Fig.6   Satellite images of Yinggezui reservoir and Lanzhou section of Yellow River


表1所示为这6条轨迹的起点与终点经纬度以及相应的时间步数. 如表2所示展示了轨迹1的部分数据.

表 1   水漂垃圾轨迹数据集轨迹点位置及数量信息

Tab.1  Information on position and quantity of trajectory points in water-floating garbage trajectory dataset

轨迹采集时间地点轨迹点数目起点经度/(°E)起点纬度/(°N)终点经度/(°E)终点纬度/(°N)
轨迹111月鹦鸽嘴水库57399.833 099 0038.936 024 0099.850 564 9738.942 732 20
轨迹211月鹦鸽嘴水库1 87999.832 001 9438.934 474 4799.843 727 8138.938 661 67
轨迹311月鹦鸽嘴水库2 24499.831 926 3538.934 483 9099.850 458 2038.943 343 19
轨迹411月鹦鸽嘴水库1 70899.833 256 6738.936 136 9799.869 500 0538.955 534 76
轨迹55月黄河兰州段4 327103.769 908 2536.089 722 37103.817 942 836.070 174 72
轨迹65月黄河兰州段3 234103.740 453 6136.095 214 53103.765 875 036.090 130 10

新窗口打开| 下载CSV


表 2   轨迹1数据展示

Tab.2  Data display of trajectory 1

时间经度/(°E)纬度/(°N)经向速度/(m·s−1纬向速度/(m·s−1经向加速度/(m·s−2纬向加速度/(m·s−2
2024/11/3099.833 099 0038.936 024 000.118 678 8720.032 987 1590.011 867 8870.003 298 716
2024/11/3099.833 102 8138.936 010 280.133 466 4640.021 879 2470.013 346 6460.002 187 925
2024/11/3099.833 100 2838.935 994 850.124 292 8560.084 214 0350.012 429 2860.008 421 404
$\vdots $$\vdots $$\vdots $$\vdots $$\vdots $$\vdots $$\vdots $
2024/11/3099.850 561 5438.942 724 880.063 335 870.029 671 3620.006 333 5870.002 967 136

新窗口打开| 下载CSV


2.2. 评价指标与实验参数

为了验证所提多尺度图卷积模型的有效性,采用平均绝对误差(mean absolute error,MAE)、均方根误差RMSE、预测区间覆盖概率(prediction interval coverage probability,PICP)、平均预测区间宽度(mean prediction interval width,MPIW)作为评价指标.

$ \mathrm{MAE}=\frac{1}{N}\sum\limits_{i=1}^{N}(\left| {y}_{i}-{\overline{y}}_{i}\right|+\left| {x}_{i}-{\overline{x}}_{i}\right| ), $

$ \mathrm{RMSE}=\sum\limits_{i=1}^{N}\sqrt{\frac{1}{N}[{({{y}_{i}}-{{\overline{y}}_{i}})}^{2}+{({{x}_{i}}-{{\overline{x}}_{i}})}^{2}]}. $

式中:$ N $为样本数据的总数量,$ {x}_{i} $$ {y}_{i} $为轨迹经纬度数据真实值,$ {\overline{x}}_{i} $$ {\overline{y}}_{i} $为轨迹经纬度数据预测值. MAE和RMSE越小,预测精度越高.

$ \mathrm{PICP}=\frac{1}{T}\sum\limits_{t=1}^{T}1({y}_{t}\geq L_{t}^{})\cdot {1}({y}_{t}\leq U_{t}^{}). $

式中:$ {1}(\cdot ) $为Heaviside步骤函数,表示如果条件成立则为$ 1 $,否则为$ 0 $; $ L_{t}^{} $$ U_{t}^{} $分别为时间$ t $时刻的预测下限和上限. PICP越大,说明模型的预测区间越能覆盖真实的观测值.

$ \mathrm{MPIW}=\frac{1}{T}\sum\limits_{t=1}^{T}(U_{t}^{}-L_{t}^{}). $

MPIW越小表示预测区间越窄.

本研究实验的硬件环境配置如下:CPU为13th Gen Intel® Core™ i5-13600KF,GPU为NVIDIA GeForce RTX 4070 SUPER. 本研究方法基于Python3.8和Pytorch1.11深度学习框架实现,CUDA版本为12.5,cuDNN版本为64.9. 模型优化器为Adam,批量大小$ B $为24,初始学习率为0.000 1,并采用0.001的指数衰减率在训练模型中更新学习率,Dropout为0.2,切比雪夫多项式的阶数为4,AGGC堆叠层数为3,空域AGGC预定义邻接矩阵初始化为全1矩阵,ENLL隐藏层宽度为64、深度为2层,决定样条分段分辨率的grid_size为3,决定每段采用几次多项式以及端点需要外延的结点数的spline_order为3,并使用验证集进行超参数调优. 基准线模型参数与本研究所提模型的实验参数设置相同.

2.3. 消融实验分析

为了评估模型中各部分的有效性,以GNN为基准模型,增加多尺度方法,模型命名为GNN-Multi-Scale(GNN-MS);在此基础上增加自适应门控图卷积方法,模型命名为GNN-Adaptive-Gate(GNN-AG);在此基础上增加多尺度特征融合方法,模型命名为GNN-Fusion-Network(GNN-FN);在此基础增加改进非线性学习层,模型命名为MAGC-Trajectory. 在轨迹3上进行消融模型的实验分析.

表3所示展示了各消融模型在2号塑料类轨迹上的预测结果. 所有改进模型均实现了100%的预测区间覆盖率. 相较于基准模型GNN,GNN-MS的MAE降低至0.000 236 09,RMSE降低至0.000 312 67,表明性能显著提升,其多尺度特征提取有效整合了时空信息,提升了长期趋势和关键转折点捕捉能力,但其MPIW为0.002 5,相对较大. GNN-AG的RMSE进一步降低至0.000 294 61,MPIW显著缩小至0.002 5,体现了模型稳定性的提升. 其自适应门控图卷积机制通过动态学习最优空间依赖并过滤冗余连接,有效降低了噪声敏感性,优化了空间特征捕捉. GNN-FN的性能提升最为显著,MAE降至0.000 157 57,RMSE降至0.000 196 12,MPIW缩小至0.001 8. 该模型通过深度耦合与多尺度时空特征交互,增强了对复杂时空动态协同演化的整体建模能力,并产出更平滑、置信区间更窄的预测. MAGC-Trajectory的综合表现最优,MAE为0.000 135 89、RMSE为0.000 161 03、MPIW为0.001 9,均为最低值. 该模型集成前述优势,其中改进非线性学习层通过动态调整激活函数优化了非线性映射和拟合能力,有效抑制了特征融合波动及预测残余抖动,实现了高精度、高稳定性的轨迹预测.

表 3   消融模型指标对比

Tab.3  Comparison of indicators of ablation models

模型名称2号塑料类轨迹
MAERMSEPICPMPIW
GNN0.000 360 700.000 637 3510.003 2
GNN-MS0.000 236 090.000 312 6710.002 5
GNN-AG0.000 235 990.000 294 6110.002 5
GNN-FN0.000 157 570.000 196 1210.001 8
MAGC-Trajectory0.000 135 890.000 161 0310.001 9

新窗口打开| 下载CSV


2.4. 对比实验分析

为了验证本研究模型的预测结果,选取ARIMA[25]、LSTM、PSO-GRU、CNN-LSTM、Crossformer[26]、ASTGCN[27]、PatchTST[28]、DCRNN、K-GCN-LSTM这9个预测模型,在轨迹3、4、5、6上进行对比实验.

图7所示为不同对比算法在轨迹6上的预测结果,其中,lat、lon分别为纬度、经度. 可以看出,PSO-GRU、K-GCN-LSTM整体上预测误差较大;ARIMA、LSTM、Crossformer能够大致把握垃圾漂移路径,预测较为准确;ASTGCN、DCRNN能够较好地拟合轨迹,但预测轨迹波动较大,不确定性较高;PatchTST、CNN-LSTM轨迹波动小,与真实轨迹基本吻合,但在轨迹弯折处误差较大;MAGC-Trajectory综合预测效果最优,基本拟合垃圾漂移路径,轨迹波动较小,轨迹弯折处误差较小.

图 7

图 7   轨迹6预测结果对比

Fig.7   Comparison of prediction results of trajectory 6


表4所示为不同对比算法的MAE与RMSE的对比. 分析表明,基于统计的预测模型ARIMA在预测轨迹上的MAE较高;LSTM能提取轨迹时间特征,然而缺乏时空联合建模,导致轨迹3上的MAE达到0.000 66,PSO-GRU在轨迹3上表现相对突出,其MAE达到0.000 27,但整体稳定性不足;Crossformer在轨迹6上表现良好,MAE达到0.000 67,但在轨迹5上误差偏大,MAE达到0.002 93;PatchTST通过分块式时间建模与单变量通道独立机制,在相对平滑的轨迹5上主动避免学习多因素特征间的复杂关联,从而精准捕捉单一维度的漂移趋势,取得MAE为0.000 227 43的最优结果;CNN-LSTM在轨迹3上预测表现良好,但因时空耦合不足,整体仍落后于图卷积方法;ASTGCN在轨迹4、轨迹6上表现较好,其MAE分别达到0.000 41和0.000 27,在轨迹5上表现中等,其MAE达到0.000 50,RMSE达到0.000 53;DCRNN利用编码-解码式扩散卷积,在轨迹3上仅次于MAGC-Trajectory,显示出优异的时空动态捕捉能力;MAGC-Trajectory在轨迹3、4、6上的预测性能较优,MAE分别为0.000 135 89、0.000 285 29,0.000 097 49,RMSE分别为0.000 161 03、0.000 331 46、0.000 131 98,整体优于其他对比模型,展示了MAGC-Trajectory在挖掘水漂垃圾复杂时空关联和多因素数据特征方面的优势.

表 4   不同对比算法的MAE与RMSE对比

Tab.4  Comparison of MAE and RMSE among different comparison models

模型轨迹3(塑料)轨迹4(塑料)轨迹5(编织物)轨迹6(金属)
MAERMSEMAERMSEMAERMSEMAERMSE
ARIMA0.000 907 770.001 044 910.000 826 460.000 997 000.000 620 720.000 733 710.000 497 540.000 479 94
LSTM0.000 664 180.000 377 460.000 526 430.000 475 120.000 610 720.000 714 910.000 581 390.000 892 69
PSO-GRU0.000 268 660.000 303 530.001 282 100.001 528 820.001 282 580.001 788 720.002 556 010.004 059 56
Crossformer0.000 855 280.001 124 090.001 844 850.003 029 050.002 930 030.005 488 650.000 665 450.001 058 63
PatchTST0.000 235 040.000 339 290.000 357 850.000 382 010.000 227 430.000 325 600.000 268 740.000 431 20
CNN-LSTM0.000 206150.000 920 980.000 416 620.000 685 010.000 706 420.000 874 630.000 415 090.000 584 47
ASTGCN0.000 285 360.000 304 840.000 406 330.000 628 630.000 502 940.000 529 850.000 270 920.000 346 26
DCRNN0.000 196 310.000 242 670.000 426 840.000 605 680.000 322 170.000 288 780.000 151 100.000 212 69
K-GCN-LSTM0.000 471 820.000 542 800.001 911 420.002 420 090.000 279 030.000 199 160.001 057 480.001 440 52
MAGC-Trajectory0.000 135 890.000 161 030.000 285 290.000 331 460.000 241 920.000 251 920.000 097 490.000 131 98

新窗口打开| 下载CSV


2.5. 概率预测结果

MAGC-Trajectory对6条轨迹的预测结果如图8所示. 其中,1号纸类轨迹、3号、6号塑料类轨迹、5号编织类轨迹的置信区间较窄,2号、4号塑料类轨迹的置信区间较宽. 水漂垃圾漂移轨迹的概率预测结果能够量化垃圾未来轨迹的不确定性,为决策者提供更丰富的信息基础,从而使决策者可以做出更科学的治理措施.

图 8

图 8   水漂垃圾轨迹概率预测结果

Fig.8   Water-floating garbage trajectory probability prediction results


3. 结 语

本研究提出基于多尺度自适应图卷积的水漂垃圾轨迹预测模型. 该模型针对水漂垃圾轨迹数据的时空异质性特性,利用门控机制动态融合预定义邻接矩阵与自适应学习矩阵,实现对轨迹节点间长短期时空依赖关系的协同建模. 构建多尺度图卷积网络模型,避免随着网络层数加深而出现的过平滑问题,同时将输入轨迹因素之间的空间特征高效地融合到多尺度时间特征中,形成完整的时空特征. 为了精确捕捉时空特征之间的非线性关系,设计改进非线性学习层,协调跨尺度时空特征的异构性,消除多源时空特征的冲突性干扰. 为了量化预测结果的不确定性,采用概率预测的方法,提供可能的垃圾分布位置,为捕捞者、决策者提供更丰富的信息支持.

在实验过程中发现,复杂运动轨迹会导致较宽的预测置信区间. 未来研究将重点突破多模态数据融合技术,建立跨模态时空特征对齐机制,实现更精确、置信区间更窄的预测方法,为水环境智慧治理提供全天候、多维度的技术支撑.

参考文献

仇威, 栾华龙, 渠庚, 等

三峡水库应急补水对2022年洪季长江口盐水入侵的影响

[J]. 长江科学院院报, 2024, 41 (10): 30- 39

DOI:10.11988/ckyyb.20240616      [本文引用: 1]

QIU Wei, LUAN Hualong, QU Geng, et al

Impact of emergent water supply of the Three Gorges Reservoir on saltwater intrusion in the Changjiang River Estuary in 2022

[J]. Journal of Changjiang River Scientific Research Institute, 2024, 41 (10): 30- 39

DOI:10.11988/ckyyb.20240616      [本文引用: 1]

张云, 王雨, 周绍辉, 等

星载GNSS-R检测太湖水华可行性分析

[J]. 北京航空航天大学学报, 2024, 50 (3): 695- 705

[本文引用: 1]

ZHANG Yun, WANG Yu, ZHOU Shaohui, et al

Analysis on feasibility of detecting water blooms in Taihu Lake with spaceborne GNSS-R

[J]. Journal of Beijing University of Aeronautics and Astronautics, 2024, 50 (3): 695- 705

[本文引用: 1]

TAN Y, CHENG Q, LYU F, et al

Hydrological reduction and control effect evaluation of sponge city construction based on one-way coupling model of SWMM-FVCOM: a case in university campus

[J]. Journal of Environmental Management, 2024, 349: 119599

DOI:10.1016/j.jenvman.2023.119599      [本文引用: 1]

CASTÁN-LASCORZ M A, JIMÉNEZ-HERRERA P, TRONCOSO A, et al

A new hybrid method for predicting univariate and multivariate time series based on pattern forecasting

[J]. Information Sciences, 2022, 586: 611- 627

DOI:10.1016/j.ins.2021.12.001      [本文引用: 1]

潘金伟, 王乙乔, 钟博, 等

基于统计特征搜索的多元时间序列预测方法

[J]. 电子与信息学报, 2024, 46 (8): 3276- 3284

DOI:10.11999/JEIT231264      [本文引用: 1]

PAN Jinwei, WANG Yiqiao, ZHONG Bo, et al

Statistical feature-based search for multivariate time series forecasting

[J]. Journal of Electronics and Information Technology, 2024, 46 (8): 3276- 3284

DOI:10.11999/JEIT231264      [本文引用: 1]

VERDONCK T, BAESENS B, ÓSKARSDÓTTIR M, et al

Special issue on feature engineering editorial

[J]. Machine Learning, 2024, 113 (7): 3917- 3928

DOI:10.1007/s10994-021-06042-2      [本文引用: 1]

CATON S, HAAS C

Fairness in machine learning: a survey

[J]. ACM Computing Surveys, 2024, 56 (7): 1- 38

[本文引用: 1]

AL-SELWI S M, HASSAN M F, ABDULKADIR S J, et al

RNN-LSTM: from applications to modeling techniques and beyond: systematic review

[J]. Journal of King Saud University - Computer and Information Sciences, 2024, 36 (5): 102068

DOI:10.1016/j.jksuci.2024.102068      [本文引用: 1]

刘凇佐, 王虔, 李磊, 等

粒子群优化的门控循环单元网络漂流浮标轨迹预测

[J]. 电子与信息学报, 2024, 46 (8): 3295- 3304

DOI:10.11999/JEIT230945      [本文引用: 1]

LIU Songzuo, WANG Qian, LI Lei, et al

Gated recurrent unit network of particle swarm optimization for drifting buoy trajectory prediction

[J]. Journal of Electronics and Information Technology, 2024, 46 (8): 3295- 3304

DOI:10.11999/JEIT230945      [本文引用: 1]

吴跃高, 俞万能, 曾广淼, 等

融合拼接注意力机制的船舶轨迹预测方法

[J]. 控制理论与应用, 2025, 42 (9): 1798- 1806

[本文引用: 1]

WU Yuegao, YU Wanneng, ZENG Guangmiao, et al

Ship trajectory prediction method incorporating concatenated attention mechanism

[J]. Control Theory and Applications, 2025, 42 (9): 1798- 1806

[本文引用: 1]

BAI J, ZHU J, SONG Y, et al

A3T-GCN: attention temporal graph convolutional network for traffic forecasting

[J]. ISPRS International Journal of Geo-Information, 2021, 10 (7): 485

DOI:10.3390/ijgi10070485      [本文引用: 1]

SRIRAMULU A, FOURRIER N, BERGMEIR C

Adaptive dependency learning graph neural networks

[J]. Information Sciences, 2023, 625: 700- 714

DOI:10.1016/j.ins.2022.12.086      [本文引用: 1]

BAI L, YAO L, LI C, et al

Adaptive graph convolutional recurrent network for traffic forecasting

[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804- 17815

[本文引用: 1]

ZHOU Y, ZHENG H, HUANG X, et al

Graph neural networks: taxonomy, advances, and trends

[J]. ACM Transactions on Intelligent Systems and Technology, 2022, 13 (1): 1- 54

[本文引用: 1]

XU D, PENG H, TANG Y, et al

Hierarchical spatio-temporal graph convolutional neural networks for traffic data imputation

[J]. Information Fusion, 2024, 106: 102292

DOI:10.1016/j.inffus.2024.102292      [本文引用: 1]

LIU R W, LIANG M, NIE J, et al

STMGCN: mobile edge computing-empowered vessel trajectory prediction using spatio-temporal multigraph convolutional network

[J]. IEEE Transactions on Industrial Informatics, 2022, 18 (11): 7977- 7987

DOI:10.1109/TII.2022.3165886      [本文引用: 1]

ZHAO J, YAN Z, CHEN X, et al

K-GCN-LSTM: a k-hop graph convolutional network and long-short-term memory for ship speed prediction

[J]. Physica A: Statistical Mechanics and Its Applications, 2022, 606: 128107

DOI:10.1016/j.physa.2022.128107      [本文引用: 1]

TANG X, CHEN H, XIANG W, et al

Short-term load forecasting using channel and temporal attention based temporal convolutional network

[J]. Electric Power Systems Research, 2022, 205: 107761

DOI:10.1016/j.jpgr.2021.107761      [本文引用: 1]

邵海东, 肖一鸣, 邓乾旺, 等

基于不确定性感知网络的可信机械故障诊断

[J]. 机械工程学报, 2024, 60 (12): 194- 206

DOI:10.3901/JME.2024.12.194      [本文引用: 1]

SHAO Haidong, XIAO Yiming, DENG Qianwang, et al

Trustworthy mechanical fault diagnosis using uncertainty-aware network

[J]. Journal of Mechanical Engineering, 2024, 60 (12): 194- 206

DOI:10.3901/JME.2024.12.194      [本文引用: 1]

TANG S, LI B, YU H. ChebNet: efficient and stable constructions of deep neural networks with rectified power units via Chebyshev approximation [EB/OL]. (2024–10–14) [2025–04–20]. https://doi.org/10.1007/s40304-023-00392-0.

[本文引用: 1]

SHARMA K, LEE Y C, NAMBI S, et al

A survey of graph neural networks for social recommender systems

[J]. ACM Computing Surveys, 2024, 56 (10): 1- 34

[本文引用: 1]

BARAKBAYEVA T, DEMIRCI F M

Fully automatic CNN design with inception and ResNet blocks

[J]. Neural Computing and Applications, 2023, 35 (2): 1569- 1580

DOI:10.1007/s00521-022-07700-9      [本文引用: 1]

LIU Z, WANG Y, VAIDYA S, et al. KAN: Kolmogorov-arnold networks [EB/OL]. (2025−02−09) [2025−04−20]. https://arxiv.org/abs/2404.19756.

[本文引用: 1]

LAURINDO L C, MARIANO A J, LUMPKIN R

An improved near-surface velocity climatology for the global ocean from drifter observations

[J]. Deep Sea Research Part I: Oceanographic Research Papers, 2017, 124: 73- 92

DOI:10.1016/j.dsr.2017.04.009      [本文引用: 1]

ZHONG W, ZHAI D, XU W, et al

Accurate and efficient daily carbon emission forecasting based on improved ARIMA

[J]. Applied Energy, 2024, 376: 124232

DOI:10.1016/j.apenergy.2024.124232      [本文引用: 1]

ZHANG Y, YAN J. Crossformer: transformer utilizing cross-dimension dependency for multivariate time series forecasting [C]// International Conference on Learning Representations. Kigali: [S.n.], 2023: 1–21.

[本文引用: 1]

BAI L, YAO L, LI C, et al

Adaptive graph convolutional recurrent network for traffic forecasting

[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804- 17815

[本文引用: 1]

NIE Y, NGUYEN N H, SINTHONG P, et al. A time series is worth 64 words: long term forecasting with transformers [EB/OL]. (2023−03−05)[2025−04−20]. https://arxiv.org/abs/2211.14730.

[本文引用: 1]

/