<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 水漂垃圾轨迹多尺度自适应图卷积模型（MAGC-Trajectory）

Fig.1 Multi-scale adaptive graph convolution model for floating garbage trajectory（MAGC-Trajectory）

1.3. 多尺度时空特征生成

如图2所示为多尺度时空特征生成模块结构示意图. 为了实现对水漂垃圾轨迹中宏观运动趋势与局部漂移模式的精细捕捉，使用谱域AGGC和空域AGGC设计多尺度时空特征生成模块^[22]. 输入数据通过因果卷积提取漂移轨迹的多尺度时间与空间特征. 多尺度特征生成模块输出1个空间特征以及4个多尺度时序特征共5个特征：$ {\boldsymbol{H}}_{\mathrm{S}}\in {{R}}^{B\times N\times T} $、$ {\boldsymbol{H}}_{\mathrm{T}}\in {{R}}^{B\times T\times N} $、$ {\boldsymbol{H}}_{\mathrm{T}/2}\in {\bf{R}}^{B\times (T/2)\times N} $、$ {\boldsymbol{H}}_{\mathrm{T}/4}\in {{R}}^{B\times (T/4)\times N} $、$ {\boldsymbol{H}}_{\mathrm{T}/8}\in {{R}}^{B\times (T/8)\times N} $，其中$ B $为批次数，$ T $为时间步数，$ N $为每个时间步的特征维度.

图 2

图 2 多尺度时空特征生成模块结构示意图

Fig.2 Structure diagram of multi-scale spatiotemporal feature generation module

如图3所示为本研究设计的自适应门控图卷积方法. 通过切比雪夫图卷积捕获时序依赖关系；通过空域图卷积来捕获空间依赖关系，实现轨迹数据中的多变量之间的融合. 首先，设输入数据为$ \boldsymbol{H}\in {{R}}^{B\times T\times N} $，通过不同空洞率的因果卷积获得不同尺度下的特征表示，以捕获水漂垃圾漂移过程中的长短期时序依赖关系. 以谱域AGGC为例，先对$ \boldsymbol{H} $使用因果卷积：

图 3

图 3 自适应门控图卷积

Fig.3 Adaptive gated graph convolution

(7)$ \boldsymbol{H}_{\mathrm{C}}^{}=\mathrm{causal}\_ \mathrm{conv}(\boldsymbol{H}). $

式中：$ \mathrm{causal}\_ \mathrm{conv} $为1×1因果卷积，$ \boldsymbol{H}_{\mathrm{C}}^{}\in {\bf{R}}^{B\times T\times N} $为因果特征. 对于每一个批次$ {B}_{i} $，若将时间步数$ T $作为图的节点数，每一个节点可表示为$ {\boldsymbol{h}}_{t}\in {{R}}^{1\times 1\times N} $，则批次内任意2个节点$ i $和$ j $之间的余弦相似度$ {S}_{ij} $定义为

(8)$ {S}_{ij}=\frac{{{\boldsymbol{h}}}_{i}\cdot {{\boldsymbol{h}}}_{j}}{\|{{\boldsymbol{h}}}_{i}\| \;\|{{\boldsymbol{h}}}_{j}\|}. $

特征矩阵$ \boldsymbol{H}_{\mathrm{C}}^{} $的一个批次依据式(8)得到自适应图：

(9)$ {{\boldsymbol{M}}_{\rm{A}}} = \left[ {\begin{array}{*{20}{c}}{{S_{11}}}&{{S_{12}}}& \cdots &{{S_{1T}}}\\{{S_{21}}}&{{S_{22}}}& \cdots &{{S_{2T}}}\\ \vdots & \vdots &{}& \vdots \\{{S_{T1}}}&{{S_{T1}}}& \cdots &{{S_{TT}}}\end{array}} \right]. $

预定义邻接矩阵$ {\boldsymbol{M}}_{\mathrm{P}}\in {{R}}^{T\times T} $为单位矩阵，并与自适应邻接矩阵$ {\boldsymbol{M}}_{\mathrm{A}} $通过门控机制交互融合形成$ {\boldsymbol{M}}_{\mathrm{AG}} $.

(10)$ {\boldsymbol{y}}_{\mathrm{A}}=\tanh \;({\boldsymbol{W}}_{\mathrm{A}}\cdot {\boldsymbol{M}}_{\mathrm{A}}), $

(11)$ {\boldsymbol{y}}_{\mathrm{P}}=\tanh \;({\boldsymbol{W}}_{\mathrm{P}}\cdot {\boldsymbol{M}}_{\mathrm{P}}). $

$ {\boldsymbol{M}}_{\mathrm{A}} $和$ {\boldsymbol{M}}_{\mathrm{P}} $分别通过权重矩阵$ {\boldsymbol{W}}_{\mathrm{A}} $和$ {\boldsymbol{W}}_{\mathrm{P}} $进行线性变换得到特征$ {\boldsymbol{y}}_{\mathrm{A}} $和$ {\boldsymbol{y}}_{\mathrm{P}} $，然后通过双曲正切激活函数捕获水漂垃圾轨迹数据中节点特征间的非线性关系. 此外，z为门控权重，控制特征融合强度：

(12)$ \boldsymbol{z}=\sigma ({\boldsymbol{W}}_{\mathrm{z}}\cdot ({\boldsymbol{M}}_{\mathrm{A}}||{\boldsymbol{M}}_{\mathrm{P}})). $

式中：z为门控权重；$ || $表示将$ {\boldsymbol{M}}_{\mathrm{A}} $和$ {\boldsymbol{M}}_{\mathrm{P}} $在最后一个维度上进行拼接操作，然后通过权重矩阵$ {\boldsymbol{W}}_{\mathrm{z}} $进行线性变换；$ \sigma $表示$ \mathrm{Sigmoid} $激活函数，将输出值限制在$ [0,1.0] $，表示节点之间依赖关系的强弱.

通过门控权重$ \boldsymbol{z} $对$ {\boldsymbol{y}}_{\mathrm{A}} $和$ {\boldsymbol{y}}_{\mathrm{P}} $加权求和：

(13)$ {\boldsymbol{M}}_{\mathrm{F}}=\boldsymbol{z}\cdot {\boldsymbol{y}}_{\mathrm{A}}+(\boldsymbol{J}-\boldsymbol{z})\cdot {\boldsymbol{y}}_{\mathrm{P}}. $

式中：$ \boldsymbol{J} $为全1矩阵；$ {\boldsymbol{M}}_{\mathrm{F}}\in {{R}}^{T\times T} $为融合水漂垃圾先验知识与轨迹数据自身特征的自适应门控邻接矩阵，既抑制了$ {\boldsymbol{M}}_{\mathrm{A}} $中冗余边的产生，又通过$ {\boldsymbol{M}}_{\mathrm{P}} $保留水漂垃圾漂流过程中的先验知识，增强了邻接矩阵的高效性和准确性. 将每一个批次的$ {\boldsymbol{M}}_{\mathrm{F}} $组合得到的$ \boldsymbol{S}\in {{R}}^{B\times T\times T} $，应用到图卷积方法构成AGGC：

(14)$ {\boldsymbol{H}}_{\mathrm{T}}=\mathrm{GCN}(\boldsymbol{H}_{\mathrm{C}}^{},\boldsymbol{S}). $

式中：$ {\boldsymbol{H}}_{\mathrm{T}} $为谱域AGGC模块的输出特征.

1.4. 多尺度时空特征交互

如图4所示，多尺度时空交互模块通过Bi-FFL与STRL实现对异质性特征的解析. 其中，STRL将空间特征映射至不同时间尺度域，提取各尺度对应的空间语义分量，并通过路由系数动态调节空间分量在时间维度的投影，在保留时序特征动态变化模式的同时，融入空间分布信息，使模型能够同步考量空间与时间维度的相互依赖关系. 为了高效融合多尺度时空特征，Bi-FFL以4个时空特征为输入，通过特征贡献度加权的双向特征交互机制充分整合多尺度信息，在提升时空表征精度的同时，有效抑制传统方法中误差随尺度传导的级联放大效应.

图 4

图 4 时空特征融合层结构示意图

Fig.4 Structure diagram of spatiotemporal feature fusion layer

如图4(b)所示，时空路由层将空间特征嵌入到时序特征中以形成水漂垃圾时空特征：首先，对空间特征$ {\boldsymbol{H}}_{\mathrm{S}} $进行转置，使其维度与时间特征对齐. 通过线性变换，将空间特征$ \boldsymbol{H}_{\mathrm{S}}^{\mathrm{T}} $和时间特征$ {\boldsymbol{H}}_{\mathrm{T}/i} $分别映射到各自尺度的子空间：

(15)$ \boldsymbol{S}=\text { Linear}_{\text {share }}\left(\boldsymbol{H}_{\mathrm{S}}^{\mathrm{T}}\right) . $

(16)$ \boldsymbol{T}_i=\operatorname{Linear}_{\text {share}}\left(\boldsymbol{H}_{\mathrm{T} / i}\right);\; i \in\{1,2,3,4\} . $

式中：$ \boldsymbol{S}\in {{R}}^{B\times T\times {{C}_{\mathrm{space}}}} $，$ {\boldsymbol{T}}_{i}\in {{R}}^{B\times T\times {{C}_{\mathrm{time}}}} $，C_space与C_time分别对应子空间特征通道维度大小；$ {\mathrm{Linear}}_{\mathrm{share}} $为共享线性层，用于映射子空间，获取时空特征的潜在表示并且保留时空信息的完整性. 通过计算空间子空间与时间子空间之间的相似性，确定路由系数$ \boldsymbol{C} $，实现水漂垃圾时空特征的精细融合.

(17)$ \boldsymbol{C}_i=\sigma\left(\text { Linear}_{\text{routing }}\left(\operatorname{resized}(\boldsymbol{S}) \| \boldsymbol{T}_i\right)\right)\; . $

式中：$ {\boldsymbol{C}}_{i}\in {{R}}^{B\times (T/i)\times 1}，i\in \{1,2,3,4\} $；$ {\mathrm{Linear}}_{\mathrm{routing}} $为路由层；$ \mathrm{resized}(\cdot ) $表示降采样操作；$ || $表示在最后一个维度上的拼接操作，用于将路由系数限制在$ [0,1.0] $. 使用路由系数$ \boldsymbol{C} $对空间子空间和时间子空间进行加权融合，并通过线性层映射调整维度再应用ReLU激活函数和批归一化层(batch normalization，BN)，以增强融合后的水漂垃圾时空特征的非线性表达能力和稳定性：

(18)$ {\boldsymbol{H}}_{\mathrm{ST}/i}=\mathrm{BN}(\mathrm{ReLU}({\mathrm{Linear}}_{\mathrm{fusion}}(\mathrm{resized}(\boldsymbol{S})\odot {\boldsymbol{C}}_{i}||{\boldsymbol{T}}_{i}\odot {\boldsymbol{C}}_{i}))). $

式中：$ {\mathrm{Linear}}_{\mathrm{fusion}} $为线性层，用于将加权后的特征映射到最终的嵌入维度，$ \odot $表示逐元素乘法. 4个时空特征分别为$ {\boldsymbol{H}}_{\mathrm{ST}}\in {{R}}^{B\times T\times N} $、$ {\boldsymbol{H}}_{\mathrm{ST}/2}\in {{R}}^{B\times (T/2)\times N} $、$ {\boldsymbol{H}}_{\mathrm{ST}/4}\in {{R}}^{B\times (T/4)\times N} $、$ {\boldsymbol{H}}_{\mathrm{ST}/8}\in {{R}}^{B\times (T/8)\times N} $.

如图4(a)中Bi-FFL所示，在时空特征融合方式中，每个特征接受2个上级输入，通过将特征上采样或下采样以适配维度，对输入特征$ {\boldsymbol{H}}_{\mathrm{ST}} $加权，通过除以加权因子$ {w} $之和来将其大小缩放到$ [0,1.0] $，$ \varepsilon =0.000\;1 $用来避免数值不稳定，$ \mathrm{resized}(\cdot ) $表示降采样操作. 以H'_ST/2与H''_ST/2为例，其表达式如下：

(19)$ \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime}=\operatorname{conv}\left(\frac{{w}_1 \cdot \boldsymbol{H}_{\mathrm{ST} / 2}+{w}_2 \cdot \operatorname{resized}\left(\boldsymbol{H}_{\mathrm{ST}}\right)}{{w}_1+{w}_2+\varepsilon}\right)\; , $

(20)$ \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime \prime} = \operatorname{conv}\left( \dfrac{{w}_1^{\prime} \cdot \boldsymbol{H}_{\mathrm{ST} / 2}^{\prime} + {w}_2^{\prime} \cdot \operatorname{resized}\left(\boldsymbol{H}_{\mathrm{ST} / 4}^{\prime \prime}\right)}{{w}_1^{\prime} + {w}_2^{\prime} + \varepsilon} \right) . $

1.5. 改进非线性学习层ENLL

提出基于KAN(kolmogorov-arnold network)^[23]的改进非线性学习层ENLL，其可学习激活函数使其在处理高度非线性、跨尺度的轨迹特征时具有更强的拟合能力和灵活性，它能更好地协调大尺度趋势与微尺度扰动，从而缓解特征冲突，减少轨迹预测失真.

如图5所示为MLP与KAN结构对比. 在多层感知机中，点代表输入的水漂垃圾特征数据，边代表权重，曲线代表固定的激活函数，而KAN在每个点均能够汇总可学习激活函数的输出且不进行任何非线性变换.

图 5

图 5 MLP与KAN结构对比

Fig.5 Structure comparison between MLP and KAN

(21)$ \mathrm{MLP}(\boldsymbol{x})=({\boldsymbol{W}}_{{L}}\cdot \sigma \cdot {\boldsymbol{W}}_{{L}-1}\cdot \sigma \cdots {\boldsymbol{W}}_{1}\cdot \sigma \cdot {\boldsymbol{W}}_{0}\cdot \sigma )， $

(22)$ \mathrm{KAN}(\boldsymbol{x})=({\varPhi }_{{L}}\cdot {\varPhi }_{{L}-1} \cdots {\varPhi }_{1}\cdot {\varPhi }_{0}). $

式中：$ \boldsymbol{W} $表示线性权重参数，$ \sigma $表示非线性激活函数，$ \varPhi $表示可学习的激活函数.

KAN的核心计算开销来源于其可学习的激活函数，当网络宽度较大、深度增加，或者每个激活函数使用的B样条基函数数量较多时，这些操作会变得非常密集，降低整体模型的实时性. 因此，ENLL在原始KAN的基础上优化了隐藏层宽度、网络深度以及激活函数基函数的初始化策略，以适应水漂垃圾轨迹数据的维度和时空尺度特性，在保证模型容量的同时提升计算效率与泛化能力.

综上，与传统的多层感知器相比，ENLL能够更好地处理水漂垃圾轨迹中如河道地形和水流波动这类高度非线性特征造成的影响. 在保持整体轨迹平滑性的同时，通过动态调整激活函数，使得模型能够精确捕捉细小的波动和变化，从而提高了水漂垃圾轨迹预测的准确性与灵活性.

1.6. 概率预测层

在水漂垃圾轨迹预测任务中，垃圾的具体漂流位置随时间动态改变，模型预测的单一确定性结果往往存在较大误差，导致了预测位置不确定性高的问题. 本研究设计概率预测层，采用均值-方差估计方法来捕捉观测中的随机不确定性，提供比确定性预测更为全面的信息. 设数据集$ {D}=\{{\boldsymbol{x}}_{t},{{y}}_{t}\}_{t=1}^{T} $，其中$ {\boldsymbol{x}}_{t}\in {{R}}^{D} $表示$ t $时刻的输入特征，包含影响水漂垃圾运动的多维环境信息，而$ {{y}}_{t} $为对应的水漂垃圾位置或轨迹信息. 神经网络只须通过2个神经元输出用于估计目标概率分布的均值$ {\hat{\mu }}_{t} $与方差$ \hat{\sigma }_{t}^{2}\in (0,1.0) $，从而描述水漂垃圾位置的预测分布. 由于传统的均方根误差（root mean square error，RMSE）难以有效捕捉时间序列预测中的不确定性，为了量化模型的预测不确定性，采用负对数似然（negative log likelihood，NLL）作为训练损失. 通过将观测值$ {\boldsymbol{y}}_{t} $作为目标分布的样本，NLL表达式如下：

(23)$ \mathrm{NLL}=0.5\left(\log\; (2{\text{π}} \hat{\sigma }_{t}^{2})+\frac{{({{y}_{t}}-{{\mu }_{t}})}^{2}}{\hat{\sigma }_{t}^{2}}\right). $

每一次前向传播会输出一个正态分布，其均值为$ {\hat{\mu }}_{t} $，方差为$ \hat{\sigma }_{t}^{2} $，$ M $次传播后构成一个均匀加权的正态分布混合体. 混合均值$ {\hat{\mu }}_{t,\mathrm{mix}} $和方差$ \hat{\sigma }_{t,\mathrm{mix}}^{2} $表达式如下：

(24)$ {\hat{\mu }}_{t,\mathrm{mix}}=\frac{1}{M}\sum\limits_{i=1}^{M}{{\hat{{\mu }}}}_{t,i}, $

(25)$ \hat{\sigma }_{t,\mathrm{mix}}^{2}=\frac{1}{M}\sum\limits_{i=1}^{M}({\hat{{\sigma }}}_{t,i}^{2}+{\hat{{\mu }}}_{t,i}^{2})-\hat{{\mu }}_{t,\mathrm{mix}}^{2}. $

使用均值和方差估算轨迹预测的区间：$ {\hat{y}}_{t}={\hat{\mu }}_{t,\mathrm{mix}} $，下界$ {\hat{L}}_{t}={\hat{\mu }}_{t,\mathrm{mix}}-z{\hat{\sigma }}_{t,\mathrm{mix}} $，上界$ {\hat{U}}_{t}={\hat{\mu }}_{t,\mathrm{mix}}+ z{\hat{\sigma }}_{t,\mathrm{mix}} $，其中z为正态分布的标准得分，对于95%的预测区间（$ P({L}_{t} \lt {y}_{t} \lt {U}_{t})=0.95 $），选择$ z=1.96 $来计算.

2. 实验设计与验证

2.1. 数据集介绍

如图6(a)所示，鹦鸽嘴水库位于张掖市肃南县梨园河中游，距临泽县城约41 km. 如图6(b)所示展示了流经兰州市城区的黄河部分河段. 2处水域均是所在区域内重要的水源地与生态节点. 水域内水漂垃圾的运动轨迹均受到风速、水流速度、河道地形及气象条件等多重因素的交互影响，呈现出高度随机与不可预测的特征，给监测数据的获取和分析带来较大挑战. 将垃圾轨迹的时空变化视为风速、水流、地形及气象条件动态耦合作用的综合结果，通过分析轨迹的漂移模式与速度波动，实现环境要素的隐式融合计算，无需解耦各因素独立建模. 基于此，为了揭示水漂垃圾的运动规律并制定相应的治理策略，通过GPS定位器采集水漂垃圾的运动轨迹，并计算其经向速度、纬向速度、经向加速度与纬向加速度4个运动学因素，结合经度与纬度信息，构建了包含6个要素的多因素轨迹数据集. 经纬度定位器主芯片为ML307A，使用SIM卡实现定位. 按照美国国家海洋和大气管理局（national oceanic and atmospheric administration，NOAA）大西洋海洋与气象实验室的全球漂流器数据集的制作标准^[24]处理原始轨迹数据，并分别计算其经纬度方向上的分解速度和加速度. 共采取了长度不一的50条水漂垃圾轨迹数据，其中训练集、测试集、验证集划分比例为6∶2∶2，任选出6条验证轨迹用于展示. 轨迹1、2、3、4采集自鹦鸽嘴水库，轨迹5、6采集自黄河兰州段.

图 6

图 6 鹦鸽嘴水库及黄河兰州段卫星图

Fig.6 Satellite images of Yinggezui reservoir and Lanzhou section of Yellow River

如表1所示为这6条轨迹的起点与终点经纬度以及相应的时间步数. 如表2所示展示了轨迹1的部分数据.

表 1 水漂垃圾轨迹数据集轨迹点位置及数量信息

Tab.1 Information on position and quantity of trajectory points in water-floating garbage trajectory dataset

轨迹	采集时间	地点	轨迹点数目	起点经度/（°E）	起点纬度/（°N）	终点经度/（°E）	终点纬度/（°N）
轨迹1	11月	鹦鸽嘴水库	573	99.833 099 00	38.936 024 00	99.850 564 97	38.942 732 20
轨迹2	11月	鹦鸽嘴水库	1 879	99.832 001 94	38.934 474 47	99.843 727 81	38.938 661 67
轨迹3	11月	鹦鸽嘴水库	2 244	99.831 926 35	38.934 483 90	99.850 458 20	38.943 343 19
轨迹4	11月	鹦鸽嘴水库	1 708	99.833 256 67	38.936 136 97	99.869 500 05	38.955 534 76
轨迹5	5月	黄河兰州段	4 327	103.769 908 25	36.089 722 37	103.817 942 8	36.070 174 72
轨迹6	5月	黄河兰州段	3 234	103.740 453 61	36.095 214 53	103.765 875 0	36.090 130 10

表 2 轨迹1数据展示

Tab.2 Data display of trajectory 1

时间	经度/（°E）	纬度/（°N）	经向速度/（m·s⁻¹）	纬向速度/（m·s⁻¹）	经向加速度/（m·s⁻²）	纬向加速度/（m·s⁻²）
2024/11/30	99.833 099 00	38.936 024 00	0.118 678 872	0.032 987 159	0.011 867 887	0.003 298 716
2024/11/30	99.833 102 81	38.936 010 28	0.133 466 464	0.021 879 247	0.013 346 646	0.002 187 925
2024/11/30	99.833 100 28	38.935 994 85	0.124 292 856	0.084 214 035	0.012 429 286	0.008 421 404
$\vdots $	$\vdots $	$\vdots $	$\vdots $	$\vdots $	$\vdots $	$\vdots $
2024/11/30	99.850 561 54	38.942 724 88	0.063 335 87	0.029 671 362	0.006 333 587	0.002 967 136

2.2. 评价指标与实验参数

为了验证所提多尺度图卷积模型的有效性，采用平均绝对误差（mean absolute error，MAE）、均方根误差RMSE、预测区间覆盖概率（prediction interval coverage probability，PICP）、平均预测区间宽度（mean prediction interval width，MPIW）作为评价指标.

(26)$ \mathrm{MAE}=\frac{1}{N}\sum\limits_{i=1}^{N}(\left| {y}_{i}-{\overline{y}}_{i}\right|+\left| {x}_{i}-{\overline{x}}_{i}\right| ), $

(27)$ \mathrm{RMSE}=\sum\limits_{i=1}^{N}\sqrt{\frac{1}{N}[{({{y}_{i}}-{{\overline{y}}_{i}})}^{2}+{({{x}_{i}}-{{\overline{x}}_{i}})}^{2}]}. $

式中：$ N $为样本数据的总数量，$ {x}_{i} $、$ {y}_{i} $为轨迹经纬度数据真实值，$ {\overline{x}}_{i} $、$ {\overline{y}}_{i} $为轨迹经纬度数据预测值. MAE和RMSE越小，预测精度越高.

(28)$ \mathrm{PICP}=\frac{1}{T}\sum\limits_{t=1}^{T}1({y}_{t}\geq L_{t}^{})\cdot {1}({y}_{t}\leq U_{t}^{}). $

式中：$ {1}(\cdot ) $为Heaviside步骤函数，表示如果条件成立则为$ 1 $，否则为$ 0 $; $ L_{t}^{} $和$ U_{t}^{} $分别为时间$ t $时刻的预测下限和上限. PICP越大，说明模型的预测区间越能覆盖真实的观测值.

(29)$ \mathrm{MPIW}=\frac{1}{T}\sum\limits_{t=1}^{T}(U_{t}^{}-L_{t}^{}). $

MPIW越小表示预测区间越窄.

本研究实验的硬件环境配置如下：CPU为13th Gen Intel® Core™ i5-13600KF，GPU为NVIDIA GeForce RTX 4070 SUPER. 本研究方法基于Python3.8和Pytorch1.11深度学习框架实现，CUDA版本为12.5，cuDNN版本为64.9. 模型优化器为Adam，批量大小$ B $为24，初始学习率为0.000 1，并采用0.001的指数衰减率在训练模型中更新学习率，Dropout为0.2，切比雪夫多项式的阶数为4，AGGC堆叠层数为3，空域AGGC预定义邻接矩阵初始化为全1矩阵，ENLL隐藏层宽度为64、深度为2层，决定样条分段分辨率的grid_size为3，决定每段采用几次多项式以及端点需要外延的结点数的spline_order为3，并使用验证集进行超参数调优. 基准线模型参数与本研究所提模型的实验参数设置相同.

2.3. 消融实验分析

为了评估模型中各部分的有效性，以GNN为基准模型，增加多尺度方法，模型命名为GNN-Multi-Scale（GNN-MS）；在此基础上增加自适应门控图卷积方法，模型命名为GNN-Adaptive-Gate（GNN-AG）；在此基础上增加多尺度特征融合方法，模型命名为GNN-Fusion-Network（GNN-FN）；在此基础增加改进非线性学习层，模型命名为MAGC-Trajectory. 在轨迹3上进行消融模型的实验分析.

如表3所示展示了各消融模型在2号塑料类轨迹上的预测结果. 所有改进模型均实现了100%的预测区间覆盖率. 相较于基准模型GNN，GNN-MS的MAE降低至0.000 236 09，RMSE降低至0.000 312 67，表明性能显著提升，其多尺度特征提取有效整合了时空信息，提升了长期趋势和关键转折点捕捉能力，但其MPIW为0.002 5，相对较大. GNN-AG的RMSE进一步降低至0.000 294 61，MPIW显著缩小至0.002 5，体现了模型稳定性的提升. 其自适应门控图卷积机制通过动态学习最优空间依赖并过滤冗余连接，有效降低了噪声敏感性，优化了空间特征捕捉. GNN-FN的性能提升最为显著，MAE降至0.000 157 57，RMSE降至0.000 196 12，MPIW缩小至0.001 8. 该模型通过深度耦合与多尺度时空特征交互，增强了对复杂时空动态协同演化的整体建模能力，并产出更平滑、置信区间更窄的预测. MAGC-Trajectory的综合表现最优，MAE为0.000 135 89、RMSE为0.000 161 03、MPIW为0.001 9，均为最低值. 该模型集成前述优势，其中改进非线性学习层通过动态调整激活函数优化了非线性映射和拟合能力，有效抑制了特征融合波动及预测残余抖动，实现了高精度、高稳定性的轨迹预测.

表 3 消融模型指标对比

Tab.3 Comparison of indicators of ablation models

模型名称	2号塑料类轨迹
模型名称	MAE	RMSE	PICP	MPIW
GNN	0.000 360 70	0.000 637 35	1	0.003 2
GNN-MS	0.000 236 09	0.000 312 67	1	0.002 5
GNN-AG	0.000 235 99	0.000 294 61	1	0.002 5
GNN-FN	0.000 157 57	0.000 196 12	1	0.001 8
MAGC-Trajectory	0.000 135 89	0.000 161 03	1	0.001 9

2.4. 对比实验分析

为了验证本研究模型的预测结果，选取ARIMA^[25]、LSTM、PSO-GRU、CNN-LSTM、Crossformer^[26]、ASTGCN^[27]、PatchTST^[28]、DCRNN、K-GCN-LSTM这9个预测模型，在轨迹3、4、5、6上进行对比实验.

如图7所示为不同对比算法在轨迹6上的预测结果，其中，lat、lon分别为纬度、经度. 可以看出，PSO-GRU、K-GCN-LSTM整体上预测误差较大；ARIMA、LSTM、Crossformer能够大致把握垃圾漂移路径，预测较为准确；ASTGCN、DCRNN能够较好地拟合轨迹，但预测轨迹波动较大，不确定性较高；PatchTST、CNN-LSTM轨迹波动小，与真实轨迹基本吻合，但在轨迹弯折处误差较大；MAGC-Trajectory综合预测效果最优，基本拟合垃圾漂移路径，轨迹波动较小，轨迹弯折处误差较小.

图 7

图 7 轨迹6预测结果对比

Fig.7 Comparison of prediction results of trajectory 6

如表4所示为不同对比算法的MAE与RMSE的对比. 分析表明，基于统计的预测模型ARIMA在预测轨迹上的MAE较高；LSTM能提取轨迹时间特征，然而缺乏时空联合建模，导致轨迹3上的MAE达到0.000 66，PSO-GRU在轨迹3上表现相对突出，其MAE达到0.000 27，但整体稳定性不足；Crossformer在轨迹6上表现良好，MAE达到0.000 67，但在轨迹5上误差偏大，MAE达到0.002 93；PatchTST通过分块式时间建模与单变量通道独立机制，在相对平滑的轨迹5上主动避免学习多因素特征间的复杂关联，从而精准捕捉单一维度的漂移趋势，取得MAE为0.000 227 43的最优结果；CNN-LSTM在轨迹3上预测表现良好，但因时空耦合不足，整体仍落后于图卷积方法；ASTGCN在轨迹4、轨迹6上表现较好，其MAE分别达到0.000 41和0.000 27，在轨迹5上表现中等，其MAE达到0.000 50，RMSE达到0.000 53；DCRNN利用编码-解码式扩散卷积，在轨迹3上仅次于MAGC-Trajectory，显示出优异的时空动态捕捉能力；MAGC-Trajectory在轨迹3、4、6上的预测性能较优，MAE分别为0.000 135 89、0.000 285 29，0.000 097 49，RMSE分别为0.000 161 03、0.000 331 46、0.000 131 98，整体优于其他对比模型，展示了MAGC-Trajectory在挖掘水漂垃圾复杂时空关联和多因素数据特征方面的优势.

表 4 不同对比算法的MAE与RMSE对比

Tab.4 Comparison of MAE and RMSE among different comparison models

模型	轨迹3（塑料）		轨迹4（塑料）		轨迹5（编织物）		轨迹6（金属）
模型	MAE	RMSE	MAE	RMSE	MAE	RMSE	MAE	RMSE
ARIMA	0.000 907 77	0.001 044 91	0.000 826 46	0.000 997 00	0.000 620 72	0.000 733 71	0.000 497 54	0.000 479 94
LSTM	0.000 664 18	0.000 377 46	0.000 526 43	0.000 475 12	0.000 610 72	0.000 714 91	0.000 581 39	0.000 892 69
PSO-GRU	0.000 268 66	0.000 303 53	0.001 282 10	0.001 528 82	0.001 282 58	0.001 788 72	0.002 556 01	0.004 059 56
Crossformer	0.000 855 28	0.001 124 09	0.001 844 85	0.003 029 05	0.002 930 03	0.005 488 65	0.000 665 45	0.001 058 63
PatchTST	0.000 235 04	0.000 339 29	0.000 357 85	0.000 382 01	0.000 227 43	0.000 325 60	0.000 268 74	0.000 431 20
CNN-LSTM	0.000 20615	0.000 920 98	0.000 416 62	0.000 685 01	0.000 706 42	0.000 874 63	0.000 415 09	0.000 584 47
ASTGCN	0.000 285 36	0.000 304 84	0.000 406 33	0.000 628 63	0.000 502 94	0.000 529 85	0.000 270 92	0.000 346 26
DCRNN	0.000 196 31	0.000 242 67	0.000 426 84	0.000 605 68	0.000 322 17	0.000 288 78	0.000 151 10	0.000 212 69
K-GCN-LSTM	0.000 471 82	0.000 542 80	0.001 911 42	0.002 420 09	0.000 279 03	0.000 199 16	0.001 057 48	0.001 440 52
MAGC-Trajectory	0.000 135 89	0.000 161 03	0.000 285 29	0.000 331 46	0.000 241 92	0.000 251 92	0.000 097 49	0.000 131 98

2.5. 概率预测结果

MAGC-Trajectory对6条轨迹的预测结果如图8所示. 其中，1号纸类轨迹、3号、6号塑料类轨迹、5号编织类轨迹的置信区间较窄，2号、4号塑料类轨迹的置信区间较宽. 水漂垃圾漂移轨迹的概率预测结果能够量化垃圾未来轨迹的不确定性，为决策者提供更丰富的信息基础，从而使决策者可以做出更科学的治理措施.

图 8

图 8 水漂垃圾轨迹概率预测结果

Fig.8 Water-floating garbage trajectory probability prediction results

3. 结　语

本研究提出基于多尺度自适应图卷积的水漂垃圾轨迹预测模型. 该模型针对水漂垃圾轨迹数据的时空异质性特性，利用门控机制动态融合预定义邻接矩阵与自适应学习矩阵，实现对轨迹节点间长短期时空依赖关系的协同建模. 构建多尺度图卷积网络模型，避免随着网络层数加深而出现的过平滑问题，同时将输入轨迹因素之间的空间特征高效地融合到多尺度时间特征中，形成完整的时空特征. 为了精确捕捉时空特征之间的非线性关系，设计改进非线性学习层，协调跨尺度时空特征的异构性，消除多源时空特征的冲突性干扰. 为了量化预测结果的不确定性，采用概率预测的方法，提供可能的垃圾分布位置，为捕捞者、决策者提供更丰富的信息支持.

在实验过程中发现，复杂运动轨迹会导致较宽的预测置信区间. 未来研究将重点突破多模态数据融合技术，建立跨模态时空特征对齐机制，实现更精确、置信区间更窄的预测方法，为水环境智慧治理提供全天候、多维度的技术支撑.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

仇威, 栾华龙, 渠庚, 等

三峡水库应急补水对2022年洪季长江口盐水入侵的影响

[J]. 长江科学院院报, 2024, 41 (10): 30- 39

DOI:10.11988/ckyyb.20240616 [本文引用: 1]

QIU Wei, LUAN Hualong, QU Geng, et al

Impact of emergent water supply of the Three Gorges Reservoir on saltwater intrusion in the Changjiang River Estuary in 2022

[J]. Journal of Changjiang River Scientific Research Institute, 2024, 41 (10): 30- 39

DOI:10.11988/ckyyb.20240616 [本文引用: 1]

[2]

张云, 王雨, 周绍辉, 等

星载GNSS-R检测太湖水华可行性分析

[J]. 北京航空航天大学学报, 2024, 50 (3): 695- 705

ZHANG Yun, WANG Yu, ZHOU Shaohui, et al

Analysis on feasibility of detecting water blooms in Taihu Lake with spaceborne GNSS-R

[J]. Journal of Beijing University of Aeronautics and Astronautics, 2024, 50 (3): 695- 705

DOI:10.1016/j.jenvman.2023.119599 [本文引用: 1]

[3]

TAN Y, CHENG Q, LYU F, et al

Hydrological reduction and control effect evaluation of sponge city construction based on one-way coupling model of SWMM-FVCOM: a case in university campus

[J]. Journal of Environmental Management, 2024, 349: 119599

[4]

CASTÁN-LASCORZ M A, JIMÉNEZ-HERRERA P, TRONCOSO A, et al

A new hybrid method for predicting univariate and multivariate time series based on pattern forecasting

[J]. Information Sciences, 2022, 586: 611- 627

DOI:10.1016/j.ins.2021.12.001 [本文引用: 1]

[5]

潘金伟, 王乙乔, 钟博, 等

基于统计特征搜索的多元时间序列预测方法

[J]. 电子与信息学报, 2024, 46 (8): 3276- 3284

DOI:10.11999/JEIT231264 [本文引用: 1]

PAN Jinwei, WANG Yiqiao, ZHONG Bo, et al

Statistical feature-based search for multivariate time series forecasting

[J]. Journal of Electronics and Information Technology, 2024, 46 (8): 3276- 3284

DOI:10.11999/JEIT231264 [本文引用: 1]

[6]

VERDONCK T, BAESENS B, ÓSKARSDÓTTIR M, et al

Special issue on feature engineering editorial

[J]. Machine Learning, 2024, 113 (7): 3917- 3928

DOI:10.1007/s10994-021-06042-2 [本文引用: 1]

[7]

CATON S, HAAS C

Fairness in machine learning: a survey

[J]. ACM Computing Surveys, 2024, 56 (7): 1- 38

DOI:10.1016/j.jksuci.2024.102068 [本文引用: 1]

[8]

AL-SELWI S M, HASSAN M F, ABDULKADIR S J, et al

RNN-LSTM: from applications to modeling techniques and beyond: systematic review

[J]. Journal of King Saud University - Computer and Information Sciences, 2024, 36 (5): 102068

[9]

刘凇佐, 王虔, 李磊, 等

粒子群优化的门控循环单元网络漂流浮标轨迹预测

[J]. 电子与信息学报, 2024, 46 (8): 3295- 3304

DOI:10.11999/JEIT230945 [本文引用: 1]

LIU Songzuo, WANG Qian, LI Lei, et al

Gated recurrent unit network of particle swarm optimization for drifting buoy trajectory prediction

[J]. Journal of Electronics and Information Technology, 2024, 46 (8): 3295- 3304

DOI:10.11999/JEIT230945 [本文引用: 1]

[10]

吴跃高, 俞万能, 曾广淼, 等

融合拼接注意力机制的船舶轨迹预测方法

[J]. 控制理论与应用, 2025, 42 (9): 1798- 1806

WU Yuegao, YU Wanneng, ZENG Guangmiao, et al

Ship trajectory prediction method incorporating concatenated attention mechanism

[J]. Control Theory and Applications, 2025, 42 (9): 1798- 1806

[11]

BAI J, ZHU J, SONG Y, et al

A3T-GCN: attention temporal graph convolutional network for traffic forecasting

[J]. ISPRS International Journal of Geo-Information, 2021, 10 (7): 485

DOI:10.3390/ijgi10070485 [本文引用: 1]

[12]

SRIRAMULU A, FOURRIER N, BERGMEIR C

Adaptive dependency learning graph neural networks

[J]. Information Sciences, 2023, 625: 700- 714

DOI:10.1016/j.ins.2022.12.086 [本文引用: 1]

[13]

BAI L, YAO L, LI C, et al

Adaptive graph convolutional recurrent network for traffic forecasting

[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804- 17815

[14]

ZHOU Y, ZHENG H, HUANG X, et al

Graph neural networks: taxonomy, advances, and trends

[J]. ACM Transactions on Intelligent Systems and Technology, 2022, 13 (1): 1- 54

DOI:10.1016/j.inffus.2024.102292 [本文引用: 1]

[15]

XU D, PENG H, TANG Y, et al

Hierarchical spatio-temporal graph convolutional neural networks for traffic data imputation

[J]. Information Fusion, 2024, 106: 102292

[16]

LIU R W, LIANG M, NIE J, et al

STMGCN: mobile edge computing-empowered vessel trajectory prediction using spatio-temporal multigraph convolutional network

[J]. IEEE Transactions on Industrial Informatics, 2022, 18 (11): 7977- 7987

DOI:10.1109/TII.2022.3165886 [本文引用: 1]

[17]

ZHAO J, YAN Z, CHEN X, et al

K-GCN-LSTM: a k-hop graph convolutional network and long-short-term memory for ship speed prediction

[J]. Physica A: Statistical Mechanics and Its Applications, 2022, 606: 128107

DOI:10.1016/j.physa.2022.128107 [本文引用: 1]

[18]

TANG X, CHEN H, XIANG W, et al

Short-term load forecasting using channel and temporal attention based temporal convolutional network

[J]. Electric Power Systems Research, 2022, 205: 107761

DOI:10.1016/j.jpgr.2021.107761 [本文引用: 1]

[19]

邵海东, 肖一鸣, 邓乾旺, 等

基于不确定性感知网络的可信机械故障诊断

[J]. 机械工程学报, 2024, 60 (12): 194- 206

DOI:10.3901/JME.2024.12.194 [本文引用: 1]

SHAO Haidong, XIAO Yiming, DENG Qianwang, et al

Trustworthy mechanical fault diagnosis using uncertainty-aware network

[J]. Journal of Mechanical Engineering, 2024, 60 (12): 194- 206

DOI:10.3901/JME.2024.12.194 [本文引用: 1]

[20]

TANG S, LI B, YU H. ChebNet: efficient and stable constructions of deep neural networks with rectified power units via Chebyshev approximation [EB/OL]. (2024–10–14) [2025–04–20]. https://doi.org/10.1007/s40304-023-00392-0.

[21]

SHARMA K, LEE Y C, NAMBI S, et al

A survey of graph neural networks for social recommender systems

[J]. ACM Computing Surveys, 2024, 56 (10): 1- 34

[22]

BARAKBAYEVA T, DEMIRCI F M

Fully automatic CNN design with inception and ResNet blocks

[J]. Neural Computing and Applications, 2023, 35 (2): 1569- 1580

DOI:10.1007/s00521-022-07700-9 [本文引用: 1]

[23]

LIU Z, WANG Y, VAIDYA S, et al. KAN: Kolmogorov-arnold networks [EB/OL]. (2025−02−09) [2025−04−20]. https://arxiv.org/abs/2404.19756.

DOI:10.1016/j.apenergy.2024.124232 [本文引用: 1]

[24]

LAURINDO L C, MARIANO A J, LUMPKIN R

An improved near-surface velocity climatology for the global ocean from drifter observations

[J]. Deep Sea Research Part I: Oceanographic Research Papers, 2017, 124: 73- 92

DOI:10.1016/j.dsr.2017.04.009 [本文引用: 1]

[25]

ZHONG W, ZHAI D, XU W, et al

Accurate and efficient daily carbon emission forecasting based on improved ARIMA

[J]. Applied Energy, 2024, 376: 124232

[26]

ZHANG Y, YAN J. Crossformer: transformer utilizing cross-dimension dependency for multivariate time series forecasting [C]// International Conference on Learning Representations. Kigali: [S.n.], 2023: 1–21.

[27]

BAI L, YAO L, LI C, et al

Adaptive graph convolutional recurrent network for traffic forecasting

[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804- 17815

[28]

NIE Y, NGUYEN N H, SINTHONG P, et al. A time series is worth 64 words: long term forecasting with transformers [EB/OL]. (2023−03−05)[2025−04−20]. https://arxiv.org/abs/2211.14730.