浙江大学学报(工学版), 2026, 60(5): 989-997 doi: 10.3785/j.issn.1008-973X.2026.05.008

交通工程

融合图卷积网络与社交池化的多模态轨迹预测模型

赵庆慧,, 崔鑫,, 张艺炜, 陈燕

1. 山东理工大学 计算机科学与技术学院,山东 淄博 255049

2. 西藏职业技术学院 信息工程学院,西藏自治区 拉萨 850000

Multimodal trajectory prediction model integrating graph convolutional networks and social pooling

ZHAO Qinghui,, CUI Xin,, ZHANG Yiwei, CHEN Yan

1. School of Computer Science and Technology, Shandong University of Technology, Zibo 255049, China

2. College of Information Engineering, Xizang Vocational Technical College, Lhasa, 850000, China

通讯作者: 崔鑫,女,副教授. orcid.org/0000-0002-4520-562X. E-mail:cx@sdut.edu.cn

收稿日期: 2025-06-9  

基金资助: 科技博士项目(4041422007).

Received: 2025-06-9  

Fund supported: 科技博士项目(4041422007).

作者简介 About authors

赵庆慧(2000—),女,硕士生,从事软件定义网络,车联网技术研究.orcid.org/0009-0005-4321-6252.E-mail:sdutzhaoqinghui@163.com , E-mail:sdutzhaoqinghui@163.com

摘要

针对实际交通环境中车辆间的交互行为,提出多模态轨迹预测模型,结合时间序列、空间序列与社交行为建模,对车辆未来轨迹进行预测. 利用长短时记忆网络(LSTM)从历史数据中提取如车辆速度、加速度的时间依赖特征. 通过图卷积网络(GCN)利用加权邻接矩阵量化车辆间的交互强度,引入卷积社交池模块,提取车辆局部交互特征,提高层次空间交互模式. 采用多模态预测机制、多层感知机(MLP)计算驾驶行为概率分布,结合LSTM解码器生成与特定驾驶行为相符的未来轨迹分布. 实验结果表明,所提模型具有良好的车辆轨迹预测性能,相较于基线模型,均方根误差平均减少27.9%,负对数似然平均减少56.45%.

关键词: 轨迹预测 ; 长短期记忆网络(LSTM) ; 图卷积网络(GCN) ; 卷积社交池化 ; 多模态预测

Abstract

A multimodal trajectory prediction model was proposed for vehicle interaction behaviors in real traffic environments. Time series, spatial sequences, and social behavior were integrated for modeling and predicting future vehicle trajectories. Time-dependent features such as vehicle speed and acceleration were extracted from historical data using long short-term memory (LSTM). The interaction intensity between vehicles was quantified by graph convolutional networks (GCN) through a weighted adjacency matrix. A convolutional social pooling module was introduced to extract local interaction features and enhance hierarchical spatial interaction patterns. A multimodal prediction mechanism was adopted, where a multilayer perceptron (MLP) was used to compute the probability distribution of driving behaviors. The LSTM decoder was combined to generate future trajectory distributions corresponding to specific driving behaviors. Experimental results demonstrate that the proposed model achieves strong performance in vehicle trajectory prediction. Compared to baseline models, the root mean square error is reduced by 27.9% on average, and the negative log-likelihood is reduced by 56.45% on average.

Keywords: trajectory prediction ; long short-term memory (LSTM) ; graph convolutional network (GCN) ; convolutional social pooling ; multimodal prediction

PDF (859KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

赵庆慧, 崔鑫, 张艺炜, 陈燕. 融合图卷积网络与社交池化的多模态轨迹预测模型. 浙江大学学报(工学版)[J], 2026, 60(5): 989-997 doi:10.3785/j.issn.1008-973X.2026.05.008

ZHAO Qinghui, CUI Xin, ZHANG Yiwei, CHEN Yan. Multimodal trajectory prediction model integrating graph convolutional networks and social pooling. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(5): 989-997 doi:10.3785/j.issn.1008-973X.2026.05.008

随着智能交通系统[1]的快速发展,车辆轨迹预测在交通流量管理、自动驾驶技术和驾驶辅助系统中发挥着至关重要的作用[2-4],已经成为提高驾驶安全性、流畅性和舒适性的关键技术之一. 传统轨迹预测方法大多基于物理学模型或规则驱动模型[5],包括卡尔曼滤波、粒子滤波技术[6-8],通过应用物理规律或数学公式预测车辆的轨迹[9-10]. Lefkopoulos等[11]设计基于交互多模型卡尔曼滤波器的滤波方案,使用投影生成非碰撞预测. Wang等[12]通过地图和车道检测获得车辆非基于时间的参考轨迹,使用蒙特卡罗模拟预测控制优化参考轨迹. Wirthmüller等[13]使用高斯混合回归,采用无启发式机器学习预测机动和车辆位置. Wang等[14]提出基于动机和风险评估的决策规划方法,实现驾驶行为预测和轨迹规划. 尽管这些方法在理想情况下可以提供较为精确的轨迹预测,但其依赖基于简单假设的交通规则和驾驶行为,无法适应实际交通场景.

基于数据驱动的方法[15]在轨迹预测领域表现出显著优势,尤其是深度学习技术凭借其强大的特征提取和时序建模能力,成为研究热点[16]. 在深度学习模型中,长短期记忆网络(long short-term memory, LSTM)因其适合捕捉时序数据中的长期依赖关系[17],广泛应用于轨迹预测任务[18-23]. 除了数据时间依赖关系外,邻车交互也是车辆轨迹预测的关键[24-27]. Sheng等[24]提出基于图的时空卷积网络,利用图卷积网络(graph convolutional network, GCN)处理相邻车辆间的空间相互作用,并利用卷积神经网络捕获时间特征. Deo等[25]提出LSTM编码器-解码器模型,使用卷积社交池作为对社交池层的改进,鲁棒地学习车辆间相互依赖性. Kawasaki等[26]提出基于车道的多模态预测网络方法,处理任意形状和数量的车道,预测车道被选择的概率和未来轨迹. Chen等[27]提出新的时空动态注意力网络用于车辆轨迹预测,以层次化的方式全面捕捉时间和社会模式. Zhang等[28]提出基于LSTM的结合意图预测和轨迹预测的框架,利用驾驶意图提高预测精度. Katariya等[29]提出深度学习算法DeepTrack,使用时间卷积网络进行车辆动态编码,用于实时车辆轨迹预测和监控应用. 以上深度学习模型具有较强的非线性拟合能力,但在处理车辆交互时往往只关注单一层次(低层次全局空间交互或高层次近距离局部空间交互)的交互建模. 已有研究尝试通过并行或串行堆叠结构(例如交替堆叠时空图卷积网络层)融合不同特征[28-29],但这类方法通常将全局与局部特征在同一层次进行混合,未能显式地构建全局感知、局部求精的分层推理机制. 由于缺乏层次化、有针对性的交互建模方式,图卷积层在处理车辆节点时难以有效抑制远距离无关车辆噪声的传播. 此外,后续的池化或卷积操作未被专门设计为用于净化前序模块输出的滤波结构,限制了模型对复杂交互关系的表征能力.

本研究提出分层交互建模机制,构建融合GCN与卷积社交池化的轨迹预测模型(trajectory prediction model integrating graph convolutional networks and convolutional social pooling, GC-LSTM). 该模型通过有机融合多个功能模块,实现对车辆运动的多层次统一建模. 具体而言,LSTM作为时序编码器,负责捕捉车辆历史轨迹中的时间依赖性,有效学习车辆运动模式的动态演化规律;GCN充当空间交互编码器,基于构建的车辆拓扑关系图对全局空间依赖性进行建模,感知整个交通场景的宏观态势;卷积社交池化作为局部交互增强模块,通过卷积核动态聚合目标车辆邻近区域的社交特征,精细化刻画局部车辆间的微观交互行为. 多层感知机(multilayer perceptron, MLP)解码器对上述融合特征进行非线性变换与映射,生成符合实际驾驶行为的多模态未来轨迹概率分布.

1. 轨迹预测模型

轨迹预测旨在基于车辆的历史运动状态,预测车辆未来的行驶轨迹. 如图1所示,预测对象作为待预测目标,其余车辆为可观测交通参与者;实线代表历史轨迹,目标车辆前方有3条可能的多模态预测轨迹. 轨迹预测的核心在于综合分析车辆间的交互行为与历史轨迹,推断目标车辆未来的运动位置.

图 1

图 1   车辆轨迹预测示意图

Fig.1   Schematic diagram of vehicle trajectory prediction


1.1. 问题定义

轨迹预测通过分析车辆的历史轨迹数据,预测目标车辆在未来时刻的运动状态,包括位置、速度、加速度和行驶方向等. 该问题核心在于准确建模车辆的动态行为,并充分考虑交通场景中的车辆交互关系. 定义在时刻$ t $,车辆状态$ {\boldsymbol{X}}_{t} $

$ {\boldsymbol{X}}_{t}={\left[{x}_{t},{y}_{t},{\theta }_{t},{v}_{t},{\gamma }_{t},{a}_{t},{\dot{\gamma }}_{t}\right]}^{{\mathrm{T}} } . $

车辆的历史轨迹数据包含车辆速度$ {v}_{t} $、位置$ ({x}_{t}{,y}_{t}) $、加速度$ {a}_{t} $. 为了能够更精确地判断车辆行驶意图,增加车辆方向角$ {\theta }_{t} $、偏航率$ {\gamma }_{t} $、偏航加速度$ {\dot{\gamma }}_{t} $等方向相关特征,以确保模型在城市场景中的性能($ x、 y\mathrm{和}\theta $基于笛卡尔坐标).

1.2. 图卷积网络

为了捕捉车辆间的交互,使GCN对车辆间的依赖关系进行建模. 定义空间图$ G=\{{G}_{t}|t\in \{1,\cdots ,T\}\} $,其中$ {G}_{t} $$ t $时刻的车辆空间关系图,$ {G}_{t}=\{{V}_{t},{E}_{t}\} $$ {V}_{t}=\{v_{t}^{n}|n\in \{1,\cdots ,N\} $为车辆节点($ v_{t}^{n} $为车辆$ n $$ t $时刻的速度),$ {E}_{t} $为车辆之间的边. 一般来说,车辆在行驶过程中,不同距离的邻车对其影响大小不一,为了更好地描述这种交互,引入如图2所示的加权邻接矩阵$ {\boldsymbol{A}}_{t}\in {\bf{R}}^{n\times n} $,使用距离倒数来测量2辆车之间的交互权重,使得较近的车辆具有较高的权重,

图 2

图 2   邻接矩阵计算举例

Fig.2   Example of adjacency matrix calculation


${{\boldsymbol{A}}_t} = \left[ {\begin{array}{*{20}{c}}0&{\dfrac{1}{{{d_{1,2}}}}}&{\dfrac{1}{{{d_{1,3}}}}}&{\cdots}&{\dfrac{1}{{{d_{1,N}}}}}\\{\dfrac{1}{{{d_{2,1}}}}}&0&{\dfrac{1}{{{d_{2,3}}}}}& \ldots &{\dfrac{1}{{{d_{2,N}}}}}\\ \vdots & \vdots & \vdots &{}& \vdots \\{\dfrac{1}{{{d_{N,1}}}}}&{\dfrac{1}{{{d_{N,2}}}}}&{\dfrac{1}{{{d_{N,3}}}}}& \ldots & 0\end{array}} \right]. $

式中:$ {d}_{i,j} $为时刻$ t $车辆$ i $和车辆$ j $之间的距离. $ G $$ {G}_{1},\cdots ,{G}_{T} $堆叠,在时空图中定义$ {\boldsymbol{V}}\in {\bf{R}}^{C\times T\times N} $$ C $为二维坐标$ (x,y) $)为$ {V}_{t} $的堆叠张量,邻接矩阵$ \boldsymbol{A}\in {\bf{R}}^{T\times N\times N} $$ {\boldsymbol{A}}_{t} $的堆叠张量. 通过加权邻接矩阵,更好地量化车辆间的空间关系,车辆间的距离越近,相互作用影响越大. 在GCN中输入车辆历史轨迹数据和$ {\boldsymbol{A}}_{t} $.

$ {\boldsymbol{Z}}^{(l+1)}=f({\boldsymbol{\varLambda }}_{t}^{-\frac{1}{2}}{\widehat{\boldsymbol{A}}}_{t}{\boldsymbol{\varLambda }}_{t}^{-\frac{1}{2}}{\boldsymbol{Z}}^{(l)}{\boldsymbol{W}}^{(l)}) . $

式中:$ {\boldsymbol{Z}}^{(l)} $为第$ l $层的特征矩阵,初始时$ {\boldsymbol{Z}}^{(0)} $为车辆历史轨迹数据,$ {\widehat{\boldsymbol{A}}}_{t}={\boldsymbol{A}}_{t}+\boldsymbol{I} $$ \boldsymbol{I} $为单位矩阵,$ {{\boldsymbol{\varLambda }}}_{t} $$ {\widehat{\boldsymbol{A}}}_{t} $的度矩阵,$ {\boldsymbol{W}}^{(l)} $为第$ l $层的参数矩阵,$ f(\cdot ) $为激活函数. 通过图卷积操作,模型提取车辆间空间依赖关系,进而捕捉车辆空间上的交互行为. 空间交互特征$ {\boldsymbol{Z}}^{(l+1)} $将被传递到下一个模块,为后续模块提供空间交互信息,增强轨迹预测准确性.

1.3. 时间序列特征

使用LSTM从历史轨迹数据中提取时间序列特征. LSTM能够处理变长时间序列,有效捕捉车辆历史轨迹中的时间依赖关系. 在GCN输出中,每个卷积单独使用1个LSTM编码器编码. 在LSTM编码器中输入空间交互特征$ {\boldsymbol{Z}}^{(l+1)} $,表示为

$ {\boldsymbol{H}}_{\text{hist}}={\text{LSTM}}_{\text{enc}}\left({\boldsymbol{Z}}^{(l+1)}\right),\;\;{\boldsymbol{H}}_{\text{hist}}\in {\bf{R}}^{d}. $

LSTM编码器从历史轨迹数据中提取时间序列特征,捕捉车辆速度、加速度,输出编码了车辆历史轨迹时空动态信息的高维特征向量$ {\boldsymbol{H}}_{\text{hist}} $.

1.4. 卷积社交池化

尽管GCN能够有效捕捉车辆间的依赖关系,但输出特征仍然包含冗余信息. 车辆间的交互模式往往具有局部性和层次性,卷积操作能够捕捉局部空间模式,池化操作能够提取更高层次的抽象特征. 为了进一步提取车辆间的社交交互特征,模型引入卷积社交池化模块,该模块包括2个卷积层和1个池化层. 如图3所示,将车道抽象为n行3列的图像,将$ {\boldsymbol{H}}_{\text{hist}} $输入卷积社交池模块中. 通过第1个卷积层提取局部空间模式:

图 3

图 3   卷积社交池化车道划分

Fig.3   Convolutional social pooling for lane division


$ {\boldsymbol{H}}_{\mathrm{conv}1}={\text{Conv}}_{1}\left({\boldsymbol{H}}_{\text{hist}};{\boldsymbol{W}}_{\mathrm{conv}1}\right). $

式中:$ {\boldsymbol{W}}_{\mathrm{conv}1} $为卷积核参数,卷积核大小为3×3,输入通道数为9,输出通道数为1,步幅为1. 通过第2个卷积层进一步提取特征:

$ {\boldsymbol{H}}_{\mathrm{conv}2}={\text{Conv}}_{2}\left({\boldsymbol{H}}_{\mathrm{conv}1};{\boldsymbol{W}}_{\mathrm{conv}2}\right). $

式中:$ {\boldsymbol{W}}_{\mathrm{conv}2} $为卷积核参数,卷积核大小为3×1,输入通道为3,输出通道为1,步幅为1. 卷积操作通过滑动窗口在空间维度上提取局部特征,捕捉车辆间的局部交互模式. 池化操作聚合局部特征,减少特征维度,提取更高层次的抽象特征,增强模型对车辆间交互行为建模能力. 最大池化表达式为

$ {\boldsymbol{H}}_{t}=\text{MaxPool}\left({\boldsymbol{H}}_{\mathrm{conv}2};{\boldsymbol{W}}_{\text{pool}}\right). $

式中:$ {\boldsymbol{W}}_{\text{pool}} $为池化操作超参数,池化窗口大小为2×1,步幅为2. 卷积社交池化模块最终输出车辆历史轨迹的动态信息、空间依赖关系及局部社交交互.

1.5. 多模态预测

在车辆轨迹预测中,由于驾驶行为不确定性,车辆在未来的行驶轨迹存在多种可能,单一预测难以涵盖所有可能的行驶轨迹. 为了有效捕捉多模态特征,在模型中加入多模态预测机制. 选择MLP作为驾驶行为概率分布的计算工具,原因在于MLP具有强大的非线性拟合能力,能够有效处理高维特征并将其映射到行为概率空间. 假设存在$ M $种可能的驾驶行为,通过MLP处理卷积池化后的特征$ {\boldsymbol{H}}_{t} $,计算每种驾驶行为的概率分布:

$ P\left({m}_{i}| X\right)=\text{softmax}\left(\text{MLP}\left({\boldsymbol{H}}_{{t}}\right)\right). $

式中:$ {m}_{i} $为第$ i $种驾驶行为,$ X $为输入特征,$ \text{softmax} $函数用于归一化输出概率分布.

1.6. 轨迹生成

为了生成与特定驾驶行为相符的未来轨迹分布,使用LSTM解码器生成未来轨迹的概率分布,对于每种驾驶行为$ {m}_{i} $,使用独立的LSTM解码器生成对应的轨迹分布$ {Y}_{i} $

$ {Y}_{i}={\text{LSTM}}_{\text{dec}}({\boldsymbol{H}}_{t},{m}_{i}) . $

LSTM解码器的时序建模能力有效捕捉车辆轨迹的时间性依赖,生成与特定驾驶行为相符的未来轨迹分布. 最终轨迹通过计算求和方式计算得到:

$ P(Y\mid X)=\sum \limits_{i}P({Y}_{i}\mid {m}_{i},X)P({m}_{i}\mid X) . $

式中:$ P({Y}_{i}\mid {m}_{i},X) $表示在给定$ {m}_{i} $$ X $的条件下生成轨迹$ {Y}_{i} $的概率,$ P({m}_{i}\mid X) $表示多模态预测模块中计算得到的驾驶行为概率. 通过以上步骤,模型综合考虑多种可能的驾驶行为及其对应的轨迹分布,生成更加全面和准确的未来轨迹预测结果. 如图4所示为GC-LSTM的整体架构.

图 4

图 4   融合图卷积网络与卷积社交池化的轨迹预测模型整体架构

Fig.4   Overall architecture of trajectory prediction model integrating graph convolutional networks and convolutional social pooling


1.7. 实现细节

在训练模型时,设置负对数似然函数NLL使其最小,NLL计算式为

$ \text{NLL}=-{\mathrm{ln}}\left(\sum \limits_{i}P({Y}_{i}\mid {m}_{i},X)P({m}_{i}\mid X)\right) . $

使用Adam[30]以0.001的学习率训练模型,LSTM编码器具有64维状态,解码器具有128维状态. 模型使用Python 3.7编写,基于PyTorch[31]实现.

2. 仿真实验

2.1. 数据集

选择公开数据集NGSIM[32]与HighD[33]作为训练集和验证集. NGSIM数据集包含美国高速公路US-101和I-80高速公路数据集,通过摄像头和传感器采集,每条道路采集时间为45 min,数据采样间隔为0.1 s. NGSIM的道路场景涵盖拥堵、换道、匝道合流等复杂交互场景,适合测试模型在高密度交通下的表现,充分验证模型对车辆交互的捕捉能力. HighD数据集采集自德国科隆附近6个地点的11.5 h测量值和110 000辆车辆,包括5 600条完整的变道记录,车辆行驶特性以高速匀速、长距离跟驰为主,适合验证模型在结构化道路下的稳定性,测试GCN对全局车流拓扑的建模效果. 实验分别将每个数据集按70%、15%、15%划分训练集、验证集和测试集. 实验分别选取2个数据集中3 s的历史轨迹作为模型输入,预测未来5 s的轨迹,使用滑动窗口提取序列,窗口大小为8,步长为1[34-38].

2.2. 评估指标

均方根误差RMSE是衡量轨迹预测效果的常用指标,计算式为

$ \mathrm{RMSE}=\sqrt{\frac{1}{N}\sum \limits_{n=1}^{N}{\left[\left(\widehat{x}_{t}^{n}-x_{t}^{n}\right)}^{2}+{\left({\widehat{y}_{t}^{n}}-{y_{t}^{n}}\right)}^{2}\right]} . $

式中:$ N $为场景中车辆总数,($ \widehat{x}_{t}^{n},\;\widehat{y}_{t}^{n}) $为车辆$ n $$ t $时刻的预测坐标,($ x_{t}^{n},\;y_{t}^{n}) $为车辆$ n $$ t $时刻的实际坐标. 实验中,对于生成二元高斯分布的模型,使用高斯分量的均值计算RMSE. 对于生成多模态预测分布的模型,使用概率最高的分组计算RMSE. 为了更好地测试模型性能,使用NLL反映实验结果. 较低的NLL表明模型生成的预测分布能够更好地覆盖真实轨迹的可能性,更准确地反映驾驶行为的多模态特性.

2.3. 基准模型

为了验证所提模型的先进性,并重点论证融合全局与局部交互策略的优越性,选取涵盖传统方法、仅侧重局部交互、仅侧重全局交互以及其他先进策略的共11种模型作为基准进行对比. 这些模型根据核心的交互建模机制分类如下. 1)传统方法基准. a)CV:基于二阶卡尔曼滤波器的轨迹预测方法,是传统方法的基准模型. b)M-LSTM[34]:基于编码器-解码器框架,利用历史轨迹与车道结构,分配置信度值预测轨迹. 2)侧重于局部空间交互的模型. a)PIP[35]:使用卷积社交池和全卷积网络来生成多模态轨迹预测,是显式建模车辆周围局部邻域空间关系的经典方法. b)RA-LSTM[36]:基于残差注意力机制的轨迹预测模型,通过构建目标车辆与周围车辆的交互张量,捕捉局部范围内的车辆关系,预测目标车辆未来轨迹的概率分布. c)WSiP[37]:基于波叠加的社交池化方法,通过动态聚合局部邻车的高阶交互信息进行预测. 3)侧重于全局结构化交互的模型. a)HAN[38]:采用层次化注意力机制,软注意力模块可以覆盖全局车辆,构建全局的交互关系,是结合时空和硬软注意力机制的全局车辆轨迹预测方法. b)STA-LSTM[39]:采用LSTM编码器-解码器框架,空间注意力机制旨在从所有周围车辆中筛选关键影响者. c)HTSA-LSTM[40]:结合时空注意力机制和驾驶风格分析的轨迹预测模型,用于评估全局环境中所有车辆的重要性. 4)采用其他先进策略的模型. a)HLTP++[41]:结合自适应视觉与实时交互和人类决策,引入新傅立叶自适应尖峰神经网络进行高效计算. b)DRBP[42]:包括换道意图预测模型和轨迹预测模型的双Transformer模型,其自注意力机制理论上能同时建模局部和全局依赖. 5)本研究提出模型. GC-LSTM:融合图卷积网络和卷积社交池化的多模态轨迹预测模型.

2.4. 实验结果分析

将GC-LSTM与10种基准模型进行轨迹预测性能对比实验,在NGSIM数据集上的对比结果如表1所示. 实验结果表明,在城市高密度交通环境下,GC-LSTM在所有预测时间尺度(tp=1~5 s)上均表现出显著的性能优势. 在均方根误差(RMSE)维度,当tp=5 s时,GC-LSTM的RMSE=3.22 m,显著低于传统模型CV的6.68 m以及经典数据驱动模型M-LSTM的4.67 m,相较于性能次优的基准模型HLTP++(RMSE=3.32 m)仍有明显提升. 在负对数似然(NLL)维度,GC-LSTM的平均NLL=1.784,相较于表现较好的HTSA-LSTM(NLL=1.976)和HLTP++(NLL=2.304)有较大幅度下降,这表明本研究模型生成的预测分布能够更准确地覆盖车辆真实的行驶意图,有效捕捉驾驶行为的多模态特性. 此外,随着预测时间从1 s延长至5 s,GC-LSTM各项指标的增长幅度在所有模型中最为平缓,充分体现了该模型在处理复杂交互场景时长时预测的稳健性.

表 1   不同轨迹预测模型在NGSIM数据集上的性能对比

Tab.1  Performance comparison of different trajectory prediction models on dataset NGSIM

模型RMSE/mNLL
tp=1 stp=2 stp=3 stp=4 stp=5 s平均值tp=1 stp=2 stp=3 stp=4 stp=5 s平均值
CV0.731.783.134.686.683.4003.725.376.407.167.766.082
M-LSTM0.581.262.133.234.672.3740.872.493.464.094.743.130
PIP0.561.232.102.994.212.2181.783.364.244.875.413.932
RA-LSTM0.521.062.233.164.552.3041.462.613.844.495.033.486
WSiP0.541.172.043.084.142.1941.663.304.174.805.323.850
HAN0.521.011.692.523.541.8561.363.144.044.685.183.680
STA-LSTM0.541.201.972.944.172.1640.561.572.323.144.042.326
HTSA-LSTM0.490.981.532.343.461.7600.511.282.062.773.261.976
HLTP++0.480.981.562.173.321.7020.611.692.542.893.792.304
GC-LSTM0.470.891.412.083.221.6140.481.121.872.472.981.784

新窗口打开| 下载CSV


各模型在结构化高速公路数据集HighD上的仿真结果如表2所示. 由于HighD数据集的车辆行驶特性以高速匀速和长距离跟驰为主,场景交互相对规整,各模型的预测误差整体上低于NGSIM数据集. 可以看出,GC-LSTM依然保持了领先优势,tp=1 s时的RMSE=0.15 m,tp=5 s时的RMSE=2.65 m,对应的平均RMSE=1.140 m,相较于基准模型中表现最优的HLTP++(RMSE=1.222 m)和DRBP(RMSE=1.224 m)分别降低了约6.7%和6.9%. 从NLL指标来看,GC-LSTM的平均值为1.922,同样优于DRBP(NLL=2.114)和HAN(NLL=2.178). 实验结果证明,GC-LSTM通过分层交互建模机制,不仅能适应高密度的拥堵场景,也能在结构化的高速环境下提供高精度的轨迹预测结果.

表 2   不同轨迹预测模型在HighD数据集上的性能对比

Tab.2  Performance comparison of different trajectory prediction models on dataset HighD

模型RMSE/mNLL
tp=1 stp=2 stp=3 stp=4 stp=5 s平均值tp=1 stp=2 stp=3 stp=4 stp=5 s平均值
CV0.330.781.622.433.671.7661.943.094.856.127.034.606
PiP0.240.681.342.193.421.5740.452.273.344.204.763.004
WSiP0.220.591.212.053.041.4220.341.832.723.494.252.526
HAN0.180.441.051.722.871.2520.271.242.373.063.952.178
HLTP++0.190.421.111.642.751.2220.291.382.593.043.872.234
DRBP0.180.491.111.622.721.2240.241.272.442.933.692.114
GC-LSTM0.150.370.991.542.651.1400.231.072.042.743.531.922

新窗口打开| 下载CSV


为了进一步探究性能优势的内在机理,通过对表1表2数据的横向对比分析可以发现,侧重于局部交互的模型(如PIP、WSiP)在短期预测中虽有较好表现,但在长时预测中误差累积严重. 这反映了此类模型若缺乏对全局场景的宏观感知,则难以预见如远方车辆汇入或整体车流态势演化的长远影响. 侧重于全局交互的模型(如HAN、STA-LSTM)虽具备一定的宏观推理能力,但在车辆密度极高的场景中,全局注意力机制在过滤环境噪声方面能力相对有限,难以完全消除远距离无关车辆的干扰,从而影响了交互建模的精度. GC-LSTM的性能突破源于对上述2种策略局限性的有效克服. GCN构建的全局拓扑关系为场景提供了结构化的宏观上下文背景,确保了预测结果的前瞻性;卷积社交池化模块在此基础上作为自适应滤波器,对目标车辆周围的局部邻域进行精细化特征聚合,在强化关键交互信号的同时抑制了冗余特征的传播. 这种协同机制使得模型实现了对车辆交互行为更完整且更具鲁棒性的多层次表征,结合如图5所示的可视化轨迹对比分析进一步证实,GC-LSTM生成的预测轨迹(虚线)相较于其他基准模型,在时空演化上与地面真值(实线)保持了高度的一致性. 特别是在如换道、减速避让的复杂交互过程中,可视化结果显示本研究模型能够生成覆盖多个潜在行驶意图的概率分布区域,且真实轨迹始终处于高概率置信区间内. 这表明分层交互建模不仅提升了定量的指标精度,更在物理层面增强了模型对车辆运动不确定性的演变推理能力,全面提升了轨迹预测的综合性能.

图 5

图 5   不同轨迹预测模型在NGSIM数据集上的仿真结果可视化对比

Fig.5   Visual comparison of simulation results for different trajectory prediction models on dataset NGSIM


2.5. 消融实验

为了进一步验证图卷积网络与卷积社交池化模块对提升轨迹预测性能的贡献,在NGSIM和HighD这2个数据集上开展消融实验,对比基准LSTM模型、仅保留图卷积组件的G-LSTM模型、仅保留卷积社交池化组件的C-LSTM模型,以及集成上述2种机制的GC-LSTM模型性能.

NGSIM数据集上的实验结果如图6所示. 分析RMSE评价指标,基准LSTM模型的平均预测误差为2.268 m,在引入图卷积模块后,G-LSTM的平均误差降低至2.078 m;在引入卷积社交池化模块后,C-LSTM的平均误差进一步降至1.892 m;同时包含上述2种机制的GC-LSTM达到了最优的1.614 m. 分析NLL评价指标,GC-LSTM的平均值为1.784,明显优于仅包含单一模块的G-LSTM(NLL=3.194)和C-LSTM(NLL=2.562),这表明图卷积网络与社交池化机制在协同作用下,能够有效提升预测分布与真实驾驶轨迹的拟合程度.

图 6

图 6   在数据集NGSIM上的模块消融实验结果

Fig.6   Module ablation experimental results on dataset NGSIM


HighD数据集上的实验结果如图7所示,各模型在该场景下展现出与NGSIM数据集一致的性能变化趋势. 基准LSTM模型在该数据集上的平均RMSE与NLL分别为1.656 m和3.044. 随着模块的逐步集成,G-LSTM与C-LSTM的性能均有所提升,其中GC-LSTM的平均RMSE与NLL分别降低至1.140 m与1.922,在所有对比模型中表现最优. 数据分析结果表明,单纯依赖全局拓扑特征或局部交互特征,均无法完全覆盖复杂交通场景下的车辆动力学演化规律,导致预测精度受限.

图 7

图 7   在数据集HighD上的模块消融实验结果

Fig.7   Module ablation experimental results on dataset HighD


消融实验结果充分证明,GCN提供的全局空间拓扑约束与卷积社交池化模块提供的局部交互特征聚合在轨迹预测任务中具有互补性,二者的协同建模显著降低了长时预测过程中的误差累积,在量化预测不确定性方面表现出更强的稳健性.

3. 结 语

本研究提出融合图卷积网络与卷积社交池化的多模态轨迹预测模型,用于精确预测车辆的未来轨迹. 所提模型通过分层交互建模机制,有机结合GCN的全局交互感知能力与CSP的局部交互精细化表征优势,显著增强了对复杂车辆交互场景的建模能力. 模型不仅能够输出多模态轨迹以贴合实际驾驶行为中的不确定性,还对概率分布进行了定量刻画,提升了预测结果的可靠性和解释性. 在公开数据集NGSIM和HighD上的性能对比实验结果表明,所提模型在多项评价指标上均优于现有主流方法. 本研究仅基于车辆历史轨迹数据进行预测,未引入环境先验信息(如高精地图、交通规则),在实际应用中仍存在局限. 未来的研究工作将致力于融合多源信息(如视觉感知、高精地图),探索环境结构化表征与车辆交互的联合建模方法,进一步提升轨迹预测系统在真实复杂场景中的适应性与鲁棒性.

参考文献

KHALIL R A, SAFELNASR Z, YEMANE N, et al

Advanced learning technologies for intelligent transportation systems: prospects and challenges

[J]. IEEE Open Journal of Vehicular Technology, 2024, 5: 397- 427

DOI:10.1109/OJVT.2024.3369691      [本文引用: 1]

XU Z, YUAN J, YU L, et al

Machine learning-based traffic flow prediction and intelligent traffic management

[J]. International Journal of Computer Science and Information Technology, 2024, 2 (1): 18- 27

[本文引用: 1]

方金凤, 张振伟, 孟祥福

基于深度学习的车辆轨迹预测研究进展

[J]. 计算机科学与探索, 2026, 20 (2): 346- 366

FANG Jinfeng, ZHANG Zhenwei, MENG Xiangfu

Advancements in deep learning-based vehicle trajectory prediction research

[J]. Journal of Frontiers of Computer Science and Technology, 2026, 20 (2): 346- 366

GAO J, YU B, CHEN Y, et al

An ADAS with better driver satisfaction under rear-end near-crash scenarios: a spatio-temporal graph transformer-based prediction framework of evasive behavior and collision risk

[J]. Transportation Research Part C: Emerging Technologies, 2024, 159: 104491

DOI:10.1016/j.trc.2024.104491      [本文引用: 1]

HUANG Y, DU J, YANG Z, et al

A survey on trajectory-prediction methods for autonomous driving

[J]. IEEE Transactions on Intelligent Vehicles, 2022, 7 (3): 652- 674

DOI:10.1109/TIV.2022.3167103      [本文引用: 1]

王娜, 罗亮, 彭锟, 等

基于组稀疏卡尔曼滤波的多步轨迹预测方法

[J]. 空军工程大学学报, 2023, 24 (6): 70- 77

DOI:10.3969/j.issn.2097-1915.2023.06.010      [本文引用: 1]

WANG Na, LUO Liang, PENG Kun, et al

A multi-step trajectory prediction method based on group sparse Kalman filtering

[J]. Journal of Air Force Engineering University, 2023, 24 (6): 70- 77

DOI:10.3969/j.issn.2097-1915.2023.06.010      [本文引用: 1]

TAO L, WATANABE Y, YAMADA S, et al

Comparative evaluation of Kalman filters and motion models in vehicular state estimation and path prediction

[J]. Journal of Navigation, 2021, 74 (5): 1142- 1160

DOI:10.1017/S0373463321000370     

佘翊妮, 裴植, 刘晴辉, 等

城市道路通勤车辆行驶轨迹的改进型隐马尔可夫预测方法

[J]. 浙江工业大学学报, 2025, 53 (4): 437- 443

DOI:10.3969/j.issn.1006-4303.2025.04.011      [本文引用: 1]

SHE Yini, PEI Zhi, LIU Qinghui, et al

An improved hidden Markov prediction method for the trajectory of urban road vehicles

[J]. Journal of Zhejiang University of Technology, 2025, 53 (4): 437- 443

DOI:10.3969/j.issn.1006-4303.2025.04.011      [本文引用: 1]

YAO H, LI X, YANG X

Physics-aware learning-based vehicle trajectory prediction of congested traffic in a connected vehicle environment

[J]. IEEE Transactions on Vehicular Technology, 2023, 72 (1): 102- 112

DOI:10.1109/TVT.2022.3203906      [本文引用: 1]

LI H, LIAO Z, RUI Y, et al

A physical law constrained deep learning model for vehicle trajectory prediction

[J]. IEEE Internet of Things Journal, 2023, 10 (24): 22775- 22790

DOI:10.1109/JIOT.2023.3305395      [本文引用: 1]

LEFKOPOULOS V, MENNER M, DOMAHIDI A, et al

Interaction-aware motion prediction for autonomous driving: a multiple model Kalman filtering scheme

[J]. IEEE Robotics and Automation Letters, 2021, 6 (1): 80- 87

DOI:10.1109/LRA.2020.3032079      [本文引用: 1]

WANG Y, LIU Z, ZUO Z, et al

Trajectory planning and safety assessment of autonomous vehicles based on motion prediction and model predictive control

[J]. IEEE Transactions on Vehicular Technology, 2019, 68 (9): 8546- 8556

DOI:10.1109/TVT.2019.2930684      [本文引用: 1]

WIRTHMÜLLER F, SCHLECHTRIEMEN J, HIPP J, et al

Teaching vehicles to anticipate: a systematic study on probabilistic behavior prediction using large data sets

[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22 (11): 7129- 7144

DOI:10.1109/TITS.2020.3002070      [本文引用: 1]

WANG Y, WANG C, ZHAO W, et al

Decision-making and planning method for autonomous vehicles based on motivation and risk assessment

[J]. IEEE Transactions on Vehicular Technology, 2021, 70 (1): 107- 120

DOI:10.1109/TVT.2021.3049794      [本文引用: 1]

宋秀兰, 董兆航, 单杭冠, 等

基于时空融合的多头注意力车辆轨迹预测

[J]. 浙江大学学报: 工学版, 2023, 57 (8): 1636- 1643

DOI:10.3785/j.issn.1008-973X.2023.08.016      [本文引用: 1]

SONG Xiulan, DONG Zhaohang, SHAN Hangguan, et al

Vehicle trajectory prediction based on temporal-spatial multi-head attention mechanism

[J]. Journal of Zhejiang University: Engineering Science, 2023, 57 (8): 1636- 1643

DOI:10.3785/j.issn.1008-973X.2023.08.016      [本文引用: 1]

YU H, HUO S, ZHU M, et al. Machine learning-based vehicle intention trajectory recognition and prediction for autonomous driving [C]// Proceedings of the 7th International Conference on Advanced Algorithms and Control Engineering. Shanghai: IEEE, 2024: 771–775.

[本文引用: 1]

张淼, 何仪娟, 杨博宇, 等

基于LSTM-KF模型的高速列车群组追踪运行轨迹预测方法

[J]. 交通运输工程学报, 2024, 24 (3): 296- 310

[本文引用: 1]

ZHANG Miao, HE Yijuan, YANG Boyu, et al

Trajectory prediction method for high-speed train group tracking operation based on LSTM-KF model

[J]. Journal of Traffic and Transportation Engineering, 2024, 24 (3): 296- 310

[本文引用: 1]

QUAN R, ZHU L, WU Y, et al

Holistic LSTM for pedestrian trajectory prediction

[J]. IEEE Transactions on Image Processing, 2021, 30: 3229- 3239

DOI:10.1109/TIP.2021.3058599      [本文引用: 1]

高镇海, 鲍明喜, 高菲, 等

基于LSTM概率多模态预期轨迹预测方法

[J]. 汽车工程, 2023, 45 (7): 1145- 1152

DOI:10.19562/j.chinasae.qcgc.2023.07.005     

GAO Zhenhai, BAO Mingxi, GAO Fei, et al

The method of probabilistic multi-modal expected trajectory prediction based on LSTM

[J]. Automotive Engineering, 2023, 45 (7): 1145- 1152

DOI:10.19562/j.chinasae.qcgc.2023.07.005     

李战武, 张帅, 乔英峰, 等

基于自注意力机制和CNN-LSTM的空战目标机动轨迹预测

[J]. 兵器装备工程学报, 2023, 44 (7): 209- 216

LI Zhanwu, ZHANG Shuai, QIAO Yingfeng, et al

Maneuvering trajectory prediction of air combat targets based on self-attention mechanism and CNN-LSTM

[J]. Journal of Ordnance Equipment Engineering, 2023, 44 (7): 209- 216

ROSSI L, AJMAR A, PAOLANTI M, et al

Vehicle trajectory prediction and generation using LSTM models and GANs

[J]. PLoS One, 2021, 16 (7): e0253868

DOI:10.1371/journal.pone.0253868     

HUANG Z, WANG J, PI L, et al

LSTM based trajectory prediction model for cyclist utilizing multiple interactions with environment

[J]. Pattern Recognition, 2021, 112: 107800

DOI:10.1016/j.patcog.2020.107800     

IP A, IRIO L, OLIVEIRA R. Vehicle trajectory prediction based on LSTM recurrent neural networks [C]// Proceedings of the IEEE 93rd Vehicular Technology Conference. Helsinki: IEEE, 2021: 1–5.

[本文引用: 1]

SHENG Z, XU Y, XUE S, et al

Graph-based spatial-temporal convolutional network for vehicle trajectory prediction in autonomous driving

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23 (10): 17654- 17665

DOI:10.1109/TITS.2022.3155749      [本文引用: 2]

DEO N, TRIVEDI M M. Convolutional social pooling for vehicle trajectory prediction [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Salt Lake City: IEEE, 2018: 1549–1557.

[本文引用: 1]

KAWASAKI A, SEKI A. Multimodal trajectory predictions for urban environments using geometric relationships between a vehicle and lanes [C]// Proceedings of the IEEE International Conference on Robotics and Automation. Paris: IEEE, 2020: 9203–9209.

[本文引用: 1]

CHEN X, ZHANG H, ZHAO F, et al

Intention-aware vehicle trajectory prediction based on spatial-temporal dynamic attention network for Internet of vehicles

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23 (10): 19471- 19483

DOI:10.1109/TITS.2022.3170551      [本文引用: 2]

ZHANG T, SONG W, FU M, et al

Vehicle motion prediction at intersections based on the turning intention and prior trajectories model

[J]. IEEE/CAA Journal of Automatica Sinica, 2021, 8 (10): 1657- 1666

DOI:10.1109/JAS.2021.1003952      [本文引用: 2]

KATARIYA V, BAHARANI M, MORRIS N, et al

DeepTrack: lightweight deep learning for vehicle trajectory prediction in highways

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23 (10): 18927- 18936

DOI:10.1109/TITS.2022.3172015      [本文引用: 2]

KINGMA D P, BA J. Adam: a method for stochastic optimization [EB/OL]. (2017–01–30)[2025–05–29]. https://arxiv.org/abs/1412.6980.

[本文引用: 1]

PASZKE A, GROSS S, CHINTALA S, et al. Automatic differentiation in pytorch [C]// 31st International Conference on Neural Information Processing Systems. Long Beach: Curran Associates Inc, 2017: 1–4.

[本文引用: 1]

COIFMAN B, LI L

A critical evaluation of the next generation simulation (NGSIM) vehicle trajectory dataset

[J]. Transportation Research Part B: Methodological, 2017, 105: 362- 377

[本文引用: 1]

KRAJEWSKI R, BOCK J, KLOEKER L, et al. The highD dataset: a drone dataset of naturalistic vehicle trajectories on German highways for validation of highly automated driving systems [C]// Proceedings of the 21st International Conference on Intelligent Transportation Systems. Maui: IEEE, 2018: 2118–2125.

[本文引用: 1]

MESSAOUD K, YAHIAOUI I, VERROUST-BLONDET A, et al. Non-local social pooling for vehicle trajectory prediction [C]// Proceedings of the IEEE Intelligent Vehicles Symposium. Paris: IEEE, 2019: 975–980.

[本文引用: 2]

SONG H, DING W, CHEN Y, et al. PiP: planning-informed trajectory prediction for autonomous driving [C]// Computer Vision – ECCV 2020. [S.l.]: Springer, 2020: 598–614.

[本文引用: 1]

YANG Z, GAO Z, GAO F, et al

Intelligent vehicle moving trajectory prediction based on residual attention network

[J]. World Electric Vehicle Journal, 2022, 13 (3): 47

DOI:10.3390/wevj13030047      [本文引用: 1]

WANG R, WANG S, YAN H, et al

WSiP: wave superposition inspired pooling for dynamic interactions-aware trajectory prediction

[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2023, 37 (4): 4685- 4692

DOI:10.1609/aaai.v37i4.25592      [本文引用: 1]

XIONG W, CHEN J, ZHANG X, et al. Hierarchical attention network for planning-informed multi-agent trajectory prediction [C]// Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems. Detroit: IEEE, 2023: 5501–5506.

[本文引用: 2]

JIN L, LIU X, WANG Y, et al

Multi-modality trajectory prediction with the dynamic spatial interaction among vehicles under connected vehicle environment

[J]. Scientific Reports, 2024, 14: 2873

DOI:10.1038/s41598-024-53315-6      [本文引用: 1]

WEI Y, ZENG X, CHEN X, et al

HTSA-LSTM: leveraging driving habits for enhanced long-term urban traffic trajectory prediction

[J]. Applied Sciences, 2025, 15 (6): 2922

DOI:10.3390/app15062922      [本文引用: 1]

LIAO H, LI Y, LI Z, et al. Less is more: efficient brain-inspired learning for autonomous driving trajectory prediction [EB/OL]. (2024–07–09)[2025–05–29]. https://arxiv.org/pdf/2407.07020.

[本文引用: 1]

GAO K, LI X, CHEN B, et al

Dual transformer based prediction for lane change intentions and trajectories in mixed traffic environment

[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24 (6): 6203- 6216

DOI:10.1109/TITS.2023.3248842      [本文引用: 1]

/