<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 LSTM神经网络传递图

Fig.1 LSTM neural network transfer diagram

1.1.2. 双层卷积神经网络(2-CNN)

2-CNN是在标准的CNN基础上扩展而来的，如图2所示，通过连续的2层卷积来增强网络的特征提取能力. 与单层相比，其局部特征提取能力强，能够有效捕捉数据中更细致的局部特征，在多车交互关系的建模上表现更优. 在输入处理上，换道车辆和周围车辆的所有特征被拼接成一个一维向量并标准化，每一行数据代表一个样本. 当输入到模型时，数据被重塑为（样本数，特征数，1）的形状，即每个特征作为一维信号的一个通道按顺序串行输入网络. 在网络结构上，第1卷积层使用大小为5、步长为1的卷积核在整个特征序列上滑动，能够同时覆盖换道车辆及周围车辆的多种组合特征，从而学习其局部交互模式. 池化层在此基础上进行降维，保留关键信息. 第2卷积层则在第1层输出的特征图上进一步提取更高阶特征，挖掘特征间的复杂关系. 随后经全连接层融合和分类，完成换道行为预测.

图 2

图 2 2-CNN神经网络传递图

Fig.2 2-CNN neural network transfer diagram

总体来说，LSTM善于应对时间序列数据，通过门控机制和细胞状态捕捉时序依赖关系，擅长建模长距离上下文信息；2-CNN则较擅长面向空间数据，利用卷积核提取局部空间特征，通过池化增强平移不变性，计算高度并行化. LSTM强调时序动态，2-CNN聚焦局部关联，分别代表了循环结构与卷积结构在时序与空间维度上的核心优势，均广泛应用于交通运输的各个领域.

1.2. 窗口时间的选取

在换道预测研究中，窗口时间指的是从换道行为起始点开始向前设定的时间区间，在此区间捕捉车辆在换道前的一系列动态轨迹行为，是驾驶风格划分的数据基础. 过短的窗口可能导致信息丢失，而过长的窗口则可能引入不相关的历史数据，降低预测效果. 有研究发现^[7]，窗口时间长度在1.0~5.0 s范围内能减少数据冗余，提升预测速度，具备更强的捕捉换道行为关键特征的性能.

本研究从换道起点开始，分别向前设置1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0 s的窗口时间. 换道起点采用阈值法^[18]确定：识别车辆出现车道ID变化的具体帧（F₂），向前回溯并计算每0.2 s间隔内车辆的横向位移变化；当该变化首次低于设定阈值（0.05 m）时，以该时刻对应的帧定义为换道行为的起点F₁（见图3）.

图 3

图 3 换道起点确定示意图

Fig.3 Schematic diagram for determining starting point of lane-changing behavior

对于未换道车辆，随机选择一个起点，并从该起点向前依次寻找1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0 s的窗口时间. 具体操作如下：随机选择起点，首先检查5.0 s的窗口时间. 如果该窗口时间的数据完整，则可选取该窗口，并同时允许更短的窗口时间（如1.0~4.5 s）供后续使用. 若5.0 s的窗口不完整，则依次检查较短的窗口时间，直到找到一个完整的窗口，并提取该窗口数据做进一步分析.

1.3. 评价指标

在评估换道行为预测模型的有效性时，使用准确率Acc、精确率P、召回率R和F1值作为评价指标. 这些指标基于二分类问题的混淆矩阵进行计算，其具体定义如表1所示.

表 1 混淆矩阵分类

Tab.1 Confusion matrix classification

实际行为	识别结果
实际行为	真实行为	其他行为
真实行为	TP(真正例)	FN(假负例)
其他行为	FP(假正例)	TN(真负例)

精确率、召回率、准确率、F1值的表达式如下：

(1)$ P={{\mathrm{TP}}}/({{\mathrm{TP}}+{\mathrm{FP}}})\;,$

(2)$ R={{\mathrm{TP}}}/({{\mathrm{TP}}+{\mathrm{FN}}}) ,$

(3)$ {\mathrm{Acc}}=({{\mathrm{TP}}+\mathrm{TN}})/({{\mathrm{TP}}+{\mathrm{TN}}+{\mathrm{FP}}+{\mathrm{FN}}}), $

(4)$ {\mathrm{F}}1={\text{2}{\mathrm{TP}}}/({2{\mathrm{TP}}+{\mathrm{FP}}+{\mathrm{FN}}}). $

1.4. SHAP方法

SHAP（SHapley Additive exPlanations）是用于解释机器学习模型预测结果的先进方法. 由于复杂机器学习模型的预测结果通常缺乏透明性和可解释性，SHAP通过量化各特征对预测结果的边际贡献，提供了一种公平且一致的解释框架，使得对模型预测结果的解读更加清晰明确. 对于给定的模型f和特征集N，第i个特征的Shapley值定义为

(5)$ \varphi_i(f)=\sum_{S \subseteq N \backslash\{i\}} \dfrac{|S|!(|N|-|S|-1)!}{|N|!} \left[f(S \cup \{i\})-f(S)\right]. $

式中：N为所有特征的集合；|S|为子集S中的特征数量；|N|为特征集N中的特征总数；f(S)为仅使用子集S中的特征时，模型的预测输出.

2. 数据来源与处理

2.1. HighD 数据集

HighD 数据集^[19]是通过无人机在晴朗无风的天气条件下从鸟瞰视角拍摄的. 数据集包含60段视频，涵盖超过11万条车辆轨迹. 视频采集频率为25 Hz，记录的车型包括小汽车和货车，其中货车的比例高达23%.

该数据集详细标注了车辆的类别、行驶方向、速度、加速度、车道位置等关键信息. 本研究选取编号为15~24的地点5的数据（双向四车道），仅关注单次换道车辆，共1155辆，并与3897辆未换道车辆以及周围车辆的信息结合，用于换道行为预测建模. 换道车辆与周围车辆位置关系如图4所示.

图 4

图 4 换道车辆与周围车辆位置关系

Fig.4 Position relationship between target vehicle and surrounding vehicles

2.2. 特征值的选取

本研究共构建4类基础特征：1）换道车辆特征，包括车辆在x和y方向的位置、速度和加速度（编号1~6）；2）换道车辆与前车的交互特征，包括两车在x和y方向的距离差、速度差和加速度差（编号7~12）；3）换道车辆与目标车道前车的交互特征，包括x和y方向距离差、速度差和加速度差（编号13~18）；4）换道车辆与目标车道后车的交互特征，包括x和y方向距离差、速度差和加速度差（编号为19~24）. 共计24个特征，其中位置、速度、加速度的单位分别为m、m/s、m/s².

为了描述换道前车辆轨迹的波动性，并比较不同时间窗口的预测性能，在1.0~5.0 s的时间窗口内（步长为0.5 s），对上述24个特征计算5类统计量：平均值、标准偏差、变异系数、平均绝对偏差和四分位数变异系数，由此得到120个统计变量. 其中编号1~24对应平均值，25~48对应标准偏差，49~72对应变异系数，73~96对应平均绝对偏差，97~120对应四分位数变异系数.

此外，考虑到车辆的换道行为受车辆属性和交通流状态的影响，新增了车长信息（换道车辆、前车、目标车道前车和后车，编号为121~124，单位为m）；交通流密度（编号为125，单位为veh/km，）和货车比例（编号为126）. 在此基础上，根据全部126个特征变量评定计算换道车辆、换道车辆前车、目标车道前车和目标车道后车的驾驶风格，编号为127~130.

3. 结果分析

3.1. 未考虑驾驶风格特征的换道行为预测

3.1.1. 参数设置

提取换道车辆和未换道车辆在不同窗口期内的1~126号特征变量，分别使用LSTM和2-CNN模型来预测车辆换道行为.

LSTM模型利用126个特征变量作为输入进行预测. 2-CNN模型采用分层处理的方式，第1层考虑换道车辆及周围车辆的统计值及车长信息、交通流信息和货车占比；第2层提取更高阶的特征，这样的设计有助于更准确地捕捉车辆间的相互作用.

模型参数设置为如下：隐藏层神经元数量（N）为8，训练轮数（epoch）为100，批量大小（batch size）为32，学习率为0.001.

3.1.2. 结果分析

在不考虑驾驶风格的条件下，对比LSTM和2-CNN模型在不同时间窗口下的表现，结果显示2-CNN在绝大多数时间窗口上均略优于LSTM，尤其在短时间窗口上表现更为突出，结果如表2所示. 其中，T为窗口时间.

表 2 不考虑驾驶风格的LSTM和2-CNN模型预测结果

Tab.2 Prediction results of LSTM and 2-CNN models without considering driving style

T/s	Acc/%		P/%		R/%		F1/%
T/s	LSTM	2-CNN	LSTM	2-CNN	LSTM	2-CNN	LSTM	2-CNN
1.0	98.81	99.21	98.21	99.50	96.07	96.71	97.13	98.09
1.5	98.92	99.06	97.15	97.15	97.85	98.58	97.50	97.86
2.0	98.60	98.64	96.69	96.17	96.17	96.93	96.42	96.55
2.5	98.62	98.40	96.46	97.54	95.88	93.47	96.16	95.46
3.0	98.26	98.62	94.33	95.31	94.33	95.70	94.32	95.50
3.5	98.11	98.52	93.66	94.98	92.91	94.53	93.28	94.75
4.0	98.55	98.47	93.68	95.06	95.98	93.82	94.82	94.43
4.5	98.10	98.42	96.63	98.22	88.88	89.83	92.58	93.84
5.0	98.45	98.91	94.09	97.50	91.61	92.37	92.82	94.86

2-CNN在1.0、1.5 s的窗口时间上取得了较高的准确率、召回率和F1值，这些指标反映了模型的稳定性和对换道行为的精确预测能力. 特别是在1.0 s窗口时间下，2-CNN的精确率和F1值分别达到了99.50%和98.09%，优于LSTM模型的98.21%和97.13%. 这表明2-CNN在短时间窗口内更具优势，在换道行为预测中具有较强的适应性.

总体来看，2种模型均在较短时间窗口上更有利于捕捉换道行为. 而随着窗口时间的延长，无论是LSTM还是2-CNN，其预测准确性均出现下降，进一步说明长时间窗口可能引入了干扰因素，削弱了模型对换道行为的捕捉能力.

3.2. 考虑驾驶风格的换道行为预测

为了考虑换道车辆及周围车辆驾驶风格对换道行为的影响，通过K-means聚类的方法并使用主成分分析与单因素方差分析的方法对主要特征变量降维，以提取换道车辆和周围车辆的驾驶风格，将其作为换道行为预测的输入变量，提高预测的准确性.

首先，对换道车辆与非换道车辆的24个基础特征值进行斯皮尔曼相关性分析，结果如图5所示. 其中，$\rho_{\mathrm{s}} $为Spearman秩相关系数，横纵坐标1~24分别对应24个特征变量. 对于相关性大于0.8的特征对，删除其中一个冗余的特征变量. 最终，筛选并保留21个具有较高代表性的特征值. 对21个筛选后的特征值计算平均值、标准偏差、变异系数、平均绝对偏差和四分位数变异系数^[14]这5种统计量，得到105个新的特征变量. 之后，提取换道车辆和未换道车辆以及周围3辆车的车长信息和对应的交通流信息，最终得到包含111个特征变量的数据集. 在整理好特征变量后，首先对数据进行归一化处理；随后，应用主成分分析方法对数据降维提高模型的训练效率和预测性能；之后，使用K-means聚类算法对数据进行聚类分析. 依据主成分分析得到的聚类结果，将具有较高加速度差值、较高速度差值、较小车间距的车辆定义为激进型，与之相反的为保守型. 分别用0、1、2代表保守型、一般型和激进型的驾驶风格，每个时间窗口期的聚类结果如图6所示.

图 5

图 5 24个特征变量的斯皮尔曼相关性分析热力图

Fig.5 Spearman correlation analysis heatmap of 24 characteristic variables

图 6

图 6 不同时间窗口的驾驶风格聚类结果

Fig.6 Clustering results of driving styles in different time windows

为了验证聚类结果的有效性，采用轮廓系数（silhouette score）、Calinski-Harabasz指数和Davies-Bouldin指数^[20]对不同窗口时间下聚类结果的有效性进行量化分析.

如表3所示为不同窗口时间下驾驶风格聚类有效性评价指标. 可以看出，所有窗口时间下的轮廓系数均大于0.5，Calinski-Harabasz指数均高于2 000，Davies-Bouldin指数均小于1，均满足聚类有效性的常用标准，说明聚类结果具有较好的分群效果. 整体来看，本研究采用的PCA+K-means方法能够有效区分不同驾驶风格，聚类分组具有较高的可信度和实际意义.

表 3 不同窗口时间下驾驶风格聚类有效性评价指标

Tab.3 Evaluation indicators for effectiveness of driving style clustering under different window times

T/s	轮廓系数	Calinski-Harabasz值	Davies-Bouldin值
1.0	0.540	2 249.709	0.861
1.5	0.544	2 273.568	0.851
2.0	0.591	2 659.616	0.781
2.5	0.596	2 696.060	0.786
3.0	0.595	2 672.858	0.793
3.5	0.591	2 605.592	0.814
4.0	0.588	2 538.292	0.817
4.5	0.584	2 488.884	0.837
5.0	0.580	2 444.602	0.852

将聚类结果作为模型输入，包括换道车辆驾驶风格、前车驾驶风格、目标车道前车驾驶风格以及目标车道后车驾驶风格. 此时数据集的特征变量增加至115个.

为了筛选出与是否发生换道行为具有统计学显著关联的特征变量，本研究采用单因素方差分析（one-factor analysis of variance，ANOVA）的方法计算F值和P值，判断某个特征是否对分类结果有显著影响，排除无关或噪声特征，以优化模型结构，提升预测准确性，同时增强模型解释力. 在给定显著性水平α=0.05下，当概率P<0.05时则认为该特征变量对于是否发生换道行为的影响显著. 对1.0~5.0 s的9个时间窗口选取对换道结果具有显著影响的特征变量，最终每个窗口时间选取的特征变量个数分别为64、71、66、74、73、71、69、66、68个. 其中，以2.0 s的窗口时间为例，符合要求的特征变量如图7所示. 按显著性由强到弱对具有显著特征变量的编号进行排序，即横轴从左到右编号对应的F值依次降低.

图 7

图 7 2.0 s窗口时间下特征变量经ANOVA检验的F值和P值

Fig.7 F-values and P-values of feature variables tested by ANOVA under 2.0-second window time

在2个模型的参数选择上，LSTM模型采用随机搜索交叉验证（randomized search cross validation）^[21]的方法，从预定义的参数空间中随机选择一组参数进行训练和评估，探索更广泛的参数空间，找到更优的超参数提高模型的泛化能力. 最后，LSTM模型的参数和3.1节中相同，超参数设置如表4所示.

表 4 考虑驾驶风格的LSTM模型的最优超参数设置

Tab.4 Optimal hyperparameter setting for LSTM model considering driving style

超参数	描述	取值
activation	激活函数	relu
alpha	L2正则化参数	0.01
batch_size	每次更新模型权重时所使用的样本数	16
hidden_layer_sizes	隐藏层的结构配置	(100, 50)
learning_rate_init	初始学习率	0.001

对于2-CNN模型来说，由于每一层的特征变量数量相对较少，采用Optuna方法^[22]进行超参数搜索. Optuna是基于贝叶斯优化的算法，在每次评估后调整搜索策略，从而更快地收敛到较好的参数，提供更好的性能优化. 2-CNN模型参数和3.1节中相同，超参数设置如表5所示.

表 5 考虑驾驶风格的2-CNN模型的最优超参数设置

Tab.5 Optimal hyperparameter setting for 2-CNN model considering driving style

超参数	描述	取值
filters	卷积核数量	32
kernel_size	卷积核大小	5
dense_units	全连接层中神经元数量	64
learning_rate	学习率	0.001

3.3. 考虑驾驶风格特征的结果分析

在考虑驾驶风格的条件下，LSTM和2-CNN模型在不同时间窗口下均比不考虑驾驶风格时有更高的准确率、精确率、召回率和F1值，如表6所示. 1）在1.0~2.0 s窗口时间下，LSTM的F1值均高于2-CNN. 特别是在2.0 s的窗口时间，LSTM预测效果最优，F1值达99.26%. 2）随着窗口时间增长，LSTM保持稳定性能优势，其F1值始终高于98.50%. 尤其在3.5 s窗口，LSTM精确率为99.78%，在所有窗口时间中达到最高，体现了对复杂驾驶行为的分辨能力. 相比之下，2-CNN性能呈现加速衰减趋势，F1值从2.5 s的96.48%降至4.0 s的90.40%，凸显了其在连续行为建模中的结构局限性. 3）在5.0 s窗口时间，LSTM表现出衰减的可控性但仍保持F1值为91.72%，其准确率与召回率显著优于2-CNN. 而2-CNN在5.0 s窗口出现指标矛盾现象：准确率回升至全数据次高值98.11%，但召回率与F1值未同步恢复，反映其长时预测存在误判积累风险.

表 6 考虑驾驶风格的LSTM和2-CNN模型预测结果

Tab.6 Prediction results of LSTM and 2-CNN models considering driving style

T/s	Acc/%		P/%		R/%		F1/%
T/s	LSTM	2-CNN	LSTM	2-CNN	LSTM	2-CNN	LSTM	2-CNN
1.0	99.03	97.72	95.95	96.33	97.83	89.27	96.88	92.68
1.5	99.36	98.35	98.75	97.28	97.59	96.42	98.17	96.85
2.0	99.74	98.27	98.96	97.14	99.57	95.84	99.26	96.48
2.5	99.73	98.95	98.90	96.46	99.57	96.50	99.23	96.48
3.0	99.54	98.03	98.58	94.37	98.83	95.11	98.71	94.74
3.5	99.56	97.59	99.78	92.77	97.34	91.11	98.54	91.93
4.0	99.52	97.47	98.11	93.73	97.50	87.31	97.80	90.40
4.5	99.37	97.50	99.04	95.25	95.26	82.60	97.11	88.34
5.0	98.59	98.11	92.25	94.35	91.23	87.24	91.72	90.64

总体来说，LSTM模型在各个窗口时间下的F1值均高于2-CNN模型的，反映出LSTM模型在处理时间序列模型上能力较强，也揭示了LSTM通过门控机制能有效捕获驾驶行为的时序关联性；在短于2.0 s的窗口时间，特征维度不足会导致模型判别边界模糊；当窗口时间长于2.0 s时，冗余时序信息可能引发注意力漂移，构成性能衰减边界条件.

合理选择最佳时间窗口（2.0 s）对于实际应用具有重要价值，不仅能够提升换道预测的准确率，还能兼顾系统的实时性和响应速度，从而更好地满足智能驾驶等实际场景对预测性能的需求，为智能驾驶辅助系统等实际场景提供更为科学合理的参数设置，提升换道行为预测的可靠性和效率.

3.4. 模型性能提升

如图8所示为考虑驾驶风格前、后，LSTM与2-CNN模型的F1值性能提升. 可以看出，在各个窗口时间下，考虑驾驶风格后的LSTM模型，其F1值基本均有提升且最大提升出现在3.5 s的窗口时间，提升了5.64%. 这说明驾驶风格会显著影响驾驶行为. 通过引入换道车辆与周围车辆的驾驶风格，LSTM模型能够建立个性化的特征映射关系，使模型对不同风格的驾驶行为产生更强的模式识别能力，也恰巧匹配LSTM模型善于处理时间序列数据的特点.

图 8

图 8 考虑驾驶风格前、后的LSTM与2-CNN模型F1值性能对比

Fig.8 Comparison of F1-score performance of LSTM and 2-CNN models with driving style versus without driving style

对于2-CNN模型，考虑驾驶风格后，在多个窗口时间下的F1值均出现减少，在4.5 s的窗口时间，下降幅度最大，达5.86%，这说明考虑驾驶风格反而不适用于空间序列处理的模型. 并且，该模型在1.0 s和4.0~5.0 s的窗口时间下的降幅都较大，表明时间窗口过短，可能无法捕捉到驾驶风格的完整动态特征，导致模型在特征提取时信息不足，从而影响分类性能；时间窗口过长，可能导致特征冗余和噪声积累，使得模型在处理复杂时间序列时表现不佳. 这可能是由于模型结构本身不适合处理类别型或全局抽象特征，因此，2-CNN模型在处理时间序列数据时，可能无法有效捕捉驾驶风格的动态变化，相比之下，时间序列模型可能更适合处理此类数据.

本研究用t检验法，检验考虑驾驶风格与未考虑驾驶风格2种情况下的F1值差异，以判断该差异在预测准确性上是否具有统计显著性. 如表7所示，两者的p-value都小于0.05，这说明LSTM和2-CNN模型在考虑驾驶风格与未考虑驾驶风格的情况下，均表现出显著的性能差异. 因此，是否考虑驾驶风格对2个模型的性能具有显著的影响.

表 7 LSTM与2-CNN模型的t检验结果

Tab.7 T-test results of LSTM and 2-CNN models

模型	t-statistic	p-value
LSTM	−2.4994	0.0237
2-CNN	2.2057	0.0424

3.5. 基于SHAP的影响因素分析

对每个窗口期内所有特征的SHAP值进行汇总与可视化，生成特征重要性图（见图9），直观地展示了整体模型中影响力最大的前20个特征，并按影响力从高到低依次排列. 其中，纵坐标代表特征变量序号，红色说明该特征的取值较大，蓝色说明该特征的取值较小，横坐标的SHAP值表示该特征对换道预测结果的影响程度与正负方向. 通过比较每个时间窗口期的SHAP值分析结果可以看出，本研究新增的特征变量，包括127（换道车辆的驾驶风格）、130（目标车道后车的驾驶风格）、123（目标车道前车长度）、126（货车在车流中的比例）、125（交通流的密度）、128（前车驾驶风格）、122（前车车长）等这些特征变量的影响排名较前，说明新增的特征变量对换道行为预测的影响较大，将其引入有助于提升模型预测的准确性.

图 9

图 9 不同窗口时间下SHAP值与单个特征变量的关系

Fig.9 Relationship between SHAP value and individual feature variable at different window times

如表8所示为各窗口期前20个高贡献特征中车辆长度、交通流及驾驶风格特征的影响排名. 可以看出，虽然在不同时间窗下，特征变量对换道行为预测模型的贡献度和排名存在一定的差异，但是，不同时间窗口下，127（换道车辆驾驶风格）展现出较为突出的影响力，在大多数窗口期内均位列特征重要性前20名，新增的125（交通流密度）和126（货车比例）这些因素同样表现出较高的重要性，较多地出现在前20个高贡献特征中. 相对而言，121~124（各个位置车辆长度）及128~130（周围车辆驾驶风格）的贡献度较低.

表 8 各窗口期前20个高贡献特征中车辆长度、交通流及驾驶风格特征的影响排名

Tab.8 Influence ranking of vehicle length, traffic flow, and driving style features among top 20 high contribution features in each window period

No.	T/s
No.	1.0	1.5	2.0	2.5	3.0	3.5	4.0	4.5	5.0
121	—	—	—	—	—	—	—	—	—
122	11	—	19	—	—	—	—	—	—
123	13	7	—	12	—	15	18	—	—
124	—	—	16	—	—	—	—	18	14
125	—	—	18	17	15	13	14	13	8
126	18	9	15	13	18	12	9	—	6
127	12	—	6	2	3	4	3	2	7
128	—	—	—	—	—	—	20	16	—
129	—	—	—	—	—	—	—	—	—
130	—	10	—	—	—	—	—	—	—

如表9所示，列举了在2.0 s时间窗口下对换道行为预测模型影响最大的特征变量及其SHAP贡献度，用以分析最优窗口时间下传统变量与新增特征变量对预测结果的贡献程度. 其中，Rank表示贡献度排名，$\overline{\rm{SHAP}} $表示平均绝对SHAP值，Co表示贡献度. 特征变量1（x方向位移的平均值）以19.38%的贡献度占据首位，其次是特征43（x方向位移的变异系数，14.26%）和25（y方向速度的标准偏差，9.46%），而本研究中重点关注的新增特征如127（换道车辆驾驶风格）、126（货车比例）、124（目标车道后车车长）、125（交通流密度）和122（前车车长）分别以4.36%、1.86%、1.81%、1.11%和1.10%的贡献度位列第6、15、16、18、19位. 将新增加的车辆长度、货车比例、交通流密度以及考虑车辆交互特征的换道车辆驾驶风格，这4类贡献度相加，得到的联合特征贡献率达11.08%. 这表明在2.0 s窗口期，传统特征（如1、43、25）对预测起主导作用，但新增的驾驶风格、车长和交通流特征仍具有一定的可解释的贡献，其重要性可能在不同时间窗口动态变化（如125，交通流特征在不同窗口时间的范围为0.66%~3.85%），共同支撑了模型预测能力的提升.

表 9 2.0 s窗口时间下前20个贡献度最高的特征值

Tab.9 Top 20 features with highest contribution values under 2.0-second window time

Rank	No.	$\overline{\rm{SHAP}} $值	Co/%	Rank	No.	$\overline{\rm{SHAP}} $值	Co/%
1	1	1.279	19.38	11	23	0.159	2.41
2	43	0.941	14.26	12	6	0.159	2.41
3	25	0.624	9.46	13	80	0.143	2.17
4	32	0.383	5.82	14	44	0.141	2.14
5	27	0.310	4.70	15	126	0.122	1.86
6	127	0.287	4.36	16	124	0.119	1.81
7	2	0.236	3.59	17	67	0.092	1.39
8	69	0.221	3.36	18	125	0.073	1.11
9	86	0.179	2.72	19	122	0.072	1.10
10	87	0.169	2.56	20	70	0.066	1.00

4. 结　论

本研究提出考虑周围车辆驾驶风格的换道决策建模方法，主要的结论有如下2点.

(1)考虑周围车辆的行驶数据的统计值用于表征其不同的驾驶风格，使用PCA+K-means的方法量化驾驶风格；新引入车辆长度、交通流密度、货车占比和考虑车辆交互特征的换道车辆驾驶风格作为预测模型的输入且其联合贡献率达11.08%.

(2)最佳方案是使用2.0 s的窗口时间并采用结合周围车辆驾驶风格特征的LSTM模型，其预测换道行为的F1值最优，达到99.26%. 该方案相对于不考虑驾驶风格提升了5.64%，相对于考虑驾驶风格的2-CNN模型（F1值为96.48%）也有较大的提升.

未来可以分析2-CNN模型在预测中出现的不增反降的现象. 同时，为了提升模型的鲁棒性和实际应用能力，计划增加训练数据的多样性，涵盖不同道路类型、交通密度和驾驶风格，将有助于提升模型在实际复杂交通环境下的泛化能力. 上述未来工作将有助于研究成果的推广，以及提高模型对实际复杂场景的预测能力，以更好地支持智能交通管理，提升道路安全与交通效率，促进智能交通技术的应用.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

NHTSA. Traffic safety facts 2020: a compilation of motor vehicle crash data from the fatality analysis reporting system and the general estimates system [R]. Washington, DC: National Highway Traffic Safety Administration, 2022.

DOI:10.1371/journal.pone.0202126 [本文引用: 1]

[2]

ZHANG Y, ZOU Y, XIE Y, et al

Identifying dynamic interaction patterns in mandatory and discretionary lane changes using graph structure

[J]. Computer-Aided Civil and Infrastructure Engineering, 2024, 39 (5): 638- 655

DOI:10.1111/mice.13099 [本文引用: 1]

[3]

ZHANG C, WANG W, CHEN Z, et al

Shareable driving style learning and analysis with a hierarchical latent model

[J]. IEEE Transactions on Intelligent Transportation Systems, 2024, 25 (9): 11471- 11484

DOI:10.1109/TITS.2024.3374771 [本文引用: 1]

[4]

WANG Y, QU W, GE Y, et al

Effect of personality traits on driving style: psychometric adaption of the multidimensional driving style inventory in a Chinese sample

[J]. PLoS One, 2018, 13 (9): e0202126

[5]

ADAVIKOTTU A, VELAGA N R

Modeling the impact of driving aggression on lane change performance measures: steering compensatory behavior, lane change execution duration and crash probability

[J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2024, 103: 526- 553

DOI:10.1016/j.trf.2024.05.001 [本文引用: 1]

[6]

MOZAFFARI S, ARNOLD E, DIANATI M, et al

Early lane change prediction for automated driving systems using multi-task attention-based convolutional neural networks

[J]. IEEE Transactions on Intelligent Vehicles, 2022, 7 (3): 758- 770

DOI:10.1109/TIV.2022.3161785 [本文引用: 2]

[7]

XU T, ZHANG Z, WU X, et al

Recognition of lane-changing behaviour with machine learning methods at freeway off-ramps

[J]. Physica A: Statistical Mechanics and Its Applications, 2021, 567: 125691

DOI:10.1016/j.physa.2020.125691 [本文引用: 2]

[8]

KHELFA B, BA I, TORDEUX A

Predicting highway lane-changing maneuvers: a benchmark analysis of machine and ensemble learning algorithms

[J]. Physica A: Statistical Mechanics and Its Applications, 2023, 612: 128471

DOI:10.1016/j.physa.2023.128471 [本文引用: 1]

[9]

XUE Q, XING Y, LU J

An integrated lane change prediction model incorporating traffic context based on trajectory data

[J]. Transportation Research Part C: Emerging Technologies, 2022, 141: 103738

DOI:10.1016/j.trc.2022.103738 [本文引用: 1]

[10]

GONAH N, SALAMA H, ALI M, et al

An evaluation of the impact of truck-lane restriction strategies on traffic operation characteristics

[J]. Innovative Infrastructure Solutions, 2025, 10 (4): 130

DOI:10.1007/s41062-025-01928-9 [本文引用: 1]

[11]

ROH C G, JEON H, SON B

Do heavy vehicles always have a negative effect on traffic flow?

[J]. Applied Sciences, 2021, 11 (12): 5520

DOI:10.3390/app11125520 [本文引用: 1]

[12]

KESTING A, TREIBER M, HELBING D

General lane-changing model MOBIL for car-following models

[J]. Transportation Research Record: Journal of the Transportation Research Board, 2007, 1999 (1): 86- 94

DOI:10.3141/1999-10 [本文引用: 1]

[13]

TOLEDO T, KOUTSOPOULOS H N, BEN-AKIVA M E

Modeling integrated lane-changing behavior

[J]. Transportation Research Record: Journal of the Transportation Research Board, 2003, 1857 (1): 30- 38

DOI:10.3141/1857-04 [本文引用: 1]

[14]

LI C, CHEN H, XIONG Y, et al

Analysis of Chinese typical lane change behavior in car–truck heterogeneous traffic flow from UAV view

[J]. Electronics, 2022, 11 (9): 1398

DOI:10.3390/electronics11091398 [本文引用: 2]

[15]

JIA Y, ZHANG Z, LI X, et al

Driving style tendency quantification method based on short-term lane change feature extraction

[J]. Sustainability, 2025, 17 (8): 3563

DOI:10.3390/su17083563 [本文引用: 1]

[16]

ZHANG Y, CHEN Y, GU X, et al

A proactive crash risk prediction framework for lane-changing behavior incorporating individual driving styles

[J]. Accident Analysis and Prevention, 2023, 188: 107072

[17]

GAO K, LI X, HU L, et al

Instantaneous lane-changing type aware lane change prediction based on LSTM in mixed traffic scenario

[J]. Journal of Circuits, Systems and Computers, 2022, 31 (10): 2250180

DOI:10.1142/S0218126622501808 [本文引用: 1]

[18]

CHEN S, PIAO L, ZANG X, et al

Analyzing differences of highway lane-changing behavior using vehicle trajectory data

[J]. Physica A: Statistical Mechanics and Its Applications, 2023, 624: 128980

DOI:10.1016/j.physa.2023.128980 [本文引用: 1]

[19]

KRAJEWSKI R, BOCK J, KLOEKER L, et al. The highD dataset: a drone dataset of naturalistic vehicle trajectories on German highways for validation of highly automated driving systems [C]// International Conference on Intelligent Transportation Systems. Maui: IEEE, 2018: 2118–2125.

DOI:10.1016/j.patcog.2012.07.021 [本文引用: 1]

[20]

ARBELAITZ O, GURRUTXAGA I, MUGUERZA J, et al

An extensive comparative study of cluster validity indices

[J]. Pattern Recognition, 2013, 46 (1): 243- 256

[21]

BERGSTRA J, BENGIO Y

Random search for hyper-parameter optimization

[J]. Journal of Machine Learning Research, 2012, 13: 281- 305

[22]

AKIBA T, SANO S, YANASE T, et al. Optuna: a next-generation hyperparameter optimization framework [C]// 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage: ACM, 2019: 2623–2631.