浙江大学学报(工学版), 2022, 56(3): 485-493 doi: 10.3785/j.issn.1008-973X.2022.03.007

计算机与控制工程

基于数据驱动的鲁棒反步自适应巡航控制

宋家成,, 闫茂德,, 杨盼盼, 巨永锋, 岳靖斐

1. 长安大学 电子与控制工程学院,陕西 西安 710064

2. 陕西汽车控股集团有限公司,陕西 西安 710200

Robust backstepping adaptive cruise control based on data-driven

SONG Jia-cheng,, YAN Mao-de,, YANG Pan-pan, JU Yong-feng, YUE Jing-fei

1. School of Electronic and Control Engineering, Chang’an University, Xi’an 710064, China

2. Shaanxi Automobile Holding Group Limited Company, Xi’an 710200, China

通讯作者: 闫茂德,男,教授,博导. orcid.org/0000-0002-0566-1567. E-mail: mdyan@chd.edu.cn

收稿日期: 2021-04-12  

基金资助: 国家自然科学基金资助项目(61803040);陕西省重点研发计划资助项目(2019GY-218);中央高校基本科研业务费资助项目(300102320720)

Received: 2021-04-12  

Fund supported: 国家自然科学基金资助项目(61803040);陕西省重点研发计划资助项目(2019GY-218);中央高校基本科研业务费资助项目(300102320720)

作者简介 About authors

宋家成(1993—),男,博士生,从事智能网联车辆控制研究.orcid.org/0000-0003-3183-123X.E-mail:jiacheng.song@chd.edu.cn , E-mail:jiacheng.song@chd.edu.cn

摘要

为了实现高精度的鲁棒自适应巡航控制(ACC),提出基于数据驱动的鲁棒反步自适应巡航控制算法. 利用反步技术设计虚拟控制器,将车辆间距控制转化为速度控制,避免速度相关型间距策略带来的间距与速度控制耦合;构建基于数据的耦合滑模面并设计状态观测器,补偿车辆复杂的非线性动力学特性、离散误差及外部干扰,提升控制算法的鲁棒性;利用反馈控制及鲁棒控制技术设计数据驱动的ACC鲁棒控制算法;分别选取固定时间间距、变时间间距策略,利用所提ACC算法及基于比例积分(PI)的ACC算法进行车辆自适应巡航控制对比仿真验证. 对比实验结果表明,所提算法在控制精度、鲁棒性方面具有优越性.

关键词: 自适应巡航控制 ; 数据驱动 ; 鲁棒控制 ; 反步控制 ; 间距策略

Abstract

A data-driven robust backstepping adaptive cruise control (ACC) algorithm was proposed to achieve high-precision robust ACC. First of all, a virtual controller was designed to convert the vehicle spacing control into speed control by using the backstepping technology, avoiding the coupling of speed and spacing control brought by the speed-dependent spacing strategy. Secondly, a data-based coupling sliding mode surface and state observer were constructed to compensate for the vehicle’s complex nonlinear dynamics, the discrete errors and the external disturbances, and the robustness of the control algorithm was improved. Then, a data-driven robust ACC algorithm was designed using feedback control and robust control techniques. Finally, the proposed ACC algorithm and the PI-based ACC were used for vehicle adaptive cruise tracking simulation verification with two spacing strategies (constant time headway and varying time headway). The superiority of the designed algorithm in terms of control accuracy and robustness are shown by the experimental results.

Keywords: adaptive cruise control (ACC) ; data-driven ; robust control ; backstepping control ; spacing strategy

PDF (1433KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

宋家成, 闫茂德, 杨盼盼, 巨永锋, 岳靖斐. 基于数据驱动的鲁棒反步自适应巡航控制. 浙江大学学报(工学版)[J], 2022, 56(3): 485-493 doi:10.3785/j.issn.1008-973X.2022.03.007

SONG Jia-cheng, YAN Mao-de, YANG Pan-pan, JU Yong-feng, YUE Jing-fei. Robust backstepping adaptive cruise control based on data-driven. Journal of Zhejiang University(Engineering Science)[J], 2022, 56(3): 485-493 doi:10.3785/j.issn.1008-973X.2022.03.007

自适应巡航控制(adaptive cruise control, ACC)作为L2级别的高级辅助驾驶系统,受到国内外学者及工程师的广泛关注 [1-5]. ACC根据前车速度自适应调整自身速度,以保持期望的车距[6]. 由于车辆内部物理机构(执行器,传感器)模型的不确定性和干扰,及外部运行环境(天气,路面类型、坡度等)复杂时变特性[7],现有ACC系统均假设在一定速度范围及场景下使用,设计强鲁棒性的ACC系统对其普及具有重要意义.

ACC系统大致可分为2种[8]:1)传统基于规则和既定逻辑的ACC决策与控制算法[9-18],2)基于学习的ACC决策与控制算法[19-21]. 具体而言,Milanes 等[9]结合智能比例积分(proportional integral, PI)控制和模糊控制,设计面向城市道路环境的车辆走停巡航控制算法. Ganji 等[10]利用粒子群算法优化PID控制器参数,提升车辆纵向自动控制效果. Kim 等[11]通过真实驾驶员测试数据设计模型自由巡航控制算法,避免了传统ACC控制算法参数较多的问题,提高了系统安全性和驾驶舒适性. 王斌等[12]综合2类模糊算法,提出可变输出论域的模糊控制方法,实现对车辆纵向自动控制。Furda等[19]考虑交通规则限制、安全性、舒适性等指标,采用 Petri 网设计用于车辆自主行为选择的最优决策体系. Chong等[20]针对车辆跟驰行为,采用模糊逻辑划分交通状态变量,建立基于规则的神经网络模型模拟驾驶员的驾驶行为. 郑睿[21]针对车辆驾驶行为的多目标问题,提出基于最小二乘策略迭代的多目标增强学习的车辆智能驾驶决策方法.

由此可见,第1种ACC着重下层控制,重点讨论控制算法设计、模型非线性及干扰抑制等问题;第2种ACC着重上层决策,重点讨论仿人类大脑驾驶决策过程及其优化. 虽然第1种ACC系统解决了大部分跟车问题,但模型参数往往相对固化. 在现实环境中,车辆的非线性动力学特性和未知环境干扰,使第1种ACC很难实现高精度的鲁棒自适应巡航控制. 第2种ACC虽然可以实现对未知环境的理解,但存在结构复杂、约束条件难以界定以及难以直接实现下层控制的问题. 相比于独立研究,利用迭代学习技术优化传统控制方法,可以有效提升ACC系统的跟踪效果、非线性抑制能力及鲁棒性.

本研究利用反步技术,将车辆距离控制转化为速度控制、解耦间距及速度控制;构建基于数据的耦合滑模面处理车辆复杂的非线性动力学特性、外部干扰及解耦误差;利用反馈控制及鲁棒控制技术设计ACC鲁棒控制算法.

1. 系统描述

1.1. 车辆动力学模型

名义下的车辆动力学方程通常描述为

$ \left. \begin{gathered} {\dot {\hat p}}\left( t \right) = \hat v \left( t \right), \hfill \\ \delta m {\dot {\hat v}}\left( t \right) = \delta ma = {\hat F} - {F_{\text{f}}} - {F_{\text{w}}} - {F_{\text{i}}}. \hfill \\ \end{gathered} \right\} $

式中: $ \hat p\left( t \right) $$ \hat v\left( t \right) $$ a $分别为车辆在 $ t $时刻的名义位置、速度和加速度; $ m $为车辆质量; $ \delta $为车辆质量浮动参数; $ \hat F $为车辆名义输出的力; $ {F_{\text{f}}} $为车辆滚动阻力, $ {F_{\text{f}}} = mg{c_{\text{r}}} $$ {F_{\text{w}}} $为车辆受到的空气阻力, ${F_{\text{w}}} = 0.5{c_{\text{f}}}{A_{\text{f}}}{\rho _{\text{a}}}\hat v{(k)^2}$$ {F_{\text{i}}} $为坡道阻力, $ {F_{\text{i}}} = mg\sin (\gamma ) $$ g $$ {c_{\text{r}}} $$ {c_{\text{f}}} $$ {A_{\text{f}}} $$ {\rho _{\text{a}}} $$ \gamma $分别为重力加速度、滚动阻力系数、空气阻力系数、车辆迎风面积、空气密度及道路坡度角.

考虑运行干扰,车辆真实的动力学模型为

$ \left. \begin{gathered} \dot p\left( t \right) = v\left( t \right), \hfill \\ \delta m\dot v\left( t \right) = F - {F_{\text{f}}} - {F_{\text{w}}} - {F_{\text{i}}} + \omega (t). \hfill \\ \end{gathered} \right\} $

式中: $ p\left( t \right) $$ v\left( t \right) $分别为车辆的真实位置、速度, $ F $为车辆真实输出的力, $ \omega (t) $为车辆受到的干扰.

采用泰勒展开,车辆的真实动力学模型为

$ \left.\begin{split} &p\left( {k + 1} \right) = p\left( k \right) + v\left( k \right){T_{\text{s}}} + {\varepsilon _1}\left( k \right), \\ &v\left( {k + 1} \right) = v\left( k \right) + G\left( {p\left( k \right),F\left( k \right),v\left( k \right),\omega \left( k \right),k} \right){T_{\text{s}}} + {\varepsilon _2}\left( k \right). \end{split} \right\} $

式中: $ {T_{\text{s}}} $为采样间隔; $ p\left( k \right) $$ v\left( k \right) $$ F\left( k \right) $$ \omega \left( k \right) $分别为在 $ k{T_{\text{s}}} $时刻的采样值; $ {\varepsilon _1}\left( k \right) $$ {\varepsilon _2}\left( k \right) $均为离散误差; $ G\left( {p,F,v,\omega ,k} \right) $为由车辆动力学不确定特性、完全未知的系统参数及系统干扰构成的非线性未知函数, $ G\left( {p,F,v,\omega ,k} \right) = {\left( {\delta m} \right)^{ - 1}}\left( {F - {F_{\text{f}}} - {F_{\text{w}}} - {F_{\text{i}}} + \omega } \right) $.

注1  对于车辆而言,其输入输出受能量及执行器限制. 因此,式(3)满足Lipschitz条件,即, $ \left| {\Delta v\left( {k + 1} \right)} \right| \leqslant \beta \left| {\Delta p\left( k \right)\Delta F\left( k \right)\Delta \omega \left( k \right)} \right| $,其中 $,\Delta v\left( {k + 1} \right) = $ $ v\left( {k + 1} \right) - v\left( k \right)$$\Delta F\left( {k + 1} \right) = F\left( {k + 1} \right) - F\left( k \right)$$\Delta \omega \left( {k + 1} \right) =$ $\omega \left( {k + 1} \right) - \omega \left( k \right) $β为待设计的小常值.

1.2. 自适应巡航控制目标

自适应巡航控制系统根据前车运行速度自适应调整自身速度,以保持期望车距. 目前采用的间距策略主要为1)固定间距策略(constant space, CS):

$ d\left( k \right) = {d^{\text{s}}}. $

2)固定时间间距策略(constant time headway, CTH):

$ d\left( k \right) = {d^{\text{s}}} + hv(k). $

3)变时间间距策略(variable time headway, VTH):

$ d\left( k \right) = {d^{\text{s}}} + {h^{\text{v}}}\left(v\left(k\right),k\right)v\left(k\right) = a + bv\left(k\right) + cv{\left(k\right)^2} . $

式中: $ d\left( k \right) $为期望的车辆间距; $ {d^{\text{s}}} $为最小安全间距,一般为2~5 m,本研究取2 m; $ h $为固定跟车时距,一般为0.8~2.0 s[22],本研究取0.8 s; $ {h^{\text{v}}}(v(k),k) $为时变跟车时距,一般取 $ a = 3 $$ b = $0.0019$ c = $0.0448[3].

为了实现期望间距,定义跟踪误差:

$ e\left( k \right) = {p^{\text{L}}}\left( k \right) - p\left( k \right) - d\left( k \right). $

式中: $ {p^{\text{L}}}\left( k \right) $为前车的真实位置. 自适应巡航控制的目标为设计强鲁棒性控制器使 $ e\left( k \right) $趋于0,从而使得 $ {p^{\text{L}}}\left( k \right) - p\left( k \right) $趋于0.

注2  固定间距策略简单,易于控制器设计,但不符合真实行驶需求. 固定时间与变时间间距策略更贴合驾驶员需求,但其间距策略与速度相关,车辆速度控制与间距控制存在耦合关系,不利于控制器设计,本研究拟提出通用的间距控制算法.

注3  车辆质量 $ m $及其浮动参数 $ \delta $未知且具有时变特性,车辆的不确定性干扰也具有时变特性. 因此,非线性未知函数 $ G\left( {p,v,\omega ,k} \right) $为时变函数. 控制目标与车辆位置、速度均有关,车辆速度控制与间距控制存在耦合关系,无法直接应用现有基于神经网络及模糊逻辑的方法实现车辆自适应巡航控制,急需设计新颖的基于数据驱动的强鲁棒性自适应巡航控制算法.

2. 自适应巡航控制算法设计

2.1. 车辆跟踪误差定义

由式(3)、(7)可知:

$ \begin{gathered} e\left( {k + 1} \right) = {p^{\text{L}}}\left( {k + 1} \right) - p\left( k \right) - v\left( k \right){T_{\text{s}}} - {\varepsilon _1}\left( k \right) - d\left( {k + 1} \right). \end{gathered} $

利用反步法,设计虚拟控制器 $ \alpha \left( k \right) $代替车辆期望运行速度 $ v\left( k \right) $,定义速度误差 $\text{z}\left( k \right) = \alpha \left( k \right) - v\left( k \right)$. 式(8)可表述为

$ \begin{aligned} e\left( {k + 1} \right) = &{p^{\text{L}}}\left( {k + 1} \right) - p\left( k \right) - \alpha \left( k \right){T_{\text{s}}} + {z}\left( k \right){T_{\text{s}}} - \\ &{\varepsilon _1}\left( k \right) - d\left( {k + 1} \right). \end{aligned} $

设计虚拟控制器 $ \alpha \left( k \right) $

$ \alpha \left( k \right) = \frac{{{k_{\text{α }}}e\left( k \right) - p\left( k \right) + {p^{\text{L}}}\left( {k + 1} \right) - d\left( k \right)}}{{{T_{\text{s}}}}}. $

式中: $ {k_{\text{α }}} $为待设计的控制增益. 由式(10)将位置跟踪需求转化为速度跟踪需求. 将(10)带入(9)中可得

$ e\left( {k + 1} \right) = {k_{\text{α }}}e\left( k \right) - \text{z}\left( k \right){T_{\text{s}}} + \xi \left( k \right). $

式中: $ \xi \left( k \right) $为未知干扰,主要包含离散误差及间距策略项带来的期望位置、速度转换误差. 具体为当采用CS时, $ \xi \left( k \right) = {\varepsilon _1}\left( k \right) $;当采用CTH时, $ \xi \left( k \right) = $ $ {\varepsilon _1}\left( k \right) + h\left( {v\left( {k + 1} \right) - v\left( k \right)} \right) $;当采用VTH时, $ \xi \left( k \right) = {\varepsilon _1}\left( k \right) + $ $ \left[ {v\left( {k + 1} \right) - v\left( k \right)} \right]\left[ {c\left( {v\left( {k + 1} \right) + v\left( k \right)} \right) + b} \right] $. 可以看出,离散误差在每种间距策略中均存在;期望速度误差存在于CTH、VTH中;期望速度及当前速度存在于VTH中. 不同间距策略产生的干扰不同,且可知其干扰程度及抑制难度为CS<CTH<VTH. 为了满足不同控制需求,设计的控制器应具有较强鲁棒性.

利用式(10)将期望间距转化为速度跟踪误差,可知:

$ \begin{split} \text{z}\left( {k + 1} \right) =& \alpha \left( {k + 1} \right) - v\left( k \right) - {\varepsilon _2}\left( k \right) - \\ & G\left( {p\left( k \right),F\left( k \right),v\left( k \right),\omega \left( k \right),k} \right){T_{\text{s}}}. \\ \end{split} $

因此,本研究的控制目标:设计仅依赖输入输出数据,且鲁棒性较强的控制器 $ F\left( k \right) $稳定速度误差 $\text{z}\left( k \right)$,使得:

$ e\left( {k + 1} \right) = ke\left( k \right) + \xi \left( k \right). $

式(13)可以保证位置误差 $ e\left( k \right) $的收敛特性.

注4  无论采用何种间距策略,离散误差固有存在于控制器的设计过程中,因此,采样间隔 $ {T_{\rm{s}}} $与车辆自适应巡航控制的跟踪性能具有很强的相关性. 较大的采样间隔 ${T_{\text{{\rm{s}}}}}$将导致较大的离散误差 $ {\varepsilon _1}\left( k \right) $$ {\varepsilon _2}\left( k \right) $,进而导致相对较大的位置跟踪误差,反之亦然.

2.2. 数据驱动的耦合滑模面设计

为了实现控制目标,设计耦合滑模面加速收敛,减少超调,提升控制鲁棒性和乘坐舒适性. 具体形式为

$ s\left( {k + 1} \right) = \left[ {\theta \varOmega \left( k \right) + \sigma } \right]\Delta {F_{{\text{PI}}}}\left( k \right) + \theta \left[ {\text{z}\left( {k + 1} \right) - \text{z}\left( k \right)} \right]. $

式中: $ \theta $$ \sigma $均为正常数; $\varOmega \left( k \right)$为时变的控制增益; $ \Delta {F_{{\text{PI}}}}\left( k \right) $为PI控制律, $\Delta {F_{{\text{PI}}}}\left( k \right) = {K_{\text{P}}}\left[ {\text{z}\left( k \right) - \text{z}\left( {k - 1} \right)} \right] + $ $ {K_{\text{I}}}{z}\left( k \right)$,其中 $ {K_{\text{P}}} $$ {K_{\text{I}}} $分别为比例、微分控制增益.

由于精确的车辆模型信息未知,无法利用传统的滑模控制设计控制器. 考虑注1中指出的车辆模型特性,设计数据驱动的耦合滑模面.

定理1  针对未知车辆运行阻力的式(3),考虑注1中的车辆特性,存在伪梯度 $\varPi \left( k \right)$$\varPhi \left( k \right)$$\varPsi \left( k \right)$使得当控制增量 $ \Delta F\left( k \right) \ne 0 $时,设计的耦合滑模面式(14)可转换为

$ \begin{split} s\left( {k + 1} \right) = &\left[ {\theta \varOmega \left( k \right) + \sigma } \right]\Delta {F_{{\rm{PI}}}}\left( k \right) + \\ &\theta \left[ {\Delta \alpha \left( {k + 1} \right) - \Delta v\left( k \right)} \right. - \varPhi \left( k \right)\Delta p\left( k \right) - \\ &\left. {\varPsi \left( k \right)\Delta \omega \left( k \right) - \varPi \left( k \right)\Delta F\left( k \right)} \right] \end{split} $

式中: $\Delta \alpha \left( {k + 1} \right) = \alpha \left( {k + 1} \right) - \alpha \left( k \right)、$ $ \Delta v\left( k \right) = v\left( k \right) - v\left( {k - 1} \right) 、$ $\left| {\varPhi \left( k \right)} \right| \leqslant \kappa、$ $\left| {\varPsi \left( k \right)} \right| \leqslant \kappa、$ $\left| {\varPi \left( k \right)} \right| \leqslant \kappa$.

证明: 将式(12)带入式(14)可得

$ \begin{split} s\left( {k + 1} \right) =& \left[ {\theta \varOmega \left( k \right) + \sigma } \right]\Delta {F_{{\rm{PI}}}}\left( k \right) + \\ &\theta \left[ {\Delta \alpha \left( {k + 1} \right) - \Delta v\left( k \right) - {G_1}\left( k \right) - {G_2}\left( k \right) - } \right.\\ &\left. {{G_3}\left( k \right) - o\left( k \right)} \right]. \end{split} $

式中:

由于非线性函数 $ G\left( k \right) $在某种情况下有可能不可微(例如:洒水车、货车的质量 $ m $),因此,考虑2种不同的状况.

1)$ m $光滑时变,非线性函数 $ G\left( k \right) $可微. 对式(16)应用中值定理可得

$ \begin{split} s\left( {k + 1} \right) = & \left[ {\theta \varOmega \left( k \right) + \sigma } \right]\Delta {F_{{\text{PI}}}}\left( k \right) + \theta \left[ {\Delta \alpha \left( {k + 1} \right) - \Delta v\left( k \right)} \right] - \\ &\theta \left[ {\frac{{\partial {G^*}}}{{\partial {p_\lambda }\left( k \right)}}\Delta p\left( k \right) + \frac{{\partial {G^*}}}{{\partial {\omega _\lambda }\left( k \right)}}\Delta \omega \left( k \right)} \right.+\\ &\left. {\frac{{\partial {G^*}}}{{\partial {F_\lambda }\left( k \right)}}\Delta F\left( k \right) + o\left( k \right)} \right]. \\[-18pt] \end{split} $

式中: $\partial {G^*}/\partial {p_\lambda }\left( {k} \right)$$\partial {G^*}/\partial {\omega _\lambda }\left( {k} \right) $$\partial {G^*}/\partial {F_\lambda }\left( k \right)$为各状态量相应的梯度, $ \lambda \in \left[ {0,1} \right] $${p_\lambda }\left( k \right) = \lambda p\left( k \right) + \left( {1 - \lambda } \right)p \left( {k - 1} \right) $${\omega _\lambda }\left( k \right) = \lambda \omega \left( k \right)+ \left( {1 - \lambda } \right)\omega \left( {k - 1} \right)$${F_\lambda }\left( k \right) = \lambda F\left( k \right) + \left( {1 - \lambda } \right) \times $ $ F\left( {k - 1} \right)$.

2)$ m $非光滑时变, $ G\left( k \right) $不可微. 定义不可微的非线性函数 $ H\left( \cdot \right) $

其中 $ H\left( \cdot \right) $满足注1注3中相应的性质,式(17)同样可以满足.

定义 $\varPhi \left( k \right) \;=\; \partial {G^*}/\partial {p_\lambda }\left( {k} \right) 、$ $\varPsi \left( k \right) \;=\; \partial {G^*}/\partial {\omega _\lambda }\left( {k} \right)、$ $\varPi \left( k \right) =$ $ \partial {G^*}/\partial {F_\lambda }\left( k \right) + $ $ o\left( k \right)/\Delta F\left( k \right)$. 将其带入式(17)可推导出式(15). 同时,根据注1可知 $\left| {\varPhi \left( k \right)} \right| \leqslant \kappa 、$ $\left| {\varPsi \left( k \right)} \right| \leqslant \kappa、$ $\;\left| {\varPi \left( k \right)} \right| \leqslant \kappa$, 其中 $ \kappa $为正常值.

证毕.

为了提升控制器的解耦能力,统一考虑各种干扰,将式(15)进一步转化为

$ \begin{split} s\left( {k + 1} \right) =& \left[ {\theta \varPi \left( k \right) + \sigma } \right]\Delta {F_{{\text{PI}}}}\left( k \right) + \theta \left[ \Delta \alpha \left( {k + 1} \right) - \right. \\ & \varPhi \left( k \right)\Delta p\left( k \right) - \left. {\varPi \left( k \right)\Delta F\left( k \right) - D\left( k \right)} \right]. \end{split} $

式中: $D = \Delta v\left( k \right) + \varPsi \left( k \right)\Delta \omega \left( k \right)$.

利用数据驱动策略,扩展状态观测器及干扰抑制技术,式(18)中的变量可通过自适应律获得.

引理1  对于构建的滑模面,其未知变量 $\varPhi \left( k \right)$$\varPi \left( k \right)$$ D\left( k \right) $可通过如下自适应律更新获得:

$ \begin{split} \hat\varPi \left( k \right) =&\hat \varPi \left( {k - 1} \right) + \frac{{{\eta _1}\Delta R\left( {k - 1} \right)}}{{{\mu _1} + {{\left| {\Delta R\left( {k - 1} \right)} \right|}^2}}} \times \\ &\Big[ {s\left( k \right) - \Big( {\Delta \alpha \left( k \right) - \Delta F} } \Big.\left( {k - 1} \right)\hat\varPi \left( {k - 1} \right) - \\ &\left.\hat\varPhi \left( {k - 1} \right)\Delta p\left( {k - 1} \right) - \hat D\left( k \right)\right)\theta - \\ &\left. {\Delta {F_{{\rm{PI}}}}\left( {k - 1} \right)\left( {\theta \hat\varPi \left( {k - 1} \right) + \sigma } \right)} \right]; \\[-2pt] \end{split} $

$\begin{split} \hat\varPhi \left( k \right) =& \hat\varPhi \left( {k - 1} \right) + \frac{{{\eta _2}\Delta p\left( {k - 1} \right)}}{{{\mu _2} + {{\left| {\Delta p\left( {k - 1} \right)} \right|}^2}}} \times \\ &\Big[ {s\left( k \right) -\Big( {\Delta \alpha \left( k \right) - \Delta F} } \Big.\left( {k - 1} \right)\hat\varPi \left( {k - 1} \right) - \\ & \left.{\hat\varPhi \left( {k - 1} \right)\Delta p\left( {k - 1} \right) - \hat D\left( k \right)} \right)\theta - \\ &\Delta {F_{{\rm{PI}}}}\left. {\left( {k - 1} \right)\left( {\theta \hat\varPi \left( {k - 1} \right) + \sigma } \right)} \right]; \\[-2pt] \end{split} $

$ \begin{array}{l}\widehat{\varPi }\left(k\right)=\widehat{\varPi }\left(1\right),如果\left|\widehat{\varPi }\left(k\right)\right| < {\phi }_{1}或 \mathrm{sgn}\left(\widehat{\varPi }\left(k\right)\right)\ne \mathrm{sgn}\left(\widehat{\varPi }\left(1\right)\right)\text{;}\end{array} $

$ \begin{array}{l}\widehat{\varPhi }\left(k\right)=\widehat{\varPhi }\left(1\right),如果\left|\widehat{\varPhi }\left(k\right)\right| < {\varphi }_{2}或 \mathrm{sgn}\left(\widehat{\varPhi }\left(k\right)\right)\ne \mathrm{sgn}\left(\widehat{\varPhi }\left(1\right)\right)\text{;}\end{array} $

$ \hat D\left( k \right) = \hat D\left( {k - 1} \right) - L\left( {s\left( k \right) - \hat s\left( k \right)} \right). $

式中: $\hat \varPi \left( k \right) 、$ $\hat \varPhi \left( k \right)$$ \hat D\left( k \right) $分别为 $\varPi \left( k \right)、$ $\varPhi \left( k \right)、$ $ D\left( k \right) $的更新值; $ \Delta R\left( k \right) = \theta \left( {\Delta {F_{{\text{PI}}}}\left( k \right) + \Delta F\left( k \right)} \right) 、$ ${\eta _1} \in \left( {0,1} \right) 、$ ${\eta _2} \in \left( {0,1} \right);$ $ {\mu _1}、 $ $ {\mu _2} $均为待设计的正常值; $ \hat s\left( k \right) $$ s\left( k \right) $的估计值,具体表示为

证明:上述自适应律可采用文献[23]中的方法获得,具体过程请参考相关文献.

2.3. 鲁棒反步自适应巡航控制算法设计

将车辆间距跟踪控制问题转化为滑模面的控制问题,具体为设计基于输入、输出数据的鲁棒控制器,使得:

$ s\left( {k + 1} \right) \to 0. $

本研究设计的基于数据驱动的鲁棒控制律为

$ \Delta F\left( k \right) = \Delta {F_{{\text{PI}}}}\left( k \right) + \Delta {F_{{\text{FEE}}}}\left( k \right) + \Delta {F_{{\text{DIS}}}}\left( k \right). $

设计的控制器包含3个部分:PI控制项 $ \Delta {F_{{\text{PI}}}}\left( k \right) 、$反馈控制项 $ \Delta {F_{{\text{FEE}}}}\left( k \right) $和鲁棒控制项 $ \Delta {F_{{\text{DIS}}}}\left( k \right) $. PI控制项 $ \Delta {F_{{\text{PI}}}}\left( k \right) $主要用来稳定车辆动力学系统,实现自适应巡航;反馈控制项 $ \Delta {F_{{\text{FEE}}}}\left( k \right) $用来补偿由于CTH及VTH带来的耦合误差、系统干扰及无法建模的非线性运行阻力;鲁棒控制项 $ \Delta {F_{{\text{DIS}}}}\left( k \right) $用来提升系统的鲁棒性. PI控制项 $ \Delta {F_{{\text{PI}}}}\left( k \right) $设计为

$ \Delta {F_{{\text{PI}}}}\left( k \right) = {K_{\text{P}}}\left[ {{{\rm{z}}}\left( k \right) - {{\rm{z}}}\left( {k - 1} \right)} \right] + {K_{\text{I}}}{{\rm{z}}}\left( k \right). $

反馈控制项 $ \Delta {F_{{\text{FEE}}}}\left( k \right) $设计为

$ \begin{gathered} \Delta {F_{{\text{FEE}}}}\left( k \right) = {\left( {\theta \hat \varPi \left( k \right) + \sigma } \right)^{{{ - 1}}}}\theta \left[ {\Delta \alpha \left( {k{{ + 1}}} \right) -\hat \varPhi \left( k \right)\Delta p\left( k \right) - \hat D\left( k \right)} \right]. \\ \end{gathered} $

鲁棒控制项 $ \Delta {F_{{\text{DIS}}}}\left( k \right) $设计为

$ \begin{split} \Delta {F_{{\text{DIS}}}}\left( k \right) =& {\left( {\theta \hat \varPi \left( k \right) + \sigma } \right)^{{{ - 1}}}}\left[ {\left( {\theta \hat \varPi \left( {k - 1} \right) + \sigma } \right) \times } \right. \\ &\left. {\Delta {F_{{\text{DIS}}}}\left( {k - 1} \right) + \rho {{\rm{sgn}}} \left( {s\left( k \right)} \right)} \right]. \end{split} $

式中: $\; \rho $为增益常数.

注5  由式(26)~(28)可知,所提算法仅需要车辆输入、输出数据,即车辆的位置及速度信息,算法简洁,无需精确的车辆模型,因此所设计的算法为数据驱动的方法.

3. 仿真验证

为了验证所设计的ACC算法,搭建Matlab仿真环境,设置前车车辆包含加速、恒速及减速等全工况运行状态,具体的车辆时间–速度–位置曲线如图1所示,选用车辆参数如表1所示. 为了验证算法对干扰的抑制及算法的鲁棒性,车辆的质量 $ m $、滚动阻力系数 $ {c_{\text{r}}} $及空气阻力系数 $ {c_{\text{f}}} $为变化值. 车辆的初始状态设置为 $ p\left( 1 \right) = 0 $ m、 $ v\left( 1 \right) = 0 $ m/s、 $ {p^{\text{L}}}\left( 1 \right) = 2 $ m.

图 1

图 1   领航车辆的时间–速度–位置轨迹图

Fig.1   Lead vehicle’s time-velocity-position profile


表 1   车辆模型基本参数

Tab.1  Parameters of vehicle model

参数 数值 参数 数值
$ m/{\text{kg}} $ 1250+250 sin (t) $ {\rho _{\text{a}}}/\left( {{\text{N}} \cdot {{\text{s}}^{\text{2}}} \cdot {{\text{m}}^{ - 4}}} \right) $ 1.225 8
$ {A_{\text{f}}}/{{\text{m}}^2} $ 2.2 $ {\gamma \mathord{\left/{\vphantom {\gamma {^ \circ }}} \right.} ({^ \circ })} $ 5
$ {c_{\text{r}}} $ 0.018+0.002 sin (t) $ \delta $ 1
$ {c_{\text{f}}} $ 0.35+0.05 sin (t) $ g/\left( {{\text{m·}}{{\text{s}}^{-2}}} \right) $ 9.8

新窗口打开| 下载CSV


3.1. 数据驱动的鲁棒反步ACC算法验证

分别利用本研究设计的ACC算法及基于PI的ACC算法进行车辆自适应巡航跟踪,并分别选取CTH、VTH策略进行对比研究. 旨在通过实验结果说明:本研究算法在不确定性抑制及对不同间距策略下产生的干扰抑制,控制精度和强鲁棒性.

3.1.1. 固定时间间隔策略下的仿真实验

取车辆的期望间距参数为 $ {d^{\text{s}}} = 2 $$ h = 0.8\;{\text{s}} $. 所设计的基于数据驱动的鲁棒反步ACC算法参数及初始值分别取为 $\hat \varPi \left( 1 \right) = 4\;110$$\hat \varPhi \left( 1 \right) = 450$$\hat D\left( 1 \right) = - 420$$\Delta F\left( 1 \right) ={0}$$\alpha \left( 1 \right) = 0.01$${T_{\text{s}}} = 0.01\;{\text{s}}$${k_{\text{α }}}{\text{ = }}0.1$$\theta {\text{ = }}0.8$$\sigma {\text{ = }}2$${K_{\text{P}}}{\text{ = }}2$${K_{\text{I}}}{\text{ = }}0.1$${\eta _{\text{1}}}{\text{ = }}{\eta _2} = 0.9$${\mu _{\text{1}}}{\text{ = }}{\mu _2} = 0.1$$L{\text{ = 0}}{\text{.8}}$$\rho {\text{ = }}0.005$. 传统的PI控制器参数选取为 $ {K_{\text{P}}}{\text{ = 50}} $,、 $ {K_{\text{I}}}{\text{ = 100}} $.

3.1.2. 变时间间隔策略下的仿真实验

取车辆的期望间距参数为 $a = 3 $$b = 0.001\;9 $$ c = 0.044\;8 $. 所设计的基于数据驱动的鲁棒反步ACC算法参数为 ${K_{\text{P}}}{\text{ = }}0.{\text{0}}5 $${K_{\text{I}}}{\text{ = }}0.{\text{8}} $, 其他参数及初始值同3.1.1. 传统的PI控制器参数选取为 ${K_{\text{P}}}{\text{ = }}10 $$ {K_{\text{I}}}{\text{ = 2}}0 $.

3.1.3. 综合分析

图23所示分别为采用本研究设计的ACC算法和基于PI的ACC算法在采取CTH、VTH间距策略下的车辆控制仿真结果. 从图2 (a)、3 (a)中可以看出,本研究设计的ACC算法和基于PI的ACC算法均能以期望间距跟踪前车. 从图2 (a)、3 (a)局部放大图可以看出,本研究算法可以精准的保持期望的间距,基于PI的ACC算法与期望的间距存在误差,本研究算法具有更好的跟踪性能. 从图2 (b)、3 (b)中可以看出,2种算法均可以跟踪前车,在加速或者减速阶段,因为需要改变车辆间距,所以本车必然与前车存在速度误差以实现间距调节. 表2给出了控制算法的跟踪精准性及控制舒适性评价结果. 表中, $ {e_{80}} $为车辆在80 s时的跟踪误差, $ \Delta \bar v $为速度变化率, $ \Delta \bar a $为加速度变化率(跃度). 可知,相比于PI算法,本研究算法具有更小的间距误差,控制精度更高. 虽然2种算法的速度变化率平均值相同,但是本研究算法跃度平均值更小,说明本研究算法能保证更好的舒适性.

图 2

图 2   固定时间间距策略下的仿真结果

Fig.2   Simulation results of constant time headway


图 3

图 3   时变时间间距策略下的仿真结果

Fig.3   Simulation results of variable time headway


表 2   控制跟踪误差、速度变化率及加速度变化率

Tab.2  Tracking error, velocity change rate and acceleration change rate

算法 CTH VTH
$ {e_{80}}/{\rm{m}} $ $\Delta \bar v/({\rm{m \cdot {s^{ - 1}}} })$ $\Delta \bar a/({\rm{m \cdot {s^{ - 2}}}) }$ $ {e_{80}}/{\rm{m}} $ $\Delta \bar v/({\rm{m \cdot {s^{ - 1} }})}$ $\Delta \bar a/({\rm{m \cdot {s^{ - 2}}}) }$
PI 0.2 3.076 9 0.106 7 0.25 3.076 9 0.294 7
本研究
0.015 3.076 9 0.068 4 0.06 3.076 8 0.293 1

新窗口打开| 下载CSV


综上所述,本研究算法可以实现车辆在时变运行阻力下以CTH或VTH多种间距策略稳定、舒适巡航运行,具有较强的鲁棒性.

3.2. 采样时间对算法的影响分析

为了验证离散误差对2种控制算法的影响,取 $ {T_{\text{s}}} = 0.1\;{\text{s}} $进行仿真实验.

3.2.1. 固定时间间隔策略下的仿真实验

基于数据驱动的鲁棒反步ACC算法的参数取为 ${k_{\text{α }}}{\text{ = }}0.05$$\theta {\text{ = }} $ $ 0.8$$ \sigma {\text{ = }}2 $${K_{\text{P}}}{\text{ = }}$1${K_{\text{I}}}{\text{ = }}0.05$${\eta _{\text{1}}}{\text{ = }}{\eta _2} = 0.99$$\;{\mu _{\text{1}}}{\text{ = }}{\mu _2} = $ $ 0.99$$ L{\text{ = 0}}{\text{.99}} $$ \rho {\text{ = }}0.05 $. 传统的PI控制器参数取为 ${K_{\text{P}}}{\text{ = }} 5$$ {K_{\text{I}}}{\text{ = 1}}0 $.

3.2.2. 变时间间隔策略下的仿真实验

所设计的基于数据驱动的鲁棒反步ACC算法参数取为 $ {K_{\text{P}}}{\text{ = }}0.05 $$ {K_{\text{I}}}{\text{ = }}0.8 $,其他参数及初始值同3.2.1. 传统的PI控制器参数取为 $ {K_{\text{P}}}{\text{ = }}1 $$ {K_{\text{I}}}{\text{ = 5}} $.

3.2.3. 综合分析

图45所示分别为当采样间隔 $ {T_{\text{s}}}{\text{ = }}0.1\;{\text{s}} $时,采用本研究和基于PI的ACC算法在采取CTH、VTH策略下的车辆控制仿真结果. 一方面,从图4 (a)、5 (a)可以看出,本研究设计的ACC算法能以期望间距跟踪前车. 基于PI的ACC算法虽然可以保证车辆间距根据速度进行变化,但其与期望间距存在较大误差. PI算法各个阶段控制误差不一,说明本研究算法对离散误差具有较强的抑制能力、更好的鲁棒性和高精度的跟踪控制能力. 从图4(b)、5(b)可以看出,2种算法均可以跟踪前车运行速度. 另一方面,对比3.1.1和3.2.1结果可知,PI算法对采样精度依赖较高,较大的采样间隔使得控制需求难以保证. 本研究算法具有较强的未知非线性及干扰抑制能力,可实现较大采样间隔下的车辆精准控制. 从图4 (a)、4 (c)、5 (a)、5 (c)可以看出,较大的采样间隔需要较长的调整时间,且具有较为明显的超调现象,进而导致加速度相比采样间隔较小时的加速度出现轻微抖动. 相比于PI算法在较大采样间隔下无法保证控制需求,本研究算法更稳定,具有更好的实际作用. 因此,在选取采样间隔 ${T_{\rm{s}}}$时,可综合平衡考虑跟踪性能需求和计算需求.

图 4

图 4   采样时间为0.1时固定时间间距策略下的仿真结果

Fig.4   Simulation results of constant time headway with 0.1 sample time


图 5

图 5   采样时间为0.1时变时间间距策略下的仿真结果

Fig.5   Simulation results of variable time headway with 0.1 sample time


3.3. 典型ACC工况测试

在3.1.1的基础上测试本研究算法在车辆切入、目标车驶离工况的控制作用.

3.3.1. 车辆切入仿真实验

设计车辆在运行到100 s时,有汽车切入到本车与目标车辆间,切入后本车与前车的间距瞬间变为8 m,验证所设计的算法能否安全调节为期望的间距. 基于数据驱动的鲁棒反步ACC算法参数取为 ${k_{\text{α }}}{\text{ = }}0.1$$\theta {\text{ = }}0.005$${K_{\text{P}}}{\text{ = }} {\text{0.5}}$${K_{\text{I}}}{\text{ = }}0.001$${\eta _1}{\,\rm{ = }\,}{\eta _2}{\,\rm{ = }\,}0.99$${\mu _{\text{1}}}{\text{ = }}{\mu _2}{\text{=}}$0.5$L{\text{ = }}{\text{0.8}}$$\rho {\text{ = }} 0.005$. 传统的PI控制器参数取为 $ {K_{\text{P}}}{\text{ = 2}} $$ {K_{\text{I}}}{\text{ = 0}}{\text{.5}} $.

3.3.2. 目标车辆驶离仿真实验

车辆在运行到100 s时,目标车辆驶离车道,驶离后本车与前车的间距瞬间变为33 m. 其他控制参数同3.3.1.

3.3.3. 综合分析

图67所示分别为在出现车辆切入和目标车辆驶离工况下,采用本研究和基于PI的ACC算法的车辆控制仿真结果. 可以看出,本研究设计的ACC算法在出现2种工况时,车辆间距均可以逐渐恢复为期望间距,说明算法具有较强的鲁棒性. 相比PI算法,本研究算法未出现超调现象,车辆间距变化平滑,驾乘舒适性更好,本研究算法下的车辆速度变化更平滑.

图 6

图 6   车辆切入工况下的仿真结果

Fig.6   Simulation results under vehicle cut in condition


图 7

图 7   目标车辆驶离工况下的仿真结果

Fig.7   Simulation results of target vehicle driving away


综合上述实验可知,本研究算法可以实现在0.01 s、0.1 s采样间隔下对CTH、VTH不同间距目标的精准控制. 说明本研究算法具有对未知的车辆非线性运行阻力、系统干扰、不同间距策略干扰、采样时间因素的抑制作用. 当出现车辆切入、目标车驶离工况时,设计的算法可以保证车辆间距安全平缓的调节到期望间距. 进一步说明本研究算法的强鲁棒性,可以保证车辆在各种工况下的安全运行.

4. 结 论

(1)提出仅基于车辆输入、输出数据的鲁棒反步自适应巡航控制算法。该算法简洁,无需精确的车辆模型,具有对前车准确跟踪的能力和较强的鲁棒性.

(2)本研究设计的ACC算法可对CTH、VTH不同间距目标实现精准控制. 在理论上,任何速度相关型期望车辆间距或可表达的车辆间距,本研究算法均可实现精准控制.

(3)所设计的算法可有效补偿低采样频率产生的离散误差,当采样时间为0.01、0.1 s时,均可实现对车辆稳定精准跟踪控制.

(4)本研究算法可应用于机器人、无人机、无人船等多种难以精确建模,控制目标与多个状态相关的非线性系统. 未来计划在本研究的控制框架下展开执行器容错,状态不测的ACC控制及智能网联汽车队列控制研究,以及Matlab与Carsim、Amesim、Advisor和Carla等汽车专用仿真软件的联合仿真分析测试.

参考文献

吴光强, 张亮修, 刘兆勇, 等

汽车自适应巡航控制系统研究现状与发展趋势

[J]. 同济大学学报:自然科学版, 2017, 45 (4): 544- 553

[本文引用: 1]

WU Guang-qiang, ZHANG Liang-xiu, LIU Zhao-yong, et al

Research status and development trend of vehicle adaptive cruise control systems

[J]. Journal of Tongji University: Natural Science, 2017, 45 (4): 544- 553

[本文引用: 1]

秦严严, 王昊, 王炜, 等

自适应巡航控制车辆跟驰模型综述

[J]. 交通运输工程学报, 2017, 17 (3): 121- 130

DOI:10.3969/j.issn.1671-1637.2017.03.013     

QIN Yan-yan, WANG Hao, WANG Wei, et al

Review of car-following models of adaptive cruise control

[J]. Journal of Traffic and Transportation Engineering, 2017, 17 (3): 121- 130

DOI:10.3969/j.issn.1671-1637.2017.03.013     

黄晶, 韦伟, 邹德飚

基于个性化间距策略的自适应巡航系统模式切换策略研究

[J]. 汽车工程, 2020, 42 (10): 1302- 1311

[本文引用: 1]

HUANG Jing, WEI Wei, ZOU De-biao

Research on multi-mode switching strategy of adaptive cruise control system based on personalized spacing strategy

[J]. Automotive Engineering, 2020, 42 (10): 1302- 1311

[本文引用: 1]

初亮, 李天骄, 孙成伟

面向再生制动优化的电动车自适应巡航控制策略

[J]. 浙江大学学报:工学版, 2017, 51 (8): 1596- 1602

CHU Liang, LI Tian-jiao, SUN Cheng-wei

Research on adaptive cruise control strategy for electric vehicle based on optimization of regenerative braking

[J]. Journal of Zhejiang University: Engineering Science, 2017, 51 (8): 1596- 1602

罗莉华, 龚李龙, 李平, 等

考虑驾驶员行驶特性的双模式自适应巡航控制设计

[J]. 浙江大学学报:工学版, 2011, 45 (12): 2073- 2078

[本文引用: 1]

LUO Li-hua, GONG Li-long, LI Ping, et al

Two-mode adaptive cruise control design with humans’ driving habits consideration

[J]. Journal of Zhejiang University: Engineering Science, 2011, 45 (12): 2073- 2078

[本文引用: 1]

IOANNOU P A, CHIEN C C

Autonomous intelligent cruise control

[J]. IEEE Transactions on Vehicular Technology, 1993, 42 (4): 657- 672

DOI:10.1109/25.260745      [本文引用: 1]

YAN M D, SONG J C, YANG P P, et al. Distributed adaptive sliding mode control for vehicle platoon with uncertain driving resistance [C]// 2017 36th Chinese Control Conference (CCC). Dalian: IEEE, 2017: 9396-9400.

[本文引用: 1]

孙天骏. 基于学习控制的汽车全速自适应巡航决策与控制算法研究[D]. 长春: 吉林大学, 2020: 12.

[本文引用: 1]

SUN Tian-jun. Research on decision and control algorithm for vehicle full-speed adaptive cruise based on learning control [D]. Changchun: Jilin University, 2020: 12.

[本文引用: 1]

MILANES V, VILLAGRA J, GODOY J, et al

Comparing fuzzy and intelligent PI controllers in stop-and-go manoeuvres

[J]. IEEE Transactions on Control Systems Technology, 2012, 20 (3): 770- 778

DOI:10.1109/TCST.2011.2135859      [本文引用: 2]

GANJI B, KOUZANI A Z, SUI Y K, et al

Adaptive cruise control of a HEV using sliding mode control

[J]. Expert Systems with Application, 2014, 41 (2): 607- 615

DOI:10.1016/j.eswa.2013.07.085      [本文引用: 1]

KIM H, YI K

Design of a model reference cruise control algorithm

[J]. SAE International Journal of Passenger Cars-Electronic and Electrical Systems, 2012, 5 (2): 440- 449

DOI:10.4271/2012-01-0492      [本文引用: 1]

王斌, 王仁广, 何玮, 等

汽车ACC系统可变输出论域模糊控制算法

[J]. 计算机应用研究, 2010, 27 (2): 465- 465

DOI:10.3969/j.issn.1001-3695.2010.02.016      [本文引用: 1]

WANG Bin, WANG Guang-ren, HE Wei, et al

Fuzzy control algorithm on variable output domain in automotive ACC system

[J]. Application research of computers, 2010, 27 (2): 465- 465

DOI:10.3969/j.issn.1001-3695.2010.02.016      [本文引用: 1]

施绍有, 高峰, 杜发荣, 等

起-停车辆巡航系统的建模与仿真

[J]. 中国公路学报, 2007, 20 (3): 115- 120

DOI:10.3321/j.issn:1001-7372.2007.03.021     

SHI Shao-you, GAO Feng, DU Fa-rong, et al

Modeling and simulation of stop-and-go vehicle cruise system

[J]. China Journal of Highway and Transport, 2007, 20 (3): 115- 120

DOI:10.3321/j.issn:1001-7372.2007.03.021     

李升波, 王建强, 李克强, 等

MPC实用化问题处理及在车辆ACC中的应用

[J]. 清华大学学报:自然科学版, 2010, 50 (5): 645- 648

LI Sheng-bo, WANG Jian-qiang, LI Ke-qiang, et al

Processing of MPC practical problems and its application to vehicular adaptive cruise control systems

[J]. Journal of Tsinghua University: Science and Technology, 2010, 50 (5): 645- 648

郭戈, 岳伟. 智能交通系统中的车辆协作控制[M]. 北京: 机械工业出版社, 2016: 1.

LIDSTRÖM K, SJÖBERG K, HÖLMBERG U, et al

A modular CACC system integration and design

[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13 (3): 1050- 1061

DOI:10.1109/TITS.2012.2204877     

NIEUWENHUIJZE M, KEULEN T V, ONCU S, et al

Cooperative driving with a heavy-duty truck in mixed traffic: experimental results

[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13 (3): 1026- 1032

DOI:10.1109/TITS.2012.2202230     

LEVENT G, ISMAIL M C U, KERIM K, et al

Cooperative adaptive cruise control implementation of Team Mekar at the grand cooperative driving challenge

[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 12 (3): 1062- 1074

[本文引用: 1]

FURDA A, VLACIC L

Enabling safe autonomous driving in real-world city traffic using multiple criteria decision making

[J]. IEEE Intelligent Transportation Systems Magazine, 2011, 3 (1): 4- 17

DOI:10.1109/MITS.2011.940472      [本文引用: 2]

CHONG L, ABBAS M M, MEDINA F A, et al

A rule-based neural network approach to model driver naturalistic behavior in traffic

[J]. Transportation Research Part C, 2013, 32 (4): 207- 223

[本文引用: 1]

郑睿. 基于增强学习的无人车辆智能决策方法研究[D]. 长沙: 国防科学技术大学, 2013: 1-3.

[本文引用: 2]

ZHENG Rui. Reinforcement learning-based intelligent decision-making methods for unmanned vehicles [D]. Changsha: National University of Defense Technology, 2013: 1-3.

[本文引用: 2]

严伟. 仿驾驶员速度跟随行为的自适应巡航控制算法研究[D]. 长春: 吉林大学, 2016: 34.

[本文引用: 1]

YAN Wei. Study on adaptive cruise control algorithms imitating car-following behaviors of drivers [D]. Changchun: Jilin University, 2016: 34.

[本文引用: 1]

HOU Z S, LIU S D, TIAN T T

Lazy-learning-based data-driven model-free adaptive predictive control for a class of discrete-time nonlinear systems

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28 (8): 1914- 1928

DOI:10.1109/TNNLS.2016.2561702      [本文引用: 1]

/