浙江大学学报(工学版), 2024, 58(5): 1001-1008 doi: 10.3785/j.issn.1008-973X.2024.05.013

交通工程、土木工程

基于非合作博弈的车道保持共享控制

章军辉,, 郭晓满, 王静贤, 付宗杰, 刘禹希

1. 常熟理工学院 电气与自动化工程学院,江苏 苏州 215500

2. 无锡物联网创新中心有限公司,江苏 无锡 214029

3. 江苏省物联网创新中心昆山分中心,江苏 苏州 215347

Shared lane-keeping control based on non-cooperative game theory

ZHANG Junhui,, GUO Xiaoman, WANG Jingxian, FU Zongjie, LIU Yuxi

1. School of Electrical and Automatic Engineering, Changshu Institute of Technology, Suzhou 215500, China

2. Wuxi Internet of Things Innovation Center Limited Company, Wuxi 214029, China

3. Kunshan Department, Jiangsu Internet of Things Innovation Center, Suzhou 215347, China

收稿日期: 2023-05-5  

基金资助: 江苏省博士后科研资助计划资助项目(2020Z411).

Received: 2023-05-5  

Fund supported: 江苏省博士后科研资助计划资助项目(2020Z411).

作者简介 About authors

章军辉(1985—),男,高级工程师,博士,从事车路协同智能驾驶的研究.orcid.org/0000-0001-5885-4314.E-mail:zjh34@mail.ustc.edu.cn , E-mail:zjh34@mail.ustc.edu.cn

摘要

为了减少共驾过程中的人机冲突,提出基于非合作博弈的人机共驾控制策略. 基于线性二自由度汽车模型,采用一阶微分方程对车道保持共享控制问题进行数学描述,利用非合作博弈理论(NCG)描述双驾双控系统中的驾驶控制权分配问题,即通过非合作博弈方法来解决多个决策者共同作用于同一个动力学系统的共享控制问题. 设计控制权博弈模型,采用预瞄偏移距离(POD),对驾驶人与智能系统的置信度矩阵进行更新,能够实现驾驶人与智能系统之间驾驶控制权的平稳交接. 基于模型预测控制(MPC)框架,采用二次型代价函数及线性不等式约束的形式,将车道保持共享控制的前轮转角决策问题转化成带约束的在线二次规划问题. 基于驾驶人在环的CarSim/Simulink集成环境,对该控制策略进行验证. 结果表明,该控制策略能够较好地兼顾横向运动控制精度及驾驶人的控制权裕度.

关键词: 智能车辆 ; 人机共驾 ; 模型预测控制 ; 博弈论 ; 预瞄偏移距离(POD)

Abstract

A driver-automation shared control strategy based on non-cooperative game (NCG) theory was proposed in order to reduce the conflict operations between the driver and intelligent system during the co-driving. The lane-keeping shared control problem was mathematically described by the first-order differential equation based on the linear two degree-of-freedom vehicle model. The NCG theory was employed to resolve the weight allocation problem of the shared control system, where the decision makers would act on the same dynamic system. The driving control authority was designed. Then the smooth transition of driving control authority between the driver and intelligent system was achieved by utilizing the preview offset distance (POD) to update the confidence matrix. The desired front wheel angle of lane-keeping shared control was transformed into an online quadratic programming problem formulated as a quadratic cost function with linear inequality constraints based on the model predictive control (MPC) framework. The shared control strategy was validated on the driver-in-the-loop CarSim/Simulink platform. Results demonstrate that such strategy can well-guarantee lateral tracking accuracy and the priority of the driver’s control authority.

Keywords: intelligent vehicle ; shared autonomy ; model predictive control ; game theory ; preview offset distance (POD)

PDF (1298KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

章军辉, 郭晓满, 王静贤, 付宗杰, 刘禹希. 基于非合作博弈的车道保持共享控制. 浙江大学学报(工学版)[J], 2024, 58(5): 1001-1008 doi:10.3785/j.issn.1008-973X.2024.05.013

ZHANG Junhui, GUO Xiaoman, WANG Jingxian, FU Zongjie, LIU Yuxi. Shared lane-keeping control based on non-cooperative game theory. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(5): 1001-1008 doi:10.3785/j.issn.1008-973X.2024.05.013

在当下无人驾驶发展尚未成熟、商业化落地难度较大的情况下,未来可能呈现人机共驾、有人-无人驾驶车辆共存的交通局面,因而对人机共驾问题的研究受到了汽车制造商及相关科研机构的广泛关注[1-2].

人机共驾是指驾驶人与智能系统同时在环,共同享有对车辆的驾驶控制权,人机一体化协同完成驾驶任务[2]. 人机共驾研讨的核心问题是对驾驶控制权交接方式及驾驶控制权动态分配过程的定性定量描述[3-5]. 当人与机并行控制车辆时,驾驶人与智能系统的驾驶控制权随场景转移的分配机制变得十分关键[6-8]. 若在车辆驾驶控制权切换过程中发生冲突,则很可能会导致车辆失控的严重后果.

目前,大部分车道保持系统(lane keeping assist system, LKAS)都是将前轮转角或转向力矩作为控制量,未考虑驾驶人在环或将驾驶人操作视为外界扰动[9-10]. LKAS与驾驶人在转向任务中都拥有独立的控制方式,容易引发控制权上的冲突,需要对二者进行协调控制. 根据驾驶人与智能系统同时在环与否,将人机协同控制方式概括如下. 1)智能辅助驾驶. 2)特定场景下的驾驶控制权切换,如基于驾驶人生理特征与心理状态的切换准则研究[11]、基于驾驶意图、驾驶风格及驾驶能力裕度的切换准则研究[12]、综合考虑人-车-路的切换准则研究[13]. 3)共驾过程中的驾驶控制权动态分配,即通过合理设计权值分配策略来综合协调控制效果,但如何设计适宜的权值及明确介入准则缺少足够的理论支撑[14-15]. 现有研究更多的是在权值分配与跟踪精度之间寻求折中设计,优先保证横向偏差、横摆角偏差(方位偏差)、横向加速度等控制目标,这样容易导致智能系统对驾驶人操作过度干预的现象.

在变道决策、交叉口决策、超车决策等场景应用中,驾驶人与智能系统的输入是并行的,具有冗余与博弈的特征[2]. 与模糊控制[10] 、LPV-H[16]理论相比,博弈论是研究多个决策主体相互对抗与冲突时如何获得各自最佳策略的理论,能够更好地描述共驾过程中驾驶人与智能系统之间的交互行为,在车辆安全性、动力性、路面附着情况等约束条件下,让驾驶人与智能系统协同高效完成操作任务,达到纳什均衡(Nash equilibrium),实现全局优化控制的目标[17-18]. 为了减少共驾过程中的人机冲突,本文研究基于非合作博弈的人机共驾控制策略. 对车道保持共享控制问题进行数学描述. 基于非合作博弈理论,设计控制权博弈模型. 基于MPC框架,将共驾型LKAS前轮转角决策问题转化成带约束的在线二次规划问题. 设计不同的驾驶状态,利用驾驶人在环的集成仿真环境,对该控制算法与控制策略进行验证与探讨.

1. 车路模型

1.1. 数学建模

1.1.1. 状态空间方程

针对驾驶人与智能系统共同控制车辆转向,构建共驾型LKAS模型,并作如下约束.

1) 当车辆速度变化较小时,常纵向速度假设是近似成立的.

2) 忽略车辆的侧倾与俯仰运动.

3) 考虑到车辆质心随载荷、轮胎、路面等扰动因素而发生变化,工程应用时以车辆后轴中点作为参考点.

图1所示,XOY表示惯性坐标系,xoy表示车身坐标系,基于线性二自由度汽车模型,采用一阶微分方程对该车路参考模型进行数学描述[19].

图 1

图 1   车路参考模型

Fig.1   Vehicle-road reference model


$ \left.\begin{array}{l}{\dot{d}_{{y}}}={v}_{{y}}+{v}_{{x}}\mathrm{sin}\;\varphi \approx{v}_{{y}}+{v}_{{x}}\varphi, \\ {\dot{v}_{{y}}}=-2\dfrac{{C}_{\text{f}}+{C}_{\text{r}}}{m{v}_{{x}}}{v}_{{y}}+\left(2\dfrac{b{C}_{\text{r}}-a{C}_{\text{f}}}{m{v}_{{x}}}-{v}_{{x}}\right){\omega }_{{\mathrm{r}}}+2\dfrac{{C}_{\text{f}}}{m}{\delta }_{\text{f}},\\ {\dot\varphi }={\omega }_{\text{r}},\\ {\dot{\omega }_{\text{r}}}=2\dfrac{b{C}_{\text{r}}-a{C}_{\text{f}}}{{I}_{{z}}{v}_{{x}}}{v}_{{y}}-2\dfrac{{a}^{2}{C}_{\text{f}}+{b}^{2}{C}_{\text{r}}}{{I}_{{z}}{v}_{{x}}}{\omega }_{{\mathrm{r}}}+2\dfrac{a{C}_{\text{f}}}{{I}_{{z}}}{\delta }_{\text{f}}.\end{array}\right\}. $

式中:$ {d_y} $为车身坐标系下车辆质心与车道中心线之间的横向位移,$ {v_y} $为车身坐标系下的横向速度,$ {v_{{x}}} $为车身坐标系下的纵向速度,$ {v_y} $$ {v_{{{{x}}}}} $的合成速度为质心速度,$ \varphi $为横摆角,$ {\omega _{\text{r}}} $为横摆角速度,$ {C_{\text{f}}} $为前轮的侧偏刚度,$ {C_{\text{r}}} $为后轮的侧偏刚度,$ a $为前轴与车辆质心之间的距离,$ b $为后轴与车辆质心之间的距离,$ {\delta _{\text{f}}} $为前轮转角,$ {I_{{z}}} $为绕z轴的转动惯量.

$ {\boldsymbol{x}} = {[\,{d_{{y}}},\,\,{v_{{y}}},\,\,\varphi ,\,\,{\omega _{\text{r}}}]^{\mathrm{T}}} $为状态向量,$ {\boldsymbol{y}} = {[\,{d_{{y}}},\,\,\varphi ]^{\mathrm{T}}} $为模型预测输出,$ {u_{\text{1}}} $为驾驶人的控制输入,$ {u_{\text{2}}} $为智能系统的控制输入,建立连续状态空间方程:

$ \left.\begin{array}{l}{\dot{\boldsymbol{x}}}={\boldsymbol{\varPsi x}}+{\boldsymbol{\varPi}} {u}_{1}+{\boldsymbol{\varPi}} {u}_{2},\\ {\boldsymbol{y}}={\boldsymbol{Cx}}.\end{array} \right\}$

式中:各系数矩阵满足

$ {T_{\text{s}}} $为采样周期,对式(2)进行离散化处理,得到离散状态空间方程:

$ \left. \begin{gathered} {\boldsymbol{x}}(k+1|k) = {\boldsymbol{Ax}}(k)+{\boldsymbol{B}}{u_1}(k)+{\boldsymbol{B}}{u_2}(k), \\ {\boldsymbol{y}}(k) = {\boldsymbol{Cx}}(k). \\ \end{gathered} \right\} $

式中:各系数矩阵满足

1.1.2. 多步预测模型

令当前时刻为k,预测时域为[kk+p−1],控制时域为[k, k+c−1],其中cp. 由式(3)逐步迭代整理得到

$ \left. \begin{gathered} {\boldsymbol{X}}(k+1|k) = {{\boldsymbol{A}}_p}{\boldsymbol{x}}(k)+{{\boldsymbol{B}}_p}{{\boldsymbol{U}}_1}(k)+{{\boldsymbol{B}}_p}{{\boldsymbol{U}}_2}(k), \\ {\boldsymbol{Y}}(k) = {{\boldsymbol{C}}_p}{\boldsymbol{X}}(k) . \\ \end{gathered} \right\} $

式中:

2. 非合作博弈共享控制

控制层的协同互补是人机共驾领域关注的焦点. 人机并行控制具有双环并行的控制结构,驾驶人与智能系统的输入具有冗余与博弈的特征[2]. 基于非合作博弈理论[20-21],设计基于非合作博弈的模型预测控制(non-cooperative game based model predictive control, NCG-MPC)算法,以提高双驾双控系统的友好性.

2.1. 人机共驾策略设计

2.1.1. 非合作人机共驾策略

图2所示,在非合作人机共驾策略中,根据环境感知、车辆模型规划出车辆运动可行域,按照车道偏离程度[6]将车辆运动可行域划分成安全域、过渡域、预警域、危险域. 根据驾驶人模型、车辆模型得到驾驶人的期望轨迹,通过车辆运动可行域与驾驶人期望轨迹进行危险态势估计. 权重$ {w_1} $$ {w_2} $分别为驾驶人与智能系统的驾驶参与度,满足$ {w_1}+{w_2} = 1 $.

图 2

图 2   非合作人机共驾策略

Fig.2   Non-cooperative driver-automation shared control strategy


非合作人机共驾策略的作用是根据危险态势估计模型来综合协调驾驶人与智能系统的驾驶参与度,能够较好地兼顾驾乘舒适性与行驶安全性,保证驾驶人时刻在环. 当车辆处于安全域或过渡域前期时,在保证一定的横向运动控制精度的前提下,给予驾驶人足够的控制权裕度,以提升驾驶人的舒适体验. 当因驾驶人误操作、走神、疲劳等而导致车辆进入预警域或危险域时,该策略会逐步将驾驶控制权从驾驶人移交给智能系统.

2.1.2. 控制权博弈模型

定义预瞄偏移距离(preview offset distance, POD)为车辆在预瞄点处偏移车道中心线的距离. 根据JTG B01-2014公路工程技术标准可知,我国高速公路车道的宽度为3.75 m,轿车宽度约为1.6~1.8 m. 基于POD距离,将车辆运动可行域划分成以下区域:1)安全域[0, 0.35] m,驾驶人占主导权;2) 过渡域(0.35, 0.6] m,逐渐提高智能系统的控制权值;3) 预警域(0.5, ∞) m,启动分级预警[22];4) 危险域(0.6, ∞) m,智能系统快速接管驾驶控制权.

为了提高驾驶人的主观感受度及其对智能系统的信任感,宜尽量减少驾驶人控制权重低于0.5的情况[6]. 此外,考虑到驾驶人对线性函数的接受度较佳,设计控制权博弈模型,如图3所示. 图中,POD距离dPOD是时间的函数.

图 3

图 3   控制权博弈模型

Fig.3   Game-theoretical model of control authority


驾驶人控制权的数学描述如下:

$ {w_1}({d_{\rm{POD}}}) = \left\{ \begin{gathered} 1\;\;\;,\;\;{d_{\rm{POD}}} \in [0,0.1] ; \\ - 2{d_{\rm{POD}}}+1.2\;\;,\;\;{d_{\rm{POD}}} \in (0.1,0.35] ; \\ 0.5\;,\;\;{d_{\rm{POD}}} \in (0.35,0.45]; \\ - 2{d_{\rm{POD}}}+1.4\;\;,\;\;{d_{\rm{POD}}} \in (0.45,0.7] ; \\ 0\;\;\;,\;\;{d_{\rm{POD}}} \in (0.7,+\infty ) . \\ \end{gathered} \right. $

式中:$ {w_1}({d_{{\mathrm{POD}}}}) $为驾驶人控制权函数.

2.2. 共享控制算法的设计
2.2.1. 代价函数

车道保持的任务是使车辆横向位置应尽可能逼近期望路径,为了保证控制效果,控制输入宜尽可能小. 在非合作人机共驾策略中,包含2个决策者(即系统有2个控制输入):驾驶人、智能系统. 这2个决策者都期望自身在实现控制目标时所花费的成本最小,构造代价函数如下:

$ \begin{split} {J_1}(k){\text{ = }}&\sum\limits_{i = 1}^p {\bigl\| {{\boldsymbol{y}}(k+i) - {{\boldsymbol{y}}_{{\text{1,des}}}}(k+i)} \bigl\|_{{{\boldsymbol{q}}_1}(k)}^2} + \\& \sum\limits_{i = 0}^{c - 1} {{\bigl| {{u_1}(k+i)} \bigl|}_{{r_1}(k)}^2}, \end{split} $

$\begin{split} {J_2}(k){\text{ = }}&\sum\limits_{i = 1}^p {\bigl\| {{\boldsymbol{y}}(k+i) - {{\boldsymbol{y}}_{{\text{2,des}}}}(k+i)} \bigl\|_{{{\boldsymbol{q}}_2}(k)}^2} + \\ & \sum\limits_{i = 0}^{c - 1} {\bigl| {{u_2}(k+i)} \bigl|_{{r_2}(k)}^2}.\end{split} $

在代价函数中,第1项体现了对期望轨迹的跟踪能力,第2项反映了对控制平稳性的要求. 式中:

$ {{\boldsymbol{y}}_{1,{\text{des}}}}(k) $$ {{\boldsymbol{y}}_{2,{\text{des}}}}(k) $分别为驾驶人与智能系统的局部期望轨迹;$ {r}_{1}(k)、{r}_{2}(k) $分别为相应的控制输入的加权系数;$ {{\boldsymbol{q}}}_{1}(k)、{{\boldsymbol{q}}}_{2}(k) $分别为相应的状态加权矩阵,也称为置信度矩阵,用来动态调整驾驶人与智能系统之间的驾驶参与度;$ {\lambda }_{1}(k)、{\lambda }_{2}(k) $影响相应规划轨迹的超调特性[20].

基于图3所示的控制权博弈模型,当车辆进入危险域时,通过逐步下调$ {w_1}(k) $与上调$ {w_2}(k) $,增加智能系统规划路径的置信度,进而确保行驶安全性. 当车辆进入安全域时,通过逐步上调$ {w_1}(k) $与下调$ {w_2}(k) $,提高驾驶人的控制权裕度,改善驾驶舒适性. 通过合理调整驾驶人与智能系统的驾驶参与度,能够较好地实现驾驶人与智能系统之间驾驶控制权的平稳交接.

2.2.2. 约束条件及松弛化处理

考虑到车辆自身的物理限制及实际应用场景,对由控制输入、系统状态所构成的控制器工作域进行边界约束:

$ \left. \begin{gathered} {u_{1,\min }} \leqslant {u_1}(k+i|k) \leqslant {u_{1,\max }},\;\;i \in [0,\;c - 1] ; \\ {u_{2,\min }} \leqslant {u_2}(k+i|k) \leqslant {u_{2,\max }},\;\;i \in [0,\;c - 1] ; \\ {d_{{{y}},\min }} \leqslant {d_{{y}}}(k+i+1|k) \leqslant {d_{y,\max }},\;\;i \in [0,p - 1]; \\ {\varphi _{\min }} \leqslant \varphi (k+i+1|k) \leqslant {\varphi _{\max }},\;\;i \in [0,p - 1] . \\ \end{gathered} \right\} $

式中:$ {u_{1,\min }} $$ {u_{2,\min }} $为控制下界,${u_{1,\max }}$${u_{2,\max }}$为控制上界, $ {d_{{{y}},\min }} $$ {\varphi _{\min }} $为输出下界, $ {d_{{{y}},\max }} $$ {\varphi _{\max }} $为输出上界.

将式(8)所示的硬约束条件所构成的约束空间称为求解可行域. 在MPC有限时域滚动优化过程中,可能会出现求解可行域内无可行解的问题. 采用松弛因子对硬约束条件进行松弛化处理,以扩展求解可行域[19],保证可行解存在.

$ \left. \begin{gathered} {u_{1,\min }}+{\varepsilon _1}\upsilon _{\min }^{{u_1}} \leqslant {u_1} \leqslant {u_{1,\max }}+{\varepsilon _1}\upsilon _{\max }^{{u_1}}, \\ {u_{2,\min }}+{\varepsilon _2}\upsilon _{\min }^{{u_2}} \leqslant {u_2} \leqslant {u_{2,\max }}+{\varepsilon _2}\upsilon _{\max }^{{u_2}}, \\ {d_{{{y}},\min }}+{\varepsilon _3}\upsilon _{\min }^d \leqslant {d_{{y}}} \leqslant {d_{y,\max }}+{\varepsilon _3}\upsilon _{\max }^d , \\ {\varphi _{\min }}+{\varepsilon _4}\upsilon _{\min }^{\varphi} \leqslant \varphi \leqslant {\varphi _{\max }}+{\varepsilon _4}\upsilon _{\max }^{\varphi}. \\ \end{gathered} \right\} $

式中:松弛因子满足${\varepsilon _1} \geqslant 0$, ${\varepsilon _2} \geqslant 0$, ${\varepsilon _3} \geqslant 0$, ${\varepsilon _4} \geqslant 0$; 松弛系数满足$\upsilon _{\min }^{{u_1}} \leqslant 0$, $\upsilon _{\min }^{{u_2}} \leqslant 0$, $\upsilon _{\min }^d \leqslant 0$, $\upsilon _{\min }^{\varphi} \leqslant 0$, $\upsilon _{\max }^{{u_1}} \geqslant 0$$\upsilon _{\max }^{{u_2}} \geqslant 0$, $\upsilon _{\max }^d \geqslant 0$, $\upsilon _{\max }^{\varphi} \geqslant 0$.

2.2.3. 算法演变

为了防止因引入松弛因子而导致对控制器工作域的边界约束作用失效,在代价函数中增加正则化项,以惩罚松弛因子扩展工作域边界的能力,从而在硬约束问题求解可行性与工作域边界的松弛程度之间寻求平衡[19]. 根据式(6)、(7)与(9),重构代价函数如下.

$\left.\begin{gathered} J\,_1^*(k) = {J_1}(k)+{\boldsymbol{\varepsilon}} _1^{\mathrm{T}}{{\boldsymbol{\rho}} _1}{{\boldsymbol{\varepsilon}} _1} = \\ {\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_1}} \\ {{{\boldsymbol{\varepsilon}} _1}} \end{array}} \right]^{\mathrm{T}}}{{\boldsymbol{H}}_1}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_1}} \\ {{{\boldsymbol{\varepsilon}} _1}} \end{array}} \right]+2{\boldsymbol{f}}_1^{\mathrm{T}}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_1}} \\ {{{\boldsymbol{\varepsilon}} _1}} \end{array}} \right]\;{+}{{{{{{{C}}}}}}_1}; \\ {\mathrm{s.t}}.\;\;\;{{\boldsymbol{\varOmega}} _1}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_1}} \\ {{{\boldsymbol{\varepsilon}} _1}} \end{array}} \right] \leqslant {{\boldsymbol{T}}_1}. \\ \end{gathered}\right\} $

$ \left.\begin{gathered} J\,_2^*(k) = {J_2}(k)+{\boldsymbol{\varepsilon}} _2^{\mathrm{T}}{{\boldsymbol{\rho}} _2}{{\boldsymbol{\varepsilon}} _2} = \\ {\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_2}} \\ {{{\boldsymbol{\varepsilon}} _2}} \end{array}} \right]^{\mathrm{T}}}{{\boldsymbol{H}}_2}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_2}} \\ {{{\boldsymbol{\varepsilon}} _2}} \end{array}} \right]+2{\boldsymbol{f}}_2^{\mathrm{T}}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_2}} \\ {{{\boldsymbol{\varepsilon}} _2}} \end{array}} \right]\;{+}{{{C}}_2} ; \\ {\mathrm{s.t}}.\;\;\;{{\boldsymbol{\varOmega}} _2}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{U}}_2}} \\ {{{\boldsymbol{\varepsilon}} _2}} \end{array}} \right] \leqslant {{\boldsymbol{T}}_2} . \\ \end{gathered} \right\}$

式中:C1C2为常数项,

其中,

$ {{\boldsymbol{I}}_c} $c×c的单位矩阵,

将共驾型LKAS算法设计问题转化为线性不等式约束的二次规划(quadratic programming, QP)问题. 对于每一个参与者来说,非合作博弈的均衡解,即纳什均衡,可以通过求解QP问题得到. 在滚动优化求解过程中,选取向量解的第1个数值作为下一步的输入,如此重复,实现滚动在线控制.

3. 实验验证

为了验证控制算法与控制策略的有效性,基于Matlab/Simulink及CarSim集成环境,搭建驾驶人在环的共驾型LKAS模型. 整车动力学参数见表1,驾驶群体特性参数[22]表2,试验台架如图4所示. 基于笔者等[22]的研究,将驾驶人的驾驶状态划分为正常驾驶状态、激进驾驶状态、疲劳驾驶状态,不同驾驶状态下驾驶人对侧偏的敏感程度不一样,即局部期望路径$ {y_{1,{\text{des}}}}(k) $不一样,智能系统的局部期望路径一直是车道中心线. 对比控制方法采用MPC控制,将驾驶人输入与智能系统输入的线性加权组合作为MPC控制器的输入,假设驾驶人控制权重为0.5.

表 1   整车动力学参数

Tab.1  Vehicular dynamics parameters

参数数值
簧载质量/kg1 650
质心绕z轴的转动惯量/( kg·m2)3 234
前轴与车辆质心之间的距离/m1.4
后轴与车辆质心之间的距离/m1.65
车身宽度/m1.88
前轮的侧偏刚度/( kN·rad−1)80
后轮的侧偏刚度/( kN·rad−1)80
路面附着系数0.8
迎风面积/m22.0

新窗口打开| 下载CSV


图 4

图 4   驾驶人在环试验台架

Fig.4   Driver-in-loop experimental platform


表 2   驾驶状态特性参数

Tab.2  Parameters of driving state characteristics

驾驶状态参数数值
正常驾驶反应时间/s0.5~1.2
正常驾驶制动减速度/(m·s−2)−2~0
正常驾驶侧偏位移/m−0.6~0.6
激进驾驶反应时间/s0.1~0.7
激进驾驶制动减速度/(m·s−2)−3~0
激进驾驶侧偏位移/m−0.4~0.4
疲劳驾驶反应时间/s0.8~2.0
疲劳驾驶制动减速度/(m·s−2)−4~0
疲劳驾驶侧偏位移/m−0.9~0.9

新窗口打开| 下载CSV


图5所示,针对不同的驾驶状态,分别对人驾与共驾模式下的横向位移进行仿真对比. 大约在第25 s时刻,开始转向操作. 与人驾模式相比,NCG-MPC共驾模式能够有效地提高路径的跟踪精度,尤其是对疲劳驾驶状态下因误操作而导致的异常侧偏具有较明显的抑制作用. MPC共驾模式相当于驾驶人和一个优秀的驾驶助理按照平等控制权共同操控车辆,跟踪效果好,响应快. 如图6(c)所示,驾驶人的驾驶控制权是逐步移交给智能系统的,即智能系统的介入有一定的延时,导致NCG-MPC共驾的侧偏相对较大. 这种固定权重分配会影响到驾驶人的主观感受[6],即友好性相对不足.

图 5

图 5   不同驾驶状态下的横向位移对比

Fig.5   Comparison of lateral displacements under different driving states


图 6

图 6   不同驾驶状态下驾驶人控制权的对比

Fig.6   Comparison of control authority under different driving states


图6所示,针对不同的驾驶状态,分别对驾驶人控制权进行仿真对比. 与正常驾驶状态相比,激进驾驶状态下由于驾驶人的应急反应较快,对侧偏的敏感度较高,能够将侧偏位移控制在±0.4 m范围内(见图5(b)),所以能够一直掌握较高的驾驶控制权. 在疲劳驾驶状态下,当侧偏过大时,利用设计的控制权博弈模型,能够及时将驾驶控制权移交给智能系统,此时智能驾驶系统占绝对主导权. 当侧偏变小时,智能系统将驾驶控制权逐步归还给驾驶人,即针对不同的驾驶状态,该控制权博弈模型具有较好的适应能力.

图7所示,针对不同的驾驶状态,分别对NCG-MPC共驾模式下驾驶人、智能系统及共驾的方向盘转角δw进行仿真对比. 在0~25 s过程中, CarSim直道并非严格直线,故该过程中智能系统会有一定的输入. 由于该过程中的侧偏很小,控制权博弈模型给智能系统分配的输入权重很小甚至为0,这样使得合成输入接近于0. 在疲劳驾驶状态下,当驾驶人方向盘转向过大时,在控制权博弈模型的作用下智能驾驶系统将会及时介入,快速接管方向盘以纠正车辆的偏离行为,有效提高了车辆横向控制的抗扰动能力.

图 7

图 7   不同驾驶状态下方向盘转角的对比

Fig.7   Comparison of steering wheel angles under different driving states


4. 结 论

(1)基于MPC模型预测控制框架提出共驾型LKAS控制算法,采用二次型性能指标及线性不等式约束的形式,将前轮转角决策问题转化成带约束的在线二次规划问题.

(2)基于非合作博弈理论设计非合作人机共驾策略,以提高驾驶人与智能系统双驾双控过程中的友好性. 按照车道偏离程度,将车辆运动可行域划分成安全域、过渡域、预警域、危险域,综合车辆运动可行域与驾驶人期望轨迹进行危险态势估计. 采用POD距离对驾驶人与智能系统的置信度矩阵进行更新,以实现驾驶人与智能系统之间驾驶控制权的平稳交接,在保证驾驶人时刻在环的同时,能够有效避免因交接突兀而影响驾乘舒适性的不足.

(3)为了提高驾驶人的主观感受度及其对智能系统的信任感,设计控制权博弈模型. 在保证一定的横向运动控制精度的前提下,给予驾驶人足够的控制权裕度,以满足驾驶人的主观感受.

参考文献

胡云峰, 曲婷, 刘俊, 等

智能汽车人机协同控制的研究现状与展望

[J]. 自动化学报, 2019, 45 (7): 1261- 1280

[本文引用: 1]

HU Yunfeng, QU Ting, LIU Jun, et al

Human-machine cooperative control of intelligent vehicle: recent developments and future perspectives

[J]. Acta Automatica Sinica, 2019, 45 (7): 1261- 1280

[本文引用: 1]

李克强, 戴一凡, 李升波, 等

智能网联汽车(ICV)技术的发展现状及趋势

[J]. 汽车安全与节能学报, 2017, 8 (1): 1- 14

[本文引用: 4]

LI Keqiang, DAI Yifan, LI Shengbo, et al

State-of-the-art and technical trends of intelligent and connected vehicles

[J]. Journal of Automotive Safety and Energy, 2017, 8 (1): 1- 14

[本文引用: 4]

MARCANO M, DÍAZ S, PÉREZ J, et al. A review of shared control for automated vehicles: theory and applications [J]. IEEE Transactions on Human-Machine Systems , 2020, 50(6): 475–491.

[本文引用: 1]

WU Y, WEI H, CHEN X, et al

Adaptive authority allocation of human-automation shared control for autonomous vehicle

[J]. International Journal of Automotive Technology, 2020, 21 (3): 541- 553

DOI:10.1007/s12239-020-0051-6     

秦增科, 郭烈, 马跃, 等

基于人机协同的车道保持辅助系统研究进展

[J]. 工程科学学报, 2021, 43 (3): 355- 364

[本文引用: 1]

QIN Zengke, GUO Lie, MA Yue, et al

Overview of lane-keeping assist system based on human-machine cooperative control

[J]. Chinese Journal of Engineering, 2021, 43 (3): 355- 364

[本文引用: 1]

陈无畏, 王其东, 丁雨康, 等

基于预期偏移距离的人机权值分配策略研究

[J]. 汽车工程, 2020, 42 (4): 101- 109

[本文引用: 4]

CHEN Wuwei, WANG Qidong, DING Yukang, et al

Weight allocation strategy between human and machine based on the preview distance to lane center

[J]. Automotive Engineering, 2020, 42 (4): 101- 109

[本文引用: 4]

LI W, XIE Z, ZHAO J, et al

Human-machine shared steering control for vehicle lane keeping systems via a fuzzy observer-based event-triggered method

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23 (8): 13731- 13744

DOI:10.1109/TITS.2021.3126876     

何仁, 赵晓聪, 杨奕彬, 等

基于驾驶人风险响应机制的人机共驾模型

[J]. 吉林大学学报:工学版, 2021, 51 (3): 799- 809

[本文引用: 1]

HE Ren, ZHAO Xiaocong, YANG Yibin, et al

Man-machine shared driving model using risk-response mechanism of human driver

[J]. Journal of Jilin University: Engineering and Technology Edition, 2021, 51 (3): 799- 809

[本文引用: 1]

LI M, CAO H, LI G, et al

A two-layer potential-field-driven model predictive shared control towards driver-automation cooperation

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23 (5): 4415- 4431

[本文引用: 1]

郭烈, 葛平淑, 夏文旭, 等

基于人机共驾的车道保持辅助控制系统研究

[J]. 中国公路学报, 2019, 32 (12): 46- 57

[本文引用: 2]

GUO Lie, GE Pingshu, XIA Wenxu, et al

Lane-keeping control systems based on human-machine cooperative driving

[J]. China Journal of Highway and Transport, 2019, 32 (12): 46- 57

[本文引用: 2]

严利鑫, 吴超仲, 贺宜, 等

人机共驾智能车驾驶模式决策属性析取研究

[J]. 中国公路学报, 2018, 31 (1): 120- 127

[本文引用: 1]

YAN Lixin, WU Chaozhong, HE Yi, et al

Research on impact factors extraction for driving mode of intelligent vehicle

[J]. China Journal of Highway and Transport, 2018, 31 (1): 120- 127

[本文引用: 1]

刘文丽, 郑玲, 杨威, 等. 基于车辆行驶状态的驾驶人能力评价方法[C]//中国汽车工程学会年会论文集. [S. l. ]: 机械工业出版社, 2018: 60-66.

[本文引用: 1]

LIU Wenli, ZHENG Ling, YANG Wei, et al. Evaluation method of driver’s capability based on analysis of vehicle states [C]// Proceedings of SAE-China Congress. [S. l. ]: China Machine Press, 2018: 60–66.

[本文引用: 1]

何仁, 赵晓聪, 王建强

人-车-路交互下的驾驶人风险响应度建模

[J]. 中国公路学报, 2020, 33 (9): 236- 250

[本文引用: 1]

HE Ren, ZHAO Xiaocong, WANG Jianqiang

Modeling of driving risk response under human-vehicle-road interaction

[J]. China Journal of Highway and Transport, 2020, 33 (9): 236- 250

[本文引用: 1]

YAN Z, YANG K, WANG Z, et al

Intention-based lane changing and lane keeping haptic guidance steering system

[J]. IEEE Transactions on Intelligent Vehicles, 2021, 6 (4): 622- 633

DOI:10.1109/TIV.2020.3044180      [本文引用: 1]

NGUYEN A, SENTOUH C, POPIEUL J

Sensor reduction for driver-automation shared steering control via an adaptive authority allocation strategy

[J]. IEEE/ASME Transactions on Mechatronics, 2018, 23 (1): 5- 16

DOI:10.1109/TMECH.2017.2698216      [本文引用: 1]

YANG K, LIU Y, NA X

Preview-scheduled steering assistance control for copiloting vehicle: a human-like methodology

[J]. Vehicle System Dynamics, 2020, 58 (4): 518- 544

DOI:10.1080/00423114.2019.1590607      [本文引用: 1]

JI A, LEVINSON D

A review of game theory models of lane changing

[J]. Transportmetrica A: Transport Science, 2020, 16 (3): 1628- 1647

DOI:10.1080/23249935.2020.1770368      [本文引用: 1]

JI X, YANG K, NA X, et al

Shared steering torque for lane change assistance: a stochastic game-theoretic approach

[J]. IEEE Transactions on Industrial Electronics, 2019, 66 (4): 3093- 3105

DOI:10.1109/TIE.2018.2844784      [本文引用: 1]

章军辉, 李庆, 陈大鹏

实时多目标权重弯道跟随预测控制

[J]. 天津大学学报:自然科学与工程技术版, 2020, 53 (8): 861- 871

[本文引用: 3]

ZHANG Junhui, LI Qing, CHEN Dapeng

Multi-objective real-time weighted model predictive control for car-following

[J]. Journal of Tianjin University: Science and Technology, 2020, 53 (8): 861- 871

[本文引用: 3]

NA X, COLE D J

Linear quadratic game and non-cooperative predictive methods for potential application to modelling driver–AFS interactive steering control

[J]. Vehicle System Dynamics, 2013, 51 (2): 165- 198

DOI:10.1080/00423114.2012.715653      [本文引用: 2]

刘瑞, 朱西产, 刘霖, 等

基于非合作模型预测控制的人机共驾策略

[J]. 同济大学学报:自然科学版, 2019, 47 (7): 1037- 1045

[本文引用: 1]

LIU Rui, ZHU Xichan, LIU Lin, et al

Cooperative driving strategy based on non-cooperative model predictive control

[J]. Journal of Tongji University: Natural Science, 2019, 47 (7): 1037- 1045

[本文引用: 1]

章军辉, 李庆, 陈大鹏

基于BP神经网络的纵向避撞安全辅助算法

[J]. 西安交通大学学报, 2017, 51 (7): 140- 147

[本文引用: 3]

ZHANG Junhui, LI Qing, CHEN Dapeng

Safety assistance algorithm for longitudinal collision avoidance based on BP neural network

[J]. Journal of Xi'an Jiaotong University, 2017, 51 (7): 140- 147

[本文引用: 3]

/