浙江大学学报(工学版), 2022, 56(1): 118-127 doi: 10.3785/j.issn.1008-973X.2022.01.013

土木工程、水利工程

路段环境自动驾驶汽车通行权决策方法

曹宁博,, 赵利英,

1. 长安大学 运输工程学院, 陕西 西安 710061

2. 西安理工大学 经济与管理学院, 陕西 西安 710048

Decision-making method of autonomous vehicles for right of way on road segments

CAO Ning-bo,, ZHAO Li-ying,

1. College of Transportation Engineering, Chang'an University, Xi’an 710061, China

2. School of Economics and Management, Xi’an University of Technology, Xi’an 710048, China

通讯作者: 赵利英,女,讲师. orcid.org/0000-0002-3954-9258. E-mail: lyzhao@xaut.edu.cn

收稿日期: 2021-02-14  

基金资助: 陕西省自然科学基础研究计划资助项目(2021JQ-279);陕西省教育厅重点科学研究计划资助项目(21JZ005);西安理工大学青年教师研究资助项目(256081921)

Received: 2021-02-14  

Fund supported: 陕西省自然科学基础研究计划资助项目(2021JQ-279);陕西省教育厅重点科学研究计划资助项目(21JZ005);西安理工大学青年教师研究资助项目(256081921)

作者简介 About authors

曹宁博(1987—),男,讲师,从事自动驾驶汽车和行人安全的研究.orcid.org/0000-0002-6630-0466.E-mail:819868226@qq.com , E-mail:819868226@qq.com

摘要

为了解决路段自动驾驶汽车的通行权决策问题,提高交通流的运行效率和稳定性,基于可接受间隙模型和谈判理论构建路段自动驾驶汽车通行权决策模型. 综合考虑多种因素,基于可接受间隙模型对行人风险进行建模,将行人风险划分为低风险、中风险和高风险. 综合考虑风险、性格(激进和保守)和等待时间等对行人行为的影响,分析不同因素组合下行人和自动驾驶汽车可能采取的行为策略,基于该行为策略,利用谈判理论对自动驾驶汽车的通行权决策过程进行建模. 利用Python联合SUMO开源交通仿真软件对模型进行验证,仿真持续10 h. 3个模型的(保守模型、Gupta模型和本文模型)仿真结果表明,当行人产生频率为15 s时,自动驾驶汽车的平均行驶时间分别为661.5、399.5和327.6 s,平均延误时间分别为618 s、336 s和260.7 s,总流量分别为6 699辆、10 583辆和11 568辆. 当行人产生频率为30 s时,自动驾驶汽车的平均行驶时间分别为643.5、311.7和81.9 s,平均延误时间分别为599.9、244.4和6.5 s,总流量分别为6 879辆、11 741辆和11 971辆. 通行权决策方法的加入有助于降低自动驾驶汽车的行驶时间和延误,提升流量.

关键词: 交通工程与交通管理 ; 自动驾驶汽车 ; 通行权决策 ; 谈判模型 ; 行人 ; 感知风险

Abstract

A decision-making method for the right of way based on acceptable gap model and negotiation theory was developed in order to solve the decision-making problem of autonomous vehicles for the right of way on road segments and improve the efficiency and stability of traffic flow. Various factors were comprehensively considered to model the perceived risk based on the acceptable gap model. Perceived risk was divided into low risk, medium risk and high risk. The potential behavior strategies of pedestrians and autonomous vehicles under different combinations of above factors were analyzed by comprehensively considering the impact of risk, personality (radical and conservative) and waiting time on pedestrians’ behaviors. The negotiation theory was used to model the process of decision-making for the right of way based on these behavior strategies. The model was simulated and verified by using Python and SUMO for ten hours. The simulation of three models (conservative model, Gupta model and our model) was conducted. When pedestrian generation frequency was 15 s, the average travel time of autonomous vehicles was 661.5, 399.5 and 327.6 s respectively; the average delay was 618, 336 and 260.7 s respectively; the total traffic volume was 6 699, 10 583 and 11 568 vehicles respectively. When the pedestrian generation frequency was 30 s, the average travel time of autonomous vehicles was 643.5, 311.7 and 81.9 s respectively; the average delay was 599.9, 244.4 and 6.5 s; the total traffic volume was 6 879, 11 741 and 11 971 vehicles respectively. The introduction of decision-making model helps to reduce the travel time and delay of the autonomous vehicles, and increase the traffic volume.

Keywords: traffic engineering and traffic management ; autonomous vehicle ; decision-making model ; negotiation model ; pedestrian ; perceived risk

PDF (1296KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

曹宁博, 赵利英. 路段环境自动驾驶汽车通行权决策方法. 浙江大学学报(工学版)[J], 2022, 56(1): 118-127 doi:10.3785/j.issn.1008-973X.2022.01.013

CAO Ning-bo, ZHAO Li-ying. Decision-making method of autonomous vehicles for right of way on road segments. Journal of Zhejiang University(Engineering Science)[J], 2022, 56(1): 118-127 doi:10.3785/j.issn.1008-973X.2022.01.013

目前,自动驾驶汽车无法像驾驶员一样与行人进行灵活的通行权沟通,只能采取保守让行的策略(绝对礼让规则),严重降低了交通流效率. 为了解决该问题,本文建立自动驾驶汽车的通行权决策方法.

自动驾驶汽车与行人的交互行为是确定通行权归属的基本依据. 行人是最灵活且反应最灵敏的道路使用者,行为受内、外因素的共同影响. 等待时间和车头时距是造成行人不安全过街的主要外部因素[1]. 激进行人喜欢选择较小的穿越间隙[2]. 保守行人犹豫不决,导致过街时间增加[3]. 随着等待时间的增加,行人会做出更危险的决定[4]. 在多车道道路上,当多辆车辆排队靠近时,行人更加保守和谨慎[5]. 行人穿越意愿与个性和态度紧密相关[6]. 上述研究揭示了行人与车辆相互作用的基本特征,但未详细分析行人行为和心理对自动驾驶决策过程的影响.

以往相关研究集中在增加人车通信渠道,例如自动驾驶汽车使用仿生眼睛模拟驾驶员和行人的眼神沟通. 驾驶员可以从行人手势和动作判断行为意图[7]. Bremner等[8]使用人工智能,训练机器人驾驶员做手势和生成表情. Chen等[9]在挡风玻璃顶部安装LED灯,向行人表明是否让行. Kim等[10]利用显示器和声音,展示自动驾驶汽车意图. Thadeshwar等[11]利用机器学习算法,提升自动驾驶汽车识别障碍物的能力. 这些研究提高了自动驾驶汽车的行人检测和识别能力,丰富了双方信息的传递渠道,但只能帮助行人了解车辆意图,无法实现双向通行权沟通.

受限于行人意图的不确定性和信息传递渠道的单向性,自动驾驶汽车只能采取保守通行权决策方法. 在通行权模糊的道路,自动驾驶汽车避障算法的首要原则是安全,收益和止损是首选策略[12]. Sathyamoorthy等[13]提升轨迹预测的准确性,最大程度上保证自动驾驶控制系统的安全. Schneider等[14]指出自动驾驶控制系统须严格尊重行人优先通行权. Marchant等[15]指出制造商更愿意采取保守控制方法,无条件避免碰撞.

综上所述,当前自动驾驶汽车是否拥有通行权直接依赖障碍物检测结果,现有的保守控制系统缺乏对行人属性、心理和环境的考虑,导致它们处于被动地位,无法发挥其提高交通流吞吐量和稳定性的优势. 随着队列控制引起学术界和工业界的广泛关注,作为自动驾驶汽车最重要的应用之一,它将在不久的将来得到普及[16],驾驶队列与行人的相互作用将非常普遍. 随着驾驶队列的增多,行人变得更加谨慎. 为了克服现有控制方法的不足并应对新的交通流特征,本文建立路段环境自动驾驶汽车的通行权决策模型.

1. 基于行人风险评估的通行权决策模型构建

传统研究表明,行人更愿意等待合适穿越间隙穿越车流. 随着等待时间的增加,行人会选择冒险过街. 驾驶员和行人具有选择合适时机完成过街的能力,而自动驾驶汽车缺乏这种能力,须建立通行权决策方法帮助自动驾驶汽车寻找优先通行机会. Brewer等[17]提出可接受间隙理论,行人利用一个穿越间隙穿越车流的概率与穿越间隙时间有关. 接受间隙的概率公式为

$ p = \frac{{{{\text{exp}}\;({\mu \Delta T})}}}{{1 + {{\text{exp}}\;({\mu \Delta T})}}} \times 100 \to \frac{1}{p} \propto {{\text{exp}}\;({ - \mu \Delta T})} . $

式中: $ \Delta T $为穿越间隙时间; $ \mu $为强度系数,本文取为0.5.

穿越间隙越大,行人受到来自车辆的风险越小,他们感到安全,接受间隙的概率越大. 行人受到来自车辆的风险( $ {\text{PRv}} $)与接受间隙的概率成反比. 根据式(1)可知, $ {\text{PRv}} $${{\text{exp}}\;({ - \mu \Delta T})}$成正比,故采用负指数形式建立行人风险评估模型. 行人和车辆在轨迹上存在冲突时,采取避让措施. Chen等[18]指出可以利用 $ {\text{TTCP}} $来判断冲突是否有效. $ {\text{TTCP}} $为行人或车辆保持当前速度到达冲突点所需的时间. 行人 $ \alpha $和车辆 $ {v_i} $$ {\text{TTCP}} $利用下式计算得到:

$ {\text{TTC}}{{\text{P}}_\alpha }(t) = \frac{{\left\| {{{\boldsymbol{p}}_{\text{c}}}(t) - {{\boldsymbol{p}}_\alpha }(t)} \right\|}}{{\left\| {{{\boldsymbol{v}}_\alpha }(t)} \right\|}}\cos \left\langle {{{\boldsymbol{p}}_{\text{c}}}(t) - {{\boldsymbol{p}}_\alpha }(t),{{\boldsymbol{v}}_\alpha }(t)} \right\rangle , $

$ {\text{TTC}}{{\text{P}}_{v_i}}(t) = \frac{{\left\| {{{\boldsymbol{p}}_{\text{c}}}(t) - {{\boldsymbol{p}}_{{v_i}}}(t)} \right\|}}{{\left\| {{{\boldsymbol{v}}_{{v_i}}}(t)} \right\|}}\cos \left\langle {{{\boldsymbol{p}}_{\text{c}}}(t) - {{\boldsymbol{p}}_{{v_i}}}(t),{{\boldsymbol{v}}_{{v_i}}}(t)} \right\rangle , $

式中: $ t $为时刻, ${{\boldsymbol{p}}_\alpha }(t)$为行人 $ \alpha $的位置坐标, ${{\boldsymbol{p}}_{{v_i}}}(t)$为车辆 $ {v_i} $的位置坐标, ${{\boldsymbol{p}}_{\text{c}}}(t)$为冲突点的坐标, ${{\boldsymbol{v}}_\alpha }(t)$为行人 $ \alpha $的速度, ${{\boldsymbol{v}}_{{v_i}}}(t)$为车辆 $ {v_i} $的速度. 若 $ {\text{TTCP}} $均为正值,则行人和车辆的冲突判定为有效,不采取措施的情况下会演变为碰撞. 若TTCP为负值,表明一方已通过冲突点.

$ \Delta {T_{\alpha {v_i}}}(t) $$ {\text{TTC}}{{\text{P}}_\alpha }{\text{(}}t{\text{)}} $$ {\text{TTC}}{{\text{P}}_{{v_i}}}{\text{(}}t{\text{)}} $差的绝对值,利用 $ \Delta {T_{\alpha {v_i}}}(t) $$ {\text{PRv}} $进行估算, $ \Delta {T_{\alpha {v_i}}}(t) $越大, $ {\text{PRv}} $越小. 公式为

$ \Delta {T}_{\alpha {v}_{i}}(t)=\left\{ {\begin{array}{l}\left|{\text{TTCP}}_{\alpha }(t)-{\text{TTCP}}_{{v}_{i}}(t)\right|,\\ \qquad{\text{TTCP}}_{\alpha }(t) > 0且{\text{TTCP}}_{{v}_{i}}(t) > 0;\\ +\infty , \quad 其他.\end{array} } \right. $

1.1. 行人受到来自车辆风险的评估模型

利用通行权决策方法帮助自动驾驶汽车在条件允许情况下获得优先通行权,而不是频繁停车让行. 在无信号控制人行横道上,行人根据自身属性和受到的风险选择对应行为,自动驾驶汽车根据行人行为判断是否优先通行. $ {\text{PRv}}(t) $是自动驾驶汽车判定是否让行的主要依据,因此建立行人风险的评估模型,综合考虑行人风险和其他因素,建立通行权决策模型. 如图1所示,位于不同车道的车辆对行人的影响不同. 即使车道1上的穿越间隙足够大,行人也依旧等待,因为行人预测将与车道2上的车辆发生碰撞. 为了全面评估行人风险,应考虑不同车道车辆的影响,选择所有车道上驶向行人的第1辆和第2辆车作为对行人有显著影响的车辆. 若这些车辆处于驾驶队列中,则驾驶队列中所有自动驾驶汽车被视为一个整体,以相同的加速度同时更新位置.

利用可接受间隙理论建立的行人风险评估模型综合考虑了上述特性, $ {\text{PRv}}(t) $$ t $时刻行人受到来自不同车道上车辆的总风险,公式为

$ \begin{split} &\text{PRv}(t)=\\ &\left\{ {\begin{array}{l}{\alpha }_ {{\text {PRv}}_{\text{1}}}\displaystyle \sum _{i\in K(t)}\frac{{N}_{\text{P}}^{{l}_{k}}(t){\text{exp}}\;\left({-0.5\left|\Delta {T}_{\alpha {v}_{i}}^{{l}_{k}}(t)\right|}\right)}{\left|{y}_{{v}_{i}}^{{l}_{k}}(t)-{y}_{\alpha }(t)\right|+1},\\ \;\;\;\;\;\;\;\;自动驾驶队列;\\ {\alpha }_{{\text {PRv}}_{\text{2}}}\displaystyle \sum _{i\in K(t)}\frac{{\text{exp}}\;\left({-0.5\left|\Delta {T}_{\alpha {v}_{i}}^{{l}_{k}}(t)\right|}\right){\text{+exp}}\;\left({-0.5\left|\Delta {T}_{ij}^{{l}_{k}}(t)\right|}\right)}{\left|{y}_{{v}_{i}}^{{l}_{k}}(t)-{y}_{\alpha }(t)\right|+1},\\ \;\;\;\;\;\;\;\;单个自动驾驶汽车;\end{array} } \right. \end{split}$

$ K(t) = \left\{ {\left. {{y_\alpha }(t) - {w}/{2}{\kern 1pt} \geqslant y_{{v_i}}^{{l_k}}(t){\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{且}}{\kern 1pt} {\kern 1pt} {\text{ }}d_{{v_i}}^{{l_k}}{\text{(}}t{\text{)}} \leqslant 60\;{\rm{m}}} \right\}} \right. . $

式中: $ {l_k} $表示第 $ k $条车道; $ {\alpha _{{\text{PR}}{{\text{v}}_1}}} $$ {\alpha _{{\text{PR}}{{\text{v}}_2}}} $为模型的归一化参数; $ K(t) $为对行人产生影响的车辆数, $ d_{{v_i}}^{{l_k}}{\text{(}}t{\text{)}} $为车辆 $ {v_i} $到最近人行横道边界的距离, $ \left| {y_{{v_i}}^{{l_k}}(t) - {y_\alpha }(t)} \right| + $ $ 1 $表示不同车道中车辆对行人影响不同, $ N_{\text{P}}^{{l_k}}(t) $为驾驶队列中的车辆数, $ \Delta T_{ij}^{{l_k}}{\text{(}}t{\text{)}} $为相邻车辆 $ {\text{TTC}}{{\text{P}}_{{v_i}}}{\text{(}}t{\text{)}} $$ {\text{TTC}}{{\text{P}}_{{v_j}}}{\text{(}}t{\text{)}} $的差, $ w $为车道宽度, $ ({x_\alpha }(t),{y_\alpha }(t)) $为行人 $ \alpha $的坐标, $ (x_{{v_i}}^{{l_k}}(t),y_{{v_i}}^{{l_k}}(t)) $为车辆 $ {v_i} $的坐标.

为了使 $ 0 \leqslant {\text{PRv}}(t) \leqslant 1 $.0$ {\alpha _{{\text{PR}}{{\text{v}}_1}}} $取0.61, $ {\alpha _{{\text{PR}}{{\text{v}}_2}}} $取0.87,根据式(5)的最大值标定. 一般情况下, $ \Delta T_{\alpha {v_i}}^{{l_k}}(t) = 0 $意味着行人和自动驾驶汽车间存在轨迹冲突,但这个判定条件过于严苛,行人无法准确判断到达冲突点的时间. 假设当 $ \Delta T_{\alpha {v_i}}^{{l_k}}{\text{(}}t{\text{)}} \leqslant w{\text{/}}{v_\alpha }{\text{(}}t{\text{)}} $时,行人和自动驾驶汽车间存在轨迹冲突,须采取避让措施. 当存在轨迹冲突时,自动驾驶汽车检测是否处于驾驶队列,利用式(5)计算等待区行人的 $ {\text{PRv}}(t) $,作为通行权决策的条件.

图 1

图 1   路段行人和车辆相互作用的场景

Fig.1   Scenario of interaction between pedestrian and vehicle on road section


1.2. 行人心理特征

根据式(1)可知,穿越间隙越大,接受间隙的概率越大,这是因为他们认为道路环境安全,感知风险较低. $ {\text{PRv}}(t) $与接受间隙的概率 $ p $成反比,因此行人让行概率( ${{{P}}_{\text{Y}}}(t) = 1 - p$)$ {\text{PRv}}(t) $成正比. 例如,当 $ {\text{PRv}}(t) $超出阈值时,保守行人会选择让行,允许自动驾驶汽车优先通过,即自动驾驶汽车获得通行权. 除 $ {\text{PRv}}(t) $外,行人心理特征会影响行人行为. 随着等待时间的增加,行人变得不耐烦,等待20 s后,行人冒险行为会增加[3,19]. 在心理承受能力范围内,性格激进的行人不会屈服于车辆,即不会让行,此时行人拥有通行权. 若因为制动性能无法停车,则自动驾驶汽车会发出强制通行信号,激进行人必须放弃优先权. 当 $ {\text{PRv}}(t) $超过心理阈值时,激进行人会变得保守,选择让行. 性格保守的行人总是让自动驾驶汽车优先通过,但当等待时间超过20 s时,保守行人会变得激进,行人获得通行权. 通行权决策须考虑行人心理特征对行人行为的影响.

1.3. 自动驾驶汽车的行为策略

当风险较小时,行人认为当前交通环境是安全的,他们可以自由过街. 自动驾驶汽车只需在随时检测行人位置和速度的基础上保持当前速度行驶. 当风险超过阈值时,部分行人开始犹豫是否让行,此时,行人与自动驾驶汽车间可能存在通行权冲突. 面对行人的不同行为,汽车会选择对应的行为,实现与行人的通行权分配. 当须与行人竞争通行权时,汽车的行为策略对通行权分配起决定性作用. 基于上述分析可知,当遇到不同风险和属性的行人时,汽车的行为策略,即面对不同行人时通行权的归属方案,如表1所示. 根据仿真效果标定相关参数的值,阈值 $ {G_1} = 0.1 $,阈值 $ {G_2} = 0.8 $.

表 1   自动驾驶汽车对应的行为策略

Tab.1  Corresponding behavior strategy of autonomous vehicles

$ {\text{PRv}}(t) $ 自动驾驶汽车和行人的对应行为
$ 0 \leqslant {\text{PRv}}(t) \leqslant {G_1} $ 无需通行权决策,行人和自动驾驶汽车均取得通行权. 行人继续加速,直至达到最大速度;自动驾驶汽车继续保持当前的运动状态,随时监视行人的行为.
$ {G_1} < {\text{PRv}}(t) \leqslant {G_2} $ 自动驾驶汽车启动通行权决策过程如下:1)如果自动驾驶汽车无法停车(自动驾驶汽车发出警告),则自动驾驶汽车获得通行权,优先通过;2)若行人保守且等待时间小于20 s,则自动驾驶汽车获得通行权,优先通过;3)若行人保守且等待时间大于20 s,则行人获得通行权,优先过街,自动驾驶汽车减速/停车;4)若行人激进,则自动驾驶汽车减速,行人获得通行权,优先通过.
$ {G_2} < {\text{PRv}}(t) \leqslant 1 $ 无需通行权决策. 不管行人是保守的还是激进的,自动驾驶汽车获得通行权,加速,直至达到最大速度,行人让行.

新窗口打开| 下载CSV


1.4. 自动驾驶汽车通行权决策模型

基于谈判理论建立通行权决策模型,谈判被定义为“在一致同意的决策规则下,将相互冲突的立场合并为共同立场的过程”,这意味着谈判双方必须达成一致的协议,冲突才会结束. 双方的共同利益和相互依赖促进了协议的达成[20]. 谈判理论定义了5个基本组成,作为理论基础,下面简单介绍这些基本组成.

1) 确定当事人及其利益:利益是谈判的基础,双方存在利益冲突是谈判开始的条件.

2) 标准:应建立决策的公平标准,以便达成协议.

3) 承诺:一旦达成协议,双方应遵守协议.

4) 备选方案:若另一方不配合,则必须有备选方案实现目标.

5) 沟通:有效的沟通对于向对方描述自己意图以及在谈判过程中了解对方的意图非常重要.

谈判在协议达成后结束,利用谈判理论的思想,将上述要素进行变化,应用到自动驾驶汽车和行人的通行权协商过程. 在该过程中,利益为通行权,当事人为行人和自动驾驶汽车,标准为通行权合理分配,备选方案为自动驾驶汽车让行,沟通为行人和自动驾驶汽车间的信息传递. 研究场景如图1所示,自动驾驶汽车和行人在路段上的人行横道区域发生相互作用. 如图2所示为利用谈判理论建立的通行权决策模型的流程图,具体步骤如下.

图 2

图 2   通行权决策的流程图

Fig.2   Flowchart diagram of proposed decision-making model


1) 检测. 利用车载传感器获取的行人速度、加速度和位置等数据判断人车是否存在轨迹冲突;获取车辆运动状态、位置和与前、后车间的车头间距,判断是否处于车队中,记录驾驶队列中的车辆数目.

2) 风险评估. 当存在冲突时,车辆根据行人风险评估模型估计检测范围内行人的风险值.

3) 意图判断. 针对中等风险行人,自动驾驶汽车根据表1判断通行意图(让行,优先通行).

4) 意图匹配. 自动驾驶汽车根据行人手势和眼神获取的行人真实意图,车辆判断自身与行人意图是否匹配(冲突). 例如,当双方均为优先通行意图时,说明双方意图不匹配;一方为通行意图,另一方为让行意图,双方意图匹配. 如双方意图不匹配,则开始进行通行权决策.

5) 通行权决策. 在该阶段,行人犹豫是否过街,自动驾驶汽车有机会进行通行权沟通. 根据步骤3)中自动驾驶汽车对行人意图的判断,改变并决定自身意图(通行或减速停车),如表1所示.

6) 状态更新. 当通行权决策未达成时,自动驾驶汽车根据式(7)更新自身下一时刻的速度和位置,行人保持当前运动状态更新下一时刻的速度和位置. 重新进行上述循环流程,直到双方通行权意图匹配. 在决策完成后,自动驾驶汽车和行人按照决策结果通行或让行. 因行人的随机性大,可能会违背决策结果强行过街或频繁改变自身意图,此时采取上述备选方案进行通行权分配,即自动驾驶汽车停车让行人优先通过,充分保证行人过街安全. 在实际应用中,可以利用现有技术(如LED灯带)将车辆意图传递给行人,帮助行人准确获取车辆意图,确保自身安全.

$ {V_{{\text{ad}}}}{\text{(}}t{\text{) = (1 − PRv(}}t{\text{))}}{V_{{\text{max}}}} , $

式中: $ {V_{{\text{ad}}}}{\text{(}}t{\text{)}} $为决策未达成时自动驾驶汽车的建议速度, $ {V_{{\text{max}}}} $为自动驾驶汽车能够达到的最大速度.

2. 仿真设计

为了使仿真过程更加稳定,给出以下假设.

1) 仿真场景为无信号控制路段,自动驾驶汽车直线行驶,无换道.

2) 自动驾驶汽车以相同顺序进出仿真场景,无超车.

3) 当自动驾驶汽车处于驾驶队列时,以整体进行控制. 车辆保持相同的速度和加速度,同步改变状态.

4) 驾驶队列中的所有车辆运动状态取决于队首车辆状态,车头时距保持不变.

5) 只考虑自动驾驶汽车与单个行人的相互作用,暂不考虑人群和其他道路参与者.

SUMO是目前广泛使用的开源交通仿真软件,通过TraCI接口,Python能够获取SUMO中车辆和行人的速度和位置,可以修改和控制它们的速度和位置. 利用Python设计和实现该通行权决策算法,联合SUMO进行仿真输出,仿真步长为1 s,每次仿真持续10 h(36 000 s). 模型伪算法如下.

输入: 行人和自动驾驶汽车的运动、个性、等待时间、手势和注视

输出: 自动驾驶汽车建议速度

1: 检测等待区是否有行人

2: for 每个决策周期 do

3:  if 与行人无轨迹冲突 then

4:  无需决策;

5:  else

6:  检测给行人带来风险的自动驾驶汽车数量

7:   $K(t) = \left\{ {\left. {{y_\alpha }(t) - {w}/{2}{\kern 1pt} \geqslant y_{{v_i}}^{{l_k}}(t){\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\text{且}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} d_{{v_i}}^{{l_k}}{\text{(}}t{\text{)}} \leqslant 60\;{\rm{m}}} \right\}} \right.$

8:  判断与行人发生相互作用的自动驾驶汽车是否在队列中

9:   if 车辆在队列中 then

10:     获取车队中的车辆数量

11:      ${N}_{{\rm{P}}}^{{l}_{k}}(t)=车辆数量$

12:     评估行人风险

13:   ${\text{PRv}}(t) = {\alpha _{{\text{PR}}{{\text{v}}_{\text{1}}}}}\displaystyle\sum\limits_{i \in K(t)} {\dfrac{{N_{\text{P}}^{{l_k}}(t){{\rm{exp}}\; \left({ - 0.5\left| {\Delta T_{\alpha {v_i}}^{{l_k}}(t)} \right|}\right)}}}{{\left| {y_{{v_i}}^{{l_k}}(t) - {y_\alpha }(t)} \right| + 1}}{\kern 1pt} {\kern 1pt} {\kern 1pt} }$

14:   else

15:                       ${\text{PRv}}(t) = {\alpha _{{\text{PR}}{{\text{v}}_{\text{2}}}}}\displaystyle\sum\limits_{i \in K(t)} {\dfrac{{{{\text{exp}}\;\left({ - 0.5\left| {\Delta T_{\alpha {v_i}}^{{l_k}}(t)} \right|}\right)}{\kern 1pt} {\kern 1pt} {\text{ + }}{{\text{exp}}\;\left({ - 0.5\left| {\Delta T_{ij}^{{l_k}}(t)} \right|}\right)}}}{{\left| {y_{{v_i}}^{{l_k}}(t) - {y_\alpha }(t)} \right| + 1}}{\kern 1pt} {\kern 1pt} {\kern 1pt} }$

16:      判断行人意图

17:      意图= f (风险,个性,等待时间,手势,眼神和速度)

18:    if 行人让行 then

19:      决策过程结束,自动驾驶汽车获得通行权

20:    else if 自动驾驶汽车发出警告 then

21:     自动驾驶车辆获得优先通行权

22:    else

23:     (通行权不匹配)

24:      if $ {\text{TTC}}{{\text{P}}_{{v_i}}}{\text{(}}t{\text{)}} < {\text{TTC}}{{\text{P}}_\alpha }{\text{(}}t{\text{)}} $$ \Delta T_{\alpha {v_i}}^{{l_k}}{\text{(}}t{\text{)}} \leqslant $ $ w{\text{/}}{v_\alpha }{\text{(}}t{\text{)}} $ then

25:      自动驾驶汽车表明优先通行意图

26:     else

27:      (自动驾驶汽车等待行人做出决策)

28:     end if

29:    end if

30:  end if

31: 计算下一仿真步自动驾驶汽车的速度

32:  下一仿真步速度: = 保持当前速度, 加速或减速

33: 以最大加速度和减速度更新下一速度

34: 计算碰撞前停车所需的减速度(decelToStop)

35: 检查所需减速度是否满足加速限制

36: 计算确定自动驾驶汽车是否需要发出警告

37:   if decelToStop > 最大减速度或 $ {d_{{v_i}}}{\text{(}}t{\text{)}} $< 0 then

38:   警告:= true

39:    下一仿真步速度: = ${\text{(1 − PRv(}}t{\text{))}}{V_{{\text{max}}}}{\text{ }}$

40:  else

41:   警告 := false

42:   end if

43: end if

44: return下一仿真步速度

45: end for

2.1. 对照模型

目前,自动驾驶汽车采取保守控制算法,保证行人安全. 检测到行人,自动驾驶汽车减速、停车并让行人优先通过. 该保守控制算法严重降低交通流的运行效率和稳定性. Gupta等[21]仅用 $ \Delta T_{\alpha {v_i}}^{{l_k}}{\text{(}}t{\text{)}} $确定行人和车辆通行权归属,忽略了后续车辆对行人的影响,在车道第1辆车通过后,后续车辆经常会与行人发生碰撞,车辆碾压行人,因此他们建立的模型仅适用于单车道道路. 本文模型弥补了上述不足,考虑了自动驾驶交通流的新特性(队列控制),因此保守模型和Gupta模型被用作对照模型.

2.2. 仿真场景设计

为了与对照模型的仿真条件一致,仿真中行人流为单向(从北向南行走). 在单向行人越过图3中边3(道路中线)后,面临的车流与到达边1(人行横道起始边)时面临的车流相似,仅车流方向不同. 设置仿真场景为单向双车道,车流由东向西,其他方向的行人和车流暂不考虑. 如图3所示为SUMO中的仿真场景,人行横道宽6 m,车道总长1 km,单车道宽3.5 m. 自动驾驶汽车与行人在人行横道(冲突区)相遇,人行横道两端设有行人等待区,等待区长1.5 m,宽6 m. 场景中自动驾驶汽车生成率为泊松分布,每小时生成1 200辆车(600辆/车道/h).

图 3

图 3   自动驾驶汽车和行人仿真场景

Fig.3   Simulation scenario of self-driving vehicles and pedestrians


2.3. 行人行为的模拟

仿真中以不同频率生成行人流(每30 s生成1个行人,共1 200个行人;每15 s生成1个行人,共2 400个行人;每生成10个行人,随机生成1个不遵守决策结果的行人),行人到人行横道的距离随机,平均速度为1.4 m/s. 行人心理特征在1.2节进行了详细解释,SUMO无法直接模拟这些心理特征,通过赋值的方法实现虚拟因素和行为的模拟. 例如,设置性格参数,若参数值为1,则行人性格为激进;若参数值为0,则行人性格为保守. 仿真开始时,行人性格参数随机赋值0或1;在仿真过程中,随着行人的心理特征变化,性格参数也会变化(由0变为1或由1变为0),实现性格特征的输入、改变和模拟. 行人的手势或凝视无法直接利用SUMO进行仿真,手势或凝视在仿真中起到表明行人意图的作用. 当行人意图为让行时,手势或者凝视参数赋值为1,否则为0,以此实现自动驾驶汽车对行人意图的获取和判断. 本文模型的建立基础是假设自动驾驶汽车能够准确识别行人手势和眼神,不研究如何提高自动驾驶汽车识别能力.

2.4. 仿真结果的对比

2.4.1. 自动驾驶汽车行驶时间的分析

图45所示为10 h仿真中所有自动驾驶汽车的行驶时间T及自动驾驶汽车数量N直方图. 与保守模型和Gupta模型的对比结果表明,利用本文模型得到的平均行驶时间最短.

图 4

图 4   每15 s生成1个行人时的车辆行驶时间

Fig.4   Travel time of vehicles when generating one pedestrian every 15 seconds


图 5

图 5   每30 s生成1个行人时的汽车行驶时间

Fig.5   Travel time of vehicles when generating one pedestrian every 30 seconds


1) 每15 s生成1个行人,此时,自动驾驶汽车频繁与行人相遇,受到的行人干扰更多. 从图4可知,在保守模型仿真中,自动驾驶汽车检测到行人时均停车让行,这导致自动驾驶汽车产生明显的延误. 与另2种方法相比,平均行驶时间最大(661.5 s). 虽然Gupta模型帮助自动驾驶汽车找到优先通行的机会,平均行驶时间降低到了399.5 s,但因为Gupta模型没有考虑多车道和自动驾驶队列的影响,导致平均行驶时间高于本文模型(327.6 s).

2) 每30 s生成1个行人,此时,行人与自动驾驶汽车间的冲突频率降低,自动驾驶汽车优先通过的机会更多. 如图5所示,整体来看,自动驾驶汽车的行驶时间低于15 s生成1个行人时,且行驶时间的变化规律与图4保持一致,利用本文模型得到的平均行驶时间最小,其次是Gupta模型,最后是保守模型.

2.4.2. 自动驾驶汽车延误分析

延误包括等待时间和损失时间,所有自动驾驶汽车延误DN的直方图如图67所示. 与保守模型和Gupta模型相比,利用本文模型得到的车辆平均延误最短,具体如下.

图 6

图 6   每15 s生成1个行人时的汽车延误

Fig.6   Delay of vehicles when generating one pedestrian every 15 seconds


图 7

图 7   每30 s生成1个行人时的汽车延误

Fig.7   Delay of vehicles when generating one pedestrian every 30 seconds


1) 每15 s生成1个行人,此时,自动驾驶汽车更容易出现等待和减速,因此延误能够反映交通流的运行效率. 从图6可知,保守模型具有最高的平均延误(618 s). Gupta模型的平均延误为336 s,较保守模型小. 本文模型的平均延误最小(260.7 s),与行驶时间的对比结果一致.

2) 每30 s生成1个行人,此时,行人与自动驾驶车辆之间的交互频率降低,自动驾驶车辆有更多机会先通过. 车辆不必频繁减速或停车等待,因此与每15 s生成1个行人的仿真实验相比,利用3种模型得到的车辆平均延误均较小. 这与图6的规律一致,利用本文模型得到的平均延误最低,其次是Gupta模型,保守模型最大. 本文模型的平均延误非常低,这可能是因为自动驾驶汽车取得通行权的机会更多,停车等待频率降低.

2.4.3. 自动驾驶汽车流量分析

图8所示为系统中通过的车辆总数量 $ {N_{\text{t}}} $随仿真时间 $ {t_{\text{s}}} $的变化趋势.

图 8

图 8   3种方法车辆的流量

Fig.8   Throughput of vehicles of three models


1) 每30 s生成1个行人,此时虽然本文模型与Gupta模型在行驶时间和延误时间方面存在显著差异,但通过冲突区的车辆总数没有明显提升. 在仿真10 h后,Gupta模型通过11 741辆自动驾驶汽车,本文模型通过11 971辆,仅增加230辆. 这是因为行人干扰的频率较低,交通流在被行人打断后能够迅速恢复平稳运行. 在这种情况下,等待车辆通过后,交通流密度恢复到稳定状态,直至遇到下1个行人. 当仿真结束时,交通流量没有显著变化. 研究结果表明,当行人频率增大时,自动驾驶汽车的流量会有显著差异,即本文通行权决策方法的性能优于Gupta模型.

2) 每15 s生成1个行人,此时,随着行人频率的增大,交通流中断频率越来越高. 当中断频率过高、车辆等待时间过长时,仿真生成的部分车辆无法进入仿真场景,车辆流量急剧减少. 如图8所示为通过冲突区的自动驾驶汽车总数. 与保守模型(6699辆)和Gupta模型(10 583辆)相比,本文模型(11 568辆)的流量分别增加4 869辆和985辆,结果表明了本文模型的有效性.

3. 结 语

本文建立自动驾驶汽车面对行人时的通行权决策方法,联合SUMO和Python进行仿真验证. 与保守模型和Gupta模型相比,本文模型有效降低了自动驾驶汽车的行驶时间和延误,提升了交通流量. 研究结果表明,现有保守模型会降低交通流效率和稳定性,本文模型可以解决现有模型的不足.

因为综合考虑了自动驾驶汽车队列、行人风险、心理和环境的影响,与实际人车交互过程更加接近,本文模型能够有效减少仿真中自动驾驶汽车的行驶时间. 随着行人受到来自不同车道上车辆的总风险 $ {\text{PRv(}}t{\text{)}} $的增大,行人让行概率增大,自动驾驶汽车优先通过的机会更多,行驶时间进一步提高. 与现有保守模型相比,利用Gupta模型能够有效地提高自动驾驶汽车的流量,但提高的幅度不如本文模型,本文模型允许更多自动驾驶汽车通过冲突区. 合理、充分的通行权决策模型帮助自动驾驶汽车获得更多的通行权,提高交通流的运行效率. 虽然该模型增加了行人延误,但它是可以接受的,因为它有助于自动驾驶汽车灵活,全面地与行人进行通行权沟通,弥补自动驾驶汽车沟通能力缺失的不足. 随着交通流效率和稳定性的提高,拥堵和尾气排放得到有效的缓解.

本文方法只考虑了单向双车道上单个行人和自动驾驶汽车之间的通行权决策问题. 现实中行人可能会以群体形式与自动驾驶汽车发生相互作用,但该方法是更复杂环境下通行权决策的基础. 本文提出的模型需要进一步深入,以适应更复杂的城市交通环境,如两车道以上的道路、行人群体和十字路口,我们将在下一步工作中努力实现这一目标.

参考文献

AMIRNAZMIAFSHAR E, TEZCAN H O. An analysis of pedestrian waiting time at uncontrolled crosswalks using discrete choice model [C]// International Conference on Transportation and Development. Seattle: ASCE, 2020: 25-38.

[本文引用: 1]

ZHANG C, CHEN F, WEI Y

Evaluation of pedestrian crossing behavior and safety at uncontrolled mid-block crosswalks with different numbers of lanes in China

[J]. Accident Analysis and Prevention, 2019, 123: 263- 273

DOI:10.1016/j.aap.2018.12.002      [本文引用: 1]

LI B

A model of pedestrians’ intended waiting times for street crossings at signalized intersections

[J]. Transportation Research Part B: Methodological, 2013, 51: 17- 28

[本文引用: 2]

GUO H, WANG W, GUO W, et al

Reliability analysis of pedestrian safety crossing in urban traffic environment

[J]. Safety Science, 2012, 50 (4): 968- 973

DOI:10.1016/j.ssci.2011.12.027      [本文引用: 1]

KOH P P, WONG Y D

Gap acceptance of violators at signalized pedestrian crossings

[J]. Accident Analysis and Prevention, 2014, 62: 178- 185

DOI:10.1016/j.aap.2013.09.020      [本文引用: 1]

SOATHONG A, CHOWDHURY S, WILSON D, et al

Investigating the motivation for pedestrians ’ risky crossing behaviour at urban mid-block road sections

[J]. Travel Behaviour and Society, 2021, 22: 155- 165

DOI:10.1016/j.tbs.2020.09.005      [本文引用: 1]

MERLINO S, MONDADA L

Crossing the street: how pedestrians interact with cars

[J]. Language and Communication, 2019, 65: 131- 147

DOI:10.1016/j.langcom.2018.04.004      [本文引用: 1]

BREMNER P, LEONARDS U. Iconic gestures for robot avatars, recognition and integration with speech [EB/OL]. (2016-02-17)[2021-02-14]. https://www.frontiersin.org/articles/10.3389/fpsyg.2016.00183/full.

[本文引用: 1]

CHEN H, COHEN R, DAUTENHAHN K, et al. Autonomous vehicle visual signals for pedestrians: experiments and design recommendations [C]// 2020 IEEE Intelligent Vehicles Symposium. Las Vegas: IEEE, 2020: 1819-1826.

[本文引用: 1]

KIM K, KIM Y, KIM H, et al. Method and device for signaling present driving intention of autonomous vehicle to humans by using various V2X-enabled application: U. S. 10780897 [P]. 2020-09-22.

[本文引用: 1]

THADESHWAR H, SHAH V, JAIN M, et al. Artificial intelligence based self-driving car [C]// 2020 4th International Conference on Computer, Communication and Signal Processing. Chennai, India: IEEE, 2020: 1-5.

[本文引用: 1]

LUETGE C

The German ethics code for automated and connected driving

[J]. Philosophy and Technology, 2017, 30 (4): 547- 558

DOI:10.1007/s13347-017-0284-0      [本文引用: 1]

SATHYAMOORTHY A J, LIANG J, PATEL U, et al. Densecavoid: real-time navigation in dense crowds using anticipatory behaviors [C]// 2020 IEEE International Conference on Robotics and Automation. Paris: IEEE, 2020: 11345-11352.

[本文引用: 1]

SCHNEIDER R J, SANDERS R L

Pedestrian safety practitioners’ perspectives of driver yielding behavior across North America

[J]. Transportation Research Record, 2015, 2519 (1): 39- 50

DOI:10.3141/2519-05      [本文引用: 1]

MARCHANT G E, LINDOR R A

The coming collision between autonomous vehicles and the liability system

[J]. Santa Clara Law Review, 2012, 52: 1321

[本文引用: 1]

GONG S Y, DU L

Cooperative platoon control for a mixed traffic flow including human drive vehicles and connected and autonomous vehicles

[J]. Transportation Research Part B:Methodological, 2018, 116: 25- 61

DOI:10.1016/j.trb.2018.07.005      [本文引用: 1]

BREWER M A, FITZPATRICK K, WHITACRE J A, et al

Exploration of pedestrian gap-acceptance behavior at selected locations

[J]. Transportation Research Record, 2006, 1982 (1): 132- 140

DOI:10.1177/0361198106198200117      [本文引用: 1]

CHEN P, ZENG W, YU G

Assessing right-turning vehicle-pedestrian conflicts at intersections using an integrated microscopic simulation model

[J]. Accident Analysis and Prevention, 2019, 129: 211- 224

DOI:10.1016/j.aap.2019.05.018      [本文引用: 1]

LI L, WEN D, YAO D

A survey of traffic control with vehicular communications

[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 15 (1): 425- 432

[本文引用: 1]

TANYA A, AZETA C

Negotiation theory and practice: a review of the literature

[J]. Fao Policy Learn. Programme, Easypol-Module, 2008, 179: 6- 16

[本文引用: 1]

GUPTA S, VASARDANI M, LOHANI B, et al

Pedestrian's risk-based negotiation model for self-driving vehicles to get the right of way

[J]. Accident Analysis and Prevention, 2019, 124: 163- 173

DOI:10.1016/j.aap.2019.01.003      [本文引用: 1]

/