Vehicle 公众号 · 2021年03月25日

自动驾驶机动动作规划和决策

我们在前两节分享了实时路径规划(自动驾驶实时路径规划算法简介(RRT 和Lattice Planner))和局部搜索(自动驾驶实时路径规划算法简介(Local search局部搜索)),那是不是这样就可以构成自动驾驶了呢?其实不然,在2007年DARPA城市挑战赛期间,由于车辆和驾驶之间缺乏人性化的互动,所以导致不少事故(如下图),在有了路径之后还需要进行机动规划和决策。

捕获.PNG

在公共道路上自动驾驶时,车辆在每一时刻都应能够在找到要遵循的最佳几何顺序的航路点后,决定进行最佳和最安全的操纵。这个决定必须在不忽略ego车辆与周围交通环境的相互作用的情况下做出。因此,机动规划包含了预测机动和非机动交通参与者的行为并评估周围交通状况的技术,从而使无人驾驶车辆能够决定其最佳操纵。

本节介绍的技术在机动规划不再仅仅搜索路径或生成轨迹;而是充当“大脑”,过滤路径搜索的结果,与其他交通参与者交互,并在几何路径转换为可行轨迹之前批准几何路径。

机动规划技术可分为两类:

(1) 强调运动建模和障碍预测的。

(2) 基于交通环境建模的自动驾驶汽车决策模块。

运动建模-障碍预测

Lefèvre等人。(2014)提供了一份详细的调查,对交通环境建模和预测的最新研究进行了分类,并介绍了几种智能车辆的风险估计器。根据他们的工作,运动模型分为基于物理的、基于操纵的和交互感知的模型。

  • 第一类仅根据物理定律描述运动模型,
  • 第二类则依赖于根据群集轨迹或基于操纵估计和执行来估计其他交通参与者的意图。

这两类运动模型不考虑环境,而是将车辆视为独立的实体。

  • 第三类开发了交互感知模型,可以感知车辆间的关系,以便能够轻松地对危险情况进行建模和实时识别。

就风险估计而言,Lefèvre等人。表明可以通过碰撞预测(二进制或概率)通过估计的轨迹预测碰撞,也可以通过车辆之间的意外行为或冲突操纵来预测碰撞。读者可参考Lefèvre等人的调查。有关技术和风险指标的详细说明。

大多数障碍物预测方法(也包括在Lefèvre等人的调查中)都是指笔直的道路,并不适用于每次机动的情况。

Alin等人使用了基于网格的贝叶斯滤波器。(2012)将行为建模为样条函数,以预测弯道并推断其他车辆的轨迹。与不考虑环境因素,但只考虑切入和变道操纵的贝叶斯滤波器相比,该技术显示出更好的结果。

Gadepally(2013)使用层次隐马尔可夫模型和有限状态机的混合状态系统来预测交叉口处交通参与者的未来状态。该模型的动机在于,人类驾驶员可以很容易地估计出车辆的行为(如转向不同的方向),但自动化车辆却无法有效地预测这些行为。然而,这种方法需要大量的训练和大量的数据采集来训练模型。

本体是计算机和信息科学中使用的,实体、层次结构和相互关系的正式描述,Armand等人(2014)使用本体来推理交通参与者的行为。只有有限数量的情况(直行、跟车和到跟着车辆或行人)仅使用很少的规则就可以进行评估,而且还注意到时间效率问题。

Gindele等人(2015)使用部分可观测马尔可夫决策过程(POMDP)处理交通环境的简化模型,并为其他交通参与者做出准确预测。他们可以预测未来在交叉口环境下6秒左右的运动,而且他们的技术可以很好地响应有噪声的传感器,允许长期预测。然而无法在线学习能力,因此,适应新的交通状况可能很困难。

基于交通环境建模以障碍预测和决策为重点的规划

Furda和Vlacic(2011)使用多准则决策(MCDM)和确定性有限自动机(DFA)来驱动操纵执行。输入来自先验已知的数据、传感器测量和车辆通信。交通规则和驾驶过程中的目标层次结构被考虑用于决策(即道路边界内的运动、安全距离、避免碰撞和最小化等待时间)。该方法需要在决策过程中为每个目标提供精确的信息和手动指定的权重。

在Hardy和Campbell(2013)中,根据动态障碍物的预测运动和静态障碍物的存在来构建驾驶走廊。车辆被建模为矩形;它们的轨迹被聚集以便于识别,冲突的轨迹用于估计每一时刻的风险。在这项工作中,规划被视为一个非线性约束优化问题。要优化的函数包括静态和动态障碍物、可能的碰撞和到目标的距离。考虑了单个障碍物和多个障碍物,但根据障碍物的数量和忽略的车辆之间的相互作用,修建驾驶走廊会线性地增加计算工作量(如自动驾驶实时路径规划算法简介(RRT 和Lattice Planner)所述)。

Ziegler等人也采用了类似的方法。(2014b)其中分层并发状态机用于静态和动态障碍,以及生成和合并规则。为了使车辆在旅途中的每一部分都有最佳的自由空间,同时避免碰撞,还指示了驾驶走廊。然而,这种技术的主要缺点是,假定其他车辆不加速,并且与道路边界保持安全距离。

Kala和Warwick(2013)考虑相对非结构化道路环境。他们假设没有道路车道,而且大部分交通参与者都是非自动驾驶的,车辆之间没有通信。在每一时刻,车辆都应该根据附近车辆的运动来显示一定的行为。障碍物避免、在道路/车道中心行驶、车道变化、超车和超车、减速、发现冲突行为和直线行驶是预先设计的行为。距离和速度约束用于在线分类不同的行为。但这种方式仅对无限长直线道路进行研究,结果表明,在曲线道路上中心恒定或超车等情况下,车辆决策存在滞后性。快速、正确地识别道路使用者之间的冲突行为是这种方法的另一个缺点。

Wei等人采用了基于预测和成本函数(PCB)的方法。(2014年)。利用参考轨迹,以及静态和动态障碍物作为输入,生成多个候选轨迹,并在预测交通环境演变后,根据舒适性、安全性、油耗和朝目标前进的进度选择最佳策略。考虑了车辆在其他车辆附近的运动,并对控制器的反应和时滞进行了仿真,以获得更好的性能。通过仿真和道路试验验证了该方法的有效性,与时空网格规划器相比,该方法计算量减少了90%。但是,只考虑单车道行为。

White and White(1989)采用马尔可夫决策过程(MDP)来估计车辆的最佳操纵,MDP包括一组假定的在不确定条件下执行的动作,并试图使每个动作的总回报或权重最大化。mdp在状态空间中工作,试图确定一个规则,该规则描述从一个状态到另一个状态的操作决策。

与mdp不同,mdp假设状态是完全可观测的,部分可观测的马尔可夫决策过程(POMDPs)假设机器人或车辆的状态未知(Ong等人,2010)。因此,POMDPs将状态空间转换为一个信念空间,其中包含了被建模系统的每个可能状态的所有可能概率分布。但是,如果已知车辆状态的某些特征(例如,方向已知,但位置未知),则我们指的是混合观测MDP或MOMDP(Ong等人,2010年)。

在Bandyopadhayy等人的工作中。(2012)在规划中嵌入了对交通参与者的意图预测。一种离散混合可观测性马尔可夫决策过程(MOMDP)对自动驾驶车辆与行人之间的交互作用进行建模,同时对行人的意图进行预测。自动驾驶车辆对行人的预测行为包括:“合理但分心”、“忘却”、“不耐烦”和“机会主义驾驶”。这个实验是通过模拟和真实世界的高尔夫球车进行的;其中假设行人的位置和速度信息是完全已知的。此外,不是同时处理一组行人,而是分别计算每个行人的MOMDP,并且假设意图不会随时间而改变。最后,实验结果只有一半的行为被考虑在内。

与之前的研究相反,布莱希特尔等人。(2014)实施连续的部分可观测MDP,假设信念状态无限大,因为驾驶是一个连续的空间问题。输入是假定已知的交通参与者的位置和速度。合并场景是模拟的,在这种情况下,由于一辆假想的非法停放的汽车,ego车辆遮挡了视线。拥有一个连续的信念空间可能会导致需要大量的样本来进行自动驾驶的决策。如此大量的样本可能会导致大量的计算工作,同时也会增加决策的密切要求的数量。

博弈论也被研究者用来考虑车辆之间的相互作用。例如,Aoude等人。(2010a)研究交叉口环境,并尝试在交通参与者之间形成一个完美的信息博弈。如果发生碰撞,每一个游戏都会终止,每辆车都会尽量缩短碰撞时间,而其他所有车辆则扮演“敌人”的角色,试图将时间减至最少。然后,将该威胁评估模型嵌入到一个类似RRT的全局规划器中,生成要遵循的路径。该方法的实时能力通过对两辆最高速度为0.5 m/s的模型车进行的评估提供。

在Martin(2013)的工作中遵循了同样的博弈论概念,同样,一个完美的信息博弈被用来预测其他车辆在高速公路上的运动规划。对于要由电动汽车轴心化的支付功能,位置、速度和加速度作为输入;使用包括直线行驶以及左或右车道变换的操纵装置,产生最佳可能的操纵作为输出。假设道路是无限直的,并在交通场景中使用最多4辆车进行模拟。

总结比较

下表总结了强调障碍预测和决策的规划方法

WeChat Image_20210325095040.jpg

机动规划在很大程度上依赖于其他交通参与者在做出决策和估计某种情况下的风险的相对位置。根据Ward等人的建议,可以使用诸如

碰撞时间(TTC)等风险指标进行风险估计

概率缺口接受模型,由Lefèvre(2012)提出,

形成态势评估并选择最佳机动作为决策理论问题(使用马尔可夫决策过程或博弈论原理)。

采用以上方法在障碍物预测和风险评估中,提供了更准确的结果,但规划中往往忽略了上下文,并且在预测自主车辆附近障碍物的运动时可能会产生沉重的计算负担。决策理论方法能很好地应对环境,并能为诸如通过交叉口(例如在城市或郊区环境中)或遵守高速公路上的操纵等问题提供解决方案。

参考文献:

1,Real-time motion planning methods for autonomous on-road driving: State-of-the-art and future research directions -Christos Katrakazas a , Mohammed Quddus a,⇑ , Wen-Hua Chen b,1 , Lipika Deka a

2,Partial Motion Planning Framework for Reactive Planning Within Dynamic Environments

3,Self-driving car: Path planning to maneuver the traffic- Jonathan Hui.

文中部分图片版权归其所有

*未经准许严禁转载和摘录

作者:Pirate Jack
来源:https://mp.weixin.qq.com/s/KE-BPG82-DDRlnf7B6X4qg
Vehicle微信公众号
qrcode_VehicleEngineering_1.jpg

相关文章推荐

更多汽车行业干货请关注Vehicle专栏。
推荐阅读
关注数
10742
内容数
181
做汽车行业内最有价值的干货内容提供者
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息