論文鏈接:https://arxiv.org/pdf/2401.06305.pdf
論文題目:用于自動駕駛最優(yōu)間距選擇和速度規(guī)劃的多配置二次規(guī)劃(MPQP)
1 摘要
本文介紹了用于自動駕駛最優(yōu)間距選擇和速度規(guī)劃的多配置二次規(guī)劃(MPQP)。平滑且安全的路徑規(guī)劃對于自動駕駛汽車的成功部署是至關重要的。本文提出了一種用于自動駕駛最優(yōu)速度規(guī)劃的數(shù)學表示,其在具有實際約束的高保真度的仿真和現(xiàn)實道路演示中得以驗證。該算法使用廣度優(yōu)先搜索來探索時間和空間域中內(nèi)部交通間距。對于每個間距,二次規(guī)劃找到一個最佳速度曲線,將時間和空間對與動態(tài)障礙物同步。通過對Carla算法的定性和定量分析,討論了該算法的光滑性和魯棒性。最后,本文給出了城市駕駛的道路演示結(jié)果。
2 Introduction
背景
:軌跡規(guī)劃一直是自動駕駛領域研究的熱點,雖然傳統(tǒng)規(guī)劃算法存在了很久[1][2],要求在高度動態(tài)和不確定的場景中高效、精確、平穩(wěn)地導航。在安全性至關重要的情況下,促使研究人員探索現(xiàn)有算法的局限性,優(yōu)先考慮經(jīng)常相互沖突的目標[3][4][5]。因為可解釋性和理論保證,MPC和二次規(guī)劃QP等形式優(yōu)化方法仍然是自動駕駛軌跡規(guī)劃和控制任務的熱門選擇[6][7]。
存在動態(tài)和不確定智能體的運動規(guī)劃會導致非凸問題[8][9]。這些可能是(1)求解緩慢,限制了解決方案的最優(yōu)性或時間范圍 (2)使用陷入局部最優(yōu)的近似,導致不穩(wěn)定或其他不期望的軌跡[10]。因此,路徑和速度分解方法已經(jīng)被積極采用,以減輕規(guī)劃子任務的復雜性[8][11][12][13]。通過將路徑規(guī)劃問題與速度規(guī)劃問題解耦,我們可以限制優(yōu)化空間,從而獲得更快的高質(zhì)量解決方案。
近年來,一直在努力改進分解方法[12][15],特別是對于自動駕駛ST圖[16][17]的應用。一直是一個熱門的選擇,細化下限和上限,從而減少搜索空間。ST圖還有助于解決動態(tài)障礙物及其相關的排序問題[18],見下圖。
上圖所示,車輛的動機:存在自車(綠色)沿著汽車123交叉時刻一起穿過交叉路口的多個時刻選擇。精確同步時間和距離以及選擇最佳間隙是安全機動的關鍵。
雖然ST圖簡化了問題,但時間和空間的同步仍然具有挑戰(zhàn)性[19]。為了解決這個問題,作者在[13]中添加了同步時間作為決策變量,并使用QP迭代近似解決了非凸問題。然而,迭代過程中通常計算量很大,有可能近似導致局部最優(yōu)[20]。類似地,作者在[16]中采用ST圖并將非凸問題近似為QP,但在空間域中求解它便于基于位置的速度限制的積分(例如對于彎曲路徑)。然而,空間域中的規(guī)劃不能無縫地考慮0速度,因為他們導致時間評估無窮大[21],這在走走停停地場景中是有問題的。在[22][17]中,作者應用動態(tài)規(guī)劃DP直接優(yōu)化ST圖上的非凸問題。然而,DP通常受到維數(shù)災難的影響,因此通常在狀態(tài)和控制輸入的數(shù)量上受到限制。自定義[22]和啟發(fā)式解決方案[17](例如,使用螺旋曲線插值[22])對于實時實現(xiàn)是不可避免的,而狀態(tài)和控制的數(shù)量仍然有限。總而言之,現(xiàn)有方法是有前途并且符合數(shù)學的,但還沒有嚴格解決設計速度規(guī)劃器的方法:(1)在時間空間中搜索解(2)在沒有近似的情況下確保全局最優(yōu)性(3)在沒有并行計算的情況下具有高計算效率(4)解決沿著動態(tài)障礙空間與時間同步。重要的是,在各種場景中進行徹底的驗證,在學術文獻中經(jīng)常缺失,在自動化車輛中部署方法之前是必不可少的。
所以,探討一個嚴格的速度規(guī)劃設計方法,通過在路徑-速度分解方案下的最優(yōu)速度規(guī)劃中包含collective efforts。
我們采用了時空ST圖的上下界進行細化,而細化是沿著時間的步驟進行的。允許將下限和上限直接且有效地集成到QP中。QP作為凸優(yōu)化,產(chǎn)生確保舒適性和安全性的全局最優(yōu)解。雖然魯棒,但硬約束通常會導致過于保守的行為(如果不是不可行的解決方案),使實時系統(tǒng)無法采取行動。我們選擇結(jié)合硬約束和軟約束用來產(chǎn)生在動態(tài)適應當前場景的復雜性的同時保證安全的行為。
本文主要貢獻
(1)本文探索了與動態(tài)障礙物相關的空間和時間場景的多種組合;
(2)優(yōu)化探索場景的速度曲線。重要的是,構想仍在時間域,解決凸優(yōu)化中的時空同步;
(3)本文還引入了將橫向加速度限制與上一個給定路徑上的曲率結(jié)合的技術;
(4)本文在仿真和道路測試中對所提出的框架進行大量驗證。
3 時空ST圖的構造與范圍初始化
3.1 概述
本節(jié)詳細介紹了該算法,該算法依次(1)生成ST圖(2)找到交通代理之間相對于自車的通行順序(我們稱之為“配置文件”)(3)獲得與每個配置文件相關聯(lián)的上下限。我們假設知道當前的狀態(tài)、要遵循的路徑以及對其他流量的預測。
為了說明該算法,參見下圖。
T形連接場景(左上)、相應的ST圖(中上部)和ST單元規(guī)劃器(右上)。ST Cell Planner還顯示了使用廣度優(yōu)先搜索算法(BFS)找到的可能路徑。下圖顯示了ST圖中找到的可行路徑和不可行路徑。
給定自車的路徑(黃色),對其他交通的預測(具有恒定速度預測)表明自車與三輛車(1號車、2號車和3號車)相交。車輛的形狀是一個多邊形,我們畫一個(時間t,距離s)的軌跡。因此,ST圖。作為ST圖的一個實例,頂部中心的圖傳達了:車輛1當前與路徑相交,并將沿著路徑行駛;車輛2以較低的速度接近,并將在稍后的時間并入路徑;車輛3最接近本車輛,并將以非常低的速度穿過路徑。ST Cell Planner然后分割連續(xù)ST圖并找到“活細胞”(表示離散化的可行空間)。在分割內(nèi),寬度優(yōu)先搜索(BFS)找到關于自車的通行順序的可能情況(即,profile)。給定輪廓,考慮運動學限制(左下圖中的綠色空間)生成相關的下限和上限。
當存在多個輪廓時,相對于QP的最小成本選擇最佳的曲線。注意,配置文件是相互獨立的,因此適用于并行計算。
3.2 ST圖的構造
與[22],[16]中的先前努力一致,ST圖的構造是MPQP的重要步驟,因為它是在后續(xù)步驟中確定二次規(guī)劃的可行空間的基礎。
對于每個代理,我們根據(jù)其尺寸和預測位置計算多邊形。該多邊形可以通過參數(shù)化的邊緣或不確定性度量(例如,噪聲、風險或預測噪聲)。如果多邊形與本車的路徑相交,則在ST圖上標記相交區(qū)域(時間和距離)。注意ST圖在Frenet框架[23]中,因此我們將相交區(qū)域轉(zhuǎn)換為Frenet框架1。畢竟,每個代理都表示為(時間,距離)坐標中的兩條線段。請注意,這些線可以移動以考慮安全裕度。
3.3 活細胞生成
“活細胞”表示ST圖中的可行集,不包括由其他代理占用的空間(由“占用的細胞”表示)。在每個時間段,單元由距離s的邊界定義,即,cell = {
s
m
i
n
s_{min}
smin?,
s
m
a
x
s_{max}
smax?}。為了簡潔起見,將分割和細胞生成的算法稱為“Cell Planner”。Cell Planner首先識別在每個時間段與每個代理相關聯(lián)的占用小區(qū)。可能存在多個被占用的小區(qū)。如果被占用的單元格重疊,則將它們合并。然后發(fā)現(xiàn)活細胞作為被占據(jù)細胞的互補組。例如,在t = 2的時間段,假設存在三個車輛(即三個被占用的單元格):
3.4 搜索輪廓
采用BFS [24]來發(fā)現(xiàn)ST圖中可能的輪廓。搜索過程如下:
(1)從原點出發(fā),時間向前邁進一步。
(2)如果細胞與上一步驟中的任何活細胞重疊,則擴展每個活細胞的圖譜。
(3)否則,終止并丟棄配置文件。
(4)如果時間步到達終點(即,計劃范圍),返回所有有效的配置文件。
步驟2表明在每個時間步中可以連接多個活細胞(參見圖2中的右上圖)。如果在原點不存在活細胞,則ST圖不可遍歷,因此不存在曲線。
3.5 整合到QP
構建ST圖最終是為了促進底層的速度優(yōu)化。三種技術:
(1)分割的ST圖的等效時間步長(0.1秒)的QP。這是直接的,同時在同步路徑和速度方面非常有效。
(2)通過連接每個時間步活細胞的下端來生成每個曲線的下限。類似地,通過連接活細胞的上端來生成上限。
(3)后過濾所有有效的配置文件與運動學限制(在速度,加速度和加加速度)。這有助于減少輪廓的數(shù)量,并確保(縱向)運動限制。
根據(jù)步長大小,整個過程可能在計算上是昂貴的。然而,處理第II-D節(jié)和第II-E節(jié)中的每個輪廓是完全可分離的,因此并行計算解決了這個問題。所得到的輪廓由具有同步時間的一對邊界表示。可以無縫集成到QP中。
4 優(yōu)化問題
給定從ST圖獲得的分段線性邊界,我們用公式表示二次規(guī)劃[20],優(yōu)化速度,保證安全。
(1)系統(tǒng)動力學:狀態(tài)包括由[p,v,a]表示的[距離,速度,加速度],并且控制是加加速度j。目標是沿著縱向方向沿著找到最佳速度曲線,因此我們利用簡化的縱向動力學:
對于增廣變量x = [p,v,a,j],我們將動力學寫成緊湊形式:
其中f(.)是線性映射
4.1 目標函數(shù)
目的是提高乘客的舒適度,減少旅行時間。形式上,目標函數(shù)F為:
F
=
1
2
x
T
H
x
+
x
T
h
F=\frac{1}{2}x^THx+x^Th
F=21?xTHx+xTh
其中,
H
∈
R
d
i
m
(
x
)
?
d
i
m
(
x
)
H\in R^{dim(x)*dim(x)}
H∈Rdim(x)?dim(x)是對角矩陣,權重
w
a
w_a
wa?施加在加速度上(對于所有
t
∈
[
0
,
.
.
.
,
N
?
2
]
)
t ∈ [0,...,N-2])
t∈[0,...,N?2]),
w
j
w_j
wj?施加在jerk上(對于所有t ∈ [0,…,N-3]),在其他地方它都是零。矢量h對于除了在t = N處的最終位移之外的所有元素具有零值(即
p
(
N
)
p(N)
p(N)),其被設置為
?
w
f
-w_f
?wf?(
w
f
>
0
w_f > 0
wf?>0)以促進相對于初始位置的大位移(即,更短的運行時間)。
4.2 約束
有兩種類型的約束:
(1)初始條件(2)下限和上限。
最初的條件是:
其中
p
0
p_0
p0?和
v
0
v_0
v0?表示在當前時間測量的位移和速度。在緊湊的形式中,可以用增廣變量x重寫它,即
x
(
0
)
=
x
0
x(0)=x_0
x(0)=x0?
回想一下,下界和上界是從第II-B節(jié)的ST圖中得到的,因此它們是已知的。相應的不等式約束如下:
注意,下限和上限可以通過自定義余量選擇(例如參數(shù))進行設計,這可能會導致不可行性問題。詳情見第III-D節(jié)。
4.3 完整的問題
完整的優(yōu)化問題如下:
注意,這是沒有任何(迭代)近似的QP的通用形式,保留了良好的凸優(yōu)化屬性[20],例如,最優(yōu)性和收斂速度。
4.4 松弛問題的軟約束
不等式約束(11)可以根據(jù)所構造的ST圖而被違反,從而導致不可行解決的問題。示例包括(1)兩個預測的代理軌跡重疊,導致規(guī)劃范圍內(nèi)不存在可行的區(qū)域(2)自車初始位置在可行的區(qū)域外。
不可行的解決方案可能會導致不穩(wěn)定和不舒服的操縱(取決于不可行解決方案的預定義操作)。
一個廣受歡迎的解決方案是通過放松約束來重新表述問題,使問題變成軟約束。我們?yōu)槊總€邊界添加一個松弛變量(即,
S
l
b
S_{lb}
Slb?和
S
u
b
S_{ub}
Sub?),并懲罰目標函數(shù)中的非零松弛變量?,F(xiàn)在的問題是:
其中,
w
b
w_b
wb?表示邊界松弛變量上的懲罰權重。注意,松弛變量對于所有t都是時態(tài)的,只有非零值才會被懲罰。此外,松弛變量是有界的(通過
s
m
a
x
l
b
s_{max lb}
smaxlb?和
s
m
a
x
u
b
s_{max ub}
smaxub?),以確保安全性。下圖展示了一個簡單的T型連接場景的軟邊界。
圖三.T型交叉口場景,2個agents(1966年的汽車為灰色,1967年的汽車為暗紅色)。硬約束可以在純色填充中看到,軟約束可以在半透明顏色填充中看到。
4.5 施加橫向加速度限制的漏斗技術
縱向速度規(guī)劃的一個警告是,它忽略了與給定路徑相關的橫向加速度和相關運動學限制。然而,直接評估橫向加速度會導致問題非凸,從而導致解決更高的復雜性問題[16],[13]。我們介紹了一種容易實現(xiàn)但有效的方法:漏斗技術。
給定路徑,我們計算每個位置步長s處的曲率K。對于參數(shù)橫向加速度限制a,相關的速度限制為:
利用參數(shù)預瞄距離
L
L
L,
v
l
v_l
vl?被設置為
v
s
v_s
vs?的最小值,即
v
∈
m
i
n
(
v
s
,
v
m
a
x
)
v \in min(v_s,v_{max})
v∈min(vs?,vmax?),
v
l
v_l
vl? ∈ {0,…,L},其中
v
m
a
x
v_{max}
vmax?是交通速度限制。然而,速度限制
v
l
v_l
vl?不能立即用于上界等式11中的QP中的速度。因為如果當前速度高于
v
l
v_l
vl?,則QP變得不可行。相反,通過以固定速率線性下降,上限從交通速度限制下降到v。請注意,高的遞減率可能會過度收緊上界(這反過來又限制了可行集)。我們發(fā)現(xiàn),最小加速度的一半,即
?
a
m
i
n
2
-\frac{a_{min}}{2}
?2amin??,是一個舒適的速度。
5 驗證
5.1 仿真概述
我們將CARLA [25]用于高保真仿真環(huán)境,該環(huán)境已被廣泛用于驗證自動駕駛研究。使用CARLA內(nèi)置的模擬生成平臺“scenario runner”生成場景。
用四種不同的場景來測試MPQP:
(1)高速公路合并
自車在坡道上啟動并并入車道,目標車道上的其他車輛快速行駛,其對自車讓步行為具有隨機性
(2)T型交叉口
自車在不受保護的情況下左轉(zhuǎn),同時保持行人的安全。
(3)四路交叉口
自車左轉(zhuǎn)。增加的復雜性是由于從相反方向接近的額外車輛。
(4)密集交通中的車道變換
目標是變道進入密集的交通,以避免緊急車輛停在前面。不存在用于本車輛在不與其它汽車相互作用的情況下合并的安全空間(即,沒有其他車輛的配合)。
如下圖所示,每個場景都有不同的道路結(jié)構、目標車道和交通參與者。
四種不同場景的模擬結(jié)果。每個場景的結(jié)果是50次運行。身份系統(tǒng)用于所有四種場景,以及位置和駕駛行為(例如,目標速度)在每次運行中隨機初始化。如果發(fā)生碰撞或達到時間限制(80秒),則運行停止。
這組場景及其固有的挑戰(zhàn)評估所提出的算法的一般性能。注意,我們對所有場景使用相同的算法,而位置和駕駛行為(例如,目標速度)在每次運行中隨機初始化。其他車輛被建模為智能駕駛員模型(IDM)[26],并進行了一些修改以檢測相鄰車道中的自我車輛。讓道行為根據(jù)預設的伯努利參數(shù)觸發(fā)。有興趣的讀者可以參考[5]了解詳情??偟膩碚f,這些車輛被設計成具有攻擊性,以挑戰(zhàn)我們的算法。智能體的行為模型是車道跟隨(除了隨機改變方向)和交通不改變車道。
MPQP的處理時間平均為20毫秒,配備英特爾?酷睿? i912900 H和32 GB RAM的筆記本電腦上的最大時間周期為84毫秒。此處理時間包括所有上述步驟:(1)ST圖構建(使用ClipperLib [27])(2)ST單元規(guī)劃(3)二次編程(使用qpOASES [28])。當規(guī)劃的軌跡被發(fā)送到底層控制器時,MPQP找到新的解決方案。計劃范圍設定為10秒(低速情況)和15秒(高速情況)。這表明MPQP適用于實時系統(tǒng)的強大潛力,即使有一個相對較長的規(guī)劃范圍。
5.2 仿真結(jié)果
我們首先研究了MPQP在四路交叉口場景中的表現(xiàn),與圖1中的激勵示例一致。與激勵性的例子不同,自車左轉(zhuǎn)與意外的行人交叉互動。MPQP的一般行為被觀察為:(1)自車接近交叉口(2)自車保持停止,直到迎面而來的車輛穿過。下圖所示自我車輛緩慢巡航,直到迎面而來的汽車穿過交叉口。(3)如果合并車道上的汽車(圖5中的汽車264)不減速,則自我車輛減速并等待。否則,它繼續(xù)。(4)在完成轉(zhuǎn)彎時,一個行人突然穿過道路,MPQP等待。根據(jù)流量的初始位置和攻擊性,行為可能會有所不同,但是,MPQP始終確保安全和成功的合并。
現(xiàn)在,我們將我們的分析擴展到上述四個場景:高速公路合并,T型交叉口,四路交叉口和車道變換。表I列出了隨機初始化重復50次的每個場景的總體性能總的來說,MPQP成功地完成了所有場景,沒有沖突或超時。注意,MPQP并不事先知道將運行什么場景以及流量基于什么行為模型。也就是說,MPQP展示了一種能力的概括性沒有情境知識和存在的不確定性。
結(jié)果中的一些觀察結(jié)果:(1)T型交叉口場景在制動器上的平均值高于高速公路(高速公路具有更高的速度吞吐量),由交通的不確定的行為變化的T型路口的情況下解釋。由于車輛在合流點處突然加速,本車不得不強力減速以保證安全。事實上,在四路場景中觀察到相同的行為,然而,由于密度導致較不積極的制動和急動,平均速度要低得多。(2)自我車輛傾向于在密集交通中更平穩(wěn)和更慢地行駛以進行車道變換,等待它們的合作(即,為自我車輛騰出空間)(3)自車往往是更保守的T型路口和四路的情況下,存在優(yōu)先級之間的交通參與者。行人和迎面而來的汽車(特別是在T形路口的情況下)優(yōu)先。因此,自車傾向于防御性的,并且只有在汽車明顯地給自車讓路或者如果安全性得到保證(例如,無車輛),整體行為與經(jīng)驗豐富的人類駕駛員保持一致,他們在防御性和不太保守之間保持平衡。
5.3 道路測試
雖然仿真有效地評估了MPQP的一般性能,但仍然存在模擬到真實的差距。也就是說,其他車輛的行為模型通常不能正確地表示其他駕駛員的決策過程。仿真環(huán)境不能精確地表示定位和感知噪聲。使用不同的控制器,并且在物理和系統(tǒng)定時方面存在變化。因此,我們于2023年7月在日本Joso市的現(xiàn)實世界城市課程中擴展了我們的驗證。
課程包括幾個駕駛場景,包括4路交叉口(上圖中的快照),T型交叉口和車道變換。公眾參與者的反饋普遍是積極的。參與者提到乘坐非常平穩(wěn),用戶舒適度良好。一些用戶表示,擁擠的十字路口即使對人類司機來說也感覺很復雜。一些參與者表示,一些操作,比如變道和繞過停著的汽車,感覺有點危險,但表示他們對自動駕駛系統(tǒng)有信心。文章來源:http://www.zghlxwxcb.cn/news/detail-806343.html
6 總結(jié)
受到路徑-速度分解方法有效性的啟發(fā),本文提供了一個數(shù)學框架來最優(yōu)地規(guī)劃自動駕駛汽車的速度配置,即MPQP。給定一條路徑,當存在動態(tài)目標時,我們利用廣度優(yōu)先搜索算法來尋找跟隨路徑的時序組合。然后,將每個配置作為下限和上限集成到二次規(guī)劃中。該表示和實現(xiàn)在計算方面是高效的,能夠為10s以上的規(guī)劃范圍在平均20ms內(nèi)提供一個新的解決方案。CARLA中的仿真結(jié)果證明了MPQP的強大潛力,隨后進行了實車演示。一個注意點是,這項工作依賴于對交通的確定性預測,這阻礙了產(chǎn)生交互行為的能力。此外,處理多模態(tài)預測中的不確定性將是未來的研究工作。文章來源地址http://www.zghlxwxcb.cn/news/detail-806343.html
到了這里,關于用于自動駕駛最優(yōu)間距選擇和速度規(guī)劃的多配置二次規(guī)劃(MPQP) 論文閱讀的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!