感知系統(tǒng)基本介紹
Perception(感知)系統(tǒng)是以多種傳感器的數(shù)據(jù)與高精度地圖的信息作為輸入,經(jīng)過一系列的計算及處理,對自動駕駛車的周圍環(huán)境精確感知的系統(tǒng)。
它能夠為下游模塊提供豐富的信息,包括障礙物的位置、形狀、類別及速度信息,也包括對一些特殊場景的語義理解(例如施工區(qū)域,交通信號燈及交通路牌等)。
感知系統(tǒng)的構(gòu)成與子系統(tǒng)
傳感器: 涉及到傳感器的安裝,視場角,探測距離,數(shù)據(jù)吞吐,標定精度,時間同步等。因為自動駕駛使用的傳感器比較多,時間同步的解決方案至關(guān)重要。
目標檢測及分類: 為了保證自動駕駛的安全,感知系統(tǒng)需要達到近似百分之百的召回率及非常高的準確率。目標檢測及分類往往會涉及到深度學(xué)習方面的工作,包括3D點云及2D Image(圖片)上的物體檢測及多傳感器深度融合等。
多目標追蹤: 跟進多幀的信息計算并預(yù)測障礙物的運動軌跡。
場景理解: 包括交通信號燈,路牌,施工區(qū)域,以及特殊類別,比如校車,警車。
機器學(xué)習分布式訓(xùn)練基礎(chǔ)架構(gòu)及相關(guān)評價系統(tǒng)
數(shù)據(jù): 大量的標注數(shù)據(jù),這里包括3D點云數(shù)據(jù)及2D的圖片數(shù)據(jù)等。
傳感器詳解
目前自動駕駛應(yīng)用的傳感器主要分為三類:激光雷達(LiDAR),相機(Camera),毫米波雷達(Radar)。
開頭提到,感知系統(tǒng)的輸入為多種傳感器數(shù)據(jù)和高精地圖,而上圖展示了感知系統(tǒng)物體檢測的輸出結(jié)果,即能夠檢測車輛周圍的障礙物,如車輛、行人、自行車等,同時結(jié)合高精度地圖,感知系統(tǒng)也會對周邊的Background(環(huán)境背景)信息進行輸出。
如上圖所示,綠顏色的塊狀代表一輛乘用車,橙色代表一輛摩托車,黃色代表一位行人,灰色則是檢測到的環(huán)境信息,如植被。
感知系統(tǒng)結(jié)合多幀的信息,還能對運動的行人和車輛的速度、方向、軌跡預(yù)測等進行精確的輸出。
傳感器配置
與多傳感器深度融合
了解了關(guān)于感知系統(tǒng)從輸入到輸出的大致介紹,接下來,我簡要介紹一下小馬智行第三代自動駕駛系統(tǒng)PonyAlpha的傳感器安裝方案以及多傳感器深度融合的解決方案。
傳感器安裝方案
目前PonyAlpha傳感器安裝方案的感知距離能夠覆蓋車周360度、范圍200米以內(nèi)。
具體來看,這套方案用到了3個激光雷達,在車的頂部和兩側(cè)。同時,通過多個廣角的攝像頭來覆蓋360度的視野。遠處的視野方面,前向的毫米波雷達以及長焦相機將感知距離擴到200米的范圍,使其可以探測到更遠處的物體信息。這套傳感器配置能保證我們的自動駕駛車輛在居民區(qū)、商業(yè)區(qū)、工業(yè)區(qū)這樣的場景進行自動駕駛。
多傳感器深度融合解決方案
多傳感器深度融合的基礎(chǔ)
多傳感器深度融合的方案首要解決的是將不同的傳感器的數(shù)據(jù)標定到同一個坐標系里,包括了相機的內(nèi)參標定,激光雷達到相機的外參標定,毫米波雷達到GPS的外參標定等等。
傳感器融合重要前提是使標定精度達到到極高水平,不論對于結(jié)果層面的傳感器融合還是元數(shù)據(jù)層面的傳感器融合,這都是必要的基礎(chǔ)。
通過上圖你會發(fā)現(xiàn),我們的感知系統(tǒng)將3D的激光點云精準地投射到影像上,可見傳感器標定的精度是足夠高的。
不同傳感器的標定方案
整個傳感器標定的工作基本上已做到完全自動化的方式。
首先是 相機內(nèi)參的標定 (上圖) ,這是為了修正由相機自身特性導(dǎo)致的圖像扭曲等。相機內(nèi)參的標定平臺使每一個相機能夠在兩到三分鐘之內(nèi)完成傳感器的標定。
其次是 激光雷達與GPS/IMU的外參標定(上圖) ,激光雷達的原始數(shù)據(jù)是基于雷達坐標系,因此我們需要將點由雷達坐標系轉(zhuǎn)換為世界坐標系,這就涉及到激光雷達與GPS/IMU相對位置關(guān)系的計算。我們的標定工具在室外通過優(yōu)化的方案,能夠快速找到最優(yōu)的位置關(guān)系。
第三是 相機到激光雷達的融合(上圖) 。激光雷達的感知環(huán)境是360度旋轉(zhuǎn)的方式,每旋轉(zhuǎn)一周是100毫秒,而相機是某一瞬時曝光,為了保證相機的曝光與激光雷達的旋轉(zhuǎn)保證同步,需要對二者進行時間同步,即通過Lidar來觸發(fā)相機曝光。比如說,可以通過激光雷達的位置信息來觸發(fā)對應(yīng)位置相機的曝光時間,以達到相機與激光雷達的精確同步。
3D(激光雷達)和2D(相機)彼此互補,二者更好的融合可使得感知得到更精確的輸出。
最后是 毫米波雷達(Radar)與GPS/IMU的標定(上圖) ,同樣是將Radar數(shù)據(jù)由Local(本地)坐標系將其轉(zhuǎn)換到世界坐標系,我們將通過真實的3D環(huán)境來計算Radar與GPS/IMU的相對位置關(guān)系。好的標定結(jié)果能夠保證感知系統(tǒng)給出200米距離以內(nèi)障礙車的車道信息(如位于車道內(nèi)或壓車道線等)等。
車載感知系統(tǒng)架構(gòu)
那么車載感知系統(tǒng)架構(gòu)是什么樣的?它的解決方案又是什么?
上圖展示了整個車載感知系統(tǒng)的架構(gòu)。首先激光雷達、相機、毫米波雷達三種傳感器數(shù)據(jù)須進行時間同步,將所有的時間誤差控制在毫秒級。結(jié)合傳感器數(shù)據(jù),感知系統(tǒng)以幀為基礎(chǔ)(frame-based)進行檢測(detection)、分割(segmentation)、分類(classification)等計算,最后利用多幀信息進行多目標跟蹤,將相關(guān)結(jié)果輸出。這個過程中將涉及到多傳感器深度融合和深度學(xué)習相關(guān)的技術(shù)細節(jié),我這里不做過多的討論。
感知系統(tǒng)的解決方案應(yīng)保證以下五點:
◆ 首先是安全,保證近乎百分之百的檢測(Detection)召回率(Recall)。
◆ 精度(Precision)要求非常高,如果低于某個閾值,造成False Positive(誤報),會導(dǎo)致車輛在自動駕駛狀態(tài)下行駛得非常不舒適。
◆ 盡量輸出所有對行車有幫助的信息,包括路牌,交通信號燈及其它場景理解的信息。
**◆ **保證感知系統(tǒng)的高效運行,能夠近實時處理大量的傳感器數(shù)據(jù)。
**◆ **可擴展性(Scalability)也很重要。深度學(xué)習(Deep learning)依賴大量數(shù)據(jù),其訓(xùn)練模型的泛化能力對于感知系統(tǒng)非常重要。未來,我們希望模型(model)和新算法有能力適配更多的城市和國家的路況。
感知技術(shù)的挑戰(zhàn)
感知精度與召回率相平衡的挑戰(zhàn)
通過3D點云數(shù)據(jù)(上圖),能夠看到此時對應(yīng)的感知原始數(shù)據(jù)。
這里挑戰(zhàn)是,經(jīng)過計算處理后,感知系統(tǒng)需要在這樣環(huán)境下輸出所有障礙物的正確的分割(segmentation)結(jié)果和障礙物類別。
除了繁忙的十字路口,感知系統(tǒng)在處理一些特殊的或者惡劣的天氣條件,也面臨不小挑戰(zhàn)。
-
傳感器
+關(guān)注
關(guān)注
2553文章
51407瀏覽量
756657 -
感知系統(tǒng)
+關(guān)注
關(guān)注
1文章
72瀏覽量
15996 -
自動駕駛
+關(guān)注
關(guān)注
785文章
13932瀏覽量
167017
發(fā)布評論請先 登錄
相關(guān)推薦
評論