摘要:現代汽車融合了越來越多的駕駛輔助功能,其中包括車道保持功能。該功能可以讓汽車正確定位在車道線內,這對于完全自動駕駛汽車中車道偏離或軌跡規劃決策有很重要的意義。傳統車道檢測方法依賴于高度專業的手工特征標記和后處理啟發式算法的組合,這些技術計算昂貴,并且由于道路現場變化而易于擴展。最近有研究利用深度學習模型來進行像素級車道分割訓練,也可以用于圖像由于較大的接收范圍而沒有標記的情況。盡管有其優點,但這些方法僅限于檢測預和定義固定數量的車道,并且不能應對車道變化。
在本文中,我們超越了上述限制,提出將車道檢測問題看作一個實例分割問題(其中每個車道都形成自己的實例)可以進行端到端的訓練。為了在裝配車道前對分段的車道實例進行參數化,我們應用了一個以圖像為條件的學習透視變換(不適用于固定的“鳥瞰”變換),這樣,我們確保了一種對道路變化具有魯棒性的車道匹配,不像現有的方法,依靠固定、預定義轉換的方法。總之,我們提出了一種快速車道檢測算法,運行速度為50幀/秒,可以處理不同數量的車道并應對車道變化。我們在tuSimple數據集上驗證了我們的方法并獲得了不錯的結果。
本文作者Davy Neevn是魯汶大學博士研究生,魯汶大學是比利時久負盛名的最高學府,歐洲歷史最悠久且最受人尊敬的大學之一,也是享譽全球的世界級頂尖研究型大學。Davy Neevn近幾年一直在從事語義分割、場景理解、實例分割等課題的研究。
傳統車道線檢測技術
目前,無論是在學術還是工業層面,自動駕駛都是計算機視覺和機器人技術研究的主要焦點。不論何種方案,都需要使用各種傳感器和控制模塊,感知汽車周圍的環境。基于攝像頭的車道檢測是環境感知的重要方法,它可以讓車輛在車道內正確定位,同時它對后續的車道偏離或軌跡規劃也至關重要。因此,準確的基于攝像頭的車道檢測是實現完全自動駕駛的關鍵推動因素。傳統的車道檢測方法(例如[9],[15],[17],[33],[35])依靠高度專業化的手工特征標記和啟發式識別來識別車道線。這種手工標記的方法主要是基于顏色的特征[7],結構張量[25],條形過濾器[34],脊線特征[26]等,它們可能與霍夫變換 [23], [37]或卡爾曼濾波器[18],[8],[34] 相結合。識別車道線后,采用后處理技術來濾除誤檢以形成最終車道。通常,這些傳統方法很容易由于道路場景變化而導致魯棒性問題。
基于深度學習的車道線檢測
最近的研究有人用深度神經網絡取代手工標記,通過構建一定量學習密集的特征檢測器進行預測,即像素級的車道分段。 Gopalan等人[11]使用像素級特征描述符來建模,并且使用增強算法來選擇用于檢測車道標記的相關特征。類似地,Kim和Lee [19]將卷積神經網絡(CNN)與RANSAC算法結合起來以檢測車道線。注意,在他們的方法中,CNN主要用于圖像增強,并且只有道路場景復雜時才會使用。Huval等人[16]用CNN模型用于高速公路駕駛,其中包括執行車道檢測和端到端CNN分類。Li等人[22]提出了使用多任務深度卷積網絡,其重點在于尋找幾何車道屬性,如位置和方向,以及檢測車道的循環神經網絡(RNN)。還有人 [21] 做了更多的研究,利用深度神經網絡訓練如何在不利的天氣和低照度條件下共同處理車道和道路標記檢測和識別。上述神經網絡模型除了更好地劃分車道標記的能力之外[16],它們也可以在圖像中標記不存在的情況下,估計車道線。然而,生成的二元分段車道仍然需要分解到不同的車道實例中。
為了解決這個問題,一些研究應用了后處理技術,這些技術依賴幾何特性為指導的啟發式算法。啟發式方法在計算上比較昂貴,并且由于道路場景變化容易出現魯棒性問題。
實例分割方法實現端到端車道檢測
在本文中,我們超越了上述限制,提出將車道檢測問題作為一個實例分割問題,其中每個車道在車道類中形成自己的實例。受密集預測網絡在語義分割[24],[28],[31],[6]和實例分割任務[36],[38],[30],[2],[14]等成功的啟發, [5]我們設計了一個多任務網絡分支,包括一個車道分割分支和一個車道嵌入分支,可以進行端到端的訓練。車道分割分支具有兩個輸出類別,即背景或車道,而車道嵌入分支進一步將分段的車道像素分解成不同的車道實例。通過將車道檢測問題分解為上述兩個任務,我們可以充分利用車道分割分支的功能,而不必為不同的車道分配不同的類別。相反,使用聚類損失函數訓練的車道嵌入分支將車道ID分配給來自車道分割分支的每個像素,同時忽略背景像素。通過這樣做,我們減輕了車道變化的問題,并且我們可以處理可變數量的車道。
通過估算車道實例,即哪些像素屬于哪條車道,我們希望將它們中的每一個轉換為參數描述。為此,曲線擬合算法被廣泛用于文獻中。流行的模型是三次多項式[32],[25],樣條曲線[1]或布盧姆曲線[10]。為了在保持計算效率同時提高組合的質量,通常使用變換[39]將圖像轉換為“鳥瞰”圖像并在那里執行曲線擬合。通常,變換矩陣是在單個圖像上計算的,并保持固定。但是,如果地平面變化較大(例如通過傾斜上坡),則該固定變換不再有效。為了彌補這種情況,我們在對曲線進行擬合之前對圖像應用透視變換,與現有的依靠固定變換矩陣進行透視變換的方法相反,我們訓練一個神經網絡來輸出變換系數。神經網絡將圖像作為輸入,并針對車道配合問題量身定制一個損失函數進行優化。
該方法的一個固有優點是對路面變化具有魯棒性,并且為了更好地擬合車道而特別進行了優化。整個識別過程的概述可以在圖1中看到。我們的貢獻可以總結如下:(1)分支的多任務體系結構,將車道檢測問題作為實例分割任務來處理,處理車道變化和允許推斷任意數量的車道。特別地,車道分割分支輸出密集的每像素車道段,而車道嵌入分支進一步將分段的車道像素分解成不同的車道實例。(2)給定輸入圖像的網絡估計透視變換的參數,透視變換允許車道擬合對路面變化具有魯棒性,例如,上坡/下坡。
圖1.系統概述。給定一個輸入圖像,Lane Net輸出一個車道實例地圖,車道ID標記每個車道像素。接下來,使用H-Net輸出的變換矩陣變換車道像素,H-Net學習以輸入圖像為條件的透視變換。對于每一條車道,都用三階多項式擬合,并且車道被重投影到圖像上。
通過訓練神經網絡進行端到端的車道檢測,將車道檢測作為實例分割問題來實現,解決了上述車道切換以及車道數的限制的問題。我們將稱之為LaneNet(參見圖2)的網絡,將二進制車道分割與單鏡頭實例分割的聚類損失函數相結合。在LaneNet的輸出中,每個車道像素被分配它們對應車道的ID。因為LaneNET輸出每個車道的像素集合,我們必須通過這些像素來獲得車道參數化的曲線。
通常情況下,車道像素被投影成“鳥瞰圖”表示,使用一個固定的轉換矩陣。然而,由于變換參數對所有圖像都是固定的,所以當遇到非地面時,例如在斜坡上,這會引起一些問題。為了緩解這個問題,我們訓練一個網絡,稱為H-Network,它可以估算輸入圖像上的“理想”透視變換的參數。
圖2. LaneNet結構。分割分支(底部)被訓練以產生二進制車道。嵌入分支(TOP)生成每個車道像素的n維嵌入,使得來自同一車道的嵌入是緊密的,而來自不同車道的嵌入是相距甚遠的。為了簡單起見,我們展示了每個像素的二維嵌入,它被可視化為XY網格中的顏色映射(所有像素)和點(僅是車道像素)。在利用分割分支的二值分割圖遮蔽背景像素之后,將車道嵌入(藍點)聚集在一起并分配給它們的聚類中心(紅點)。
結論
在本文中,我們介紹了一種以50幀/秒進行端到端車道檢測的方法。受到最近實例分割技術的啟發,與其他相關的深度學習方法相比,我們的方法可以檢測可變數量的車道并且可以應對車道變換。為了使用低階多項式對分段車道進行參數化,我們已經訓練了一個網絡來生成透視變換的參數,以圖像為條件,其中車道擬合是最優的。與流行的“鳥瞰視圖”方法不同,我們的方法通過調整相應地參數進行變換,可以有效抵抗地平面的坡度變化。
-
檢測器
+關注
關注
1文章
869瀏覽量
47785 -
自動駕駛
+關注
關注
785文章
13931瀏覽量
167008 -
深度學習
+關注
關注
73文章
5515瀏覽量
121551
原文標題:IEEE IV 2018:一種實例分割方法實現端到端車道檢測
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
一種新的判別變壓器繞組同名端的檢測方法
SDN中的端到端時延
![SDN中的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>時延](https://file.elecfans.com/web2/M00/49/75/poYBAGKhwLeAPdNLAAAQ4hOIkTE865.jpg)
一種不同步雙端數據修正波速的單端行波定位方法
![<b class='flag-5'>一種</b>不同步雙<b class='flag-5'>端</b>數據修正波速的單<b class='flag-5'>端</b>行波定位<b class='flag-5'>方法</b>](https://file.elecfans.com/web1/M00/4F/B6/o4YBAFrhjKWARa1eAAAyaLkhPpM410.jpg)
一種基于端到端基于語音的對話代理
一種二階段端到端的自適應去霧生成網絡
![<b class='flag-5'>一種</b>二階段<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自適應去霧生成網絡](https://file.elecfans.com/web1/M00/EC/28/pIYBAGB_wayALOHEAAGFs1PfhPg482.png)
一種端到端的立體深度感知系統的設計
![<b class='flag-5'>一種</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的立體深度感知系統的設計](https://file1.elecfans.com/web2/M00/88/BE/wKgaomRwafKAJKWHAABkmufOUpY949.png)
評論