那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

BEVSegFormer創造了新的BEV分割SOTA

Nullmax紐勱 ? 來源:紐勱科技 ? 作者:紐勱科技 ? 2022-04-27 09:50 ? 次閱讀

自動駕駛而言,BEV(鳥瞰圖)下的語義分割是一項重要任務。盡管這項工作已經吸引了大量的研究,但靈活處理自動駕駛車輛上的任意相機配置(單個或多個攝像頭),仍然是一項挑戰。

為此,Nullmax的感知團隊提出了BEVSegFormer,這一基于Transformer的BEV語義分割方法,可面向任意配置的相機進行BEV語義分割。

這項研究的題目為《BEVSegFormer: Bird's Eye View Semantic Segmentation From Arbitrary Camera Rigs》,論文鏈接:https://arxiv.org/abs/2203.04050。

為了評估這一算法的效果,Nullmax在nuScenes公開數據集以及Nullmax的自采數據集上進行了驗證。實驗結果表明,BEVSegFormer對任意相機配置的BEV語義分割,具有出色的性能表現。并且在nuScenes驗證集上,BEVSegFormer創造了新的BEV分割SOTA。

在接下來的工作中,我們還計劃針對自動駕駛以及BEV語義分割的一些其他挑戰,展開進一步的研究。

歡迎對計算機視覺及自動駕駛感知感興趣的小伙伴加入我們,一起探索!

01

關于BEVSegFormer

在自動駕駛或者機器人導航系統中,以BEV形式對感知信息進行表征,具有至關重要的作用,因為它可以為規劃和控制提供諸多的便利。

比如,在無地圖導航方案中,構建本地BEV地圖,不僅成為了高精地圖外的另一種選擇,并且對于包括智體行為預測以及運動規劃等感知系統下游任務而言,也非常重要。而利用相機的輸入進行BEV語義分割,通常被視為構建本地BEV地圖的第一步。

為此,傳統方法一般會先在圖像空間生成分割結果,然后通過逆透視變換(IPM)函數轉換到BEV空間。雖然這是一種連接圖像空間和BEV空間的簡單直接的方法,但它需要準確的相機內外參,或者實時的相機位姿估計。所以,視圖變換的實際效果有可能比較差。

以車道線分割為例,在一些挑戰性場景中,比如遮擋或者遠處區域,使用IPM的傳統方法提供的結果就不夠準確,如圖所示。

d90fae6c-c5ca-11ec-bce3-dac502259ad0.png

近年來,深度學習方法已被研究用于BEV語義分割。Lift-Splat-Shoot通過逐像素深度估計結果完成了從圖像視圖到BEV的視圖變換。不過使用深度估計,也增加了視圖變換過程的復雜度。此外,有一些方法應用MLP或者FC算子來進行視圖變換。這些固定的視圖變換方法,學習圖像空間和BEV空間之間的固定映射,因此不依賴于輸入的數據。

而基于Transformer的方法,是在BEV空間下進行感知的另一個研究方向。在目標檢測任務中,DETR3D引入了一種3D邊界框檢測方法,直接從多個相機圖像的2D特征生成3D空間中的預測。3D空間和2D圖像空間之間的視圖變換,通過交叉注意模塊的3D到2D查詢來實現。

受此啟發,我們提出了BEVSegFormer,通過在Transformer中使用交叉注意機制進行BEV到圖像的查詢,來計算視圖變換。

BEVSegFormer由3個主要的組件組成:

共享的主干網絡,用于提取任意相機的特征圖;

Transformer編碼器,通過自注意模塊嵌入特征圖;

BEV Transformer解碼器,通過交叉注意機制處理BEV查詢,輸出最終的BEV語義分割結果。

d944de0c-c5ca-11ec-bce3-dac502259ad0.png

具體來說,BEVSegFormer首先是使用了共享的主干網絡,對來自任意相機的圖像特征進行編碼,然后通過基于可變形Transformer的編碼器對這些特征進行增強。

除此之外,BEVSegFormer還引入了一個BEV Transformer解碼器模塊,對BEV語義分割的結果進行解析,以及一種高效的多相機可變形注意單元,完成BEV到圖像的視圖變換。

最后,根據BEV中的網格布局對查詢進行重塑,并進行上采樣,以有監督的方式生成語義分割結果。

我們分別在nuScenes公開數據集以及Nullmax的自采數據集上,檢驗了BEVSegFormer的算法效果。實驗結果表明,BEVSegFormer在nuScenes驗證集上創造了新的BEV分割SOTA。通過消融實驗,當中每個組件的效果也得到了驗證。

d97c3780-c5ca-11ec-bce3-dac502259ad0.png

02

加入我們

在這項研究中,我們為了應對自動駕駛車輛上任意相機配置的BEV語義分割挑戰,提出了BEVSegFormer。

接下來,我們還計劃在自動駕駛當中,基于Transformer探索內存效率更高、解釋性更強的BEV語義分割方法。

歡迎對BEV、Transformer在自動駕駛中的感知任務感興趣,以及希望從事于計算機視覺和自動駕駛感知研發的同學,加入Nullmax感知團隊。

在這里,你可以直接參與到大量自動駕駛量產項目的落地,以及最前沿技術的預研當中,為你的idea和技術找到一個充分施展的舞臺!

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167017
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121556

原文標題:當BEV語義分割遇上了Transformer,故事的結局是新的SOTA

文章出處:【微信號:Nullmax,微信公眾號:Nullmax紐勱】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    康謀方案 | BEV感知技術:多相機數據采集與高精度時間同步方案

    隨著自動駕駛技術的快速發展,車輛準確感知周圍環境的能力變得至關重要。BEV Camera數據采集方案有效解決多相機同步采集和高精度時間同步的難題,還提供靈活的相機參數配置和高效的數據傳輸,能夠滿足自動駕駛和高精度測量等場景的
    的頭像 發表于 02-06 13:45 ?385次閱讀
    康謀方案 | <b class='flag-5'>BEV</b>感知技術:多相機數據采集與高精度時間同步方案

    Mamba入局圖像復原,達成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復原領域,比基于CNN
    的頭像 發表于 12-30 18:09 ?230次閱讀
    Mamba入局圖像復原,達成新<b class='flag-5'>SOTA</b>

    淺析基于自動駕駛的4D-bev標注技術

    4D-bev標注技術是指在3D空間中以時間作為第四個維度進行標注的過程。4D-bev通常在地場景較為復雜的自動駕駛場景中使用,其可以通過精準地跟蹤和記錄動態對象的運動軌跡、姿勢變化以及速度等信息,全面理解和分析動態對象在連續的時間序列中的變化,提升自動駕駛系統的感知、決策
    的頭像 發表于 12-06 15:01 ?1456次閱讀
    淺析基于自動駕駛的4D-<b class='flag-5'>bev</b>標注技術

    自動駕駛中一直說的BEV+Transformer到底是個啥?

    在很多車企的自動駕駛介紹中,都會聽到一個關鍵技術,那就是BEV+Transformer,那BEV+Transformer到底是個啥?為什么很多車企在自動駕駛技術中都十分追捧這項技術?其實“BEV
    的頭像 發表于 11-07 11:19 ?538次閱讀
    自動駕駛中一直說的<b class='flag-5'>BEV</b>+Transformer到底是個啥?

    語義分割25種損失函數綜述和展望

    本綜述提供對25種用于圖像分割的損失函數的全面且統一的回顧。我們提供一種新穎的分類法,并詳細審查這些損失函數如何在圖像分割中被定制和利
    的頭像 發表于 10-22 08:04 ?796次閱讀
    語義<b class='flag-5'>分割</b>25種損失函數綜述和展望

    畫面分割器怎么調試

    畫面分割器,通常指的是視頻畫面分割器,它是一種可以將一個視頻信號分割成多個小畫面的設備。這種設備廣泛應用于監控系統、視頻會議、多畫面顯示等場景。調試畫面分割器是一個技術性很強的工作,需
    的頭像 發表于 10-17 09:32 ?531次閱讀

    畫面分割器怎么連接

    畫面分割器,也稱為視頻分割器或多畫面處理器,是一種可以將多個視頻信號源分割成單個畫面或多個畫面顯示在單個監視器上的設備。這種設備廣泛應用于監控系統、視頻會議、多媒體展示等領域。 一、畫面分割
    的頭像 發表于 10-17 09:29 ?418次閱讀

    關于\"OPA615\"的SOTA的跨導大小的疑問求解

    關于OPA615的SOTA部分,看datasheet的page9的figure22,我們可以知道跨導大小大概是35mA/V左右,并且可以知道其Chold輸出一般在5mA以內,但是我從社區里面找到
    發表于 09-13 06:25

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義分割的基本原理 1.1
    的頭像 發表于 07-17 09:56 ?538次閱讀

    圖像分割和語義分割的區別與聯系

    圖像分割和語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區域或對象的過程。這些區域或對象具有相似的屬性
    的頭像 發表于 07-17 09:55 ?1171次閱讀

    機器學習中的數據分割方法

    在機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據分割的方法,包括常見的分割方法、各自的優缺點、適用場景以及實際應用中的注意事項。
    的頭像 發表于 07-10 16:10 ?2135次閱讀

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心模型,在圖像分割與語義分割中發揮著至關重要的
    的頭像 發表于 07-09 11:51 ?1162次閱讀

    機器人視覺技術中常見的圖像分割方法

    機器人視覺技術中的圖像分割方法是一個廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的過程,這些區域或對象具有某種共同的特征,如顏色、紋理、形狀等。在機器人視覺中,圖像分割對于物體識別
    的頭像 發表于 07-09 09:31 ?886次閱讀

    NB81是否支持OneNet SOTA功能?應該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應該如何激活SOTA
    發表于 06-04 06:14

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內部的等效阻抗嗎,有專家
    發表于 05-17 08:13
    墨尔本百家乐官网的玩法技巧和规则 | 棋牌评测网xjqppc| 免费百家乐官网计划软件| 六合彩报码| e世博百家乐娱乐场| 百家乐官网投资心得| 24山向吉凶详解视频| 临沂市| 钱隆百家乐破解版| 百家乐官网破解秘籍| 威尼斯人娱乐网注册送38元彩金 | 兰桂坊百家乐官网的玩法技巧和规则 | 百家乐方案| 百家乐官网群b28博你| 泾阳县| 网络百家乐开户网| 24山向是什么| 百家乐官网开户送18元| 粤港澳百家乐官网娱乐平台| 大发888网页版免费| 百家乐网上技巧| 百家乐官网游戏规则介绍| 有钱人百家乐的玩法技巧和规则 | 环球百家乐娱乐城| 百家乐官网与21点| 博御国际| 缅甸百家乐网络赌博解谜| 百家乐官网赌场赌场网站| 德州扑克大赛| 香港百家乐玩| 老k百家乐官网的玩法技巧和规则| 大发888 赌博网站| 百家乐群11889| 百家乐官网群11889| 新天地百家乐的玩法技巧和规则| BB百家乐官网HD| 青浦区| 大发888 xp缺少 casino| 百家乐套路| 百家乐能作弊吗| 百家乐官网试玩1000元|