那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用CUDA PCL 1.0加速Jetson的點云處理

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 10:53 ? 次閱讀

很多Jetson用戶在自動化解決方案中選擇激光雷達進行定位和感知。激光雷達使用3D點云描繪周圍的空間環(huán)境。點云可以高精度長距離采樣物體表面信息以便于上層應(yīng)用的障礙感知、繪圖、定位和路徑規(guī)劃算法。

使用CUDA-PCL處理點云

CUDA PCL 1.0是基于CUDA開發(fā)的點云處理庫,在本文中,我們將介紹目前所有的三個庫:ICP,segmentation 和 filter。

CUDA-ICP

迭代最近點算法(Iterative Closest Point,ICP) 用于計算兩幀點云數(shù)據(jù)之間的坐標變換矩陣,從而能夠使不同的坐標下的點云數(shù)據(jù)合并到同一個坐標系統(tǒng)中。ICP算法 通過計算兩幀點云的距離誤差從而修正變換矩陣(平移和旋轉(zhuǎn))以便最小化距離誤差,通常兩幀點云之間的距離誤差是通過匹配點的距離計算得來。ICP算法應(yīng)用廣泛,能夠獲得很高的匹配結(jié)果且有很高的魯棒性,同時會耗費大量的計算資源。為了改進ICP算法在Jetson上的性能,我們推薦使用基于CUDA加速的CUDA-ICP。

使用CUDA-ICP

以下是CUDA ICP的使用實例

我們僅僅需要初始化相關(guān)的類對象,并調(diào)用接口函數(shù)即可。

    cudaICP icpTest(nPCountM, nQCountM, stream);
    icpTest.icp(cloud_source, nPCount,
            float *cloud_target, int nQCount,
            int Maxiterate, double threshold,
            Eigen::Matrix4f &transformation_matrix, stream);

CUDA-ICP 計算的輸出是 transformation_matrix,代表的含義如下:

源點云(P)* transformation = 目標坐標系的點云(Q)

因為激光類型的輸出點云的數(shù)量為固定值,所以CUDA-ICP在輸出化的時候,要求輸入兩幀點云的最大數(shù)量,從而分配計算資源。

class cudaICP
{
public:
    /*
       nPCountM and nQCountM are the maximum of count for input clouds
       They are used to pre-allocate memory.
    */
    cudaICP(int nPCountM, int nQCountM, cudaStream_t stream = 0);
    ~cudaICP(void);

    /*
    cloud_target = transformation_matrix *cloud_source
    When the Epsilon of transformation_matrix is less than threshold,
    the function will return transformation_matrix.
    Input:
        cloud_source, cloud_target: data pointer for points cloud
        nPCount: the points number of cloud_source
        nQCount: the points number of cloud_target
        Maxiterate: the threshold for iterations
        threshold: When the Epsilon of transformation_matrix is less than
            threshold, the function will return transformation_matrix.
    Output:
        transformation_matrix
    */

    void icp(float *cloud_source, int nPCount,

Figure 1. 執(zhí)行ICP之前的兩幀點云。

Figure 2. 經(jīng)過ICP匹配后的兩幀點云。

CUDA-Segmentation

點云地圖包含大量的地面點,不僅會使得地圖變的雜亂,也會干擾之后的點云的分類和識別。因此在實際處理中,我們會首先使用點云分割移除點云中的地面。CUDA-Segmentation 使用隨機樣本一致性算法(random sample consensus, Ransac)進行點云的分割。

使用CUDA- Segmentation

以下代碼是CUDA Segmentation的使用實例。

我們直接初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

  //Now Just support: SAC_RANSAC + SACMODEL_PLANE
  std::vector indexV;
  cudaSegmentation cudaSeg(SACMODEL_PLANE, SAC_RANSAC, stream);
  segParam_t setP;
  setP.distanceThreshold = 0.01; 
  setP.maxIterations = 50;
  setP.probability = 0.99;
  setP.optimizeCoefficients = true;
  cudaSeg.set(setP);
  cudaSeg.segment(input, nCount, index, modelCoefficients);
  for(int i = 0; i < nCount; i++)
  {
    if(index[i] == 1) 
    indexV.push_back(i);
  }

CUDA Segmentation分割擁有nCount個的點云,并輸出索引表index用于指示輸入點云中的被分割掉的點和modelCoefficients用于指示尋找的平面公式。

typedef struct {
  double distanceThreshold; 
  int maxIterations;
  double probability;
  bool optimizeCoefficients;
} segParam_t;

class cudaSegmentation
{
public:
    //Now Just support: SAC_RANSAC + SACMODEL_PLANE
    cudaSegmentation(int ModelType, int MethodType, cudaStream_t stream = 0);

    ~cudaSegmentation(void);

    /*
    Input:
        cloud_in: data pointer for points cloud
        nCount: count of points in cloud_in
    Output:
        Index: data pointer which has the index of points in a plane from input
      modelCoefficients: data pointer which has the group of coefficients of the plane
    */
    int set(segParam_t param);
    void segment(float *cloud_in, int nCount,
            int *index, float *modelCoefficients);
private:
    void *m_handle = NULL;
}; 

讓我們查看下面的實例,第一張圖是原始的點云,第二張圖是經(jīng)過算法尋找到的平面。這是一個非常典型的平面移除的應(yīng)用。

Figure 3. cuda-segmentaion處理之前的點云。

Figure 4. cuda-segmentaion找到的點云平面。

CUDA-Filter

濾波器是在分割,檢測和識別之前,點云數(shù)據(jù)中最重要的處理。

帶通點云濾波是最簡單的方法,僅僅是過濾X,Y和Z軸方向的點云。

目前CUDA-Filter僅支持帶通操作,更多的濾波器會在后續(xù)加入。

使用CUDA- Filter

這個是CUDA Filter的使用實例。

我們僅僅需要初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

我們僅僅需要初始化對象并調(diào)用相關(guān)的接口函數(shù)即可。

  cudaFilter filterTest(stream);
  FilterParam_t setP;
  FilterType_t type = PASSTHROUGH;
  setP.type = type;
  setP.dim = 2;
  setP.upFilterLimits = 1.0;
  setP.downFilterLimits = 0.0;
  setP.limitsNegative = false;
  filterTest.set(setP);
  filterTest.filter(output, &countLeft, input, nCount);

CUDA-Filter使用指定的參數(shù)過濾nCount有個點的點云數(shù)據(jù),過濾后輸出的點云數(shù)量為countLeft。


typedef struct {
    FilterType_t type;
    //0=x,1=y,2=z
    int dim;
    float upFilterLimits;
    float downFilterLimits;
    bool limitsNegative;

} FilterParam_t;

class cudaFilter
{
public:
    cudaFilter(cudaStream_t stream = 0);
    ~cudaFilter(void);
    int set(FilterParam_t param);
    /*
    Input:
        source: data pointer for points cloud
        nCount: count of points in cloud_in
    Output:
        output: data pointer which has points filtered by CUDA
        countLeft: count of points in output
    */
    int filter(void *output, unsigned int *countLeft, void *source, unsigned int nCount);

    void *m_handle = NULL;
}; 

讓我們看下X軸方向的帶通濾波實例。

Figure 5. 原始點云。

Figure 6. X周過濾后的數(shù)據(jù)。

開始使用 CUDA-PCL

我們希望通過本文介紹使用CUDA-PCL從而獲得更好的點云處理性能。

因為PCL在Jetson上無法使用CUDA進行點云的加速處理,所以我們開發(fā)了基于CUDA的點云處理庫CUDA-PCL。

關(guān)于作者

范磊是英偉達高級CUDA軟件工程師,在TSE China 小組致力于CUDA軟件方案的開發(fā)和優(yōu)化。

李雨倩負責(zé)基于Jetson的自主機器解決方案和生態(tài)發(fā)展建設(shè),讓開發(fā)者在Jetson上開發(fā)機器人應(yīng)用獲得更好更全面的體驗和支持。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 激光雷達
    +關(guān)注

    關(guān)注

    968

    文章

    4028

    瀏覽量

    190424
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    13687
收藏 人收藏

    評論

    相關(guān)推薦

    GPU加速服務(wù)器怎么用的

    GPU加速服務(wù)器是將GPU硬件與計算服務(wù)相結(jié)合,通過服務(wù)提供商的平臺,用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機實例。那么,GPU加速
    的頭像 發(fā)表于 12-26 11:58 ?130次閱讀

    數(shù)據(jù)庫和主機哪個好一?

    數(shù)據(jù)庫和主機哪個好一主機和數(shù)據(jù)庫各有優(yōu)勢,選擇哪個更好取決于具體需求。主機提供虛擬
    的頭像 發(fā)表于 12-04 13:50 ?176次閱讀

    基于深度學(xué)習(xí)的三維分類方法

    近年來,云表示已成為計算機視覺領(lǐng)域的研究熱點之一,并廣泛應(yīng)用于自動駕駛、虛擬現(xiàn)實、機器人等許多領(lǐng)域。雖然深度學(xué)習(xí)技術(shù)在處理常規(guī)結(jié)構(gòu)化的二維網(wǎng)格圖像數(shù)據(jù)方面取得了巨大成功,但在處理不規(guī)則、非結(jié)構(gòu)化的
    的頭像 發(fā)表于 10-29 09:43 ?807次閱讀
    基于深度學(xué)習(xí)的三維<b class='flag-5'>點</b><b class='flag-5'>云</b>分類方法

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda加速圖像處理
    發(fā)表于 10-20 09:14

    怎么在TMDSEVM6678: 6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?

    請教一下gpgpu上包括4個Riscv cpu和一個DPU, 沒有6678,要替換原來信號處理用的6678,該怎么在6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?
    發(fā)表于 09-27 07:20

    LiDAR激光數(shù)據(jù)處理軟件處理流程

    、形狀等信息。LiDAR技術(shù)在地形測繪、城市規(guī)劃、林業(yè)、交通、考古等領(lǐng)域有著廣泛的應(yīng)用。本文將介紹LiDAR激光數(shù)據(jù)處理軟件的處理流程。 一、LiDAR數(shù)據(jù)采集 飛行平臺選擇:Li
    的頭像 發(fā)表于 08-29 17:05 ?1278次閱讀

    如何理解計算?

    據(jù)的安全性。 **高性能計算:**計算平臺提供高性能的計算資源,用于處理復(fù)雜的科學(xué)和工程計算任務(wù)。用戶可以使用平臺來進行高性能計算、模擬和仿真,加速科學(xué)研究和工程設(shè)計的進程。 **
    發(fā)表于 08-16 17:02

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達在GPU領(lǐng)域最大的護城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)生態(tài)則更加穩(wěn)固,AMD
    的頭像 發(fā)表于 07-19 00:16 ?4893次閱讀

    軟件生態(tài)上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。 ? 英偉達——CUDA的絕對統(tǒng)治 ? 相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUDA。CUDA在后端架構(gòu)上處于絕對的統(tǒng)
    的頭像 發(fā)表于 06-20 00:09 ?3795次閱讀

    友思特案例 | 自研創(chuàng)新!三維工件尺寸測量及處理解決方案

    3D相機等新型傳感器的發(fā)展克服了傳統(tǒng)工件尺寸測量的各種局限,可獲取豐富的三維數(shù)據(jù)。友思特提供了一種工件3D尺寸測量和處理方案,結(jié)合自
    的頭像 發(fā)表于 06-13 14:13 ?577次閱讀
    友思特案例 | 自研創(chuàng)新!三維工件尺寸測量及<b class='flag-5'>點</b><b class='flag-5'>云</b><b class='flag-5'>處理</b>解決方案

    加速一鍵智能上,耀 X 實例顯真功夫

    ,推出了下一代柔性算力新物種——華為耀服務(wù)器 X 實例(以下簡稱:耀 X 實例),助力企業(yè)
    的頭像 發(fā)表于 05-27 18:20 ?2189次閱讀
    <b class='flag-5'>加速</b>一鍵智能上<b class='flag-5'>云</b>,<b class='flag-5'>云</b>耀 X 實例顯真功夫

    借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

    Aerial CUDA 加速無線接入網(wǎng) (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。
    的頭像 發(fā)表于 05-24 11:10 ?669次閱讀
    借助NVIDIA Aerial <b class='flag-5'>CUDA</b>增強5G/6G的DU性能和工作負載整合

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    加速的高性能計算系統(tǒng)中的量子處理器(QPU)。 ? QPU 是量子計算機的大腦,通過利用電子或光子等粒子行為進行
    發(fā)表于 05-13 15:21 ?226次閱讀
    NVIDIA 通過 <b class='flag-5'>CUDA</b>-Q 平臺為全球各地的量子計算中心提供<b class='flag-5'>加速</b>

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發(fā)表于 04-11 07:56

    基于深度學(xué)習(xí)的方法在處理3D進行缺陷分類應(yīng)用

    背景部分介紹了3D應(yīng)用領(lǐng)域中公開可訪問的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對于分析和比較各種模型至關(guān)重要。研究人員專門設(shè)計了各種數(shù)據(jù)集,包括用于3D形狀分類、3D物體檢測和3D分割等任
    的頭像 發(fā)表于 02-22 16:16 ?1334次閱讀
    基于深度學(xué)習(xí)的方法在<b class='flag-5'>處理</b>3D<b class='flag-5'>點</b><b class='flag-5'>云</b>進行缺陷分類應(yīng)用
    最新百家乐官网的玩法技巧和规则| 免费百家乐官网追号软件| 百家乐玩法守则| 贵宾百家乐的玩法技巧和规则| 现金网送体验金| 百家乐官网平台有什么优势| 金冠百家乐官网的玩法技巧和规则 | 百家乐官网和局投注法| 乐宝百家乐游戏| 百家乐扑| 大港区| 做生意摆放的招财物件| 威尼斯人娱乐城网址| 佛教| 做生意的人早晨讲究| 大发888真钱游戏平台| 亚洲百家乐的玩法技巧和规则| 真钱娱乐平台| 百家乐官网高手论| 百家乐论坛| 网上百家乐官网辅助软件| 百家乐怎样捉住长开| 88娱乐城1| 致胜百家乐官网的玩法技巧和规则| 八大胜百家乐的玩法技巧和规则| 百家乐官网能战胜吗| 百家乐算号软件| 集结号棋牌下载| 百家乐官网正式版| 金殿百家乐的玩法技巧和规则| 阳新县| 百家乐官网相对策略| 百家乐最保险的方法| 瑞丰国际娱乐城| 百家乐官网影院| bet365忠实奖金| 百家乐官网网页qq| 天鸿德州扑克游戏币| 华硕百家乐官网的玩法技巧和规则 | 9人百家乐官网桌布| 威尼斯人娱乐城评价|