那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MG-SLAM:融合結構化線特征優化高斯SLAM算法

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2024-11-11 16:17 ? 次閱讀

0. 這篇文章干了啥?

同步定位與地圖構建 (SLAM) 是計算機視覺中的一個基本問題,旨在在同時跟蹤相機姿勢的同時對環境進行地圖構建。基于學習的密集 SLAM 方法,尤其是神經輻射場 (NeRF) 方法,在捕獲密集光度信息和提供準確的全局重建方面表現出顯著的進步,而傳統系統則基于稀疏點云或體素。然而,NeRF 方法仍然存在過度平滑、場景表示受限和計算效率低下等缺點。最近,基于高斯的 SLAM已成為一種利用體積輻射場的有前途的方法。利用顯式 3D 高斯表示,高斯 SLAM 可提供高保真渲染和細粒度場景重建,從而克服了基于 NeRF 的方法的局限性。

盡管高斯 SLAM 具有優勢,但它在室內場景中仍面臨顯著挑戰,因為室內場景通常以無紋理表面和復雜的空間布局為特征。這些環境由于缺乏相機姿勢優化所必需的足夠紋理細節而阻礙了穩健的跟蹤。此外,由于遮擋或視野覆蓋有限,室內場景的復雜幾何形狀通常會導致大量未觀察到的區域。這些看不見的區域對高斯 SLAM 構成了關鍵但尚未探索的挑戰,因為高斯表示很難在沒有多視圖優化的情況下插入未觀察到的幾何形狀。因此,地圖上看不見的區域留下了大量的漏洞和空白,這個問題在以前的高斯 SLAM 研究中基本上被忽視了。

為了克服這些挑戰,我們利用著名的曼哈頓世界假設作為細化和完成場景幾何圖形的基礎策略。該假設認為,構建的環境主要遵循網格狀結構,表面和線條與三個正交方向對齊。這些線條和平面對高斯 SLAM 系統中的跟蹤和映射過程施加了有意義的約束。具體來說,我們涵蓋了跟蹤、映射和場景完成方面的增強。在跟蹤中,我們利用從結構化場景中得出的線特征作為無紋理區域中的穩健特征基礎,對這些線段進行反向投影和重新投影以進行姿勢優化和全束調整。在映射中,我們對重新投影的線特征應用光度損失來細化地圖。這種方法確保重建的場景緊密遵循環境的真實結構,從而提高其幾何精度和渲染質量。此外,曼哈頓世界假設有助于識別和插值結構化表面,例如地板和天花板。這些平面對于定義空間的整體幾何形狀至關重要,但在捕獲的視圖中通常會被部分遮擋或缺失。通過分割這些不完整的表面(通過提取的線作為邊界進行細化),我們可以通過生成新的高斯函數來預測它們在直接觀察到的部分之外的延續。這種策略使我們能夠優化場景中大表面的表示,從而增強渲染地圖的完整性。最后,我們通過泊松重構合并正則化項,將高斯表示壓縮為網格表面。這種方法能夠提取以前在高斯 SLAM 系統中無法獲得的高質量網格,使其隨時可用于下游任務。

下面一起來閱讀一下這項工作~

1. 論文信息

標題:Structure Gaussian SLAM with Manhattan World Hypothesis

作者:Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

機構:東京大學、哥倫比亞大學、國家信息學研究所、上海交通大學、薩爾州應用科學大學、大連理工大學

原文鏈接:https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系統在提高實時重建的效率和保真度方面取得了重大進展。然而,這些系統在復雜的室內環境中經常會遇到不完整的重建,其特點是由于障礙物或有限的視角導致未觀察到的幾何形狀而產生大量空洞。為了應對這一挑戰,我們提出了曼哈頓高斯 SLAM (MG-SLAM),這是一個利用曼哈頓世界假設來提高幾何準確性和完整性的 RGB-D 系統。通過無縫集成來自結構化場景的融合線段,MG-SLAM 可確保在無紋理的室內區域中進行穩健的跟蹤。此外,提取的線和平面假設允許在缺失幾何形狀的區域中戰略性地插入新的高斯函數,從而實現高效的場景完成。在合成場景和真實世界場景上進行的大量實驗表明,這些進步使我們的方法能夠實現最先進的性能,標志著高斯 SLAM 系統功能的顯著提升。

3. 效果展示

MG-SLAM 利用線段在相機姿態估計和場景重建方面實現 SOTA 結果。此外,通過應用結構表面約束,我們通過對缺失的幾何體進行新的高斯插值來增強和完善場景。

10f385ec-9053-11ef-a511-92fbcf53809c.png

在Replica Apartment 數據集場景 frl_apartment_4 上的線段提取結果的消融實驗。

113851ea-9053-11ef-a511-92fbcf53809c.png

4. 主要貢獻

? 我們提出了 MG-SLAM,這是一種新穎的 RGB-D 高斯 SLAM 系統,它利用了曼哈頓世界假設 [5]。該假設引入了線和平面,用于神經密集型 SLAM 系統的穩健跟蹤、地圖細化和表面補全。

? 我們使用提取的代表平面邊界的線段建立假設表面。這些表面指導我們有效地插入新的高斯函數來填補重建地圖中的間隙和空洞,無縫解決當前高斯 SLAM 系統由于未觀察到的幾何形狀而面臨限制的區域。

? 在大型合成和真實世界數據集上進行的大量實驗表明,我們的系統提供了最先進的 (SOTA) 跟蹤和全面的地圖重建,在真實世界場景中實現了 ATE 降低 50% 和 PSNR 增強 5dB,同時以極高的幀速率運行。這些進步明顯優于以前的高斯 SLAM 系統。

5. 基本原理是啥?

所提出的 MG-SLAM 的兩階段流水線圖示。上部可視化了跟蹤和建圖系統的并行過程。下部展示了場景完成和網格提取的后優化。在曼哈頓世界假設的約束下,MG-SLAM 引入了線段和結構化表面來增強相機姿態估計和地圖重建。我們利用一種特定的策略來融合線段,以確保可靠地識別線特征。高斯表示,包括專用于線段重建的專用損失項。

115f94f8-9053-11ef-a511-92fbcf53809c.png

6. 實驗結果

使用表 1 中的 ScanNet 數據集和Replica-V1 數據集對重建質量進行了定量評估。我們的方法提供了 SOTA 結果,在兩個數據集上的 PSNR 均顯著優于其他基于高斯的方法 4dB。跟蹤評估結果如表 2 所示。我們的方法顯著降低了 ATE RMSE(cm)誤差,比高斯基線提高了 50%。此外,得益于我們的線融合策略,MG-SLAM 還表現出優于傳統 SLAM 系統的跟蹤性能。

1190cc76-9053-11ef-a511-92fbcf53809c.png

11c6c948-9053-11ef-a511-92fbcf53809c.png

為了評估系統在大型室內環境中的穩健性,我們在 Replica Apartment 數據集上評估了 MG-SLAM。該數據集包含廣泛的多房間場景、復雜的物體幾何形狀和跨房間的循環軌跡。表 3 展示了我們的方法與 SplaTAM和 MonoGS在五個選定場景中的渲染質量對比。MG-SLAM 在這些基線上顯示出顯著的改進,特別是在具有兩層八室布局的廣泛公寓 0 場景中實現了 7dB 的改進。這種最佳性能主要歸功于融合線段的加入,這為環路閉合和姿勢優化奠定了堅實的基礎。圖 5 展示了公寓場景的新視圖渲染結果。我們的方法在幾何精度和精細細節豐富度方面比高斯基線有顯著的增強。

11fce0dc-9053-11ef-a511-92fbcf53809c.png

12294866-9053-11ef-a511-92fbcf53809c.png

7. 總結

在本研究中,我們提出了 MG-SLAM,這是一種基于曼哈頓世界假設的高斯 SLAM 方法。MG-SLAM 采用線段進行穩健的姿態估計和地圖細化。此外,通過利用線段和平面假設,我們可以在缺失幾何的間隙上有效地插入新的高斯函數。大量實驗表明,我們的方法提供了最先進的跟蹤和映射性能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 結構化
    +關注

    關注

    0

    文章

    27

    瀏覽量

    10331
  • SLAM算法
    +關注

    關注

    0

    文章

    11

    瀏覽量

    2552

原文標題:GS SLAM最新SOTA!MG-SLAM:使用結構化線特征提升高斯SLAM

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種基于MASt3R的實時稠密SLAM系統

    精心設計的集成式硬件與軟件堆棧,實現穩健且精準的視覺SLAM已成為可能。然而,SLAM尚未能成為一種即插即用的算法,因其需要硬件方面的專業知識以及校準操作。即便對于僅配備單個攝像頭且無諸如IMU等額外傳感器的最簡設置而言,也不存
    的頭像 發表于 12-27 15:25 ?429次閱讀

    利用VLM和MLLMs實現SLAM語義增強

    語義同步定位與建圖(SLAM)系統在對鄰近的語義相似物體進行建圖時面臨困境,特別是在復雜的室內環境中。本文提出了一種面向對象SLAM的語義增強(SEO-SLAM)的新型SLAM系統,借
    的頭像 發表于 12-05 10:00 ?275次閱讀
    利用VLM和MLLMs實現<b class='flag-5'>SLAM</b>語義增強

    最新圖優化框架,全面提升SLAM定位精度

    已經實現了準確的估計。然而,在大規模問題中更新協方差矩陣在計算上是昂貴的。基于圖的方法最早由Lu和Milios在1997年引入,隨著圖的增長,計算成本較低。隨著計算能力的提高,基于圖的SLAM優化算法
    的頭像 發表于 11-12 11:26 ?616次閱讀
    最新圖<b class='flag-5'>優化</b>框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷達在SLAM算法中的應用綜述

    SLAM算法運行的重要傳感器。基于激光雷達的SLAM算法,對激光雷達SLAM總體框架進行介紹,詳細闡述前端里程計、后端
    的頭像 發表于 11-12 10:30 ?1039次閱讀
    激光雷達在<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>中的應用綜述

    算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們在[第 1 部分]中所討論的,SLAM 是指在無地圖區域中估計機器人車輛的位置,同時逐步繪制該區域地圖的過程。根據使用的主要技術,SLAM 算法可分為三種
    的頭像 發表于 10-02 16:39 ?397次閱讀
    從<b class='flag-5'>算法</b>角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    Jetson Nano集成探索大象機器人myAGV上的 SLAM 算法

    引言 大家好,最近新入手了一臺myAGV JN這是elephant robotics在myAGV升級后的版本。最近有對SLAM相關知識感興趣,想深入了解一些關于ROS中SLAM的一些算法和規劃,跟據
    的頭像 發表于 06-03 14:13 ?604次閱讀
    Jetson Nano集成探索大象機器人myAGV上的 <b class='flag-5'>SLAM</b> <b class='flag-5'>算法</b>!

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術,使得深度學習SLAM系統獲得了迅速發展,并且比傳統
    發表于 04-23 17:18 ?1380次閱讀
    深度解析深度學習下的語義<b class='flag-5'>SLAM</b>

    什么是結構化網絡布線?結構化網絡布線有哪些好處?

    在電纜領域,結構化網絡布線這個術語經常被提及。人們將其用作流行語,但它的真正含義是什么?結構化布線到底是什么? 為了了解真正的含義,讓我們看它的一些相關定義。 根據光纖協會的說法,結構化布線是由
    的頭像 發表于 04-11 11:54 ?591次閱讀

    工程實踐中VINS與ORB-SLAM的優劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統,廣泛用于實時三維地圖構建和機器人定位。該系統使用ORB特征進行高效的視覺識別和地圖重建,支持關鍵幀技術和回環檢測來
    的頭像 發表于 04-08 10:17 ?3110次閱讀
    工程實踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優劣分析

    結構化布線的好處多嗎

    考慮將這種布線納入網絡基礎設施中,以優化性能和生產力。 結構化布線的好處 ? 增強的可靠性:結構化布線通過最大限度地減少錯誤和故障點來確保可靠的網絡基礎設施。正確安裝和組織的布線可以降低信號干擾、數據丟失和性能
    的頭像 發表于 04-07 11:15 ?491次閱讀

    什么是SLAMSLAM算法涉及的4要素

    SLAM技術可以應用在無人駕駛汽車、無人機、機器人、虛擬現實等領域中,為這些領域的發展提供了支持。SLAM技術的發展已經逐漸從單純的定位和地圖構建轉向了基于場景理解的功能。
    發表于 04-04 11:50 ?2746次閱讀

    什么是SLAM?基于3D高斯輻射場的SLAM優勢分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數,通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發表于 04-01 12:44 ?830次閱讀

    從基本原理到應用的SLAM技術深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法SLAM,但是實現了半稠密建圖,建圖規模大,可以
    發表于 02-26 09:41 ?9635次閱讀
    從基本原理到應用的<b class='flag-5'>SLAM</b>技術深度解析

    深度解析:多傳感器融合SLAM技術全景剖析

    SLAM中,先驗值通常從一系列傳感器獲得,比如慣性測量單元(IMU)和編碼器,而觀測值則是通過GPS、相機和激光雷達等其他傳感器獲取的,后驗值是融合了先驗信息與觀測數據之后得到的結果,它代表了根據所有已知信息計算出的最優定位輸出。
    發表于 02-23 11:31 ?3410次閱讀
    深度解析:多傳感器<b class='flag-5'>融合</b><b class='flag-5'>SLAM</b>技術全景剖析
    澳门百家乐博牌| 百家乐官网概率统计| 酒泉市| 豪门娱乐网| 曼哈顿娱乐城| 鹤山市| 百家乐官网网上赌博| 百家乐官网新台第二局| 百家乐官网视频游戏网址| 广州百家乐官网酒店用品制造有限公司 | 百家乐官网如何投注技巧| 百家乐官网线上真人游戏| 利高百家乐官网娱乐城| 百家乐官网书| 游戏机百家乐官网庄闲| 网上百家乐官网记牌软件| 百家乐官网规则以及玩法 | 打百家乐纯打庄的方法| 三公百家乐在线哪里可以| 鼠和猴做生意招财| 澳门百家乐真人版| 百利宫百家乐的玩法技巧和规则| 免费百家乐倍投| 88娱乐城备用网址| 百家乐官网是否有路子| 678百家乐官网博彩赌场娱乐网规则| 做生意风水问题| 澳门百家乐怎赌才能赚钱| 喜洋洋水果机遥控器| 真人游戏百家乐| 百家乐官网高手和勒威| 粤港澳百家乐官网娱乐 | 网络百家乐会作假吗| 大发888老虎机游戏| 黑河市| 游戏机百家乐官网的玩法技巧和规则 | 日照市| 没费用百家乐官网分析器| 百家乐ho168平台| 百家乐什么方法容易赢| 百家乐官网历史路单|