0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2024-11-11 16:17 ? 次閱讀

0. 這篇文章干了啥?

同步定位與地圖構(gòu)建 (SLAM) 是計算機視覺中的一個基本問題,旨在在同時跟蹤相機姿勢的同時對環(huán)境進行地圖構(gòu)建?;趯W(xué)習(xí)的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,在捕獲密集光度信息和提供準(zhǔn)確的全局重建方面表現(xiàn)出顯著的進步,而傳統(tǒng)系統(tǒng)則基于稀疏點云或體素。然而,NeRF 方法仍然存在過度平滑、場景表示受限和計算效率低下等缺點。最近,基于高斯的 SLAM已成為一種利用體積輻射場的有前途的方法。利用顯式 3D 高斯表示,高斯 SLAM 可提供高保真渲染和細(xì)粒度場景重建,從而克服了基于 NeRF 的方法的局限性。

盡管高斯 SLAM 具有優(yōu)勢,但它在室內(nèi)場景中仍面臨顯著挑戰(zhàn),因為室內(nèi)場景通常以無紋理表面和復(fù)雜的空間布局為特征。這些環(huán)境由于缺乏相機姿勢優(yōu)化所必需的足夠紋理細(xì)節(jié)而阻礙了穩(wěn)健的跟蹤。此外,由于遮擋或視野覆蓋有限,室內(nèi)場景的復(fù)雜幾何形狀通常會導(dǎo)致大量未觀察到的區(qū)域。這些看不見的區(qū)域?qū)Ω咚?SLAM 構(gòu)成了關(guān)鍵但尚未探索的挑戰(zhàn),因為高斯表示很難在沒有多視圖優(yōu)化的情況下插入未觀察到的幾何形狀。因此,地圖上看不見的區(qū)域留下了大量的漏洞和空白,這個問題在以前的高斯 SLAM 研究中基本上被忽視了。

為了克服這些挑戰(zhàn),我們利用著名的曼哈頓世界假設(shè)作為細(xì)化和完成場景幾何圖形的基礎(chǔ)策略。該假設(shè)認(rèn)為,構(gòu)建的環(huán)境主要遵循網(wǎng)格狀結(jié)構(gòu),表面和線條與三個正交方向?qū)R。這些線條和平面對高斯 SLAM 系統(tǒng)中的跟蹤和映射過程施加了有意義的約束。具體來說,我們涵蓋了跟蹤、映射和場景完成方面的增強。在跟蹤中,我們利用從結(jié)構(gòu)化場景中得出的線特征作為無紋理區(qū)域中的穩(wěn)健特征基礎(chǔ),對這些線段進行反向投影和重新投影以進行姿勢優(yōu)化和全束調(diào)整。在映射中,我們對重新投影的線特征應(yīng)用光度損失來細(xì)化地圖。這種方法確保重建的場景緊密遵循環(huán)境的真實結(jié)構(gòu),從而提高其幾何精度和渲染質(zhì)量。此外,曼哈頓世界假設(shè)有助于識別和插值結(jié)構(gòu)化表面,例如地板和天花板。這些平面對于定義空間的整體幾何形狀至關(guān)重要,但在捕獲的視圖中通常會被部分遮擋或缺失。通過分割這些不完整的表面(通過提取的線作為邊界進行細(xì)化),我們可以通過生成新的高斯函數(shù)來預(yù)測它們在直接觀察到的部分之外的延續(xù)。這種策略使我們能夠優(yōu)化場景中大表面的表示,從而增強渲染地圖的完整性。最后,我們通過泊松重構(gòu)合并正則化項,將高斯表示壓縮為網(wǎng)格表面。這種方法能夠提取以前在高斯 SLAM 系統(tǒng)中無法獲得的高質(zhì)量網(wǎng)格,使其隨時可用于下游任務(wù)。

下面一起來閱讀一下這項工作~

1. 論文信息

標(biāo)題:Structure Gaussian SLAM with Manhattan World Hypothesis

作者:Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

機構(gòu):東京大學(xué)、哥倫比亞大學(xué)、國家信息學(xué)研究所、上海交通大學(xué)、薩爾州應(yīng)用科學(xué)大學(xué)、大連理工大學(xué)

原文鏈接:https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系統(tǒng)在提高實時重建的效率和保真度方面取得了重大進展。然而,這些系統(tǒng)在復(fù)雜的室內(nèi)環(huán)境中經(jīng)常會遇到不完整的重建,其特點是由于障礙物或有限的視角導(dǎo)致未觀察到的幾何形狀而產(chǎn)生大量空洞。為了應(yīng)對這一挑戰(zhàn),我們提出了曼哈頓高斯 SLAM (MG-SLAM),這是一個利用曼哈頓世界假設(shè)來提高幾何準(zhǔn)確性和完整性的 RGB-D 系統(tǒng)。通過無縫集成來自結(jié)構(gòu)化場景的融合線段,MG-SLAM 可確保在無紋理的室內(nèi)區(qū)域中進行穩(wěn)健的跟蹤。此外,提取的線和平面假設(shè)允許在缺失幾何形狀的區(qū)域中戰(zhàn)略性地插入新的高斯函數(shù),從而實現(xiàn)高效的場景完成。在合成場景和真實世界場景上進行的大量實驗表明,這些進步使我們的方法能夠?qū)崿F(xiàn)最先進的性能,標(biāo)志著高斯 SLAM 系統(tǒng)功能的顯著提升。

3. 效果展示

MG-SLAM 利用線段在相機姿態(tài)估計和場景重建方面實現(xiàn) SOTA 結(jié)果。此外,通過應(yīng)用結(jié)構(gòu)表面約束,我們通過對缺失的幾何體進行新的高斯插值來增強和完善場景。

10f385ec-9053-11ef-a511-92fbcf53809c.png

在Replica Apartment 數(shù)據(jù)集場景 frl_apartment_4 上的線段提取結(jié)果的消融實驗。

113851ea-9053-11ef-a511-92fbcf53809c.png

4. 主要貢獻

? 我們提出了 MG-SLAM,這是一種新穎的 RGB-D 高斯 SLAM 系統(tǒng),它利用了曼哈頓世界假設(shè) [5]。該假設(shè)引入了線和平面,用于神經(jīng)密集型 SLAM 系統(tǒng)的穩(wěn)健跟蹤、地圖細(xì)化和表面補全。

? 我們使用提取的代表平面邊界的線段建立假設(shè)表面。這些表面指導(dǎo)我們有效地插入新的高斯函數(shù)來填補重建地圖中的間隙和空洞,無縫解決當(dāng)前高斯 SLAM 系統(tǒng)由于未觀察到的幾何形狀而面臨限制的區(qū)域。

? 在大型合成和真實世界數(shù)據(jù)集上進行的大量實驗表明,我們的系統(tǒng)提供了最先進的 (SOTA) 跟蹤和全面的地圖重建,在真實世界場景中實現(xiàn)了 ATE 降低 50% 和 PSNR 增強 5dB,同時以極高的幀速率運行。這些進步明顯優(yōu)于以前的高斯 SLAM 系統(tǒng)。

5. 基本原理是啥?

所提出的 MG-SLAM 的兩階段流水線圖示。上部可視化了跟蹤和建圖系統(tǒng)的并行過程。下部展示了場景完成和網(wǎng)格提取的后優(yōu)化。在曼哈頓世界假設(shè)的約束下,MG-SLAM 引入了線段和結(jié)構(gòu)化表面來增強相機姿態(tài)估計和地圖重建。我們利用一種特定的策略來融合線段,以確保可靠地識別線特征。高斯表示,包括專用于線段重建的專用損失項。

115f94f8-9053-11ef-a511-92fbcf53809c.png

6. 實驗結(jié)果

使用表 1 中的 ScanNet 數(shù)據(jù)集和Replica-V1 數(shù)據(jù)集對重建質(zhì)量進行了定量評估。我們的方法提供了 SOTA 結(jié)果,在兩個數(shù)據(jù)集上的 PSNR 均顯著優(yōu)于其他基于高斯的方法 4dB。跟蹤評估結(jié)果如表 2 所示。我們的方法顯著降低了 ATE RMSE(cm)誤差,比高斯基線提高了 50%。此外,得益于我們的線融合策略,MG-SLAM 還表現(xiàn)出優(yōu)于傳統(tǒng) SLAM 系統(tǒng)的跟蹤性能。

1190cc76-9053-11ef-a511-92fbcf53809c.png

11c6c948-9053-11ef-a511-92fbcf53809c.png

為了評估系統(tǒng)在大型室內(nèi)環(huán)境中的穩(wěn)健性,我們在 Replica Apartment 數(shù)據(jù)集上評估了 MG-SLAM。該數(shù)據(jù)集包含廣泛的多房間場景、復(fù)雜的物體幾何形狀和跨房間的循環(huán)軌跡。表 3 展示了我們的方法與 SplaTAM和 MonoGS在五個選定場景中的渲染質(zhì)量對比。MG-SLAM 在這些基線上顯示出顯著的改進,特別是在具有兩層八室布局的廣泛公寓 0 場景中實現(xiàn)了 7dB 的改進。這種最佳性能主要歸功于融合線段的加入,這為環(huán)路閉合和姿勢優(yōu)化奠定了堅實的基礎(chǔ)。圖 5 展示了公寓場景的新視圖渲染結(jié)果。我們的方法在幾何精度和精細(xì)細(xì)節(jié)豐富度方面比高斯基線有顯著的增強。

11fce0dc-9053-11ef-a511-92fbcf53809c.png

12294866-9053-11ef-a511-92fbcf53809c.png

7. 總結(jié)

在本研究中,我們提出了 MG-SLAM,這是一種基于曼哈頓世界假設(shè)的高斯 SLAM 方法。MG-SLAM 采用線段進行穩(wěn)健的姿態(tài)估計和地圖細(xì)化。此外,通過利用線段和平面假設(shè),我們可以在缺失幾何的間隙上有效地插入新的高斯函數(shù)。大量實驗表明,我們的方法提供了最先進的跟蹤和映射性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 結(jié)構(gòu)化
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    10300
  • SLAM算法
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2523

原文標(biāo)題:GS SLAM最新SOTA!MG-SLAM:使用結(jié)構(gòu)化線特征提升高斯SLAM

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    已經(jīng)實現(xiàn)了準(zhǔn)確的估計。然而,在大規(guī)模問題中更新協(xié)方差矩陣在計算上是昂貴的?;趫D的方法最早由Lu和Milios在1997年引入,隨著圖的增長,計算成本較低。隨著計算能力的提高,基于圖的SLAM優(yōu)化算法
    的頭像 發(fā)表于 11-12 11:26 ?84次閱讀
    最新圖<b class='flag-5'>優(yōu)化</b>框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷達在SLAM算法中的應(yīng)用綜述

    SLAM算法運行的重要傳感器?;诩す饫走_的SLAM算法,對激光雷達SLAM總體框架進行介紹,詳細(xì)闡述前端里程計、后端
    的頭像 發(fā)表于 11-12 10:30 ?80次閱讀
    激光雷達在<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>中的應(yīng)用綜述

    算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們在[第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計機器人車輛的位置,同時逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?222次閱讀
    從<b class='flag-5'>算法</b>角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    Jetson Nano集成探索大象機器人myAGV上的 SLAM 算法

    引言 大家好,最近新入手了一臺myAGV JN這是elephant robotics在myAGV升級后的版本。最近有對SLAM相關(guān)知識感興趣,想深入了解一些關(guān)于ROS中SLAM的一些算法和規(guī)劃,跟據(jù)
    的頭像 發(fā)表于 06-03 14:13 ?384次閱讀
    Jetson Nano集成探索大象機器人myAGV上的 <b class='flag-5'>SLAM</b> <b class='flag-5'>算法</b>!

    深度解析深度學(xué)習(xí)下的語義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展,例如目標(biāo)的檢測、識別和分類等領(lǐng)域。近年來,研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)技術(shù),使得深度學(xué)習(xí)SLAM系統(tǒng)獲得了迅速發(fā)展,并且比傳統(tǒng)
    發(fā)表于 04-23 17:18 ?1228次閱讀
    深度解析深度學(xué)習(xí)下的語義<b class='flag-5'>SLAM</b>

    工程實踐中VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng),廣泛用于實時三維地圖構(gòu)建和機器人定位。該系統(tǒng)使用ORB特征進行高效的視覺識別和地圖重建,支持關(guān)鍵幀技術(shù)和回環(huán)檢測來
    的頭像 發(fā)表于 04-08 10:17 ?2533次閱讀
    工程實踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣分析

    結(jié)構(gòu)化布線的好處多嗎

    考慮將這種布線納入網(wǎng)絡(luò)基礎(chǔ)設(shè)施中,以優(yōu)化性能和生產(chǎn)力。 結(jié)構(gòu)化布線的好處 ? 增強的可靠性:結(jié)構(gòu)化布線通過最大限度地減少錯誤和故障點來確保可靠的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。正確安裝和組織的布線可以降低信號干擾、數(shù)據(jù)丟失和性能
    的頭像 發(fā)表于 04-07 11:15 ?401次閱讀

    什么是SLAM?SLAM算法涉及的4要素

    SLAM技術(shù)可以應(yīng)用在無人駕駛汽車、無人機、機器人、虛擬現(xiàn)實等領(lǐng)域中,為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場景理解的功能。
    發(fā)表于 04-04 11:50 ?2146次閱讀

    什么是SLAM?基于3D高斯輻射場的SLAM優(yōu)勢分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 04-01 12:44 ?658次閱讀

    從基本原理到應(yīng)用的SLAM技術(shù)深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法SLAM,但是實現(xiàn)了半稠密建圖,建圖規(guī)模大,可以
    發(fā)表于 02-26 09:41 ?8882次閱讀
    從基本原理到應(yīng)用的<b class='flag-5'>SLAM</b>技術(shù)深度解析

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 01-26 10:48 ?605次閱讀
    基于NeRF/Gaussian的全新<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>

    NeRF何去何從?GS SLAM到底哪家強?來看看最新的開源方案!

    Gaussian-SLAM提出了用于seeding和優(yōu)化Gaussian splats的新策略,以將其從多視圖離線場景擴展到RGBD序列。還擴展了Gaussian splats來編碼幾何圖形并嘗試
    的頭像 發(fā)表于 12-26 16:38 ?1113次閱讀
    NeRF何去何從?GS <b class='flag-5'>SLAM</b>到底哪家強?來看看最新的開源方案!

    CFD 設(shè)計利器:結(jié)構(gòu)化和非結(jié)構(gòu)化網(wǎng)格的組合使用

    在CFD的發(fā)展歷史中,結(jié)構(gòu)化網(wǎng)格出現(xiàn)最早,至今仍在使用。結(jié)構(gòu)化網(wǎng)格有幾個主要優(yōu)點,如精度高、生成速度快、單元分布均勻。有些工具擅長繪制這類網(wǎng)格,例如CadenceFidelityAutomesh
    的頭像 發(fā)表于 12-23 08:12 ?1641次閱讀
    CFD 設(shè)計利器:<b class='flag-5'>結(jié)構(gòu)化</b>和非<b class='flag-5'>結(jié)構(gòu)化</b>網(wǎng)格的組合使用

    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計、回環(huán)檢測、子圖融合和全局優(yōu)化
    的頭像 發(fā)表于 11-29 10:35 ?561次閱讀
    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(<b class='flag-5'>SLAM</b>)系統(tǒng)

    什么是激光雷達3D SLAM技術(shù)?

    什么是激光雷達3DSLAM?在了解這個概念之前,我們首先需要弄懂什么是“SLAM”。SLAM,英文是SimultaneousLocalizationandMapping,意思是即時定位與建圖。通俗
    的頭像 發(fā)表于 11-25 08:23 ?1526次閱讀
    什么是激光雷達3D <b class='flag-5'>SLAM</b>技術(shù)?