0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于隱式表達(dá)的大規(guī)模三維建圖的方法

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-06-27 11:01 ? 次閱讀

?導(dǎo)讀 本文是VCC馬雪奇同學(xué)對(duì)論文 SHINE-Mapping: Large-Scale 3D Mapping Using Sparse Hierarchical Implicit Neural Representations[1] 的解讀,該工作來自德國(guó)波恩大學(xué)攝影測(cè)量與機(jī)器人實(shí)驗(yàn)室,已被機(jī)器人領(lǐng)域的頂級(jí)會(huì)議ICRA 2023收錄。 項(xiàng)目主頁: https://github.com/PRBonn/SHINE_mapping 該工作提出了一種基于隱式表達(dá)的大規(guī)模三維建圖的方法,它利用分層八叉樹的結(jié)構(gòu)來存儲(chǔ)可學(xué)習(xí)的局部特征,并通過共享的淺層MLP將局部特征轉(zhuǎn)換為有符號(hào)距離場(chǎng)。相比于以往的工作,該方法能夠以更小的資源消耗,重建出更準(zhǔn)確、更完整的大規(guī)模場(chǎng)景。 注:本文圖片與視頻均來自原論文與其項(xiàng)目主頁。

I 引言 對(duì)移動(dòng)機(jī)器人而言,在大規(guī)模的室外場(chǎng)景中進(jìn)行定位和導(dǎo)航是一項(xiàng)常見的任務(wù)。因此,一個(gè)精確的三維環(huán)境地圖變得尤為重要。重建的三維場(chǎng)景地圖除了要足夠精確,還應(yīng)該盡可能地減少內(nèi)存消耗。而目前的建圖方法往往采用空間網(wǎng)格來表示三維地圖[2][3][4],這種方法很難同時(shí)滿足精確建圖和減少內(nèi)存的要求。 最近,基于隱式神經(jīng)網(wǎng)絡(luò)的表示方法在精確重建網(wǎng)格的同時(shí),還能保持低內(nèi)存消耗的要求。不過,這類方法通常應(yīng)用于RGB-D數(shù)據(jù)構(gòu)建的三維場(chǎng)景[5][6][7],在LiDAR數(shù)據(jù)方面應(yīng)用的不多。此外,這類方法只適用于小型場(chǎng)景,很難應(yīng)用于大規(guī)模的室外場(chǎng)景中。 本次導(dǎo)讀論文從Takikawa等人[8] 的工作中得到啟發(fā),通過構(gòu)建稀疏的分層隱式神經(jīng)網(wǎng)絡(luò)表示,完成了對(duì)大規(guī)模場(chǎng)景的增量式重建。該方法利用八叉樹的稀疏數(shù)據(jù)結(jié)構(gòu)來增量式地存儲(chǔ)學(xué)習(xí)到的局部特征,并基于一個(gè)淺層的MLP將學(xué)習(xí)到的局部特征轉(zhuǎn)換為有符號(hào)距離場(chǎng)。除此之外,該工作還設(shè)計(jì)了一個(gè)二值交叉熵?fù)p失函數(shù),能夠高效地實(shí)現(xiàn)局部特征優(yōu)化。并且,該論文采用正則化的方法對(duì)特征更新進(jìn)行約束,有效地緩解了在大規(guī)模場(chǎng)景建圖過程中遇到的災(zāi)難性遺忘問題。實(shí)驗(yàn)結(jié)果表明: (1) 在密集點(diǎn)云采樣區(qū)域,該方法的重建精度優(yōu)于基于TSDF的方法[4][9] 以及基于體積渲染的隱式神經(jīng)映射方法[7]; (2) 在稀疏點(diǎn)云采樣區(qū)域,該方法的重建完整度優(yōu)于非學(xué)習(xí)的方法[12]; (3) 相比于基于TSDF的方法,該方法重建的場(chǎng)景內(nèi)存消耗更小。

II 技術(shù)貢獻(xiàn)

本工作主要貢獻(xiàn)如下:

提出了一種新的基于稀疏分層八叉樹的大規(guī)模場(chǎng)景表示方法。該方法增量式地將學(xué)習(xí)到的局部特征向量存儲(chǔ)在八叉樹中,并通過一個(gè)淺層的神經(jīng)網(wǎng)絡(luò)將學(xué)習(xí)到的局部特征轉(zhuǎn)換為有符號(hào)距離值;

設(shè)計(jì)了一種二值交叉損失函數(shù),能夠?qū)崿F(xiàn)快速且魯棒的局部特征值優(yōu)化;

通過對(duì)特征進(jìn)行正則化,有效避免了災(zāi)難性遺忘問題對(duì)大規(guī)模場(chǎng)景建圖的影響。

III 方法介紹 SHINE-Mapping以激光雷達(dá)點(diǎn)云作為輸入,利用稀疏分層八叉樹以及全局共享的MLP解碼器來隱式地表示連續(xù)空間中的有符號(hào)距離場(chǎng)。該方法以直接測(cè)量的點(diǎn)云作為監(jiān)督,通過在線優(yōu)化MLP解碼器輸出的有符號(hào)距離值來捕捉局部場(chǎng)景中的幾何信息。最后,該方法利用Marching Cubes[10]將有符號(hào)距離場(chǎng)轉(zhuǎn)換為顯式的網(wǎng)格信息。 隱式神經(jīng)地圖表示 首先,SHINE-Mapping將三維空間中的局部特征存儲(chǔ)在稀疏分層八叉樹中,實(shí)現(xiàn)了隱式地圖表示,有效地減少了建圖過程中的內(nèi)存開銷。其次,該方法將八叉樹中存儲(chǔ)的多層局部特征進(jìn)行求和,并送入到MLP中進(jìn)行解碼,從而得到三維空間中的有符號(hào)距離場(chǎng)。 此外,為了能夠快速查找局部空間中的特征信息,SHINE-Mapping將八叉樹中每一層特征信息存儲(chǔ)在一個(gè)哈希表中,并通過獨(dú)特的莫頓碼,將多維數(shù)據(jù)映射到一維。這樣的設(shè)計(jì)使得該方法能夠輕松地?cái)U(kuò)展地圖,而無需事先分配內(nèi)存,從而有效地提升了建圖速度。

9929d6e6-1476-11ee-962d-dac502259ad0.png

圖1 SHINE-Mapping整體重建過程 圖1為SHINE-Mapping重建隱式表示地圖的整體過程。為了便于理解,上圖中僅描述了兩個(gè)層級(jí)的特征,綠色和藍(lán)色。該方法的流程為:對(duì)于任意的查詢點(diǎn)首先從最底層(第0層)開始,對(duì)的空間位置進(jìn)行三線性插值,從而得到第0層的特征。然后以此類推,獲得第1層的特征信息。接著,該方法通過對(duì)多層的特征信息進(jìn)行求和,得到合并后的特征,并將合并后的特征送入到MLP中,從而獲得位置點(diǎn)的有符號(hào)距離值。由于整個(gè)過程是可微的,因此可以通過反向傳播的方式對(duì)特征向量和MLP參數(shù)進(jìn)行聯(lián)合優(yōu)化。 訓(xùn)練與損失函數(shù) 因?yàn)長(zhǎng)iDAR能夠提供準(zhǔn)確的三維空間測(cè)距結(jié)果,因此該方法直接以LiDAR作為真值,以二值交叉熵作為損失函數(shù)來對(duì)特征向量和MLP參數(shù)進(jìn)行監(jiān)督訓(xùn)練。除此之外,由于該方法的網(wǎng)絡(luò)輸出是有符號(hào)距離值,為了能夠得到準(zhǔn)確的輸出結(jié)果,該方法在損失函數(shù)中添加了一個(gè)Eikonal項(xiàng)[11]: 其中為網(wǎng)絡(luò)模型的輸出,為網(wǎng)絡(luò)模型的參數(shù),為網(wǎng)絡(luò)模型的輸入。 得到的損失函數(shù)如下:其中,為超參數(shù),其表示的權(quán)重。 增量式重建 在增量式重建工程中,由于每次重建只聚焦于當(dāng)前的局部區(qū)域,忽略了之前重建區(qū)域的信息,往往會(huì)導(dǎo)致最終的全局重建性能下降。為了避免這種問題對(duì)重建結(jié)果的影響SHINE-Mapping在損失函數(shù)中添加了正則化項(xiàng)用于約束參數(shù)更新:其中,為權(quán)重,表示先前訓(xùn)練數(shù)據(jù)的Loss對(duì)于參數(shù)變化的敏感性。為當(dāng)前的參數(shù)值,為之前數(shù)據(jù)訓(xùn)練收斂之后的參數(shù)值。增量式重建的損失函數(shù)如下:其中,為超參數(shù),表示的權(quán)重。 IV 部分結(jié)果展示

接下來我們首先以虛擬場(chǎng)景數(shù)據(jù)集MaiCity dataset為例,展示SHINE-Mapping與之前方法 Voxblox、VDBFusion、Puma[12] 以及添加可微渲染 (Differentiable Rendering: DR) 的SHINE-Mapping的重建結(jié)果對(duì)比。第一行展示的是重建后的網(wǎng)格結(jié)果,其中,黑色線框部分為街道兩旁的“樹”;第二行展示的是重建結(jié)果的誤差圖,從藍(lán)色到紅色的顏色圖表示從-5cm到5cm的有符號(hào)重建誤差。

995d080e-1476-11ee-962d-dac502259ad0.png

圖2 在MaiCity數(shù)據(jù)集上,不同方法的重建結(jié)果對(duì)比

表1為不同方法在MaiCity數(shù)據(jù)集上的重建質(zhì)量評(píng)價(jià)結(jié)果??梢钥闯觯琒HINE-Mapping與先前的大規(guī)模室外場(chǎng)景建圖方法相比,在完整性誤差,準(zhǔn)確性誤差、Chamfer-L1誤差、完整度、F-score上均表現(xiàn) SOTA。

999d1994-1476-11ee-962d-dac502259ad0.png

表1 不同方法在MaiCity數(shù)據(jù)集上的重建質(zhì)量對(duì)比

99bf1a76-1476-11ee-962d-dac502259ad0.gif

圖3 在MaiCity數(shù)據(jù)集上,SHINE-Mapping增量式重建過程

接下來是SHINE-Mapping在真實(shí)場(chǎng)景數(shù)據(jù)集Newer College dataset上的重建結(jié)果。第一行展示的是不同方法重建的Newer College網(wǎng)格結(jié)果,黑色線框部分為“樹”;第二行展示的是重建結(jié)果的誤差圖,從藍(lán)色到紅色的顏色圖表示從-50cm到50cm的有符號(hào)重建誤差。

9a0d1d48-1476-11ee-962d-dac502259ad0.png

圖4 在Newer College數(shù)據(jù)集上,不同方法的重建結(jié)果對(duì)比

9a61cb18-1476-11ee-962d-dac502259ad0.gif

?圖5 在Newer College數(shù)據(jù)集上,SHINE-Mapping的重建結(jié)果

表2為不同方法在Newer College dataset上的重建質(zhì)量評(píng)價(jià)結(jié)果。可以看到,在真實(shí)場(chǎng)景數(shù)據(jù)集上,相比于其他方法,SHINE-Mapping的重建質(zhì)量也是最好的。

9b7eec42-1476-11ee-962d-dac502259ad0.png

表2 不同方法在Newer College數(shù)據(jù)集上的重建質(zhì)量對(duì)比

下圖描述了在MaiCity dataset與Newer College dataset兩個(gè)數(shù)據(jù)集實(shí)驗(yàn)中,內(nèi)存消耗與建圖質(zhì)量之間的關(guān)系,地圖的分辨率從100cm到10cm。從對(duì)比結(jié)果可以看出,SHINE-Mapping方法可以使用更小的內(nèi)存資源來重建出質(zhì)量更高的室外地圖。

9b9cdc0c-1476-11ee-962d-dac502259ad0.png

圖6 不同方法在內(nèi)存效率與重建誤差上的表現(xiàn)

下圖為SHINE-Mapping在KITTI dataset上的重建過程。可以看到,即使是大規(guī)模的實(shí)際復(fù)雜街道場(chǎng)景,該方法依然可以精確地重建出道路的真實(shí)樣貌。

9be030ba-1476-11ee-962d-dac502259ad0.gif

圖7 SHINE-Mapping在KITTI數(shù)據(jù)集上的重建過程

V 總結(jié)與展望 本次導(dǎo)讀的論文提出了一種基于LiDAR的大規(guī)模三維場(chǎng)景建圖方法。與基于TSDF的方法不同,SHINE-Mapping方法使用基于八叉樹的隱式表示法,將學(xué)習(xí)到的隱式特征存儲(chǔ)在哈希表中,大大縮短了處理時(shí)間。其次,該方法將學(xué)習(xí)到的特征通過一個(gè)MLP轉(zhuǎn)換為有符號(hào)距離值,并通過Marching Cubes進(jìn)行顯式化網(wǎng)格重建。除此之外,該方法通過對(duì)損失函數(shù)進(jìn)行調(diào)整,并添加相應(yīng)的正則化,避免了增量式重建過程中遇到的災(zāi)難性遺忘問題。實(shí)驗(yàn)結(jié)果表明,該方法能夠以較小的內(nèi)存重建出更為準(zhǔn)確和完整的三維地圖。 VI 思考與討論 Q: SHINE-Mapping方法將局部特征信息存放入八叉樹中時(shí),使用了其中的幾層呢?又是如何實(shí)現(xiàn)快速查找對(duì)應(yīng)的特征信息的呢? A: 如下圖所示,假設(shè)八叉樹為11層,SHINE-Mapping方法將最低的三層作為局部特征存放層,即第0,1,2層(分別對(duì)應(yīng)圖中的紅色、綠色、藍(lán)色方格)。為了能夠加速建圖速度,SHINE-Mapping將八叉樹中第 0,1,2層的局部特征信息存儲(chǔ)在哈希表中,并且每一層對(duì)應(yīng)一個(gè)哈希表。當(dāng)需要查詢指定點(diǎn)的局部特征時(shí),使用哈希表可以很快得到相應(yīng)的特征信息。

9c7dfc1e-1476-11ee-962d-dac502259ad0.png

圖8SHINE-Mapping對(duì)空間進(jìn)行網(wǎng)格劃分,并得到局部特征信息 Q: 在增量式重建過程中,是否可以使用預(yù)訓(xùn)練的MLP作為解碼器來得到相應(yīng)的有符號(hào)距離值? A: 是的,雖然本文提出的方法可以在訓(xùn)練過程中聯(lián)合優(yōu)化八叉樹中的局部特征信息以及MLP中的參數(shù),但是在實(shí)際增量式重建過程中,作者采用的是預(yù)訓(xùn)練的MLP來得到對(duì)應(yīng)位置的有符號(hào)距離值,一方面這樣可以加快重建的速度,另外一方面,在實(shí)驗(yàn)過程中,使用預(yù)訓(xùn)練的MLP可以得到更好的重建效果。 以下是開放性問題,歡迎讀者朋友留言討論: Q: SHINE-Mapping在增量式重建的過程中,實(shí)際上是增量式地更新空間中的局部特征信息,并在更新完整個(gè)地圖之后,使用MLP將局部特征信息轉(zhuǎn)換為有符號(hào)距離值,然后使用Marching Cubes來顯式的構(gòu)建網(wǎng)格。因此,如果想在建圖的過程中,實(shí)時(shí)地查看重建的網(wǎng)格信息,則需要不斷地調(diào)用MLP和Marching Cubes,這將會(huì)導(dǎo)致實(shí)時(shí)的計(jì)算效率非常低。那么應(yīng)該如何改進(jìn)這一方法,或者是否可以使用其他的網(wǎng)格構(gòu)建方法,使得在快速建圖過程中,能夠?qū)崟r(shí)地查看重建效果呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28103

    瀏覽量

    205849
  • 三維
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    28923
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4277

    瀏覽量

    62323

原文標(biāo)題:基于稀疏分層隱式神經(jīng)表示的大規(guī)模三維場(chǎng)景建圖

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    單像素動(dòng)態(tài)液晶透鏡的三維立體顯示方法介紹

    近來,三維顯示技術(shù)受到了極大的關(guān)注,并有可能在將來帶來一個(gè)可觀的市場(chǎng)。三維顯示依據(jù)實(shí)現(xiàn)方法分為多種,例如:偏振眼鏡法式、頭盔、障柵、棱鏡
    的頭像 發(fā)表于 11-01 07:57 ?6343次閱讀
    單像素動(dòng)態(tài)液晶透鏡的<b class='flag-5'>三維</b>立體顯示<b class='flag-5'>方法</b>介紹

    光學(xué)三維測(cè)量技術(shù)的各種實(shí)現(xiàn)方法及原理

    本文主要對(duì)接觸三維測(cè)量和非接觸三維測(cè)量進(jìn)行了介紹。著重介紹了光學(xué)三維測(cè)量技術(shù)的各種實(shí)現(xiàn)方法
    發(fā)表于 07-13 10:09 ?3919次閱讀

    三維網(wǎng)的高級(jí)處理

    三維網(wǎng)的高級(jí)處理1. 消處理 例.比較網(wǎng)前后的圖形 z=peaks(50); subplot(2,1,1); mesh(z); t
    發(fā)表于 09-22 15:37

    什么讓三維掃描數(shù)據(jù)栩栩如生

    三維模型數(shù)據(jù)5.真實(shí)拍攝的物體照片4、小結(jié)思看科技的HSCAN331可以在10分鐘內(nèi)掃描出該物體外形,相比傳統(tǒng)的三維掃描儀,HSCAN手持三維
    發(fā)表于 08-02 10:18

    labview怎樣畫三維曲面?

    用labview三維曲面圖畫一個(gè)曲面,橫截面表達(dá)式為f=2.4*y*y*y*y-1.6*y*y+0.1*y+2.2
    發(fā)表于 12-15 18:42

    三維快速建模技術(shù)與三維掃描建模的應(yīng)用

    的HANDYSCAN三維激光掃描儀采集它的三維點(diǎn)云信息,然后利用Vxelements軟件對(duì)多站點(diǎn)云數(shù)據(jù)進(jìn)行拼接、統(tǒng)一化和去燥,將處理后的點(diǎn)云數(shù)據(jù)導(dǎo)入Geomagic Studio軟件,對(duì)其進(jìn)行封裝、孔洞填充、平滑等
    發(fā)表于 08-07 11:14

    廣西掃描服務(wù)三維檢測(cè)三維掃描儀

    、醫(yī)療、教育等行業(yè)都在廣泛使用三維掃描技術(shù)。中科院廣州電子的Creaform便攜激光三維掃描儀掃描工件的三維數(shù)據(jù),通過實(shí)物與理論二
    發(fā)表于 08-29 14:42

    Handyscan三維掃描儀對(duì)戶外大型燈箱三維掃描解決方案

    的戶外廣告燈箱的生產(chǎn)圖紙??蛻粼瓉硎鞘褂美鲜降呐恼?b class='flag-5'>式三維掃描儀,掃描前需要噴粉、貼點(diǎn),但是掃描數(shù)據(jù)精度卻差強(qiáng)人意,不僅外觀粗糙、噪點(diǎn)多,且掃描速度慢,工作效率低。在掃描結(jié)束后,還需要再對(duì)噴的粉(顯像劑
    發(fā)表于 07-15 10:52

    Labview繪制三維曲面

    `現(xiàn)在有個(gè)項(xiàng)目我想優(yōu)化一下,想要添加一個(gè)三維曲線圖(火山),有沒有在這方面有過研究的?不太會(huì)弄,每次畫出來的都奇奇怪怪的,主要問題應(yīng)該是數(shù)據(jù)不夠,有人知道怎么將X-Z,Y-Z(如圖)兩條曲線擬合
    發(fā)表于 12-18 10:12

    光學(xué)方法測(cè)量三維形狀綜述

    光學(xué)方法測(cè)量三維形狀綜述光學(xué)方法測(cè)量三維形狀綜述光學(xué)方法測(cè)量三維形狀綜述
    發(fā)表于 01-07 16:48 ?2次下載

    近日奧比中光Workshop舉行展示 商業(yè)空間三維數(shù)字化大規(guī)模應(yīng)用前景

    近日,奧比中光Workshop系列之新商業(yè)沙龍?jiān)谏钲谂e行,北京眾趣科技創(chuàng)始人、CEO高翔發(fā)表了題為《商業(yè)空間三維數(shù)字化的大規(guī)模應(yīng)用》演講,展示了商業(yè)空間三維數(shù)字化的大規(guī)模應(yīng)用前景。
    的頭像 發(fā)表于 07-26 11:06 ?3252次閱讀

    基于三維激光數(shù)據(jù)的層級(jí)SLAM方法

    課題組已將該研究成果應(yīng)用于智能駕駛即時(shí)定位與(SLAM)任務(wù)中,提出了基于三維激光數(shù)據(jù)的層級(jí)SLAM方法,實(shí)現(xiàn)了無GNSS環(huán)境下智能無
    的頭像 發(fā)表于 04-20 09:19 ?2040次閱讀
    基于<b class='flag-5'>三維</b>激光數(shù)據(jù)的層級(jí)<b class='flag-5'>式</b>SLAM<b class='flag-5'>方法</b>

    智慧城市_實(shí)景三維|物業(yè)樓三維掃描案例分享_泰來三維

    三維激光掃描技術(shù)是近年來發(fā)展的新型測(cè)量方法,通過三維掃描獲取大量全面點(diǎn)云數(shù)據(jù),形成三維立體模型,實(shí)現(xiàn)快速掌握被測(cè)目標(biāo)信息。
    的頭像 發(fā)表于 05-16 13:56 ?991次閱讀
    智慧城市_實(shí)景<b class='flag-5'>三維</b>|物業(yè)樓<b class='flag-5'>三維</b>掃描案例分享_泰來<b class='flag-5'>三維</b>

    NeurlPS&apos;23開源 | 大規(guī)模室外NeRF也可以實(shí)時(shí)渲染

    神經(jīng)輻射場(chǎng) (NeRF)是一種新穎的三維重建方法,顯示出巨大的潛力,受到越來越多的關(guān)注。它能夠僅從一組照片中重建3D場(chǎng)景。然而,它的實(shí)時(shí)渲染能力,尤其是對(duì)于
    的頭像 發(fā)表于 11-08 16:41 ?972次閱讀
    NeurlPS&apos;23開源 | <b class='flag-5'>大規(guī)模</b>室外NeRF也可以實(shí)時(shí)渲染

    RayDF:實(shí)時(shí)渲染!基于射線的三維重建新方法

    在機(jī)器視覺和機(jī)器人領(lǐng)域的許多前沿應(yīng)用中,學(xué)習(xí)準(zhǔn)確且高效的三維形狀表達(dá)是十分重要的。然而,現(xiàn)有的基于三維坐標(biāo)的
    的頭像 發(fā)表于 11-17 16:23 ?678次閱讀
    RayDF:實(shí)時(shí)渲染!基于射線的<b class='flag-5'>三維</b>重建新<b class='flag-5'>方法</b>