0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于SLAM的神經(jīng)隱含可擴(kuò)展編碼

3D視覺工坊 ? 來源:泡泡機(jī)器人SLAM ? 2023-01-30 11:19 ? 次閱讀

摘要

最近,神經(jīng)隱含表征在各個(gè)領(lǐng)域顯示出令人鼓舞的結(jié)果,包括在同步定位和映射(SLAM)方面取得的可喜進(jìn)展。然而,現(xiàn)有的方法產(chǎn)生了過度平滑的場(chǎng)景重建,并且難以擴(kuò)展到大場(chǎng)景。這些限制主要是由于其簡(jiǎn)單的全連接網(wǎng)絡(luò)結(jié)構(gòu),沒有將局部信息納入觀察范圍。

在本文中,我們提出了NICE-SLAM,這是一個(gè)密集的SLAM系統(tǒng),通過引入分層的場(chǎng)景表示,納入了多層次的本地信息。用預(yù)先訓(xùn)練好的幾何先驗(yàn)來優(yōu)化這個(gè)表示,可以在大的室內(nèi)場(chǎng)景中進(jìn)行詳細(xì)的重建。與最近的神經(jīng)隱含SLAM系統(tǒng)相比,我們的方法更具可擴(kuò)展性、效率和魯棒性。在五個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)表明,NICE-SLAM在映射和跟蹤質(zhì)量方面都具有競(jìng)爭(zhēng)力。

主要貢獻(xiàn)

我們提出了NICE-SLAM,一個(gè)密集的RGB-DSLAM系統(tǒng),它具有實(shí)時(shí)性、可擴(kuò)展性、預(yù)測(cè)性和對(duì)各種挑戰(zhàn)性場(chǎng)景的魯棒性。

NICE-SLAM的核心是一個(gè)分層的、基于網(wǎng)格的神經(jīng)隱式編碼。與全局神經(jīng)場(chǎng)景編碼相比,這種表示法允許局部更新,這是大規(guī)模方法的一個(gè)先決條件。

我們?cè)诟鞣N數(shù)據(jù)集上進(jìn)行了廣泛的評(píng)估,證明了在映射和跟蹤方面具有競(jìng)爭(zhēng)力的性能。

主要方法

我們的方法將RGB-D圖像流作為輸入,并以分層特征網(wǎng)格的形式輸出攝像機(jī)的姿勢(shì)和學(xué)習(xí)到的場(chǎng)景表示。從右到左,我們的管道可以被解釋為一個(gè)生成模型,它根據(jù)給定的場(chǎng)景表示和攝像機(jī)姿勢(shì)渲染深度和顏色圖像。在測(cè)試時(shí),我們通過逆向傳播圖像和深度重建損失來解決逆向問題,并通過可區(qū)分的渲染器(從左到右)來估計(jì)場(chǎng)景表現(xiàn)和攝像機(jī)的姿勢(shì)。

這兩個(gè)實(shí)體都是在交替優(yōu)化中估計(jì)的。映射:逆?zhèn)鞑ブ桓聦哟位膱?chǎng)景表示。跟蹤:逆?zhèn)鞑ブ桓聰z像機(jī)的姿態(tài)。為了提高可讀性,我們將用于幾何編碼的細(xì)尺度網(wǎng)格與同等大小的顏色網(wǎng)格結(jié)合起來,并將它們顯示為具有兩個(gè)屬性(紅色和橙色)的一個(gè)網(wǎng)格。

cbdceb7c-984e-11ed-bfe3-dac502259ad0.png

1. 層次化的場(chǎng)景表示

現(xiàn)在我們介紹一下我們的分層場(chǎng)景表示,它結(jié)合了多級(jí)網(wǎng)格特征和預(yù)訓(xùn)練的解碼器,用于占用率預(yù)測(cè)。幾何圖形被編碼成三個(gè)特征網(wǎng)格j l θ和它們相應(yīng)的MLP解碼器f l,其中l(wèi)∈{0,1,2}是指粗、中、細(xì)三級(jí)場(chǎng)景細(xì)節(jié)。此外,我們還有一個(gè)單一的特征網(wǎng)格ψω和解碼器gω來模擬場(chǎng)景外觀。這里θ和ω表示幾何和顏色的可優(yōu)化參數(shù),即網(wǎng)格中的特征和顏色解碼器中的權(quán)重。

2. 深度和色彩渲染

給定相機(jī)的固有參數(shù)和當(dāng)前相機(jī)的姿勢(shì),我們可以計(jì)算出一個(gè)像素坐標(biāo)的觀察方向r。我們首先沿著這條射線對(duì)Nstrat點(diǎn)進(jìn)行分層采樣,同時(shí)對(duì)靠近深度的Nimp點(diǎn)進(jìn)行均勻采樣1。

我們對(duì)每條射線總共取樣N=Nstrat+Nimp點(diǎn)。更正式地說,讓pi = o + dir, i∈ {1, - -, N}表示給定攝像機(jī)原點(diǎn)o的射線r上的采樣點(diǎn),di對(duì)應(yīng)于pi沿該射線的深度值。對(duì)于每一個(gè)點(diǎn)pi,我們可以計(jì)算出它們的粗粒度占用概率o0 pi,細(xì)粒度占用概率opi,和顏色值cpi。

最后,對(duì)于每條射線,在粗略和精細(xì)層面的深度,以及顏色可以被呈現(xiàn)為:

cbe79db0-984e-11ed-bfe3-dac502259ad0.png

cbf1a6f2-984e-11ed-bfe3-dac502259ad0.png

cbfe2698-984e-11ed-bfe3-dac502259ad0.png

3. 建圖和跟蹤

建圖。

為了優(yōu)化上文提到的場(chǎng)景表示,我們從當(dāng)前幀和選定的關(guān)鍵幀中均勻地取樣共M個(gè)像素。接下來,我們以分階段的方式進(jìn)行優(yōu)化,以最小化幾何和光度損失。

幾何損失僅僅是觀測(cè)值和預(yù)測(cè)深度之間的L1損失,在粗略的或精細(xì)的水平上為:

cc061ba0-984e-11ed-bfe3-dac502259ad0.png

光度損失為:

cc0e3d6c-984e-11ed-bfe3-dac502259ad0.png

相機(jī)跟蹤。

除了優(yōu)化場(chǎng)景表示外,我們還平行運(yùn)行攝像機(jī)跟蹤,以優(yōu)化當(dāng)前幀的攝像機(jī)姿勢(shì),即旋轉(zhuǎn)和平移{R,t}。為此,我們對(duì)當(dāng)前幀中的Mt像素進(jìn)行采樣,并應(yīng)用上面相同的光度損失,但使用一個(gè)修改過的幾何損失:

cc19600c-984e-11ed-bfe3-dac502259ad0.png

修改后的損失在重建的幾何形狀中減少了某些區(qū)域的權(quán)重,例如物體的邊緣。攝像機(jī)跟蹤最終被表述為以下最小化問題:

cc27b26a-984e-11ed-bfe3-dac502259ad0.png

4. 關(guān)鍵幀的選擇 與其他SLAM系統(tǒng)類似

我們用一組選定的關(guān)鍵幀不斷優(yōu)化我們的分層場(chǎng)景表示。我們按照iMAP的方法維護(hù)一個(gè)全局關(guān)鍵幀列表,我們根據(jù)信息增益逐步添加新的關(guān)鍵幀。然而,與iMAP相比,我們?cè)趦?yōu)化場(chǎng)景幾何時(shí)只包括與當(dāng)前幀有視覺重疊的關(guān)鍵幀。這是可能的,因?yàn)槲覀兡軌驅(qū)ξ覀兊幕诰W(wǎng)格的表示進(jìn)行局部更新,而且我們不會(huì)像iMap那樣存在關(guān)鍵幀消失的問題。

這種關(guān)鍵幀選擇策略不僅確保了當(dāng)前視圖之外的幾何形狀保持靜態(tài),而且還導(dǎo)致了一個(gè)非常有效的優(yōu)化問題,因?yàn)槲覀兠看沃粌?yōu)化必要的參數(shù)。在實(shí)踐中,我們首先隨機(jī)地對(duì)像素進(jìn)行采樣,并使用優(yōu)化后的相機(jī)姿勢(shì)對(duì)相應(yīng)的深度進(jìn)行反投影。

然后,我們將點(diǎn)云投影到全局關(guān)鍵幀列表中的每個(gè)關(guān)鍵幀。從這些有點(diǎn)投射到的關(guān)鍵幀中,我們隨機(jī)選擇K-2幀。此外,我們還將最近的關(guān)鍵幀和當(dāng)前的幀包括在場(chǎng)景表示優(yōu)化中,形成總共K個(gè)活動(dòng)幀。

主要結(jié)果

cc30744a-984e-11ed-bfe3-dac502259ad0.png

cc43f9e8-984e-11ed-bfe3-dac502259ad0.png

cc4cf5e8-984e-11ed-bfe3-dac502259ad0.png

cc599ee2-984e-11ed-bfe3-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1129

    瀏覽量

    40636
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    796

    瀏覽量

    58336
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    415

    瀏覽量

    31758
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4216

原文標(biāo)題:NICE-SLAM:用于SLAM的神經(jīng)隱含可擴(kuò)展編碼(CVPR 2022)

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    動(dòng)態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D SLAM

    神經(jīng)隱式表示已經(jīng)被探索用于增強(qiáng)視覺SLAM掩碼算法,特別是在提供高保真的密集地圖方面。
    的頭像 發(fā)表于 01-17 10:39 ?848次閱讀
    動(dòng)態(tài)環(huán)境中基于<b class='flag-5'>神經(jīng)</b>隱式表示的RGB-D <b class='flag-5'>SLAM</b>

    SLAM技術(shù)的應(yīng)用及發(fā)展現(xiàn)狀

    近年來,由于掃地機(jī)的出現(xiàn)使得SLAM技術(shù)名聲大噪,如今,已在機(jī)器人、無人機(jī)、AVG等領(lǐng)域相繼出現(xiàn)它的身影,今天就來跟大家聊一聊國(guó)內(nèi)SLAM的發(fā)展現(xiàn)狀。 SLAM的多領(lǐng)域應(yīng)用SLAM應(yīng)用
    發(fā)表于 12-06 10:25

    讓機(jī)器人完美建圖的SLAM 3.0到底是何方神圣?

    過程中調(diào)整了圖結(jié)構(gòu)中每個(gè)節(jié)點(diǎn)的pose和對(duì)應(yīng)的傳感器信息以及所有關(guān)鍵點(diǎn)構(gòu)建的位姿關(guān)系圖,利用全部的機(jī)器人位姿信息和對(duì)應(yīng)傳感器數(shù)據(jù)生成環(huán)境地圖。    SLAM 3.0 編碼了機(jī)器人在SLAM過程中的位
    發(fā)表于 01-21 10:57

    【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)

    傳播的,不會(huì)回流),區(qū)別于循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。BP算法(Back Propagation):誤差反向傳播算法,用于更新網(wǎng)絡(luò)中的權(quán)重。BP神經(jīng)網(wǎng)絡(luò)思想:表面上:1. 數(shù)據(jù)信息的前向傳播,從輸入層到
    發(fā)表于 07-21 04:00

    SLAM技術(shù)目前主要應(yīng)用在哪些領(lǐng)域

      目前,SLAM(即時(shí)定位與地圖構(gòu)建)技術(shù)主要被運(yùn)用于無人機(jī)、無人駕駛、機(jī)器人、AR、智能家居等領(lǐng)域,從各應(yīng)用場(chǎng)景入手,促進(jìn)消費(fèi)升級(jí)?! C(jī)器人  激光+SLAM是目前機(jī)器人自主定位導(dǎo)航所
    發(fā)表于 12-01 14:26

    激光SLAM與視覺SLAM有什么區(qū)別?

    機(jī)器人定位導(dǎo)航中,目前主要涉及到激光SLAM與視覺SLAM,激光SLAM在理論、技術(shù)和產(chǎn)品落地上都較為成熟,因而成為現(xiàn)下最為主流的定位導(dǎo)航方式,在家用掃地機(jī)器人及商用送餐機(jī)器人等服務(wù)機(jī)器人中普遍采用了...
    發(fā)表于 07-05 06:41

    基于視覺的slam自動(dòng)駕駛

    基于視覺的slam自動(dòng)駕駛,這是我們測(cè)試的視頻《基于slam算法的智能機(jī)器人》調(diào)研分析報(bào)告項(xiàng)目背景分析機(jī)器人曾經(jīng)是科幻電影中的形象,目前已經(jīng)漸漸走入我們的生活。機(jī)器人技術(shù)以包含機(jī)械、電子、自動(dòng)控制
    發(fā)表于 08-09 09:37

    單目視覺SLAM仿真系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

    實(shí)現(xiàn)單目視覺同時(shí)定位與建圖(SLAM)仿真系統(tǒng),描述其設(shè)計(jì)過程。該系統(tǒng)工作性能良好,其SLAM算法擴(kuò)展性強(qiáng),可以精確逼近真實(shí)單目視覺SLAM
    發(fā)表于 04-15 08:50 ?82次下載

    擴(kuò)展應(yīng)用與擴(kuò)展系統(tǒng)

    擴(kuò)展計(jì)算機(jī)系統(tǒng) 在各個(gè)領(lǐng)域得到了越來越廣泛的應(yīng)用,這些應(yīng)用往往具有擴(kuò)展的需求,而這些擴(kuò)展應(yīng)
    發(fā)表于 05-30 10:08 ?33次下載
    <b class='flag-5'>可</b><b class='flag-5'>擴(kuò)展</b>應(yīng)用與<b class='flag-5'>可</b><b class='flag-5'>擴(kuò)展</b>系統(tǒng)

    基于擴(kuò)展編碼的多視角視頻編碼研究

    本內(nèi)容提供了基于擴(kuò)展編碼的多視角視頻編碼研究
    發(fā)表于 09-26 15:39 ?25次下載
    基于<b class='flag-5'>可</b><b class='flag-5'>擴(kuò)展</b><b class='flag-5'>編碼</b>的多視角視頻<b class='flag-5'>編碼</b>研究

    57682543slam_code

    基于擴(kuò)展卡爾曼濾波的SLAM算法相關(guān)代碼。
    發(fā)表于 03-22 14:11 ?34次下載

    谷歌全新操作系統(tǒng)Android Q Beta 1發(fā)布 擴(kuò)展神經(jīng)網(wǎng)絡(luò)API

    據(jù)國(guó)外媒體報(bào)道,谷歌今日發(fā)布全新操作系統(tǒng)Android Q Beta 1,其主要特性有增強(qiáng)的隱私和安全功能,支持可折疊屏幕的增強(qiáng)功能,全新API接口,全新媒體編碼解碼器,全新攝像頭功能,擴(kuò)展
    的頭像 發(fā)表于 03-17 09:13 ?2516次閱讀

    用于神經(jīng)場(chǎng)SLAM的矢量化對(duì)象建圖

    vMAP 是一種基于神經(jīng)場(chǎng)的對(duì)象級(jí)密集 SLAM 系統(tǒng),可根據(jù) RGB-D 輸入流實(shí)時(shí)自動(dòng)構(gòu)建對(duì)象級(jí)場(chǎng)景模型。
    的頭像 發(fā)表于 06-15 09:29 ?739次閱讀
    <b class='flag-5'>用于</b><b class='flag-5'>神經(jīng)</b>場(chǎng)<b class='flag-5'>SLAM</b>的矢量化對(duì)象建圖

    視覺SLAM是什么?視覺SLAM的工作原理 視覺SLAM框架解讀

    近年來,SLAM技術(shù)取得了驚人的發(fā)展,領(lǐng)先一步的激光SLAM已成熟的應(yīng)用于各大場(chǎng)景中,視覺SLAM雖在落地應(yīng)用上不及激光SLAM,但也是目前
    的頭像 發(fā)表于 09-05 09:31 ?3686次閱讀
    視覺<b class='flag-5'>SLAM</b>是什么?視覺<b class='flag-5'>SLAM</b>的工作原理 視覺<b class='flag-5'>SLAM</b>框架解讀

    NeRF何去何從?GS SLAM到底哪家強(qiáng)?來看看最新的開源方案!

    Gaussian-SLAM提出了用于seeding和優(yōu)化Gaussian splats的新策略,以將其從多視圖離線場(chǎng)景擴(kuò)展到RGBD序列。還擴(kuò)展了Gaussian splats來
    的頭像 發(fā)表于 12-26 16:38 ?1104次閱讀
    NeRF何去何從?GS <b class='flag-5'>SLAM</b>到底哪家強(qiáng)?來看看最新的開源方案!