0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于快速高保真RGB-D表面重建的神經特征網格優(yōu)化的GO-Surf

3D視覺工坊 ? 來源:泡泡機器人SLAM ? 2023-03-17 16:35 ? 次閱讀

摘要

我們提出了GO-Surf,一種直接的特征網格優(yōu)化方法,用于從RGB-D序列中準確和快速地重建表面。我們用一個學習過的分層特征體素網格對底層場景進行建模,該網格封裝了多層次的幾何和外觀局部信息。

特征向量被直接優(yōu)化,以便在三線插值后,由兩個淺層MLP解碼為有符號的距離和輻射度值,并通過體積渲染進行渲染,使合成的RGB/深度值與觀察到的RGB/深度值之間的差異最小。

我們的監(jiān)督信號--RGB、深度和近似的SDF--可以直接從輸入圖像中獲得,不需要任何融合或后處理。我們制定了一個新的SDF梯度正則化項,鼓勵表面光滑和孔洞填充,同時保持高頻細節(jié)。GO-Surf可以在15-45分鐘內優(yōu)化1-2K幀的序列,比基于MLP表示的最相關方法NeuralRGB-D的速度提高了60倍,同時在標準基準上保持同等的性能。

主要貢獻: GO-Surf將可學習的特征網格引入RGB-D序列的SDF重建中,以實現(xiàn): (i) 在交互式運行時間內快速優(yōu)化 (ii) 高精度的表面重建。 我們還首次在體素網格的背景下應用Eikonal和平滑度正則化條款。

主要方法

給定一個輸入的RGB-D序列,GO-Surf通過直接優(yōu)化一個多分辨率的特征網格和有符號的距離值以及顏色預測來獲得高質量的三維表面重建。

我們在有符號距離值上制定了一個新的平滑度先驗,從而在保留細節(jié)的同時,改善了孔洞填充和平滑度特性。我們的優(yōu)化比基于MLP的方法快×60倍。

ad4fb7a8-c494-11ed-bfe3-dac502259ad0.png

GO-Surf使用多級特征網格和兩個淺層MLP解碼器。給定一個沿射線的采樣點,每個網格通過三線插值進行查詢。多級特征被串聯(lián)并解碼為SDF,并用于計算樣本權重。顏色是由最細的網格單獨解碼的。

損失項被應用于SDF值,并渲染深度和顏色。在每個查詢點計算SDF的梯度,并用于Eikonal和平滑度正則化。

ad8d5842-c494-11ed-bfe3-dac502259ad0.pngad9b92cc-c494-11ed-bfe3-dac502259ad0.png

主要結果

af01cc12-c494-11ed-bfe3-dac502259ad0.pngaf208de6-c494-11ed-bfe3-dac502259ad0.pngaf6a4594-c494-11ed-bfe3-dac502259ad0.png

afc9355e-c494-11ed-bfe3-dac502259ad0.png





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1107

    瀏覽量

    40443
  • RGB
    RGB
    +關注

    關注

    4

    文章

    785

    瀏覽量

    58204
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4183

原文標題:3DV2022 | GO-Surf: 用于快速、高保真RGB-D表面重建的神經特征網格優(yōu)化

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    動態(tài)環(huán)境中基于神經隱式表示的RGB-D SLAM

    神經隱式表示已經被探索用于增強視覺SLAM掩碼算法,特別是在提供高保真的密集地圖方面。
    的頭像 發(fā)表于 01-17 10:39 ?773次閱讀
    動態(tài)環(huán)境中基于<b class='flag-5'>神經</b>隱式表示的<b class='flag-5'>RGB-D</b> SLAM

    高保真是什么意思?什么叫高保真

    `<p><b><font face="Verdana">高保真
    發(fā)表于 05-04 18:58

    如何去開發(fā)一款基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)有哪些關鍵技術?如何去開發(fā)一款基于RGB-D相機與機械臂的三維重建無序抓取系統(tǒng)?基于RGB-D
    發(fā)表于 09-08 06:12

    什么是高保真耳機

    什么叫高保真耳機 常聽說“高保真耳機”、“高保真音響”。音響中的“高保真”指的是什么高保真簡單的說就是 讓你感受原汁原味的聲音 好象就在
    發(fā)表于 10-09 16:18 ?53次下載

    什么是高保真?

    什么是高保真? 高保真的英文原詞是High Fidelity,簡稱HI-FI。高保真指聲頻錄音及放音系統(tǒng)或設備具有如實反
    發(fā)表于 05-04 18:55 ?1.1w次閱讀

    基于RGB-D圖像物體識別方法

    針對傳統(tǒng)的顏色一深度(RGB-D)圖像物體識別的方法所存在的圖像特征學習不全面、特征編碼魯棒性不夠等問題,提出了基于核描述子局部約束線性編碼( KD-LLC)的RGB-D圖像物體識別方
    發(fā)表于 12-07 10:22 ?1次下載
    基于<b class='flag-5'>RGB-D</b>圖像物體識別方法

    基于STL曲面網格重建算法

    快速獲得完整拓撲關系且其存在大量冗余信息的缺點,制約了STL網格模型的進一步優(yōu)化處理與應用.為此,需要針對STL網格模型進行網格
    發(fā)表于 12-25 11:52 ?1次下載
    基于STL曲面<b class='flag-5'>網格</b><b class='flag-5'>重建</b>算法

    RGB-D圖像是什么

    RGB-D圖像其實是兩幅圖像。
    的頭像 發(fā)表于 11-01 11:46 ?1.8w次閱讀

    基于RGB-D相機的三維重建和傳統(tǒng)SFM和SLAM算法有什么區(qū)別?

    輸入數(shù)據流不同。在基于RGB-D相機的三維重建中,輸入有深度信息和彩色信息,并且深度信息起主導作用,而在SLAM和SFM算法中輸入的是主要是彩色信息,個別工作也有結合深度信息。
    發(fā)表于 03-23 12:28 ?1211次閱讀

    GO-Surf: 用于快速、高保真RGB-D表面重建神經特征網格優(yōu)化

    GO-Surf使用多級特征網格和兩個淺層MLP解碼器。給定一個沿射線的采樣點,每個網格通過三線插值進行查詢。多級特征被串聯(lián)并解碼為SDF,并
    的頭像 發(fā)表于 03-24 11:13 ?812次閱讀

    生成高質量 3D 網格,從重建到生成式 AI

    新一代 AI 工作流已經在生成高保真 3D 模型方面取得了巨大成功,從基于給定圖像的場景重建,到能夠為交互式體驗制作資產的生成式 AI。 這些生成的 3D 模型通常被提取成標準的三角
    的頭像 發(fā)表于 08-17 19:15 ?633次閱讀
    生成高質量 3<b class='flag-5'>D</b> <b class='flag-5'>網格</b>,從<b class='flag-5'>重建</b>到生成式 AI

    基于3D形狀重建網絡的機器人抓取規(guī)劃方法

    一個帶有分割掩碼的輸入RGB-D圖像被提供給兩個神經網絡,分別產生一個6自由度的抓取姿勢和一個物體的3D點云重建。通過將抓取姿勢投影到點云中最近的點來
    發(fā)表于 11-02 10:39 ?380次閱讀
    基于3<b class='flag-5'>D</b>形狀<b class='flag-5'>重建</b>網絡的機器人抓取規(guī)劃方法

    一種基于RGB-D圖像序列的協(xié)同隱式神經同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計、回環(huán)檢測、子圖融合和全局優(yōu)化。
    的頭像 發(fā)表于 11-29 10:35 ?468次閱讀
    一種基于<b class='flag-5'>RGB-D</b>圖像序列的協(xié)同隱式<b class='flag-5'>神經</b>同步定位與建圖(SLAM)系統(tǒng)

    手持RGB-D傳感器廣泛應用的情況

    DisCo方法:提出了一種基于擴散的跨模態(tài)形狀重建方法。該方法利用三平面擴散模型,結合部分點云和多視圖圖像,實現(xiàn)了高保真度的3D形狀重建?;旌?b class='flag-5'>特征
    的頭像 發(fā)表于 12-26 16:44 ?348次閱讀
    手持<b class='flag-5'>RGB-D</b>傳感器廣泛應用的情況

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實時室內場景三維重建算法框架。輸入為RGB-D相機采集的并且是對齊好的RGB圖像和深度圖的數(shù)據流。輸出為重建好的稠密三維場景模型。
    的頭像 發(fā)表于 04-16 09:37 ?622次閱讀
    常用的<b class='flag-5'>RGB-D</b> SLAM解決方案