0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于NeRF的三維場景重建和理解

3D視覺工坊 ? 來源:深藍(lán)AI ? 2023-02-06 10:50 ? 次閱讀

如果從方法出發(fā)的話,兩張圖就能看懂:

a30c93d0-a570-11ed-bfe3-dac502259ad0.png

圖 1

a31dad5a-a570-11ed-bfe3-dac502259ad0.png

圖 2 上面是 NeRF網(wǎng)絡(luò)結(jié)構(gòu),下面是 Semantic-NeRF 的網(wǎng)絡(luò)結(jié)構(gòu),就是在 NeRF 的網(wǎng)絡(luò)中加了一個分支,輸出到語義。和 NeRF 一樣,Semantic-NeRF 能夠連續(xù)的表達(dá)空間信息,因此你可以看到 Semantic-NeRF 主頁里的各種酷炫的 demo. 這是 ICCV 2021 的 oral 工作。 如果有留意上一講的講座,從 Semantic-NeRF 的demo中你應(yīng)該能推測出,這應(yīng)該是第四種拍攝方式:

a33919e6-a570-11ed-bfe3-dac502259ad0.png

圖 3 這種拍攝方式在SLAM或者SFM中更多見,而傳統(tǒng)三維重建或者RGBD重建是很難做出 NeRF 或者 Semantic-NeRF 這種效果的。所以方法可能很簡單,但是這個工作很有意義。 應(yīng)用的話,大家可以參考視頻。

Semantic-NeRF應(yīng)用

稀疏監(jiān)督下的新視角語義生成(Semantic View Synthesis with Sparse Labels

語義標(biāo)簽去噪(LabelDenoising

語義標(biāo)簽超分辨(Super-Resolution)

稀疏語義標(biāo)簽傳播(LabelPropagation)

多視角語義融合(Multi-view Semantic Fusion)

稠密的語義三維重建

在這篇工作之后智博又做了 iLabel 的工作,將 imap 和 semantic-NeRF 結(jié)合,這里我們就不細(xì)講了,感興趣的同學(xué)歡迎去看原文。 需要提到的另一篇工作是 NeSF 這篇文章。 智博在講解 NeSF 的時候提到,訓(xùn)練的sample是場景,而不是圖片,這是對這篇文章的一個高度概況。NeSF 首先會訓(xùn)練許多場景,比如100個場景,那我們就會得到100個 NeRF 的模型,我們對這 100 個 NeRF 的模型做 Grid query,從而獲取一個 Density Grid,其實(shí)就是一堆規(guī)則的點(diǎn),可以使用 3D 卷積,從而轉(zhuǎn)換為 Feature Grid. 對 Feature Grid 做 volume rendering 就能渲染出各個視角的語義圖像了。下面是 NeSF 的流程圖。

a374c306-a570-11ed-bfe3-dac502259ad0.png

圖 4 NeSF流程圖 NeSF 的泛化性從 demo 來看還是不錯的,但是這樣的工作顯然不是我們可以玩的 (訓(xùn)練 100 個 NeRF), 你幾乎不用猜都知道是哪里出的工作。 這也就引出了 NeRF 的許多痛點(diǎn),印象里第四講嘉賓在講 NeRF in the wild 和 Ha-NeRF 的時候說,每次實(shí)驗(yàn)要 4 張V100 跑2天。因此不論是推理還是訓(xùn)練,加速工作都顯得尤為重要,對語義 NeRF 相關(guān)的工作更是如此,因?yàn)槟壳暗募铀俟ぷ鞔蠖純A向于擺脫神經(jīng)網(wǎng)絡(luò)。 動態(tài)場景的 NeRF 也有一些工作,但是是否一樣能像 Semantic NeRF 一樣,很輕松地 work 呢?其實(shí)能引發(fā)的問題還是挺多的。 評估一項(xiàng)工作的 novelty 的其中一項(xiàng)指標(biāo)就是看這篇工作挖了多少坑,能啟發(fā)多少后續(xù)工作,Semantic NeRF 就是這樣的一篇工作。如果你看懂這個系列的工作,推薦大家立刻去看 panoptic NeRF 相關(guān)的工作。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2852

    瀏覽量

    107267
  • 網(wǎng)絡(luò)結(jié)構(gòu)

    關(guān)注

    0

    文章

    48

    瀏覽量

    11059

原文標(biāo)題:基于NeRF的三維場景重建和理解

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無序抓取系統(tǒng)?三維重建無序抓取系統(tǒng)是由哪些部分組成的?三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)?
    發(fā)表于 07-02 06:29

    如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)?基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)是由哪些部分組成的?
    發(fā)表于 09-08 06:12

    無人機(jī)三維建模的信息

    項(xiàng)目需要調(diào)研一下無人機(jī)三維建模的信息無人機(jī)三維建模核心技術(shù)是三維重建,或者說基于圖片的建模(Image-Based Modeling)。項(xiàng)目需要是建立園區(qū)的三維模型,其他應(yīng)用上可以用于
    發(fā)表于 09-16 06:55

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法 根據(jù)立體視覺在視覺導(dǎo)航應(yīng)用中的特點(diǎn),提出了由視差圖重建三維場景的整套算法。首先,推導(dǎo)視差圖里各點(diǎn)在攝
    發(fā)表于 02-27 09:24 ?18次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對這個問題,設(shè)計(jì)與實(shí)現(xiàn)了一個基于FPGA(Field Programmable Gate Array,現(xiàn)場可編
    發(fā)表于 03-15 13:52 ?44次下載

    基于非量測相片的三維模型重建

    三維激光掃描技術(shù)進(jìn)行三維重建和傳統(tǒng)的室內(nèi)三維重建。近年來,數(shù)碼攝像產(chǎn)品性價比進(jìn)一步提高得到廣泛使用且其數(shù)碼攝像技術(shù)有了突破性進(jìn)展,攝影成像的質(zhì)量和分辨率有了大幅度的提高,為三維模型構(gòu)建
    發(fā)表于 02-23 10:30 ?0次下載
    基于非量測相片的<b class='flag-5'>三維</b>模型<b class='flag-5'>重建</b>

    如何使用單目視覺進(jìn)行高精度三維場景重建技術(shù)研究

    近年來,隨著計(jì)算機(jī)硬件的不斷快速更新,計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時場景三維模型的獲取技術(shù)越來越成熟,我們獲得場景三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用單目視覺進(jìn)行高精度<b class='flag-5'>三維</b><b class='flag-5'>場景</b><b class='flag-5'>重建</b>技術(shù)研究

    NVIDIA Omniverse平臺助力三維重建服務(wù)協(xié)同發(fā)展

    計(jì)算機(jī)視覺的進(jìn)步為元宇宙的數(shù)字孿生應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。數(shù)字孿生開發(fā)者可借助三維重建服務(wù),加速 3D 模型構(gòu)建,提
    的頭像 發(fā)表于 10-13 09:45 ?1134次閱讀

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維重建,其中基于網(wǎng)格的
    的頭像 發(fā)表于 01-09 14:26 ?2231次閱讀

    NerfingMVS:引導(dǎo)優(yōu)化神經(jīng)輻射場實(shí)現(xiàn)室內(nèi)多視角三維重建

    既然Nerf可以表示場景三維信息,一個自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場景三維重建任務(wù)中
    的頭像 發(fā)表于 02-13 11:20 ?2910次閱讀

    從多視角圖像做三維場景重建 (CVPR&apos;22 Oral)

    最近,有方法提出基于隱式神經(jīng)表示做三維重建。NeRF [3] 通過可微分的體積渲染技術(shù)從圖像中學(xué)習(xí)隱式輻射場。NeRF可以實(shí)現(xiàn)有真實(shí)感的視角合成,但是幾何重建結(jié)果噪音很嚴(yán)重,主要是因?yàn)?/div>
    的頭像 發(fā)表于 02-20 10:11 ?2715次閱讀

    三維重建:從入門到入土

    經(jīng)典三維重建系統(tǒng)的整個pipeline從相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動恢復(fù)結(jié)構(gòu)(SFM),從SFM到稠密點(diǎn)云重建、表面重建、紋理貼圖。熟悉SFM的工程師已經(jīng)是行業(yè)內(nèi)的佼佼者,能掌握
    的頭像 發(fā)表于 03-03 10:17 ?1107次閱讀

    三維場景點(diǎn)云理解重建技術(shù)

    三維場景理解重建技術(shù)主要包含場景點(diǎn)云特征提取、掃描點(diǎn)云配準(zhǔn)與融合、場景
    的頭像 發(fā)表于 08-08 16:58 ?1238次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>場景</b>點(diǎn)云<b class='flag-5'>理解</b>與<b class='flag-5'>重建</b>技術(shù)

    如何實(shí)現(xiàn)整個三維重建過程

    在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識,而多視圖的三維重建
    發(fā)表于 09-01 11:06 ?1591次閱讀
    如何實(shí)現(xiàn)整個<b class='flag-5'>三維重建</b>過程

    基于光學(xué)成像的物體三維重建技術(shù)研究

    隨著計(jì)算機(jī)科學(xué)和數(shù)字成像技術(shù)的飛速發(fā)展,光學(xué)成像技術(shù)在許多領(lǐng)域中得到了廣泛應(yīng)用,其中之一便是物體三維重建。物體三維重建技術(shù)是一種通過計(jì)算機(jī)處理圖像數(shù)據(jù),獲得物體三維信息的技術(shù)。光學(xué)成像技術(shù)作為物體
    的頭像 發(fā)表于 09-15 09:29 ?850次閱讀
    基于光學(xué)成像的物體<b class='flag-5'>三維重建</b>技術(shù)研究