0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從單張二維圖像重建出三維形狀的方法

nlfO_thejiangme ? 來源:lq ? 2018-11-30 09:11 ? 次閱讀

對(duì)于具有豐富的日常經(jīng)驗(yàn)的人類來說,我們可以通過單一的圖像推斷出物體的三維形貌,甚至對(duì)從未見過的物體也能夠通過單一視角的圖像對(duì)其形狀有八九不離十的感官認(rèn)知,但這對(duì)計(jì)算機(jī)來說卻是一個(gè)巨大的挑戰(zhàn)。目前從單一視圖重物體的三維形貌極大地受到了訓(xùn)練數(shù)據(jù)的影響,對(duì)于未知物體的重建依然存在著一系列問題。

視覺領(lǐng)域的研究人員認(rèn)為人類的這種能力來自于對(duì)于物體表示的復(fù)雜層級(jí)關(guān)系,通過將圖像映射到表面最終得到物體的體積和形狀信息,利用不同形式的表示來處理形狀不同方面的信息。為了有效的解決這一問題,研究人員提出了一種稱為一般性重建(Generalizable Reconstruction, GenRe)的算法,來捕捉與物體類別無關(guān)的形狀先驗(yàn)特征,并實(shí)現(xiàn)了表現(xiàn)良好的單視圖形狀恢復(fù),對(duì)于未包含在訓(xùn)練集內(nèi)的物體也具有良好的重建效果。

近年來很多計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域的研究人員探索了從單張二維圖像重建出三維形狀的方法,包括ShapeNet和MarrNet等工作都在這個(gè)方向進(jìn)行了一系列有益的探索,通過學(xué)習(xí)復(fù)雜龐大的數(shù)據(jù)集與其對(duì)應(yīng)視圖的映射關(guān)系來實(shí)現(xiàn)2D到3D的映射。三維形狀重建問題可以分解為f(2.5D->3D)&f(2D->2.5D)兩個(gè)子過程。

但很多現(xiàn)存的方法卻忽略了一個(gè)問題,從2D或者2.5D到3D形狀的映射會(huì)涉及復(fù)雜但確定的幾何投影過程,如果不為這個(gè)映射過程精確建模而簡(jiǎn)單地使用神經(jīng)網(wǎng)絡(luò)來近似,會(huì)造成過度參數(shù)化/過擬合的現(xiàn)象。同時(shí)還會(huì)忽略這一投影過程中有價(jià)值的歸納偏置(inductive biases)。正是由于這兩個(gè)因素造成了目前的算法對(duì)于未知分類的重建泛化能力不盡如人意。

在這篇文章中,研究人員提出了一種解耦形狀重建幾何投影的過程,來實(shí)現(xiàn)對(duì)于未知物體更好的外形重建泛化能力。在MarrNet的基礎(chǔ)上,將先前的f(2.5D-3D)的映射解耦成了兩個(gè)過程:現(xiàn)充2.5D數(shù)據(jù)投影到部分的3D模型,再將部分3D模型構(gòu)建出完整的3D模型,此時(shí)f(2.5D->3D)=c(2.5D->3D)&p(2.5D->3D),變成了一個(gè)部分三維投影問題和三維體素補(bǔ)全問題的組合。但三維的形狀補(bǔ)全問題卻面臨著嚴(yán)重的稀疏性問題,得不到很好的重建效果。

于是研究人員提出了基于球坐標(biāo)(spherical maps)的三維補(bǔ)全。spherical maps是一種在單位球面上由UV坐標(biāo)定義的表示,其中坐標(biāo)點(diǎn)的值表示從這點(diǎn)沿直徑到三維物體表面的最短距離。這種表示結(jié)合了2D和3D的特征:其中球面可以看做是2D圖像的一種形式,那么就可以利用神經(jīng)網(wǎng)絡(luò)圖像修復(fù)的方法來進(jìn)行補(bǔ)全;同時(shí)其中保留的語義信息可以將它重新投影到3D恢復(fù)完整的幾何形狀。這種表示使得我們可以通過可見區(qū)域來補(bǔ)全不可見區(qū)域,作為實(shí)現(xiàn)三維重建的中間步驟。此時(shí)上面的步驟就可以轉(zhuǎn)換為:f(2.5D->3D)=p(S->3D)c(s->s)p(2.5D->S),即2.5D先投影到S表示下,補(bǔ)全后再由S投影到3D。

綜上所述,將單幅圖像重建為三維形貌的模型總共包含了三部分:

首先利用單幅圖像來預(yù)測(cè)深度圖(2D->2.5D),并將深度圖投影到球表示上(2.5D->S);

隨后利用球面修復(fù)網(wǎng)絡(luò)來對(duì)其中的數(shù)據(jù)進(jìn)行補(bǔ)全(s->s),將補(bǔ)全后的數(shù)據(jù)投影到3D體素表示(s->3D);

最后利用體素精調(diào)網(wǎng)絡(luò)來進(jìn)一步提高體素空間中3D形狀的表示。

這一神經(jīng)網(wǎng)絡(luò)只需要為目標(biāo)的幾何外形建模而無需學(xué)習(xí)復(fù)雜的幾何投影關(guān)系。除了這一因素外,還有以下幾點(diǎn)提高了模型的泛化性:

模塊化設(shè)計(jì)使得模型學(xué)習(xí)上一模塊給出的特征,避免了模型記住訓(xùn)練集的形狀。

每個(gè)模塊的模型輸入輸出都在同一個(gè)域內(nèi),保證了更為有效的映射。

下面將具體介紹各個(gè)模塊的具體實(shí)現(xiàn)過程。

單視角深度估計(jì)器

這一模塊可以從干凈背景的輸入圖片估計(jì)出深度圖。深度估計(jì)是一個(gè)與類別無關(guān)的任務(wù),使用了自編碼器和U-NET的網(wǎng)絡(luò)架構(gòu),從256-256的輸入生成了512-1-1的特征圖,并通過對(duì)稱的網(wǎng)絡(luò)預(yù)測(cè)出深度圖。

球面修復(fù)網(wǎng)絡(luò)

通過將3D形狀補(bǔ)全問題轉(zhuǎn)化為二維球面的修復(fù)問題來實(shí)現(xiàn),這對(duì)于新類別物體有很好的泛華性,同時(shí)也比體素的方法更為高效。球面修復(fù)網(wǎng)絡(luò)的結(jié)構(gòu)類似深度估計(jì),利用了標(biāo)準(zhǔn)的卷積網(wǎng)絡(luò),但為了適應(yīng)球面周期性的結(jié)構(gòu),在訓(xùn)練目標(biāo)和輸入上加入了周期性的padding。

體素精煉網(wǎng)絡(luò)

在球面修復(fù)后投影到體素空間的三維形狀還存在自遮擋問題,還需要通過精煉網(wǎng)絡(luò)來改善最終輸出的形狀。通過輸入從球面投影而來的體素表示和直接從深度圖投影而來的體素表示,共同生成最終的結(jié)果。

由于遮擋來自于局部的鄰近區(qū)域,網(wǎng)絡(luò)只需要學(xué)習(xí)局部的結(jié)構(gòu)先驗(yàn),而這也是與物體類別無關(guān)的過程。這一模塊的輸入包含了兩通道的128-128-128的三維體素,并輸入320D的隱變量,在解碼時(shí)每一個(gè)解碼層還接入了對(duì)應(yīng)編碼層的輸出。

模型表現(xiàn)

通過對(duì)三部分模塊進(jìn)行訓(xùn)練后,研究人員給出了模型對(duì)于未知物體的重建表現(xiàn)。首先,利用汽車、椅子和飛機(jī)訓(xùn)練的單視圖深度估計(jì)器,在訓(xùn)練集未包含的物體類別上精度表現(xiàn)良好。

隨后對(duì)于訓(xùn)練集包含和未知的物體,這一算法GenRe也有著良好的表現(xiàn)。可以看到,除了飛機(jī)、汽車和椅子外其他都是沒有見過的物體,但依然可以獲得與GT較為接近的結(jié)果。

在真實(shí)數(shù)據(jù)上的重建誤差也達(dá)到了前沿水平:

最后為了驗(yàn)證算法的有效性,研究人員利用訓(xùn)練好的模型對(duì)非剛體和高度規(guī)則化的幾何體進(jìn)行了從深度圖到三維外形重建,依然保持了較好的效果。

這篇文章通過將三維形狀補(bǔ)全的工作投影到了二維球面上,使用了二維圖像修復(fù)類似的方法來實(shí)現(xiàn)三維圖像補(bǔ)全,提高了從單張圖像恢復(fù)三維形貌的精度,希望這一工作能對(duì)相關(guān)領(lǐng)域的研究帶來一些有益的想法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:MIT研究人員提出新方法,可從單張圖片實(shí)現(xiàn)未知物體的三維外形重建

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    二維三維Gauss隨機(jī)粗糙面的Monte Carlo仿真

    二維的推導(dǎo)方法擴(kuò)展到三維,建立了三維Gauss隨機(jī)粗糙面模型?!娟P(guān)鍵詞】:高功率微波;;Monte Carlo方法;;隨機(jī)粗糙面;;仿真【D
    發(fā)表于 05-28 13:41

    三維觸控技術(shù)突破“向箔”的束縛

    》中被向箔擊中的文明一樣。很自然地,我們會(huì)想到:既然人類生活在三維的空間里,為什么用戶與設(shè)備的交互只能是在二維空間里呢?有沒有可能實(shí)現(xiàn)三維的交互
    發(fā)表于 12-19 15:53

    安徽三維動(dòng)畫制作和二維動(dòng)畫有哪些區(qū)別呢?(一)

    三維動(dòng)畫制作中,“”這個(gè)字,是一個(gè)幾何學(xué)和空間理論的基本概念。構(gòu)成空間的每一個(gè)要素,如長(zhǎng)度、寬度、高度,被稱之為一“”。二維空間是指由長(zhǎng)度和寬度(在幾何學(xué)中為X軸和Y軸)兩個(gè)要素
    發(fā)表于 01-22 10:02

    安徽三維動(dòng)畫制作和二維動(dòng)畫有哪些區(qū)別呢?(

    二維動(dòng)畫制作制作和三維動(dòng)畫制作除了按照在制作過程中攝像機(jī)或者虛擬攝像機(jī)是否可以任意進(jìn)行旋轉(zhuǎn)的區(qū)別外,主流的二維動(dòng)畫制作(不包括平面材料動(dòng)畫制作)和三維動(dòng)畫制作(不包括立體材料動(dòng)畫制作)
    發(fā)表于 01-25 10:34

    基于紋理映射的醫(yī)學(xué)圖像三維重建

    提出了一種基于紋理映射的體繪制算法,提高了圖像重建效率,增強(qiáng)了圖像重建效果。算法實(shí)現(xiàn)了對(duì)二維醫(yī)學(xué)圖像
    發(fā)表于 12-14 11:10 ?19次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對(duì)這個(gè)問題,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于FPGA(Field Progra
    發(fā)表于 03-15 13:52 ?42次下載

    基于二維激光測(cè)距儀的三維模型配準(zhǔn)研究

    在自主移動(dòng)機(jī)器人上安裝二維激光測(cè)距儀和內(nèi)置室內(nèi)小型電機(jī)云臺(tái)。將激光的平面信息和電機(jī)云臺(tái)的高度信息結(jié)合構(gòu)建一個(gè)三維模型。通過RANSAC算法三維點(diǎn)云陣中提取平面。并在
    發(fā)表于 09-16 14:46 ?70次下載
    基于<b class='flag-5'>二維</b>激光測(cè)距儀的<b class='flag-5'>三維</b>模型配準(zhǔn)研究

    光學(xué)方法測(cè)量三維形狀綜述

    光學(xué)方法測(cè)量三維形狀綜述光學(xué)方法測(cè)量三維形狀綜述光學(xué)方法
    發(fā)表于 01-07 16:48 ?2次下載

    AI+AR將用于智能三維重建領(lǐng)域

    AI與AR的關(guān)系日漸微妙,正在不斷融合、相互促進(jìn)。在計(jì)算機(jī)視覺中, 三維重建是指根據(jù)單視圖或者多視圖的二維圖像重建三維信息·的過程。在虛擬現(xiàn)
    發(fā)表于 09-21 10:33 ?4552次閱讀

    基于圖像三維物體重建:在深度學(xué)習(xí)時(shí)代的最新技術(shù)和趨勢(shì)綜述之訓(xùn)練

    前面幾節(jié)討論了直接二維觀測(cè)重建三維對(duì)象的方法。本節(jié)展示了如何使用附加提示,如中間表示和時(shí)間相關(guān)性來促進(jìn)
    發(fā)表于 01-26 19:55 ?5次下載
    基于<b class='flag-5'>圖像</b>的<b class='flag-5'>三維</b>物體<b class='flag-5'>重建</b>:在深度學(xué)習(xí)時(shí)代的最新技術(shù)和趨勢(shì)綜述之訓(xùn)練

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)
    的頭像 發(fā)表于 01-09 14:26 ?1881次閱讀

    三維重建入門到入土

    經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SFM),SFM到稠密點(diǎn)云重建、表面重建
    的頭像 發(fā)表于 03-03 10:17 ?1002次閱讀

    升級(jí)!昊衡科技應(yīng)變場(chǎng)重構(gòu)軟件二維擴(kuò)展到三維

    擴(kuò)展到三維,應(yīng)變溫度傳感數(shù)據(jù)可以在三維模型上展示。圖1三維溫度場(chǎng)重構(gòu)二維、三維應(yīng)變場(chǎng)重構(gòu)軟件設(shè)計(jì)思路相同,都是用網(wǎng)口作為接口,基于TCP/I
    的頭像 發(fā)表于 08-25 10:47 ?629次閱讀
    升級(jí)!昊衡科技應(yīng)變場(chǎng)重構(gòu)軟件<b class='flag-5'>從</b><b class='flag-5'>二維</b>擴(kuò)展到<b class='flag-5'>三維</b>

    如何實(shí)現(xiàn)整個(gè)三維重建過程

    在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識(shí),而多視圖的
    發(fā)表于 09-01 11:06 ?1447次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過程

    RayDF:實(shí)時(shí)渲染!基于射線的三維重建方法

    在機(jī)器視覺和機(jī)器人領(lǐng)域的許多前沿應(yīng)用中,學(xué)習(xí)準(zhǔn)確且高效的三維形狀表達(dá)是十分重要的。然而,現(xiàn)有的基于三維坐標(biāo)的隱式表達(dá)在表示三維形狀或是渲染
    的頭像 發(fā)表于 11-17 16:23 ?596次閱讀
    RayDF:實(shí)時(shí)渲染!基于射線的<b class='flag-5'>三維重建</b>新<b class='flag-5'>方法</b>