0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

3D視覺(jué)工坊 ? 來(lái)源:凹非寺 ? 2023-04-10 11:12 ? 次閱讀

普通手機(jī)“隨手”拍的雕像,一下就變成了精細(xì)的三維重建圖。

水杯來(lái)回動(dòng)的動(dòng)態(tài)場(chǎng)景下,細(xì)節(jié)清晰可見(jiàn):

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

靜態(tài)場(chǎng)景效果也同樣nice,狗狗突出的肋骨都被還原了出來(lái):

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

對(duì)比來(lái)看其他方法,效果是醬嬸的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

這就是英偉達(dá)最新提出的方法BundleSDF。

這是一種可對(duì)未知物體的6D姿態(tài)追蹤和三維重建的方法。

用于從單目RGBD視頻序列中跟蹤未知物體的6自由度運(yùn)動(dòng),同時(shí)進(jìn)行物體的隱式神經(jīng)三維重建,方法接近于實(shí)時(shí)(10Hz)。

這種方法適用于任意剛性物體,即使視覺(jué)紋理大部分確實(shí),僅需在第一幀中分割出物體,不需要任何額外的信息,并且不對(duì)智能體與物體的交互模式做任何假設(shè)。

目前,該方法已被CVPR 2023接收。

可處理大幅度姿態(tài)變化、有遮擋視頻

該方法的關(guān)鍵是一個(gè)神經(jīng)物體場(chǎng),它與姿態(tài)圖優(yōu)化過(guò)程同時(shí)進(jìn)行,以便將信息穩(wěn)健地累積到一致的3D表示中,捕捉幾何和外觀。

方法自動(dòng)維護(hù)了一組動(dòng)態(tài)的姿態(tài)內(nèi)存幀,以便這些線程之間進(jìn)行通信。

它能處理具有大幅度姿態(tài)變化、部分和完全遮擋、無(wú)紋理表面和高光反射等具有挑戰(zhàn)性的視頻。

作者展示了HO3D、YCBInEOAT和BEHAVE數(shù)據(jù)集上的結(jié)果,證明了我們的方法顯著優(yōu)于現(xiàn)有方法。

野外測(cè)試

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

該方法不僅適用于更具挑戰(zhàn)性的動(dòng)態(tài)場(chǎng)景,還適用于此前經(jīng)常被考慮的靜態(tài)場(chǎng)景(移動(dòng)相機(jī))。

因此實(shí)現(xiàn)了比專門(mén)設(shè)計(jì)用于靜態(tài)場(chǎng)景的那些方法更好或相當(dāng)?shù)慕Y(jié)果(即文章開(kāi)頭展示動(dòng)圖)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

與SOTA對(duì)比

HO3D數(shù)據(jù)集上三種最具競(jìng)爭(zhēng)力方法的定性比較。

左圖:6自由度姿態(tài)跟蹤可視化,其中輪廓(青色)以估計(jì)的姿態(tài)渲染。

值得注意的是,如第二列所示,我們的預(yù)測(cè)姿態(tài)有時(shí)甚至?xí)m正GT的錯(cuò)誤。

右圖:每種方法輸出的最終3D重建的正面和背面視圖。

由于手部遮擋,視頻中的某些部分永遠(yuǎn)不可見(jiàn)。雖然從相同的視角渲染網(wǎng)格,但是DROID-SLAM和BundleTrack的顯著漂移導(dǎo)致網(wǎng)格錯(cuò)誤旋轉(zhuǎn)。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量結(jié)果對(duì)比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

問(wèn)題設(shè)置

給定一段單目RGBD輸入視頻以及僅在第一幀中目標(biāo)物體的分割掩碼,該方法能持續(xù)追蹤物體的6-DoF姿態(tài)并重建物體的3D模型。

所有處理都是在線自回歸的(沒(méi)有假設(shè)未來(lái)幀可用)。

處理的物體是剛性的,但不依賴其特定豐富的紋理 - 方法適用于無(wú)紋理的物體。

此外,不需要物體的實(shí)例級(jí)CAD模型,也不需要物體類別的先驗(yàn)知識(shí)(例如事先對(duì)同一物體類別進(jìn)行預(yù)訓(xùn)練)。

具體框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在連續(xù)的分割圖像之間匹配特征,以獲得粗略的姿態(tài)估計(jì)(第3.1節(jié))。

其中一些帶姿態(tài)的幀被存儲(chǔ)在內(nèi)存池中,以便稍后使用和精化(第3.2節(jié))。

從內(nèi)存池的子集動(dòng)態(tài)創(chuàng)建位姿圖(第3.3節(jié));在線優(yōu)化與當(dāng)前姿態(tài)一起聯(lián)合細(xì)化圖中的所有姿態(tài)。

然后,這些更新的姿態(tài)被存儲(chǔ)回內(nèi)存池中。

最后,內(nèi)存池中的所有帶姿態(tài)的幀用于學(xué)習(xí)神經(jīng)物體場(chǎng)(在單獨(dú)的線程中),該場(chǎng)建模了物體的幾何和視覺(jué)紋理(第3.4節(jié)),同時(shí)調(diào)整其先前估計(jì)的姿態(tài),使姿態(tài)跟蹤更加魯棒。

項(xiàng)目地址:
https://bundlesdf.github.io/

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2852

    瀏覽量

    107267
  • 三維重建

    關(guān)注

    0

    文章

    26

    瀏覽量

    9891
  • 姿態(tài)
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7879

原文標(biāo)題:英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計(jì)是三維數(shù)字城市重建中的一項(xiàng)重要任務(wù),基于深度學(xué)習(xí)的多視圖立體(MVS)方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過(guò)修改MVS 框架實(shí)現(xiàn)建筑物的深度估計(jì),缺乏對(duì)建筑物
    的頭像 發(fā)表于 11-07 10:16 ?91次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b><b class='flag-5'>方法</b>

    三維打印技術(shù)原理

    三維打印技術(shù),又稱3D打印技術(shù),是一種快速成型技術(shù),其核心原理在于將數(shù)字模型文件逐層轉(zhuǎn)化為實(shí)體物體。以下是三維打印技術(shù)原理的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 15:31 ?396次閱讀

    留形科技借助NVIDIA平臺(tái)提供高效精確的三維重建解決方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺(tái),實(shí)現(xiàn)邊緣設(shè)備上的實(shí)時(shí)、全彩、無(wú)損三維重建,從而在建筑細(xì)節(jié)捕捉、大型基礎(chǔ)設(shè)施的數(shù)字孿生等應(yīng)用中,大幅提升三維數(shù)據(jù)采集與處理的效率與精度。
    的頭像 發(fā)表于 09-09 09:42 ?378次閱讀

    基于大模型的仿真系統(tǒng)研究一——三維重建大模型

    問(wèn)題,賽目推出了基于大模型的仿真系統(tǒng),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù),不僅推出自動(dòng)標(biāo)注大模型、多模態(tài)檢測(cè)大模型和場(chǎng)景生成大模型等模塊,并且引入三維重建大模型加強(qiáng)渲染畫(huà)面真實(shí)性。 ? ?通過(guò)上述模塊,賽目的路采
    的頭像 發(fā)表于 07-30 14:51 ?1298次閱讀
    基于大模型的仿真系統(tǒng)研究一——<b class='flag-5'>三維重建</b>大模型

    泰來(lái)三維 工廠三維掃描建模技術(shù)服務(wù)

    通過(guò)利用三維掃描技術(shù)建立工廠物體三維模型,可以更加直觀地了解物體的形狀和尺寸信息,避免傳統(tǒng)測(cè)量方法的誤差和繁瑣操作,從而提高生產(chǎn)效率和質(zhì)量
    的頭像 發(fā)表于 07-22 13:14 ?266次閱讀
    泰來(lái)<b class='flag-5'>三維</b> 工廠<b class='flag-5'>三維</b>掃描建模技術(shù)服務(wù)

    三維掃描與3D打印在法醫(yī)頭骨重建中的突破性應(yīng)用

    隨著科技的飛速發(fā)展,三維掃描和3D打印技術(shù)已經(jīng)逐漸滲透到醫(yī)療領(lǐng)域的各個(gè)環(huán)節(jié),為臨床診斷、治療和醫(yī)學(xué)研究帶來(lái)了前所未有的便利。特別是在法醫(yī)學(xué)領(lǐng)域,三維掃描和3D打印技術(shù)的應(yīng)用更是為頭骨
    的頭像 發(fā)表于 04-19 10:26 ?411次閱讀
    <b class='flag-5'>三維</b>掃描與3<b class='flag-5'>D</b>打印在法醫(yī)頭骨<b class='flag-5'>重建</b>中的突破性應(yīng)用

    Nullmax提出多相機(jī)3D目標(biāo)檢測(cè)新方法QAF2D

    今天上午,計(jì)算機(jī)視覺(jué)領(lǐng)域頂會(huì)CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門(mén)的3D目標(biāo)檢測(cè)研究《Enhancing 3D Object Detection with 2D De
    的頭像 發(fā)表于 02-27 16:38 ?1050次閱讀
    Nullmax提出多相機(jī)3<b class='flag-5'>D</b>目標(biāo)檢測(cè)<b class='flag-5'>新方法</b>QAF2<b class='flag-5'>D</b>

    角礦山機(jī)械設(shè)備三維掃描、逆向3d建模抄數(shù)設(shè)計(jì)

    在機(jī)械制造領(lǐng)域,逆向工程很多企業(yè)經(jīng)常使用的一種方法,逆向工程可以幫助企業(yè)復(fù)制、改進(jìn)和優(yōu)化產(chǎn)品。CASAIM中科廣電主要使用三維掃描技術(shù)來(lái)獲取產(chǎn)品表面的三維數(shù)據(jù),三維測(cè)量技術(shù)能夠快速、高
    的頭像 發(fā)表于 01-16 15:14 ?438次閱讀
    珠<b class='flag-5'>三</b>角礦山機(jī)械設(shè)備<b class='flag-5'>三維</b>掃描、逆向3<b class='flag-5'>d</b>建模抄數(shù)設(shè)計(jì)

    工業(yè)上常見(jiàn)的高精度主動(dòng)式重建算法

    三維重建目前是最為炙手可熱的領(lǐng)域。攝影測(cè)量或結(jié)構(gòu)光投影技術(shù)可以解決漫反射重建問(wèn)題,但卻無(wú)法有效應(yīng)對(duì)鏡面反射物體(如玻璃、積水、反光物體和汽車車身)等的
    發(fā)表于 01-05 10:46 ?421次閱讀
    工業(yè)上常見(jiàn)的高精度主動(dòng)式<b class='flag-5'>重建</b>算法

    基于光學(xué)計(jì)算超表面的全光學(xué)目標(biāo)識(shí)別和三維重建技術(shù)

    隨著物體識(shí)別和三維(3D) 重建技術(shù)在各種逆向工程、人工智能、醫(yī)療診斷和工業(yè)生產(chǎn)領(lǐng)域變得必不可少,人們?cè)絹?lái)越關(guān)注與尋求可以簡(jiǎn)化處理的高效、更快的速度和更集成的
    的頭像 發(fā)表于 12-22 10:13 ?553次閱讀
    基于光學(xué)計(jì)算超表面的全光學(xué)目標(biāo)識(shí)別和<b class='flag-5'>三維重建</b>技術(shù)

    一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

    今天筆者將為大家分享NVIDIA的最新開(kāi)源方案FoundationPose,是一個(gè)用于 6D 姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像,F(xiàn)oundationPose就可以在測(cè)試時(shí)立即應(yīng)用于新物體,無(wú)需任何微
    的頭像 發(fā)表于 12-19 09:58 ?779次閱讀
    一個(gè)用于<b class='flag-5'>6D</b><b class='flag-5'>姿態(tài)</b>估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

    3D-IC 設(shè)計(jì)之早期三維布圖綜合以及層次化設(shè)計(jì)方法

    3D-IC 設(shè)計(jì)之早期三維布圖綜合以及層次化設(shè)計(jì)方法
    的頭像 發(fā)表于 12-04 16:53 ?491次閱讀
    3<b class='flag-5'>D</b>-IC 設(shè)計(jì)之早期<b class='flag-5'>三維</b>布圖綜合以及層次化設(shè)計(jì)<b class='flag-5'>方法</b>

    基于深度學(xué)習(xí)的三維重建技術(shù)

    多視圖立體幾何(Multi-View Stereo,MVS)是計(jì)算機(jī)視覺(jué)中重要的研究領(lǐng)域,也是邁入三維計(jì)算機(jī)視覺(jué)研究的重點(diǎn)問(wèn)題。它通過(guò)利用多張互相重疊的圖像恢復(fù)出原始三維場(chǎng)景的幾何結(jié)構(gòu)和紋理信息,是現(xiàn)實(shí)中拍攝照片的逆過(guò)程。
    的頭像 發(fā)表于 12-04 10:08 ?857次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>三維重建</b>技術(shù)

    VLSI系統(tǒng)設(shè)計(jì)的最新方法

    電子發(fā)燒友網(wǎng)站提供《VLSI系統(tǒng)設(shè)計(jì)的最新方法.pdf》資料免費(fèi)下載
    發(fā)表于 11-20 11:10 ?0次下載
    VLSI系統(tǒng)設(shè)計(jì)的最<b class='flag-5'>新方法</b>

    RayDF:實(shí)時(shí)渲染!基于射線的三維重建新方法

    在機(jī)器視覺(jué)和機(jī)器人領(lǐng)域的許多前沿應(yīng)用中,學(xué)習(xí)準(zhǔn)確且高效的三維形狀表達(dá)是十分重要的。然而,現(xiàn)有的基于三維坐標(biāo)的隱式表達(dá)在表示三維形狀或是渲染二圖像時(shí),需要耗費(fèi)昂貴的計(jì)算成本;
    的頭像 發(fā)表于 11-17 16:23 ?678次閱讀
    RayDF:實(shí)時(shí)渲染!基于射線的<b class='flag-5'>三維重建</b><b class='flag-5'>新方法</b>