0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

手持RGB-D傳感器廣泛應(yīng)用的情況

3D視覺(jué)工坊 ? 來(lái)源:3D視覺(jué)工坊 ? 2023-12-26 16:44 ? 次閱讀

8a79feca-a394-11ee-8b88-92fbcf53809c.png

從3D場(chǎng)景中實(shí)例形狀重建涉及恢復(fù)多個(gè)對(duì)象的完整幾何結(jié)構(gòu)。這涉及到在語(yǔ)義實(shí)例級(jí)別對(duì)數(shù)據(jù)進(jìn)行處理。使用數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)來(lái)應(yīng)對(duì)場(chǎng)景的復(fù)雜性和室內(nèi)遮擋。方法需要大規(guī)模、高質(zhì)量的數(shù)據(jù)集來(lái)訓(xùn)練,其中包括與真實(shí)世界掃描對(duì)齊和配對(duì)的形狀標(biāo)注。已有數(shù)據(jù)集可能是合成的或不對(duì)齊的,這會(huì)限制數(shù)據(jù)驅(qū)動(dòng)方法在真實(shí)數(shù)據(jù)上的表現(xiàn)。文章提出了一個(gè)名為L(zhǎng)ASA的數(shù)據(jù)集,包含了高質(zhì)量的CAD標(biāo)注和與ArkitScenes的真實(shí)場(chǎng)景掃描對(duì)齊的數(shù)據(jù),這些由專業(yè)藝術(shù)家手動(dòng)創(chuàng)建。在此基礎(chǔ)上,文章提出了一種名為DisCo的新型基于擴(kuò)散的跨模態(tài)形狀重建方法,利用混合特征聚合設(shè)計(jì),融合多模態(tài)輸入,并恢復(fù)高保真度的對(duì)象幾何結(jié)構(gòu)。除此之外,還提出了一種名為OccGOD的基于占據(jù)信息引導(dǎo)的3D對(duì)象檢測(cè)方法,并展示了形狀標(biāo)注提供的場(chǎng)景占據(jù)信息線索如何進(jìn)一步改善3D對(duì)象檢測(cè)。經(jīng)過(guò)大量實(shí)驗(yàn)驗(yàn)證,文章的方法在實(shí)例級(jí)別場(chǎng)景重建和3D對(duì)象檢測(cè)任務(wù)中取得了最先進(jìn)的性能。

讀者理解:

LASA 使用大型對(duì)齊形狀注釋數(shù)據(jù)集的做法非常有意義。這使得 LASA 能夠?qū)W習(xí)到更通用的形狀特征,從而提高實(shí)例重建的準(zhǔn)確性和可靠性。

LASA 使用實(shí)例分割、形狀對(duì)齊和生成對(duì)抗網(wǎng)絡(luò)等多種技術(shù)的做法非常合理。這使得 LASA 能夠生成逼真的、高質(zhì)量的實(shí)例 3D 模型。

該研究提出了以下主要方法和貢獻(xiàn):

LASA數(shù)據(jù)集構(gòu)建:LASA是一個(gè)大規(guī)模數(shù)據(jù)集,包含10,412個(gè)手工制作的高質(zhì)量CAD模型,覆蓋了920個(gè)真實(shí)場(chǎng)景。這些模型與ArkitScenes的3D激光掃描對(duì)齊,為數(shù)據(jù)驅(qū)動(dòng)的重建算法提供了準(zhǔn)確、一致的訓(xùn)練數(shù)據(jù)。

DisCo方法:提出了一種基于擴(kuò)散的跨模態(tài)形狀重建方法。該方法利用三平面擴(kuò)散模型,結(jié)合部分點(diǎn)云和多視圖圖像,實(shí)現(xiàn)了高保真度的3D形狀重建?;旌咸卣骶酆蠈佑行诤狭瞬煌斎肽B(tài)的局部特征,提高了特征對(duì)齊效果。

OccGOD方法:占據(jù)引導(dǎo)的3D物體檢測(cè)方法利用LASA的完整標(biāo)注生成場(chǎng)景級(jí)占據(jù)地面真值,指導(dǎo)3D物體檢測(cè)。這種方法在處理遮擋和稀疏物體方面相較于基線方法取得了顯著的性能提升。

1 引言

本文探討了手持RGB-D傳感器廣泛應(yīng)用的情況,指出由于傳感器精度的限制、室內(nèi)環(huán)境的復(fù)雜性和物體之間的遮擋等問(wèn)題,室內(nèi)場(chǎng)景掃描往往存在噪音和不完整性。這限制了在虛擬/增強(qiáng)現(xiàn)實(shí)和3D行業(yè)等領(lǐng)域中對(duì)完整高質(zhì)量重建的需求。文章著重介紹了3D視覺(jué)和圖形學(xué)領(lǐng)域?qū)κ覂?nèi)實(shí)例級(jí)場(chǎng)景重建的迫切需求,目標(biāo)是基于傳感器捕捉的3D掃描或圖像來(lái)重建觀察到的物體形狀。深度學(xué)習(xí)方法已取得許多進(jìn)展,但這些方法需要大量配對(duì)的場(chǎng)景掃描和CAD模型以進(jìn)行訓(xùn)練。然而,現(xiàn)有的數(shù)據(jù)集往往是合成的或者不對(duì)齊的,限制了數(shù)據(jù)驅(qū)動(dòng)方法在真實(shí)數(shù)據(jù)上的性能。文章介紹了LASA數(shù)據(jù)集的創(chuàng)建,這是一個(gè)大規(guī)模對(duì)齊的形狀標(biāo)注數(shù)據(jù)集,由專業(yè)藝術(shù)家手工制作,與920個(gè)真實(shí)世界場(chǎng)景的3D掃描對(duì)齊。LASA數(shù)據(jù)集的推出旨在解決當(dāng)前研究中的瓶頸,為數(shù)據(jù)驅(qū)動(dòng)的室內(nèi)場(chǎng)景理解和重建提供了途徑。這里也推薦工坊推出的新課程《徹底搞透視覺(jué)三維重建:原理剖析、代碼講解、及優(yōu)化改進(jìn)》。

8a8fab80-a394-11ee-8b88-92fbcf53809c.png

2 方法

LASA數(shù)據(jù)集包含10,412個(gè)獨(dú)特的CAD模型,覆蓋了920個(gè)場(chǎng)景,采用專業(yè)藝術(shù)家手工創(chuàng)建,并與3D掃描對(duì)齊。這些標(biāo)注為數(shù)據(jù)驅(qū)動(dòng)的重建算法提供了精確一致的訓(xùn)練數(shù)據(jù)。

LASA數(shù)據(jù)集是基于ArkitScenes的3D激光掃描構(gòu)建,通過(guò)降采樣和轉(zhuǎn)換矩陣對(duì)齊實(shí)現(xiàn)數(shù)據(jù)預(yù)處理,再通過(guò)CAD模型手動(dòng)標(biāo)注和驗(yàn)證確保了標(biāo)注質(zhì)量。

LASA數(shù)據(jù)集與其他現(xiàn)有數(shù)據(jù)集相比,具有相似數(shù)量的CAD模型,并且在CAD標(biāo)注質(zhì)量和形狀多樣性方面表現(xiàn)出優(yōu)勢(shì),同時(shí)能夠提供完整的RGB-D序列,拓展了其在下游應(yīng)用中的可能性。

DisCo方法利用三平面擴(kuò)散模型,結(jié)合了部分點(diǎn)云和多視圖圖像,實(shí)現(xiàn)了高保真度的3D形狀重建。同時(shí),混合特征聚合層有助于更好地融合不同輸入模態(tài)的局部特征。

OccGOD利用形狀完整性先驗(yàn)從LASA的標(biāo)注中生成場(chǎng)景級(jí)占據(jù)地面真值,以指導(dǎo)3D物體檢測(cè),在處理遮擋和稀疏物體方面取得了顯著的性能提升。

8aa85946-a394-11ee-8b88-92fbcf53809c.png

8ab54fe8-a394-11ee-8b88-92fbcf53809c.png

3 總結(jié)

通過(guò)引入LASA數(shù)據(jù)集,本研究提出了DisCo和OccGOD兩種方法,分別用于跨模態(tài)形狀重建和占據(jù)引導(dǎo)的3D物體檢測(cè)。這兩種方法在真實(shí)場(chǎng)景中取得了最先進(jìn)的性能表現(xiàn),證明了LASA數(shù)據(jù)集的支持對(duì)于改善室內(nèi)場(chǎng)景理解和重建領(lǐng)域的標(biāo)注質(zhì)量和數(shù)量至關(guān)重要。

8ba1bdd8-a394-11ee-8b88-92fbcf53809c.png

8bb92c3e-a394-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2545

    文章

    50445

    瀏覽量

    751044
  • CAD
    CAD
    +關(guān)注

    關(guān)注

    17

    文章

    1070

    瀏覽量

    72289
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24619

原文標(biāo)題:讀者理解:

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RGB傳感器的典型應(yīng)用

    特定玻璃對(duì)讀數(shù)的影響,并調(diào)整最終產(chǎn)品所需的色度補(bǔ)償。軟件還可以顯示,IC傳感器的精度能夠與專用手持色度儀的精度有多接近?! ntersil ISL29125便是一款滿足這種快速增長(zhǎng)市場(chǎng)需求的RGB
    發(fā)表于 11-07 10:51

    多維力傳感器廣泛應(yīng)用

    多維傳感器,量程范圍從幾百克力到幾十噸,并獲得彈性體結(jié)構(gòu)和矢量解耦電路等方面多項(xiàng)技術(shù)?! 《嗑S力傳感器廣泛應(yīng)用于機(jī)器人手指、手爪研究;機(jī)器人外科手術(shù)研究;指力研究;牙齒研究;力反饋;剎車檢測(cè);精密裝配
    發(fā)表于 08-05 11:44

    如何去開(kāi)發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開(kāi)發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)?基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的?
    發(fā)表于 09-08 06:12

    美國(guó)國(guó)家半導(dǎo)體溫度傳感器廣泛應(yīng)用

    美國(guó)國(guó)家半導(dǎo)體溫度傳感器廣泛應(yīng)用  溫度傳感器可以說(shuō)是無(wú)所不在,空調(diào)系統(tǒng)、冰箱、電飯煲、電風(fēng)扇等家電產(chǎn)品以至手
    發(fā)表于 01-14 09:07 ?1649次閱讀

    基于RGB-D圖像物體識(shí)別方法

    針對(duì)傳統(tǒng)的顏色一深度(RGB-D)圖像物體識(shí)別的方法所存在的圖像特征學(xué)習(xí)不全面、特征編碼魯棒性不夠等問(wèn)題,提出了基于核描述子局部約束線性編碼( KD-LLC)的RGB-D圖像物體識(shí)別方法。首先,在
    發(fā)表于 12-07 10:22 ?1次下載
    基于<b class='flag-5'>RGB-D</b>圖像物體識(shí)別方法

    3D場(chǎng)景感知所需要的技術(shù)以及未來(lái)發(fā)展的方向

    2. RGB-D是一種特殊的相機(jī),它不僅能捕捉深度信息(D)還能捕捉圖像顏色(RGB)。而且它還能捕捉到和2D相機(jī)一樣的彩色圖像。大多數(shù)RGB-D
    的頭像 發(fā)表于 08-31 09:59 ?9236次閱讀

    傳感器廣泛應(yīng)用各個(gè)行業(yè)

    傳感器應(yīng)用傳感器廣泛應(yīng)用于汽車、制造、航空、船舶、醫(yī)療、電信、化工和計(jì)算機(jī)硬件等各個(gè)行業(yè)。 傳感器是一種電子設(shè)備,用于測(cè)量設(shè)備、器具、機(jī)器和任何其他系統(tǒng)的物理屬性,如溫度、壓力、距離、
    的頭像 發(fā)表于 09-22 13:58 ?3652次閱讀

    RGB-D圖像是什么

    RGB-D圖像其實(shí)是兩幅圖像。
    的頭像 發(fā)表于 11-01 11:46 ?1.8w次閱讀

    基于UWB、里程計(jì)和RGB-D融合的室內(nèi)定位方法

    的思想,僅消耗極少部分的計(jì)算資源就可以將各個(gè)傳感器融合起來(lái),提高了系統(tǒng)精度。實(shí)驗(yàn)結(jié)果表明,該方法可以將定位誤差抑制在10cm以內(nèi)將偏轉(zhuǎn)角誤差抑制在1以內(nèi),徹底解決單一RGB-D攝像頭SLAM時(shí)跟蹤失敗的問(wèn)題。
    發(fā)表于 04-25 14:47 ?14次下載
    基于UWB、里程計(jì)和<b class='flag-5'>RGB-D</b>融合的室內(nèi)定位方法

    用于快速高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化的GO-Surf

    我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于從RGB-D序列中準(zhǔn)確和快速地重建表面。
    的頭像 發(fā)表于 03-17 16:35 ?705次閱讀

    瞄準(zhǔn)AGV/AMR領(lǐng)域-維感科技發(fā)布高性價(jià)比RGB-D ToF相機(jī)DS86/87

    維感科技于近期正式對(duì)外發(fā)售極具性價(jià)比的3D ToF RGB-D深度相機(jī)新品DS86/87,零售價(jià)格分別為4,199元與4,999元。
    發(fā)表于 06-16 09:40 ?490次閱讀
    瞄準(zhǔn)AGV/AMR領(lǐng)域-維感科技發(fā)布高性價(jià)比<b class='flag-5'>RGB-D</b> ToF相機(jī)DS86/87

    一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng),該系統(tǒng)由完整的前端和后端模塊組成,包括里程計(jì)、回環(huán)檢測(cè)、子圖融合和全局優(yōu)化。
    的頭像 發(fā)表于 11-29 10:35 ?560次閱讀
    一種基于<b class='flag-5'>RGB-D</b>圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

    兩種應(yīng)用于3D對(duì)象檢測(cè)的點(diǎn)云深度學(xué)習(xí)方法

    隨著激光雷達(dá)傳感器(“光檢測(cè)和測(cè)距”的縮寫,有時(shí)稱為“激光掃描”,現(xiàn)在在一些最新的 iPhone 上可用)或 RGB-D 攝像頭(一種 RGB-D 攝像頭)的興起,3D 數(shù)據(jù)變得越來(lái)越
    的頭像 發(fā)表于 01-03 10:32 ?866次閱讀
    兩種應(yīng)用于3<b class='flag-5'>D</b>對(duì)象檢測(cè)的點(diǎn)云深度學(xué)習(xí)方法

    常用的RGB-D SLAM解決方案

    BundleFusion是一種稠密的實(shí)時(shí)室內(nèi)場(chǎng)景三維重建算法框架。輸入為RGB-D相機(jī)采集的并且是對(duì)齊好的RGB圖像和深度圖的數(shù)據(jù)流。輸出為重建好的稠密三維場(chǎng)景模型。
    的頭像 發(fā)表于 04-16 09:37 ?837次閱讀
    常用的<b class='flag-5'>RGB-D</b> SLAM解決方案

    觸控傳感器:工作原理、運(yùn)行方式及廣泛應(yīng)用

    、便捷的操作方式,極大地提升了用戶體驗(yàn)。本文將深入探討觸控傳感器的工作原理、多樣化的運(yùn)行方式以及其在各領(lǐng)域的廣泛應(yīng)用,帶領(lǐng)讀者一窺這一技術(shù)的奧秘。 觸控傳感器的工作原理 觸控傳感器的工
    的頭像 發(fā)表于 08-29 10:17 ?283次閱讀