0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

15倍加速!SuperCluster:最強(qiáng)3D點(diǎn)云全景分割!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-22 14:03 ? 次閱讀

1. 寫在前面

今天筆者為大家推薦一篇最新的開源工作SuperCluster,實(shí)現(xiàn)了大型三維點(diǎn)云的全景分割,可以在一次推理中處理包含數(shù)百萬個(gè)點(diǎn)和數(shù)千個(gè)對(duì)象的場(chǎng)景。在僅有209k個(gè)參數(shù)的情況下,SuperCluster比SOTA方法小30多倍,訓(xùn)練速度快15倍。

下面一起來閱讀一下這項(xiàng)工作

2. 摘要

通過將該任務(wù)重新定義為可擴(kuò)展的圖聚類問題,我們介紹了一種高效的方法用于大型三維點(diǎn)云的全景分割。該方法可以僅使用局部輔助任務(wù)進(jìn)行訓(xùn)練,從而省去了訓(xùn)練過程中資源密集型的實(shí)例匹配步驟。此外,我們的公式可以很容易地適應(yīng)超點(diǎn)范式,從而進(jìn)一步提高其效率。這使得我們的模型可以在一次推理中處理包含數(shù)百萬個(gè)點(diǎn)和數(shù)千個(gè)對(duì)象的場(chǎng)景。我們的方法,稱為SuperCluster,在兩個(gè)室內(nèi)掃描數(shù)據(jù)集上取得了最新的全景分割性能:S3DIS Area 5為50.1 PQ ( + 7.8 ),ScanNetV2為58.7 PQ ( + 25.2 )。我們還為兩個(gè)大規(guī)模移動(dòng)建圖基準(zhǔn):KITTI - 360和DALES設(shè)置了第一個(gè)最先進(jìn)的基準(zhǔn)。在僅有209k個(gè)參數(shù)的情況下,我們的模型比最好的競(jìng)爭(zhēng)方法小30多倍,訓(xùn)練速度快15倍。

3. 效果展示

S3DIS Area 5的大規(guī)模全景分割結(jié)果,共有9.2 M個(gè)點(diǎn)( 78M預(yù)采樣)和1863個(gè)真實(shí)"物"對(duì)象。SuperCluster可以在3.3秒內(nèi)在單塊V100 - 32GB GPU上一次推理處理如此大的掃描,并達(dá)到50.1的PQ值。

faa05c00-b8c3-11ee-8b88-92fbcf53809c.jpg

四個(gè)數(shù)據(jù)集的全景預(yù)測(cè)結(jié)果。

faae49be-b8c3-11ee-8b88-92fbcf53809c.jpg

4. 具體原理是什么?

SuperCluster對(duì)一個(gè)包含兩個(gè)物體(椅子和沙發(fā))的簡化場(chǎng)景的操作順序:子圖( a )展示了第一階段,其中點(diǎn)云被分割成具有簡單幾何形狀的連通超點(diǎn)。在子圖( b )中,預(yù)測(cè)每個(gè)超點(diǎn)的語義類分布。在子圖( c )中,預(yù)測(cè)每一對(duì)相鄰超點(diǎn)的對(duì)象一致性,表明它們屬于同一個(gè)對(duì)象的可能性。子圖( d )展示了一個(gè)圖聚類問題的輸出,該問題在對(duì)象之間的轉(zhuǎn)換處切割邊的同時(shí),合并了具有兼容類分布和對(duì)象一致性的超點(diǎn)。由此產(chǎn)生的超點(diǎn)簇定義了全景3D分割的實(shí)例。

fab75dec-b8c3-11ee-8b88-92fbcf53809c.jpg

超點(diǎn)對(duì)象Agreement:對(duì)每一對(duì)相鄰的超點(diǎn)( s , t)計(jì)算一個(gè)對(duì)象一致性分?jǐn)?shù)。這個(gè)值是由s和t以及它們的多數(shù)對(duì)象obj ( t )和obj ( s )之間的平均重疊率定義。

fac5a8ca-b8c3-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法的對(duì)比

S3DIS Area 5上SOTA語義分割方法的語義( SS )和全景分割結(jié)果,提供了兩個(gè)全景度量,將所有類別視為"事物" ( PS -- no "stuff"),將墻壁、天花板和地板視為"物品" ( PS )。

faccebd0-b8c3-11ee-8b88-92fbcf53809c.jpg

6. 總結(jié)

這篇文章引入了SuperCluster,一種用于大規(guī)模點(diǎn)云的三維全景分割的新方法。作者將這個(gè)任務(wù)設(shè)計(jì)為可擴(kuò)展的圖聚類問題,繞過了當(dāng)前全景分割方法中的一些計(jì)算密集型步驟。SuperCluster在S3DIS,ScanNet,KITTI - 360和DALES在內(nèi)的多個(gè)基準(zhǔn)測(cè)試集上達(dá)到了最先進(jìn)的性能,同時(shí)顯著地更小,可擴(kuò)展,更容易訓(xùn)練。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128592
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24619

原文標(biāo)題:15倍加速!SuperCluster:最強(qiáng)3D點(diǎn)云全景分割!

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于3D點(diǎn)的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    對(duì)于自動(dòng)駕駛應(yīng)用來說,3D 場(chǎng)景感知至關(guān)重要。3D點(diǎn)數(shù)據(jù)就是具有3D特征的數(shù)據(jù)。一方面,3D
    的頭像 發(fā)表于 12-28 16:35 ?1337次閱讀
    基于<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>的多任務(wù)模型在板端實(shí)現(xiàn)高效部署

    基于深度學(xué)習(xí)的方法在處理3D點(diǎn)進(jìn)行缺陷分類應(yīng)用

    背景部分介紹了3D點(diǎn)應(yīng)用領(lǐng)域中公開可訪問的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對(duì)于分析和比較各種模型至關(guān)重要。研究人員專門設(shè)計(jì)了各種數(shù)據(jù)集,包括用于3D形狀分類、
    的頭像 發(fā)表于 02-22 16:16 ?957次閱讀
    基于深度學(xué)習(xí)的方法在處理<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>進(jìn)行缺陷分類應(yīng)用

    如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)?

    如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)?以上來自于谷歌翻譯以下為原文How to obtain the sequence of 2d im
    發(fā)表于 11-13 11:25

    3D點(diǎn)技術(shù)介紹及其與VR體驗(yàn)的關(guān)系

    ;x>nkedIn上發(fā)表了一篇跟澳大利亞科技公司優(yōu)立(Euclideon)所使用的點(diǎn)數(shù)據(jù)有關(guān)的文章,并在業(yè)內(nèi)引起了一番討論。 1. 點(diǎn)的問題 點(diǎn)
    發(fā)表于 09-15 09:28 ?20次下載

    點(diǎn)問題的介紹及3D點(diǎn)技術(shù)在VR中的應(yīng)用

    1. 點(diǎn)的問題 點(diǎn)是由3D掃描硬件收集的數(shù)據(jù),如FARO的Focus 3D激光掃描儀和Shi
    發(fā)表于 09-27 15:27 ?17次下載

    實(shí)現(xiàn)快讀高效且穩(wěn)健的3D稀疏點(diǎn)分割

    在進(jìn)行分割之前,需要從掃描的點(diǎn)數(shù)據(jù)中移除地面。這種地面移除的方法,只是把低于車輛高度的3D點(diǎn)移除。這種方法在簡單的場(chǎng)景中起作用,但是如果在
    的頭像 發(fā)表于 11-16 16:45 ?5868次閱讀

    3D的感知技術(shù)及實(shí)踐

    測(cè)量表面法向量估計(jì) 幾何測(cè)量平面提取 3D重建從離散點(diǎn)得到光滑曲面 3D重建ICP點(diǎn)配準(zhǔn)
    的頭像 發(fā)表于 10-23 09:40 ?3160次閱讀
    <b class='flag-5'>3D</b>的感知技術(shù)及實(shí)踐

    3D全景線上博物館展廳的優(yōu)勢(shì)是什么

    3D全景線上展廳VR虛擬博物館可視化在線展館以公共服務(wù)需求為核心,為客戶通過無處不在的服務(wù)。 商迪3D運(yùn)用3D全景技術(shù)和VR虛擬技術(shù)打造的
    的頭像 發(fā)表于 05-10 14:13 ?5327次閱讀

    何為3D點(diǎn)語義分割

    融合標(biāo)注使用的3D標(biāo)注工具仍以3D立體框?yàn)橹?,但?b class='flag-5'>3D點(diǎn)數(shù)據(jù)以外,還需要使用2D標(biāo)注工具在
    的頭像 發(fā)表于 07-21 15:52 ?8497次閱讀

    首個(gè)無監(jiān)督3D點(diǎn)物體實(shí)例分割算法

    本文旨在尋求一種無監(jiān)督的3D物體分割方法。我們發(fā)現(xiàn),運(yùn)動(dòng)信息有望幫助我們實(shí)現(xiàn)這一目標(biāo)。如下圖1所示,在左圖中的藍(lán)色/橙色圓圈內(nèi),一輛汽車上的所有點(diǎn)一起向前運(yùn)動(dòng),而場(chǎng)景中其他的點(diǎn)則保持靜止。那么理論上,我們可以基于每個(gè)
    的頭像 發(fā)表于 11-09 15:15 ?2158次閱讀

    點(diǎn)分割相較圖像分割的優(yōu)勢(shì)是啥?

    自動(dòng)駕駛領(lǐng)域的下游任務(wù),我認(rèn)為主要包括目標(biāo)檢測(cè)、語義分割、實(shí)例分割全景分割。其中目標(biāo)檢測(cè)是指在區(qū)域中提取目標(biāo)的候選框并分類,語義分割是對(duì)區(qū)
    的頭像 發(fā)表于 12-14 14:25 ?2607次閱讀

    3D點(diǎn)數(shù)據(jù)集在3D數(shù)字化技術(shù)中的應(yīng)用

    隨著計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,3D 數(shù)字化技術(shù)已經(jīng)成為了當(dāng)今工業(yè)制造領(lǐng)域和三維醫(yī)學(xué)影像領(lǐng)域的關(guān)鍵技術(shù)。然而,構(gòu)建高精度、高分辨率的 3D 點(diǎn)數(shù)據(jù)集對(duì)于實(shí)現(xiàn)這一技術(shù)至關(guān)重要。在這篇文章
    的頭像 發(fā)表于 05-06 16:46 ?1339次閱讀

    自動(dòng)駕駛3D點(diǎn)語義分割數(shù)據(jù)標(biāo)注

    在自動(dòng)駕駛環(huán)境感知系統(tǒng)中,如何獲取高精度實(shí)時(shí)路況數(shù)據(jù),是決定自動(dòng)駕駛系統(tǒng)行車安全的關(guān)鍵。 目前主流的兩種感知技術(shù)路徑“純視覺”與“高精地圖+激光雷達(dá)”中,由于激光雷達(dá)采集的3D點(diǎn)路況數(shù)據(jù)更為密集
    發(fā)表于 06-06 09:48 ?3次下載
    自動(dòng)駕駛<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>語義<b class='flag-5'>分割</b>數(shù)據(jù)標(biāo)注

    基于點(diǎn)3D障礙物檢測(cè)介紹

    基于點(diǎn)3D障礙物檢測(cè) 主要有以下步驟: 點(diǎn)數(shù)據(jù)的處理 基于點(diǎn)
    的頭像 發(fā)表于 06-26 10:22 ?905次閱讀
    基于<b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>的<b class='flag-5'>3D</b>障礙物檢測(cè)介紹

    基于深度學(xué)習(xí)的3D點(diǎn)實(shí)例分割方法

    3D實(shí)例分割3DIS)是3D領(lǐng)域深度學(xué)習(xí)的核心問題。給定由點(diǎn)云表示的 3D 場(chǎng)景,我們尋求為每
    發(fā)表于 11-13 10:34 ?2106次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>3D</b><b class='flag-5'>點(diǎn)</b><b class='flag-5'>云</b>實(shí)例<b class='flag-5'>分割</b>方法