0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

標(biāo)注神器!AAAI'24最新:第一個交互式3D目標(biāo)檢測器!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-16 16:08 ? 次閱讀

1. 寫在前面

在LiDAR場景中標(biāo)注3D目標(biāo)非常繁瑣,今天筆者為大家推薦一篇加速3D標(biāo)注的最新工作iDet3D。這個交互式的標(biāo)注算法支持2D界面,可以以最少的交互來標(biāo)注每個場景中的整個目標(biāo)。

下面一起來閱讀一下這項(xiàng)工作~

2. 摘要

對LiDAR場景中的多個三維物體進(jìn)行精確標(biāo)注是一項(xiàng)費(fèi)力且具有挑戰(zhàn)性的工作。盡管先前的一些研究試圖利用半自動方法來進(jìn)行具有成本效益的邊界框標(biāo)注,但這些方法在有效地處理大量多類對象方面具有局限性。為了有效加速3D標(biāo)注流水線,我們提出了一種高效的交互式3D目標(biāo)檢測器iDet3D。iDet3D支持用戶友好的2D界面,可以減輕探索3D空間提供點(diǎn)擊交互的認(rèn)知負(fù)擔(dān),使用戶能夠以最少的交互來標(biāo)注每個場景中的整個物體??紤]到三維點(diǎn)云的稀疏性,我們設(shè)計了負(fù)點(diǎn)擊模擬( negative click simulation,NCS ),通過減少假陽性預(yù)測來提高精度。此外,iDet3D結(jié)合了兩種點(diǎn)擊傳播技術(shù),以充分利用用戶交互:( 1 )密集點(diǎn)擊引導(dǎo)( DCG ),用于在整個網(wǎng)絡(luò)中保存用戶提供的信息;( 2 )空間點(diǎn)擊傳播( SCP ),用于根據(jù)用戶指定的對象檢測同一類的其他實(shí)例。通過我們的大量實(shí)驗(yàn),我們發(fā)現(xiàn)我們的方法可以在少量的點(diǎn)擊中構(gòu)建精確的注釋,這表明了我們的方法作為三維物體檢測的有效注釋工具的實(shí)用性。

3. 效果展示

iDet3D中點(diǎn)擊編碼的可視化示例:(a) 輸入點(diǎn)云和用戶點(diǎn)擊(紅色箭頭)。(b) 在目標(biāo)對象上突出顯示相應(yīng)的基于距離編碼的用戶交互。

e7d40fcc-b3fa-11ee-8b88-92fbcf53809c.jpg

看一下具體標(biāo)注過程:( a ) 給定輸入點(diǎn)云。( b ) 提供對行人的正向點(diǎn)擊(紅色圓圈),iDet3D在一次點(diǎn)擊中檢測到場景中多個不同類別的物體。( c )在第2次迭代中,通過增加一個負(fù)點(diǎn)擊(藍(lán)色圓圈),可以一次性過濾掉假陽性預(yù)測。( d )真值。在幾次迭代內(nèi),就可以獲得高質(zhì)量的標(biāo)注結(jié)果。

e7e4360e-b3fa-11ee-8b88-92fbcf53809c.jpg

4. 具體原理是什么?

考慮到3D點(diǎn)云的稀疏性質(zhì),iDet3D設(shè)計了負(fù)點(diǎn)擊模擬 (NCS),通過減少誤報預(yù)測來提高準(zhǔn)確性。還結(jié)合了兩種點(diǎn)擊傳播技術(shù)來充分利用用戶交互:(1) 密集點(diǎn)擊引導(dǎo) (DCG),用于在整個網(wǎng)絡(luò)中保留用戶提供的信息;(2) 空間點(diǎn)擊傳播 (SCP),用于檢測其他實(shí)例。

iDet3D的訓(xùn)練流程。給定用戶對目標(biāo)對象的點(diǎn)擊,將點(diǎn)擊轉(zhuǎn)化為點(diǎn)擊編碼。( a )密集點(diǎn)擊引導(dǎo)( DCG )在輸入端和中間層將編碼融合到骨干網(wǎng)架構(gòu)中。( b )負(fù)點(diǎn)擊模擬( Negative Click Simulation,NCS )通過選擇具有高前景分?jǐn)?shù)的具有挑戰(zhàn)性的背景點(diǎn)來隨機(jī)模擬可能的負(fù)點(diǎn)。( c )后續(xù)的空間點(diǎn)擊傳播( Spatial Click Propagation,SCP )模塊根據(jù)特征嵌入之間的相似性,有效地傳播用戶點(diǎn)擊來檢測同一類的其他對象。

e7f4843c-b3fa-11ee-8b88-92fbcf53809c.jpg

利用空間點(diǎn)擊傳播( SCP )模塊生成關(guān)聯(lián)圖的實(shí)例:( a )點(diǎn)擊關(guān)于N個輸入點(diǎn)的汽車對象(紅色箭頭)上的編碼E。( b )對N′個降采樣點(diǎn)(經(jīng)過降采樣層從N點(diǎn)降至N′點(diǎn))點(diǎn)擊編碼E′。( c )由SCP生成的點(diǎn)擊相關(guān)圖M和( d )與真實(shí)3D邊界框覆蓋的可視化。注意,與點(diǎn)擊同一類的點(diǎn)在輸出的相關(guān)圖中被突出顯示。

e809e390-b3fa-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法對比如何?

baseline和iDet3D在KITTI val集上的定量結(jié)果。

e8134278-b3fa-11ee-8b88-92fbcf53809c.jpg

nuScenes數(shù)據(jù)集的基線和iDet3D ( IA-SSD Backbone)的定量結(jié)果。

e826575a-b3fa-11ee-8b88-92fbcf53809c.jpg

6. 總結(jié)

這篇文章提出了第一個交互式3D目標(biāo)檢測器iDet3D,能夠在幾次點(diǎn)擊中檢測出大量的多類物體。iDet3D設(shè)計了NCS來過濾通過負(fù)點(diǎn)擊產(chǎn)生的假陽性預(yù)測,以及兩個點(diǎn)擊傳播模塊( DCG和SCP)來為用戶提供指導(dǎo)。但是在這項(xiàng)工作中,iDet3D僅對單幀圖像進(jìn)行分析,忽略了連續(xù)幀之間的互補(bǔ)信息。未來作者將考慮處理多個連續(xù)幀之間需要對齊的點(diǎn)嵌入,進(jìn)一步改進(jìn)iDet3D。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    847

    瀏覽量

    47560
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2836

    瀏覽量

    107015
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1141

    瀏覽量

    20738

原文標(biāo)題:標(biāo)注神器!AAAI'24最新:第一個交互式3D目標(biāo)檢測器!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    智能座艙的人車交互大戰(zhàn),3D交互將成為勝負(fù)手?

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)交互式3D的出現(xiàn)原本是為了解決網(wǎng)絡(luò)購物過程中,消費(fèi)者對商品了解的信息偏差。通過對產(chǎn)品模型進(jìn)行3D建模,消費(fèi)者可以對其進(jìn)行拆解、旋轉(zhuǎn)、移動等操作,這就是交互式
    的頭像 發(fā)表于 12-02 01:07 ?1882次閱讀

    基于GAC模型實(shí)現(xiàn)交互式圖像分割的改進(jìn)算法

    ,逐次進(jìn)行單個目標(biāo)的分割,最終實(shí)現(xiàn)了對3病變細(xì)胞的準(zhǔn)確分割。   針對交互式圖像分割方法的重要問題——如何更精確地選取“
    發(fā)表于 09-19 09:19

    如何在交互式人臉檢測演示中將Web瀏覽流用作目標(biāo)輸入?

    無法將 Web 瀏覽流用作交互式人臉檢測演示的目標(biāo)輸入。
    發(fā)表于 08-15 06:02

    英偉達(dá)再出新研究成果 可以渲染合成交互式3D環(huán)境的AI技術(shù)

    據(jù)透露,英偉達(dá)最新研發(fā)的這項(xiàng)成果,是可以渲染合成交互式3D環(huán)境的AI技術(shù)。在創(chuàng)建逼真的3D環(huán)境時,英偉達(dá)研發(fā)團(tuán)隊不再使用傳統(tǒng)的圖形技術(shù),而是使用神經(jīng)網(wǎng)絡(luò) ,特別是“生成模型”,通過來自如YouTube等來源的真實(shí)視頻,進(jìn)行模型訓(xùn)
    發(fā)表于 12-12 09:22 ?918次閱讀

    自動駕駛檢測器可同時實(shí)現(xiàn)3D檢測精讀和速度的提升

    3月19日,阿里巴巴達(dá)摩院宣布近日有論文入選計算機(jī)視覺頂會CVPR 2020。論文提出通用、高性能的自動駕駛檢測器,可兼顧3D物體的
    的頭像 發(fā)表于 03-20 13:40 ?2492次閱讀

    陶瓷3D打印指南: 3D Ceram快速陶瓷成型

    陶瓷3D打印已經(jīng)研究了近二十年(幾乎與AM直存在)并且從開始就表現(xiàn)出很大的潛力,但最近才開始出現(xiàn)陶瓷3D打印實(shí)用和商業(yè)應(yīng)用。在這個交互式
    的頭像 發(fā)表于 12-26 12:46 ?1306次閱讀

    如何處理orcad與Cadence Allegro的交互式操作

    第一方的網(wǎng)表,Allegro導(dǎo)入的是第一方網(wǎng)表,輸出的具體方法見第3.35問; ??Orcad軟件需要勾選以下選項(xiàng),才可以實(shí)現(xiàn)交互式的操作,執(zhí)行Options→Preference選項(xiàng),選擇
    的頭像 發(fā)表于 11-17 11:11 ?1.1w次閱讀
    如何處理orcad與Cadence Allegro的<b class='flag-5'>交互式</b>操作

    港大&amp;amp;騰訊提出DiffusionDet:第一個用于目標(biāo)檢測的擴(kuò)散模型

    近日,來自香港大學(xué)的羅平團(tuán)隊、騰訊 AI Lab 的研究者聯(lián)合提出種新框架 DiffusionDet,將擴(kuò)散模型應(yīng)用于目標(biāo)檢測。據(jù)了解,還沒有研究可以成功地將擴(kuò)散模型應(yīng)用于目標(biāo)
    的頭像 發(fā)表于 11-22 15:35 ?1708次閱讀

    Pair標(biāo)注神器推出醫(yī)學(xué)影像智能交互式分割itSeg

    本次Pair軟件V2.7版本迎來全新升級,重磅推出了智能交互式分割標(biāo)注功能——Intelligent Interactive Segmentation (itSeg),僅需用戶提供少量涂鴉標(biāo)記即可實(shí)現(xiàn)解剖結(jié)構(gòu)的精細(xì)分割
    的頭像 發(fā)表于 12-01 13:55 ?1093次閱讀

    智能座艙的人車交互大戰(zhàn),3D交互將成為勝負(fù)手?

    電子發(fā)燒友網(wǎng)報道(文/ 吳子鵬 )交互式3D的出現(xiàn)原本是為了解決網(wǎng)絡(luò)購物過程中,消費(fèi)者對商品了解的信息偏差。通過對產(chǎn)品模型進(jìn)行3D建模,消費(fèi)者可以對其進(jìn)行拆解、旋轉(zhuǎn)、移動等操作,這就是交互式
    的頭像 發(fā)表于 12-02 07:10 ?722次閱讀

    介紹開源的制作交互式BOM的AD插件!

    介紹開源的制作交互式BOM的AD插件!
    的頭像 發(fā)表于 01-10 14:15 ?5760次閱讀
    介紹<b class='flag-5'>一</b><b class='flag-5'>個</b>開源的制作<b class='flag-5'>交互式</b>BOM的AD插件!

    工業(yè)儀器3D交互式產(chǎn)品展示的亮點(diǎn)

    在現(xiàn)代工業(yè)生產(chǎn)中,工業(yè)儀器起著重要的作用。如何推銷展示這些復(fù)雜龐大的工業(yè)儀器效果更好? 3D交互式產(chǎn)品展示 就是不錯的方法,廣州華銳互動利用3D
    的頭像 發(fā)表于 05-18 15:11 ?411次閱讀

    基于BEV的視覺3D目標(biāo)檢測器

    根據(jù)我們的實(shí)驗(yàn)分析,我們認(rèn)為實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于提升檢測器在 BEV 空間和 2D 空間的適應(yīng)性。這種適應(yīng)性是針對 query 而言的,即對于不同的 query,檢測器要能以不同的方
    發(fā)表于 09-16 10:09 ?625次閱讀
    基于BEV的視覺<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測器</b>

    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺3D目標(biāo)檢測器

    本文介紹在3D 目標(biāo)檢測領(lǐng)域的新工作:SparseBEV。我們所處的 3D 世界是稀疏的,因此稀疏 3D
    的頭像 發(fā)表于 09-19 10:00 ?831次閱讀
    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測器</b>

    如何搞定自動駕駛3D目標(biāo)檢測

    可用于自動駕駛場景下基于圖像的3D目標(biāo)檢測的數(shù)據(jù)集總結(jié)。其中些數(shù)據(jù)集包括多個任務(wù),這里只報告了3D檢測
    發(fā)表于 01-05 10:43 ?439次閱讀
    如何搞定自動駕駛<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>!