0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于幾何單目3D目標(biāo)檢測(cè)的密集幾何約束深度估計(jì)器

3D視覺工坊 ? 來源:自動(dòng)駕駛之心 ? 作者:汽車人 ? 2022-10-09 15:51 ? 次閱讀

摘要

由于深度信息的缺失,從單目圖像估計(jì)物體的準(zhǔn)確3D位置是一個(gè)具有挑戰(zhàn)性的問題。之前的工作表明,利用目標(biāo)的關(guān)鍵點(diǎn)投影約束來估計(jì)多個(gè)候選深度可以提高檢測(cè)性能。然而,現(xiàn)有方法只能利用垂直邊緣作為深度估計(jì)的投影約束。所以這些方法只利用了少量的投影約束,產(chǎn)生的深度候選不足,導(dǎo)致深度估計(jì)不準(zhǔn)確。論文提出了一種可以利用來自任何方向邊緣的密集投影約束方法。通過這種方式,論文使用了更多的投影約束并輸出了更多的候選深度。此外,論文提出了一個(gè)圖匹配加權(quán)模塊來合并候選深度。本文提出的方法名為DCD(Densely Constrained Detector),在 KITTI 和 WOD基準(zhǔn)上實(shí)現(xiàn)了最先進(jìn)的性能。

之前算法存在的問題在于它們的幾何約束不足。具體來說,一些現(xiàn)有的方法估計(jì)2D邊界框和3D邊界框的高度,然后利用2D到3D高度投影約束生成目標(biāo)的深度候選。最終的深度是通過對(duì)所有候選深度進(jìn)行加權(quán)來生成的。如下圖所示,該方法僅適用于垂直邊緣,這意味著它們只使用少量約束和3D先驗(yàn),導(dǎo)致深度估計(jì)的不準(zhǔn)確。

65534d06-32f0-11ed-ba43-dac502259ad0.png

方法

DCD的框架的如下圖所示。DCD使用單階段檢測(cè)器從單目圖像中檢測(cè)目標(biāo)。論文提出了密集幾何約束深度估計(jì)器(DGDE,Densely Geometric-constrained Depth Estimator),它可以計(jì)算任何方向的2D-3D邊緣的深度。DGDE可以有效地利用目標(biāo)的語義關(guān)鍵點(diǎn)并產(chǎn)生更多的深度候選。此外,論文利用回歸得到的2D邊緣、3D邊緣和方向作為2D-3D邊緣圖匹配網(wǎng)絡(luò)的輸入。所提出的圖匹配加權(quán)模塊 (GMW,Graph Matching Weighting module) 匹配每個(gè)2D-3D邊緣并輸出匹配分?jǐn)?shù)。通過將多個(gè)深度與其相應(yīng)的匹配分?jǐn)?shù)相結(jié)合,論文最終可以為目標(biāo)生成一個(gè)穩(wěn)健的深度。

65702e3a-32f0-11ed-ba43-dac502259ad0.png

Geometric-based 3D Detection Definition

基于幾何的單目3D目標(biāo)檢測(cè)通過2D-3D投影約束估計(jì)目標(biāo)的位置。具體來說,網(wǎng)絡(luò)預(yù)測(cè)目標(biāo)的尺寸(),旋轉(zhuǎn)角。假設(shè)一個(gè)目標(biāo)有n個(gè)語義關(guān)鍵點(diǎn),論文回歸第i個(gè)關(guān)鍵點(diǎn)在圖像坐標(biāo)中的2D坐標(biāo)和object frame中的3D坐標(biāo)。object frame的坐標(biāo)原點(diǎn)是目標(biāo)的中心點(diǎn)。給定n個(gè)語義2D-3D關(guān)鍵點(diǎn)投影約束,解決3D目標(biāo)位置是一個(gè)超定問題,它是用于將點(diǎn)云將從object frame轉(zhuǎn)換到camera frame的平移向量。生成每個(gè)目標(biāo)的語義關(guān)鍵點(diǎn)的方法改編自。論文通過PCA建立了一些汽車模型,并通過從點(diǎn)云和2D mask中分割出來的3D點(diǎn)云來細(xì)化模型。在獲得關(guān)鍵點(diǎn)后,就可以使用DGDE從關(guān)鍵點(diǎn)投影約束中估計(jì)目標(biāo)的深度。

Densely Geometric-constrained Depth Estimation

雖然以前的深度估計(jì)方法[51]只考慮了垂直邊緣,但DGDE可以處理任意方向的邊緣。因此,論文能夠利用更多的約束來估計(jì)每個(gè)深度候選的深度。

該方法基于關(guān)鍵點(diǎn)從3D空間到2D圖像的投影關(guān)系。第i個(gè)關(guān)鍵點(diǎn)的3D坐標(biāo)在object frame中定義,并通過以下等式投影到2D圖像平面上:

659994a0-32f0-11ed-ba43-dac502259ad0.png

其中是第i個(gè)關(guān)鍵點(diǎn)的深度,K是相機(jī)內(nèi)參,K,R,t 表示為:

65b1dace-32f0-11ed-ba43-dac502259ad0.png

通過上述兩式,第i個(gè)關(guān)鍵點(diǎn)的投影約束方程記為:

65d49866-32f0-11ed-ba43-dac502259ad0.png

第j個(gè)關(guān)鍵點(diǎn)投影約束方程與上式類似,進(jìn)一步可以從第i個(gè)、第 j 個(gè)關(guān)鍵點(diǎn)投影約束中得到深度估計(jì):

65e973bc-32f0-11ed-ba43-dac502259ad0.png

這個(gè)方程表明深度可以通過任意方向邊緣的投影約束來計(jì)算。

給定n個(gè)關(guān)鍵點(diǎn),論文生成m=n(n-1)/2 個(gè)深度候選。與此同時(shí),不可避免地會(huì)遇到一些低質(zhì)量的深度候選。因此,需要適當(dāng)?shù)募訖?quán)方法來集成這些深度候選。

Depth Weighting by Graph Matching

利用DGDE估計(jì)目標(biāo)的深度候選時(shí),目標(biāo)的最終深度可以根據(jù)根據(jù)估計(jì)質(zhì)量進(jìn)行加權(quán):

65fc61f2-32f0-11ed-ba43-dac502259ad0.png

接下來介紹論文提出的新的加權(quán)方法——Graph Matching Weighting module (GMW)。

Graph Construction and Edge Feature extraction:論文構(gòu)造了2D關(guān)鍵點(diǎn)圖和3D關(guān)鍵點(diǎn)圖。3D關(guān)鍵點(diǎn)圖與2D關(guān)鍵點(diǎn)圖基本一致,唯一的區(qū)別是頂點(diǎn)坐標(biāo)是2D坐標(biāo)還是3D坐標(biāo)。2D和3D邊緣特征提取器[47]如下所示:

66120a66-32f0-11ed-ba43-dac502259ad0.png

FC、CN、BN、ReLU 分別表示全連接層、Context Normalization [47]、Batch Normalization 和 ReLU。值得一提的是,Context Normalization 提取了所有邊的全局信息。

Graph matching layer:給定提取的2D和3D邊緣特征,根據(jù)在邊緣s上的2D特征和邊緣t上的3D特征之間的L2距離計(jì)算如下?lián)p失:

662a3a3c-32f0-11ed-ba43-dac502259ad0.png

然后論文將M作為Sinkhorn layer[4]的輸入來獲得分配矩陣P。Sinkhorn layer通過最小化下述目標(biāo)函數(shù)來迭代優(yōu)化P:

6644d9e6-32f0-11ed-ba43-dac502259ad0.png

Loss function:設(shè)計(jì)如下所示的回歸損失來監(jiān)督最終的加權(quán)深度,并使用分類損失來監(jiān)督圖匹配:

66622ef6-32f0-11ed-ba43-dac502259ad0.png

實(shí)驗(yàn)結(jié)果

KITTI上的實(shí)驗(yàn)結(jié)果,優(yōu)勢(shì)比較明顯。

667235ee-32f0-11ed-ba43-dac502259ad0.png

可視化:

66a4fcae-32f0-11ed-ba43-dac502259ad0.png

更多的實(shí)驗(yàn)結(jié)果如下表所示:

66dbcda6-32f0-11ed-ba43-dac502259ad0.png

消融實(shí)驗(yàn)

670c7190-32f0-11ed-ba43-dac502259ad0.png

DCD可以比基線更準(zhǔn)確地估計(jì)深度。

673121fc-32f0-11ed-ba43-dac502259ad0.png

GMW和邊數(shù)量的消融實(shí)驗(yàn)

674e04d4-32f0-11ed-ba43-dac502259ad0.png

關(guān)于DCD和AutoShape的討論

盡管DCD和AutoShape都利用多個(gè)關(guān)鍵點(diǎn)來估計(jì)目標(biāo)的位置,但存在如下關(guān)鍵差異:

AutoShape直接使用所有2D-3D關(guān)鍵點(diǎn)投影約束來求解對(duì)象目標(biāo)深度。DCD則從每個(gè)邊緣約束中求解一個(gè)深度候選。因此,DCD的邊緣約束不僅數(shù)量多,而且比關(guān)鍵點(diǎn)約束的階數(shù)更高;

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    847

    瀏覽量

    47555
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2836

    瀏覽量

    107000

原文標(biāo)題:ECCV 2022 | 用于單目3D目標(biāo)檢測(cè)的密集約束深度估計(jì)器

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深度解析自動(dòng)駕駛的雙目3D感知視覺方案

    基于攝像頭圖像來感知3D環(huán)境是一個(gè)病態(tài)問題,但是可以利用一些幾何約束和先驗(yàn)知識(shí)來輔助完成這個(gè)任務(wù),也可以采用深度神經(jīng)網(wǎng)絡(luò)端對(duì)端的學(xué)習(xí)如何從
    發(fā)表于 06-08 10:22 ?1829次閱讀
    <b class='flag-5'>深度</b>解析自動(dòng)駕駛的雙目<b class='flag-5'>3D</b>感知視覺方案

    如何通俗理解視覺定位?帶你看懂對(duì)極幾何與基本矩陣

    是Epipolarconstraint極線約束:X在右像面上的投影XR必然被約束在eR-XR極線上。對(duì)于OL-XL上的X,X1,X2,X3都受該約束。極線
    發(fā)表于 06-01 08:00

    最受歡迎的三種深度傳感

    時(shí)間(ToF)  TOF是Time of flight的簡(jiǎn)寫,直譯為飛行時(shí)間。所謂飛行時(shí)間法3D成像,是通過給目標(biāo)連續(xù)發(fā)送光脈沖,然后用傳感接收從物體返回的光,通過探測(cè)光脈沖的飛行(往返)時(shí)間來得到
    發(fā)表于 08-25 11:05

    3D設(shè)計(jì)太耗時(shí)?趕緊試試浩辰3D軟件中的幾何約束關(guān)系命令!

    。若存在幾何約束重疊,則可使用「快速選取」進(jìn)行選擇式刪除。如何顯示和關(guān)閉幾何約束關(guān)系? 選擇工具欄「草圖」-「相關(guān)」-「保持關(guān)系」,該命令默認(rèn)為自動(dòng)開啟狀態(tài)。該命令開啟時(shí),浩辰
    發(fā)表于 12-11 11:17

    實(shí)時(shí)3D藝術(shù)最佳實(shí)踐-幾何指南

    為確保游戲在所有設(shè)備上運(yùn)行良好, 游戲的幾何學(xué)考慮必須認(rèn)真和盡可能優(yōu)化。 本指南突出顯示三維資產(chǎn)中的幾何性能優(yōu)化, 可以提高游戲效率。 這些優(yōu)化有助于實(shí)現(xiàn)改善移動(dòng)平臺(tái)上游戲表現(xiàn)的總體目標(biāo)。 本指南也可以以Unity Learn
    發(fā)表于 08-02 08:05

    基于幾何約束的視頻幀間線段特征匹配算法

    規(guī)劃的線段特征匹配算法。首先,基于校正后視頻幀間線段特征的空間相鄰性計(jì)算線段匹配的初始候選集;然后,基于極線約束、應(yīng)矩陣模型約束以及點(diǎn)一線相鄰性約束等多重
    發(fā)表于 11-29 10:20 ?0次下載
    基于<b class='flag-5'>幾何</b><b class='flag-5'>約束</b>的視頻幀間線段特征匹配算法

    基于圖像的深度估計(jì)算法,大幅度提升基于圖像深度估計(jì)的精度

    雙目匹配需要把左圖像素和右圖中其對(duì)應(yīng)像素進(jìn)行匹配,再由匹配的像素差算出左圖像素對(duì)應(yīng)的深度,而之前的深度估計(jì)方法均不能顯式引入類似的
    的頭像 發(fā)表于 06-04 15:46 ?3.5w次閱讀
    基于<b class='flag-5'>單</b><b class='flag-5'>目</b>圖像的<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>算法,大幅度提升基于<b class='flag-5'>單</b><b class='flag-5'>目</b>圖像<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>的精度

    3D的感知技術(shù)及實(shí)踐

    3D濾波、噪聲過濾和表面平滑 3D信號(hào)處理深度圖平滑濾波 3D信號(hào)處理深度圖的雙邊濾波 3D信號(hào)
    的頭像 發(fā)表于 10-23 09:40 ?3096次閱讀
    <b class='flag-5'>3D</b>的感知技術(shù)及實(shí)踐

    關(guān)于鋼塊3D幾何測(cè)量的實(shí)用性說明

    鋼塊3D幾何測(cè)量的實(shí)用性 3D幾何測(cè)量在鋼塊生產(chǎn)的兩個(gè)步驟中非常有用:(1)經(jīng)過平方處理后,為拋光生成建議,以減少拋光工作量。(2)在最終檢查過程中,要確保
    發(fā)表于 07-05 15:56 ?376次閱讀

    密集SLAM的概率體積融合概述

    我們提出了一種利用深度密集 SLAM 和快速不確定性傳播從圖像重建 3D 場(chǎng)景的新方法。所提出的方法能夠
    的頭像 發(fā)表于 01-30 11:34 ?591次閱讀

    介紹第一個(gè)結(jié)合相對(duì)和絕對(duì)深度的多模態(tài)深度估計(jì)網(wǎng)絡(luò)

    深度估計(jì)分為兩個(gè)派系,metric depth estimation(度量深度估計(jì),也稱絕對(duì)
    的頭像 發(fā)表于 03-21 18:01 ?4464次閱讀

    公差分析VS尺寸鏈計(jì)算-DTAS 3D幾何數(shù)據(jù)導(dǎo)入

    DTAS 3D幾何數(shù)據(jù)導(dǎo)入/網(wǎng)站www.dtas-china. com【支持免費(fèi)案例解析、尺寸問題答疑、軟件試用】等服務(wù)
    的頭像 發(fā)表于 04-20 11:56 ?921次閱讀
    公差分析VS尺寸鏈計(jì)算-DTAS <b class='flag-5'>3D</b><b class='flag-5'>幾何</b>數(shù)據(jù)導(dǎo)入

    一種利用幾何信息的自監(jiān)督深度估計(jì)框架

    本文方法是一種自監(jiān)督的深度估計(jì)框架,名為GasMono,專門設(shè)計(jì)用于室內(nèi)場(chǎng)景。本方法通過應(yīng)用多視圖幾何的方式解決了室內(nèi)場(chǎng)景中幀間大旋轉(zhuǎn)和
    發(fā)表于 11-06 11:47 ?322次閱讀
    一種利用<b class='flag-5'>幾何</b>信息的自監(jiān)督<b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>框架

    深度估計(jì)開源方案分享

    可以看一下深度估計(jì)效果,這個(gè)深度圖的分辨率是真的高,物體邊界分割的非常干凈!這里也推薦工坊推出的新課程《
    的頭像 發(fā)表于 12-17 10:01 ?672次閱讀
    <b class='flag-5'>單</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>開源方案分享

    如何搞定自動(dòng)駕駛3D目標(biāo)檢測(cè)!

    可用于自動(dòng)駕駛場(chǎng)景下基于圖像的3D目標(biāo)檢測(cè)的數(shù)據(jù)集總結(jié)。其中一些數(shù)據(jù)集包括多個(gè)任務(wù),這里只報(bào)告了3D檢測(cè)基準(zhǔn)(例如KITTI
    發(fā)表于 01-05 10:43 ?431次閱讀
    如何搞定自動(dòng)駕駛<b class='flag-5'>3D</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>!