摘要:在雜亂場(chǎng)景中進(jìn)行三維目標(biāo)識(shí)別是一個(gè)迅速發(fā)展的研究領(lǐng)域。根據(jù)使用的特征類型,三維物體識(shí)別方法大致可分為兩類:基于全局特征的方法和基于局部特征的方法。密集的基于局部地物特征的方法對(duì)遮擋和雜波有較強(qiáng)的魯棒性經(jīng)常出現(xiàn)在現(xiàn)實(shí)世界的場(chǎng)景中。本文對(duì)現(xiàn)有的局部地物進(jìn)行了綜合研究三維物體識(shí)別方法。這些方法一般包括三個(gè)階段:三維關(guān)鍵點(diǎn)檢測(cè)、局部表面特征描述和表面匹配。
一 引言
在雜亂的場(chǎng)景中,物體識(shí)別是在計(jì)算機(jī)視覺研究領(lǐng)域的一個(gè)基礎(chǔ)。它有很多應(yīng)用,比如智能監(jiān)控,自動(dòng)裝配,遙感,移動(dòng)操作,機(jī)器人,生物特征分析和醫(yī)學(xué)治療。在過去的幾十年中,二維物體識(shí)別得到了廣泛的應(yīng)用,目前比較成熟的研究區(qū)域[1]。與二維圖像相比,距離圖像都顯示出了對(duì)象識(shí)別的幾個(gè)優(yōu)點(diǎn)。例如,(i)和2D圖像相比,距離圖像提供更多的幾何信息。距離圖像也編碼表面度量尺寸比較明確。(ii)距離圖像通常不受尺度的影響,旋轉(zhuǎn)和照明。(iii) 與二維圖像估計(jì)的姿勢(shì)相比,估計(jì)3D距離圖像中的物體姿態(tài)更準(zhǔn)確。因此,距離圖像有可能被克服二維圖像所面臨的許多困難在于對(duì)象識(shí)別[2]。這些優(yōu)勢(shì)使三維物體識(shí)別成為一個(gè)活躍的研究課題。而且,技術(shù)迅速發(fā)展并且成本較低的3D采集系統(tǒng)(如微軟Kinect)使得距離圖像更容易獲取。此外,設(shè)備的進(jìn)步使之成為任何計(jì)算密集型的處理三維物體識(shí)別算法在一個(gè)比較公平的并可接受的方式。所有這些因素的共同作用,促成了研究的三維物體識(shí)別系統(tǒng)的發(fā)展。 現(xiàn)有的三維物體識(shí)別方法可以進(jìn)行劃分為兩大類:基于全局特征的方法和基于局部特征的方法?;谌痔卣鞯姆椒ㄌ幚韺?duì)象作為一個(gè)整體來獲得認(rèn)可。它們定義了一組全局的特征,有效和簡潔地描述完整的3D對(duì)象(或模型)。這些方法在三維形狀檢索中得到了廣泛的應(yīng)用分類。這個(gè)類別的例子包括幾何三維矩形,形狀分布、點(diǎn)特征直方圖[3]、空間嵌入。然而,它們忽視形狀細(xì)節(jié),需要先從場(chǎng)景中分割對(duì)象。因此不適合識(shí)別部分可見的從混亂的場(chǎng)景中對(duì)象。另一方面,基于局部特征的方法只提取局部特征特定關(guān)鍵點(diǎn)周圍的表面。它們通常用基于全局特征的方法來處理遮擋和雜波較好,這種類型也有在2D領(lǐng)域的表現(xiàn)明顯更好進(jìn)行對(duì)象識(shí)別。這一結(jié)論也是擴(kuò)展到3D物體識(shí)別領(lǐng)域。在此基礎(chǔ)上,本文重點(diǎn)研究了三維物體識(shí)別在有局部地表特征的雜亂場(chǎng)景中。
二 相關(guān)工作
范圍圖像可以表示為三種類型,即深度圖像、點(diǎn)云或多邊形網(wǎng)。給定一幅距離圖像,即三維對(duì)象的目標(biāo)識(shí)別就是正確地識(shí)別事物中存在的物體范圍成像,并確定他們的姿勢(shì),在概念層次上,基于典型的局部特征三維物體識(shí)別系統(tǒng)主要由三個(gè)部分組成階段:三維關(guān)鍵點(diǎn)檢測(cè),局部表面特征描述和表面匹配。在3D關(guān)鍵點(diǎn)檢測(cè)階段,三維點(diǎn)具有豐富的信息內(nèi)容被確定為關(guān)鍵點(diǎn)。固有的規(guī)模對(duì)每個(gè)關(guān)鍵點(diǎn)也進(jìn)行檢測(cè)。這兩個(gè)位置和一個(gè)關(guān)鍵點(diǎn)的尺度(即鄰里大小)定義后續(xù)使用的局部表面,在局部表面特征描述階段,對(duì)關(guān)鍵點(diǎn)的鄰域曲面的幾何信息進(jìn)行編碼變成一個(gè)代表性的特征描述符。在表面匹配相位,對(duì)場(chǎng)景特征進(jìn)行匹配針對(duì)庫中的所有模型特性,導(dǎo)致一組特征對(duì)應(yīng)和假設(shè)。這些假設(shè)最終被驗(yàn)證以推斷身份和物體的姿態(tài)。
三 3D關(guān)鍵點(diǎn)檢測(cè)
關(guān)鍵點(diǎn)檢測(cè)是基于局部坐標(biāo)的三維目標(biāo)識(shí)別系統(tǒng)的第一個(gè)主要階段。最簡單的關(guān)鍵點(diǎn)檢測(cè)方法是表面稀疏采樣和網(wǎng)格抽取。然而,這些方法在可重復(fù)性和信息性方面并沒有產(chǎn)生合格的關(guān)鍵點(diǎn)。這是因?yàn)樗鼈儧]有或很少考慮到這些檢測(cè)到的關(guān)鍵的判別信息的豐富性。因此,有必要根據(jù)關(guān)鍵點(diǎn)的特殊性對(duì)其進(jìn)行檢測(cè)。根據(jù)尺度來判斷是否自適應(yīng)檢測(cè),關(guān)鍵點(diǎn)檢測(cè)方法可以分為固定尺度關(guān)鍵點(diǎn)檢測(cè)方法和自適應(yīng)尺度關(guān)鍵點(diǎn)檢測(cè)方法。
3.1 固定尺寸關(guān)鍵點(diǎn)的檢測(cè)
固定尺度關(guān)鍵點(diǎn)檢測(cè)方法定義一個(gè)在預(yù)定鄰域內(nèi)具有特征的點(diǎn)作為關(guān)鍵點(diǎn)。鄰域大小由尺度決定,尺度是算法的輸入參數(shù)。
3.1.1 基于曲率的方法
Mokhtarian等人使用高斯和平均曲率檢測(cè)關(guān)鍵點(diǎn)。如果一個(gè)點(diǎn)p的曲率值大于它的內(nèi)環(huán)鄰域的曲率值,那么這個(gè)點(diǎn)p就是一個(gè)關(guān)鍵點(diǎn)。Yamany和Farag使用單純形角來檢測(cè)關(guān)鍵點(diǎn)。單形角φ與平均曲率有關(guān)。在單形角滿足約束|sin(φ)|τ的位置檢測(cè)到關(guān)鍵點(diǎn)。它們的閾值τ對(duì)于關(guān)鍵點(diǎn)檢測(cè)的性能是至關(guān)重要的,選擇一個(gè)合適的閾值仍然是一個(gè)未解決的問題。Gal和Cohen-Or提出了關(guān)鍵點(diǎn)檢測(cè)的顯著性等級(jí)。p點(diǎn)的顯著性等級(jí)是兩項(xiàng)的線性組合,項(xiàng)是相鄰點(diǎn)曲率的和,第二項(xiàng)是相鄰點(diǎn)曲率值的方差。選取顯著性等級(jí)高的點(diǎn)作為重點(diǎn)。Chen和Bhanu基于形狀指標(biāo)值檢測(cè)關(guān)鍵點(diǎn)。也就是說,在一個(gè)鄰域內(nèi),點(diǎn)p只有在其形狀索引值為局部最優(yōu)(最大值/最小值)時(shí)才被標(biāo)記為關(guān)鍵點(diǎn)。實(shí)驗(yàn)結(jié)果表明,檢測(cè)到的關(guān)鍵點(diǎn)分布均勻在[33]表面。然而,這種方法對(duì)噪聲很敏感。
3.1.2 基于 (OSV)方法
Matei等人使用相鄰點(diǎn)協(xié)方差矩陣的最小特征值λ3來測(cè)量點(diǎn)p周圍的表面變化。根據(jù)點(diǎn)的表面變化對(duì)點(diǎn)進(jìn)行排序。本文使用兩個(gè)連續(xù)特征值的比率來修剪點(diǎn)。Glomb提出了四個(gè)命題,將流行的Harris檢測(cè)器從2D圖像擴(kuò)展到3D網(wǎng)格。他們發(fā)現(xiàn)哈里斯探測(cè)器利用擬合二次曲面的導(dǎo)數(shù),達(dá)到了最好的效果。這一命題,siiran和Busto提出了一種“哈里斯3D”探測(cè)器。給定一個(gè)點(diǎn)p,相鄰的點(diǎn)優(yōu)先平移到質(zhì)心,然后旋轉(zhuǎn)以對(duì)齊垂直于p和z軸。
3.2 自適應(yīng)尺度關(guān)鍵點(diǎn)檢測(cè)
自適應(yīng)尺度關(guān)鍵點(diǎn)檢測(cè)方法首先對(duì)給定的距離圖像建立尺度空間。然后,他們?cè)诳臻g和尺度上選取具有極端特殊性的點(diǎn)作為關(guān)鍵點(diǎn)。結(jié)果,檢測(cè)出了關(guān)鍵點(diǎn)的位置和尺度。根據(jù)尺度空間構(gòu)建技術(shù),這些方法可以分為四類:坐標(biāo)平滑法、幾何屬性平滑法、表面變化法和基于變換的方法。
3.2.1 基于坐標(biāo)平滑的方法
這些方法是通過平滑距離圖像的3D坐標(biāo)連續(xù)地構(gòu)造一個(gè)尺度空間,以二維尺度空間理論為基礎(chǔ)的。 Uluoy通過構(gòu)造曲面的高斯金字塔得到了三維曲面的尺度空間。然后他們計(jì)算了平均值和所有點(diǎn)在所有尺度上的高斯曲率值,并根據(jù)每個(gè)點(diǎn)的高斯曲率和平均曲率將其分類為八種曲面類型之一。在分類的尺度空間中,每個(gè)具有相同表面類型的連接體都被檢測(cè)到。連接體的中心被選擇為一個(gè)關(guān)鍵點(diǎn)的位置。
3.2.2 基于幾何屬性平滑(GAS)方法
這些方法通過連續(xù)平滑距離圖像的幾何屬性來構(gòu)造尺度空間。由于濾波是應(yīng)用于幾何屬性而不是距離圖像本身,沒有對(duì)三維形狀的外部幾何進(jìn)行修改。因此,保持了尺度空間的因果關(guān)系屬性。
3.2.3 基于表面變化(SV)方法
這些方法首先計(jì)算一組不同鄰域大小的曲面變化。然后,他們通過尋找不同鄰域大小的局部鄰域表面變化的最大值來檢測(cè)關(guān)鍵點(diǎn)。它們是基于假設(shè)鄰域大小可以看作是一個(gè)離散尺度參數(shù),增加局部鄰域大小類似于應(yīng)用平滑濾波器。這些方法避免了對(duì)3D表面的直接更改,而且它們很容易實(shí)現(xiàn)。
圖1 在龍模型上檢測(cè)到關(guān)鍵點(diǎn) (a)通過[4]檢測(cè)到的關(guān)鍵點(diǎn)。不同大小的球體對(duì)應(yīng)著不同尺度的關(guān)鍵點(diǎn)。 (b)(c)(d)通過[5]在3個(gè)尺度上檢測(cè)到的關(guān)鍵點(diǎn)及其鄰域。每個(gè)彩色的小塊對(duì)應(yīng)著一個(gè)關(guān)鍵點(diǎn)的附近,藍(lán)色球體的大小對(duì)應(yīng)著尺度。 Ho和Gibbins[4]使用的是標(biāo)準(zhǔn)偏差鄰點(diǎn)的形狀索引值來測(cè)量地表變化。檢測(cè)到的要點(diǎn)在圖中對(duì)龍模型進(jìn)行了說明。圖1(a)表明了該方法的有效性對(duì)小噪聲有效且魯棒。它實(shí)現(xiàn)了高重復(fù)性的結(jié)果,即使有噪聲表面。后來,Ho和Gibbin估算了曲線度在不同的尺度上,選擇極端的點(diǎn)尺度空間中的值作為關(guān)鍵點(diǎn)。同樣的,Ioanou等提出了對(duì)較大的字符進(jìn)行分割的DoN (Normals)操作符無組織的3D點(diǎn)云。DoN操作員提供點(diǎn)數(shù)的大幅減少,從而減少任何后續(xù)處理的計(jì)算成本場(chǎng)景的階段(當(dāng)處理在分割的部分)。犰狳上發(fā)現(xiàn)的關(guān)鍵點(diǎn)的插圖模型如圖2所示。實(shí)驗(yàn)結(jié)果顯示這些關(guān)鍵點(diǎn)對(duì)于剛性變換,等距變形和不同的網(wǎng)格三角法。如圖3所示,它能夠檢測(cè)出高度可重復(fù)的關(guān)鍵點(diǎn),并且對(duì)噪聲具有魯棒性。然而,該方法對(duì)不同的網(wǎng)格分辨率非常敏感,并且檢測(cè)到的關(guān)鍵點(diǎn)非常少。此外,它還需要一個(gè)大的計(jì)算機(jī)內(nèi)存。
圖2 在不同姿態(tài)的犰狳模型上檢測(cè)到的關(guān)鍵點(diǎn)
圖3 在犰狳模型上檢測(cè)到關(guān)鍵點(diǎn)
結(jié)論
本文對(duì)基于局部表面特征的三維物體識(shí)別方法的研究現(xiàn)狀進(jìn)行了綜述。對(duì)全面的3D對(duì)象識(shí)別方法進(jìn)行了分類并分析了各種特征類型及其提取方法的優(yōu)缺點(diǎn)。
責(zé)任編輯:lq
-
圖像
+關(guān)注
關(guān)注
2文章
1079瀏覽量
40375 -
檢測(cè)
+關(guān)注
關(guān)注
5文章
4413瀏覽量
91305 -
物體識(shí)別
+關(guān)注
關(guān)注
0文章
15瀏覽量
7492
原文標(biāo)題:基于局部表面特征在雜亂場(chǎng)景中的三維物體識(shí)別
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論