0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于前后信息的糾錯算法

SwM2_ChinaAET ? 來源:未知 ? 作者:李倩 ? 2018-05-06 10:11 ? 次閱讀

摘要:針對傳統(tǒng)方法在人體行為識別方面拓展性不強等問題,提出一種序列化的研究思想,提取骨骼圖的特征矢量,用SVM訓(xùn)練和識別靜態(tài)動作,形成序列即可表示動態(tài)動作,因此只要豐富靜態(tài)動作庫,就可以實現(xiàn)多種動態(tài)動作的識別,具有很好的拓展性。為了減少靜態(tài)動作識別錯誤產(chǎn)生的影響,提出一種基于前后信息的糾錯算法。實驗表明,該算法具有較高的識別準(zhǔn)確率,并且具有很好的魯棒性和實時性。

0引言

隨著科學(xué)技術(shù)的發(fā)展,計算機的運算能力大大提升,針對大數(shù)據(jù)的處理漸漸得以實現(xiàn)。在此基礎(chǔ)上發(fā)展而來的人體行為姿態(tài)識別為人機交互、視頻監(jiān)控和智能家居等方面的應(yīng)用提供了基礎(chǔ)。近些年,研究人員已經(jīng)在人體行為識別方面做了大量的研究工作,取得了許多重要的成果,但是對于復(fù)雜人體行為的識別準(zhǔn)確率較低,仍然有待于提高。

基于視覺的人體行為識別方法[2]可以分為兩類,一類基于模板匹配[3],一類基于機器學(xué)習(xí)[4]?;谀0迤ヅ涞姆椒ㄍㄟ^計算當(dāng)前動作與模板庫里的模板之間的相似度,把當(dāng)前模板判定為最相似動作的過程。IBANEZ R和SORIA A等人通過提取人體肢體行為軌跡,分別用動態(tài)時間規(guī)整(DTW)和隱馬爾科夫(HMM)算法,基于模板匹配進行人體行為識別[5]?;跈C器學(xué)習(xí)的方法通過提取樣本特征對樣本訓(xùn)練,得到一個分類器,此分類器具有預(yù)測未知樣本的能力。TRIGUEIROS P和RIBEIRO F等人就對比了幾種機器學(xué)習(xí)算法在手勢識別上的應(yīng)用[6]。但是,這些算法都是為某一具體行為動作所設(shè)計,當(dāng)需要檢測額外的行為動作時,又需要重新設(shè)計方案,拓展性較差。

本文使用從Kinect[7]采集的骨骼圖數(shù)據(jù)(由MSRC-12 Gesture Dataset數(shù)據(jù)庫[8]提供),Kinect提取的骨骼圖像能夠克服光線強弱等外界因素帶來的干擾,具有較強的魯棒性;提取骨骼特征,并采用機器學(xué)習(xí)的算法對靜態(tài)動作分類,最終形成序列;從序列中找出需要識別的動作序列的過程即可表示動態(tài)動作識別過程,此過程具有很好的實時性和拓展性。

1基于骨骼圖的特征提取

選取既能夠充分表示人體某一動作,又不包含過多的冗余信息的人體特征特征提取對行為識別的研究很有價值。根據(jù)人體機械學(xué)理論,本文通過提取4個關(guān)節(jié)點向量、5個關(guān)節(jié)點角度和4個關(guān)節(jié)點距離系數(shù)表示人體行為姿態(tài)。

1.1關(guān)節(jié)點向量提取

如圖1所示,4個關(guān)節(jié)點向量分別是左上臂(VSL-EL)、右上臂(VSR-ER)、左大腿(VHL-KL)和右大腿(VHR-KR)。現(xiàn)以左上臂為例,計算左上臂向量。已知左肩膀(ShoulderLeft)關(guān)節(jié)點坐標(biāo)為SL(Sx,Sy,Sz),左手肘(ElbowLeft)關(guān)節(jié)點坐標(biāo)為EL(Ex,Ey,Ez),則左上臂關(guān)節(jié)點向量計算方法如式(1)所示。其他關(guān)節(jié)點向量以此類推。

1.2關(guān)節(jié)點角度提取

在原有向量的基礎(chǔ)上提取4個關(guān)節(jié)點角度。聯(lián)合關(guān)節(jié)點向量,可以描述人體左小臂、右小臂、左小腿和右小腿的活動狀態(tài)。圖1中θEL、θER、θKL和θKR分別表示左肘關(guān)節(jié)點角度、右肘關(guān)節(jié)點角度、左膝關(guān)節(jié)點角度和右膝關(guān)節(jié)點角度。θHC表示臀部中心到頭部的向量與豎直方向向量之間的夾角,可以表示人體姿態(tài)的彎腰程度,描述整體軀干的活動狀態(tài)。夾角可以通過式(2)計算獲得。

其中V1、V2分別表示兩個關(guān)節(jié)點向量,θ表示這兩個關(guān)節(jié)點向量的夾角。

1.3關(guān)節(jié)點距離系數(shù)提取

為了能夠讓選取特征對上肢手部活動更加敏感,本文加入4個關(guān)節(jié)點距離系數(shù)。圖1中,a為臀部中心到頭部的關(guān)節(jié)向量,b為頭部到右手的關(guān)節(jié)向量,c為頭部到左手的關(guān)節(jié)向量,d為臀部中心到右手的關(guān)節(jié)向量,e為臀部中心到左手的關(guān)節(jié)向量。通過式(3)可以獲得頭部到左右手的相對距離系數(shù)d1、d2和臀部中心到左右手的相對距離系數(shù)d3、d4。

至此,基于骨骼圖的特征可以表示為式(4)所示的特征矩陣,共計4×3+5+4=21維。

2基于SVM的識別算法流程

支持向量機[9](Support Vector Machines,SVM)是一種用于分類的算法,它能夠在多維空間找出完美劃分事物的超平面。本文使用SVM進行動作分類,以二分類支持向量機為例,已知訓(xùn)練樣本集T:

使用多個二分類器形成多分類器,用豐富的樣本訓(xùn)練并識別人體靜態(tài)姿勢。

2.2動態(tài)動作的序列化識別

設(shè)定某一采樣頻率,所提取到每一幀骨骼圖都以靜態(tài)的方式呈現(xiàn)。對每一幀骨骼圖進行靜態(tài)動作識別,可以得到一串長序列。在長序列中尋找待識別序列即為動態(tài)動作識別。如圖2所示,一組抬起雙手舉高(Start system)的動作可以分解為G1、G2、G3 3個靜態(tài)動作,因此只要在長序列中檢測到連續(xù)的G1、G2、G3 3個靜態(tài)動作即可判定出現(xiàn)“抬起雙手舉高”的動態(tài)動作。

2.3分類的糾錯過程

為了減小靜態(tài)姿勢識別錯誤對動態(tài)動作識別準(zhǔn)確率的影響,本文提出一種基于前后信息的姿態(tài)糾正算法。一般情況下,相鄰兩幀或者多幀的數(shù)據(jù)描述的都是同一動作。算法流程圖如圖3所示,其中predict是分類器預(yù)測的結(jié)果,sequence是最終形成的長序列。首先判斷當(dāng)前預(yù)測結(jié)果是否與長序列隊尾數(shù)據(jù)相同,如果相同,說明當(dāng)前動作與上一幀動作相同,把預(yù)測結(jié)果加入長序列隊尾;如果不相同,需要驗證當(dāng)前預(yù)測結(jié)果是否出錯。此算法判斷當(dāng)前動作之后的n(本文選取15)幀預(yù)測結(jié)果中出現(xiàn)最多的數(shù)據(jù)是否等于當(dāng)前動作預(yù)測結(jié)果,并且其所占比是否大于某一閾值(本文選取0.5),如果是,將當(dāng)前動作的預(yù)測結(jié)果加入長序列隊尾;如果否,說明當(dāng)前動作預(yù)測結(jié)果出錯,長序列隊尾數(shù)據(jù)保持不變。

3實驗驗證

3.1訓(xùn)練靜態(tài)動作

MSRC-12 Gesture Dataset是微軟提供的數(shù)據(jù)庫,共包括12組動作。本文選擇其中3組動作,分別為Start system、Duck和Push right,如圖2、圖4和圖5所示。

顯然,大多數(shù)志愿者保持某一靜態(tài)動作的時間并不一致。為了合理利用資源和方便處理,把姿勢劃分為進行態(tài)和保持態(tài)兩種狀態(tài):

(1)進行態(tài)是一組動作的中間狀態(tài),即兩種靜態(tài)姿態(tài)的過度,可包含運動過程中較大范圍的運動姿態(tài),圖2(b)的G2和圖5(b)中的G5即是進行態(tài)。因為進行態(tài)不能對決策結(jié)果起決定性作用,所以進行態(tài)并不需要非常高的識別精確度。

(2)保持態(tài)是一組動作中保持時間較長的狀態(tài),能夠?qū)ψ藙莸淖R別起決定性作用,因此需要很高的識別準(zhǔn)確率。圖2(a)中的G1、圖2(c)中的G3、圖4(b)中的G4以及圖5(c)中的G6都屬于保持態(tài)。實驗中,從10人中選取600幀G1姿勢,5人中選取550幀G2、G3、G4、G5和G6姿勢,共3 350幀數(shù)據(jù),用于訓(xùn)練分類器,SVM識別結(jié)果見表1。

3.2靜態(tài)動作結(jié)果分析

采用十折交叉驗證法檢驗分類器的性能,最終得到的平均識別準(zhǔn)確度為93.12%。表1為單個姿態(tài)的識別準(zhǔn)確度。從表1可以看出,位于保持態(tài)的姿態(tài)識別準(zhǔn)確率普遍在90%以上,達到較高的準(zhǔn)確率。進行態(tài)姿態(tài)識別準(zhǔn)確率比保持態(tài)稍低,但是從前文可知,這對最終的判定結(jié)果影響不大。

3.3序列糾錯

采用2.3節(jié)所述的方法進行姿態(tài)序列糾錯。不失一般性,從實驗的3 350幀數(shù)據(jù)中隨機選取150幀數(shù)據(jù)(原序列)為例,見圖6(a)。在原序列第30幀左右,姿勢2(G2)向姿勢3(G3)過度階段出現(xiàn)了較多錯分類現(xiàn)象。圖6(b)是采用2.3節(jié)方法糾錯后序列,可以看出,整個序列變得光滑得多,上述的分類錯誤得到了抑制,大大方便了后續(xù)動作識別。

3.4態(tài)動作識別驗證

為便利于分析,將經(jīng)過糾錯處理的數(shù)據(jù)中連續(xù)的n個“1”用一個“1”表示,其他姿態(tài)以此類推。以Start system為例,當(dāng)檢測到連續(xù)的1,2,3或者1,3則可以判定出現(xiàn)一組Start system動作,當(dāng)檢測到連續(xù)的1,2,3,2,1、1,2,3,1、1,3,2,1、1,3,1則判定完成Start system動作并回到站姿(G1)。用MSRC-12 Gesture Dataset數(shù)據(jù)測試,測試結(jié)果見表2。為了對比算法的優(yōu)劣,表2中同時列出了文獻[10]的隨機森林算法的識別情況。

由表2明顯可以看出,與文獻[10]的算法相比,本文提出的算法的識別準(zhǔn)確率更高。通過實驗得知,Start system、Duck和Push right 3種動作具體的識別準(zhǔn)確率分別是71.82%、80%和76.36%。

4總結(jié)

本文算法可以實現(xiàn)實時提取骨骼數(shù)據(jù),計算骨骼特征,分類識別并形成序列,具有很好的實時性。序列化的動態(tài)動作識別方法可以滿足各種動作的任意組合,具有很好的拓展性。實驗表明,本文算法具有較高的識別準(zhǔn)確率。但是,對采集到的每一幀骨骼圖進行分類無疑會增加算法復(fù)度。因此,如何降低冗余的分類識別,是下一步研究需要解決的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關(guān)注

    關(guān)注

    12

    文章

    1199

    瀏覽量

    55269
  • 識別算法
    +關(guān)注

    關(guān)注

    0

    文章

    44

    瀏覽量

    10345

原文標(biāo)題:【學(xué)術(shù)論文】人體行為序列化識別算法研究

文章出處:【微信號:ChinaAET,微信公眾號:電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    一種基于混沌和小波變換的大容量音頻信息隱藏算法

    `音頻信息隱藏的主要原理是利用人耳聽覺系統(tǒng)的某些特性,將秘密信息隱藏到普通的音頻數(shù)據(jù)流中以達到隱蔽通信的目的.提出了一種基于混沌和小波變換的大容量音頻隱藏算法.該
    發(fā)表于 03-06 18:32

    請問怎樣去設(shè)計一種糾錯邏輯電路?

    怎樣去設(shè)計一種糾錯邏輯電路?怎樣對檢糾錯邏輯電路進行仿真?
    發(fā)表于 05-06 08:12

    一種實用的數(shù)據(jù)融合算法

    摘要:文章分析了目前些數(shù)據(jù)融合算法中對先驗信息要求苛刻,定義數(shù)據(jù)間支持度中門限預(yù)先設(shè)定對融合結(jié)果的不利影響,提出了一種實用的數(shù)據(jù)融合算法,
    發(fā)表于 01-18 23:20 ?16次下載

    一種新的自糾錯句對齊算法的研究與實現(xiàn)

    本文提出了一種基于詞性的判別函數(shù),用來自動識別句子對齊結(jié)果的正確性。通過反向采用基于長度的對齊算法,糾正了初步對齊產(chǎn)生的連續(xù)性錯誤。該方法節(jié)省了人力,同時提
    發(fā)表于 09-18 10:56 ?8次下載

    一種安全的糾錯網(wǎng)絡(luò)編碼

    該文利用消息空間的所有子空間上的一種度量,給出了一種安全的糾錯網(wǎng)絡(luò)編碼。首先,此度量下的最小距離譯碼法可以糾正定維數(shù)的錯誤。另外,在此編碼方法下,當(dāng)攻擊者
    發(fā)表于 11-09 13:32 ?19次下載

    一種利用顏色信息的車牌字符分割新算法

     汽車牌照自動識別系統(tǒng)中由于拍攝得到的字符模糊經(jīng)常造成分割效果不佳。通常采用的灰度處理方法也丟失了很多顏色信息。本文提出一種基于模糊神經(jīng)網(wǎng)絡(luò)的算法,充分利用車
    發(fā)表于 07-16 18:00 ?10次下載

    用FPGA實現(xiàn)糾錯編碼的一種方法

    本文提出了一種用FPGA實現(xiàn)糾錯編碼的設(shè)計思想,并以Altera MAX+PluslI為硬件開發(fā)平臺。利用FPGA編程的特點,用軟件編程方法,很好的解決了糾錯編碼中存在的碼速變換和實時性問題,實現(xiàn)
    發(fā)表于 11-10 17:10 ?61次下載
    用FPGA實現(xiàn)<b class='flag-5'>糾錯</b>編碼的<b class='flag-5'>一種</b>方法

    一種改進的多傳感器信息融合算法

    一種改進的多傳感器信息融合算法_夏菽蘭
    發(fā)表于 01-03 15:24 ?0次下載

    一種基于改進信息熵的協(xié)同過濾算法_曾建新

    一種基于改進信息熵的協(xié)同過濾算法_曾建新
    發(fā)表于 03-19 11:46 ?0次下載

    一種改進的高速鏈路前向糾錯編碼

    在高速鏈路的可靠傳輸中,物理層前向糾錯的研究主要集中在提高編碼的糾錯性能,且編碼冗余位全部用于糾錯校驗,難以滿足用戶在傳輸中加裁定制信息的應(yīng)用需求。針對這
    發(fā)表于 11-21 15:41 ?15次下載
    <b class='flag-5'>一種</b>改進的高速鏈路前向<b class='flag-5'>糾錯</b>編碼

    一種基于全局信息共享的自適應(yīng)FA算法

    針對螢火蟲算法FA對于高維復(fù)雜問題,收斂速度慢、求解精度低,優(yōu)化效果不理想等缺點,提出一種基于全局信息共享的自適應(yīng)FA算法。分別從三個方面對FA算法
    發(fā)表于 11-29 17:24 ?0次下載

    一種結(jié)合未標(biāo)簽信息的主動學(xué)習(xí)算法

    針對高光譜遙感影像分類中,傳統(tǒng)的主動學(xué)習(xí)算法僅利用已標(biāo)簽數(shù)據(jù)訓(xùn)練樣本,大量未標(biāo)簽數(shù)據(jù)被忽視的問題,提出一種結(jié)合未標(biāo)簽信息的主動學(xué)習(xí)算法。首先,通過K近鄰
    發(fā)表于 12-01 16:19 ?0次下載
    <b class='flag-5'>一種</b>結(jié)合未標(biāo)簽<b class='flag-5'>信息</b>的主動學(xué)習(xí)<b class='flag-5'>算法</b>

    一種融合局部紋理信息的改進PRICoLBP算法

    針對用于紋理特征提取的成對旋轉(zhuǎn)不變共生局部二值模式( PRICoLBP)算法計算特征維度大、旋轉(zhuǎn)不變性較差、對光照變化敏感的問題,提出一種融合局部紋理信息的改進PRICoLBP算法。首
    發(fā)表于 12-08 11:46 ?0次下載
    <b class='flag-5'>一種</b>融合局部紋理<b class='flag-5'>信息</b>的改進PRICoLBP<b class='flag-5'>算法</b>

    一種新聞關(guān)鍵信息的提取算法

    針對網(wǎng)頁正文提取算法缺乏通用性,以及對新聞網(wǎng)頁的提取缺乏標(biāo)題、時間、來源信息的問題,提出一種新聞關(guān)鍵信息的提取算法newsExtractor
    發(fā)表于 12-13 16:16 ?5次下載
    <b class='flag-5'>一種</b>新聞關(guān)鍵<b class='flag-5'>信息</b>的提取<b class='flag-5'>算法</b>

    基于糾錯碼的灰度位信息隱藏算法

    碼的最低有效位( LSB)信息隱藏算法與基于糾錯碼的灰度位信息隱藏算法。前者將秘密信息進行編碼并
    發(fā)表于 01-07 10:12 ?0次下載
    基于<b class='flag-5'>糾錯</b>碼的灰度位<b class='flag-5'>信息</b>隱藏<b class='flag-5'>算法</b>