資料介紹
0 前言
隨著智能手機(jī)和平板電腦等無輸入鍵盤電子設(shè)備的流行,聯(lián)機(jī)手寫識別的研究吸引了越來越多的關(guān)注。而手寫簽名驗(yàn)證和基于3D加速度傳感器的姿態(tài)識別、手寫識別等新應(yīng)用形式的出現(xiàn),也為聯(lián)機(jī)手寫識別的研究注入了新的活力。
支持向量機(jī)(Support Vector Machine,SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的新一代分類識別算法,使用核函數(shù)方法將非線性可分的特征向量映射到高維空間,計(jì)算最大化分類間隔的最優(yōu)分類超平面。在文本分類、語音識別、手寫識別、曲線擬合等領(lǐng)域,SVM已經(jīng)有比較成熟的應(yīng)用。但是,一般的核函數(shù)要求不同樣本的特征向量的維數(shù)相同,限制了SVM在語音識別和聯(lián)機(jī)手寫識別領(lǐng)域的進(jìn)一步發(fā)展。為此,Bahlmann等人使用彈性距離計(jì)算算法--DTW算法--構(gòu)造了GDTW核函數(shù),進(jìn)而提出GDTW-SVM算法。GDTW-SVM的聯(lián)機(jī)手寫識別實(shí)驗(yàn)結(jié)果表明,GDT W-SVM取得了可媲美隱馬爾科夫模型、神經(jīng)網(wǎng)絡(luò)等分類算法的識別率,并且與使用后來提出的基于其它彈性距離計(jì)算構(gòu)造的核函數(shù)的SVM相比,性能不相伯仲。
本文結(jié)合GDTW核函數(shù)和聯(lián)機(jī)手寫識別樣本的特征向量的特點(diǎn),引入新的控制參數(shù)優(yōu)化GDTW核函數(shù)的計(jì)算。實(shí)驗(yàn)結(jié)果表明,本文提出的優(yōu)化方法不僅減少了支持向量的數(shù)目,而且提高了GDTW-SVM運(yùn)行效率。
1 聯(lián)機(jī)手寫識別過程
1.1 聯(lián)機(jī)手寫識別流程介紹
聯(lián)機(jī)手寫識別的過程與通用模式識別的過程基本相同,由數(shù)據(jù)采集和預(yù)處理、特征提取、分類識別、后處理四個步驟組成。
在數(shù)據(jù)采集和預(yù)處理階段,首先使用傳感器采集原始物理信息,比較常見的是加速度、速度、位移、起筆和落筆;然后,對原始信息進(jìn)行傳感器矯正、去噪等預(yù)處理。
特征提取是手寫識別的重要步驟之一,對分類器的設(shè)計(jì)和分類結(jié)果有著重要的影響,選擇合適的特征不僅可以提高識別率,也可以節(jié)省計(jì)算存儲空間、運(yùn)算時間、特征提取費(fèi)用。聯(lián)機(jī)手寫識別中比較常見特征提取方法有加速度、位移、DCT變換等。
分類識別是手寫識別的核心階段,大多數(shù)分類器在實(shí)際分類應(yīng)用之前,需要使用訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練,不斷地修正特征提取方法和方案、分類器的判決規(guī)則和參數(shù)。目前,分類識別的訓(xùn)練階段需要人工干預(yù)以達(dá)到最佳的識別率。
一些識別系統(tǒng)在分類識別之后使用后處理進(jìn)一步提高識別率。例如,數(shù)字“1”和小寫字母“1”在很多情況下難以分辨,但是在后處理階段結(jié)合上下文信息,決定當(dāng)前字符是數(shù)字“1”還是小寫字母“1”。
1.2 聯(lián)機(jī)手寫識別實(shí)驗(yàn)
本文聯(lián)機(jī)手寫識別實(shí)驗(yàn)采用了Bahlmann等人和Bothe等人使用的方法。所使用的樣本數(shù)據(jù)庫是免費(fèi)的聯(lián)機(jī)手寫數(shù)據(jù)庫UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60個書寫者的共11640個手寫樣本。這些樣本包含ASCII字符、拉丁字符和西班牙字符,而每個字符包含80個訓(xùn)練樣本和140個測試樣本。每個樣本由一劃或多劃組成,數(shù)據(jù)庫提供每個筆劃的坐標(biāo)序列。
坐標(biāo)序列由等時間間隔采集的筆尖的水平坐標(biāo)xi和垂直坐標(biāo)yi組成。而在本文實(shí)驗(yàn)中,樣本的坐標(biāo)序列不經(jīng)過任何去噪等預(yù)處理,直接對每個坐標(biāo)點(diǎn),使用字符的重心(μx,μy)和垂直坐標(biāo)的方差σy計(jì)算列向量
式(1)中,ang是求虛數(shù)相角的函數(shù)。每個字符樣本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐標(biāo)點(diǎn)數(shù)目,即特征向量的維數(shù),每個字符樣本的NT可以不相同。
本文的聯(lián)機(jī)手寫識別實(shí)驗(yàn)假設(shè)每個字符不需要分析其上下文即可完成識別,所以,特征提取之后使用本文所述的分類算法進(jìn)行分類識別,并且將其輸出結(jié)果作為最終識別結(jié)果,不經(jīng)過任何后處理。
2 GDTW-SVM算法
2.1 支持向量機(jī)
假設(shè)線性分類器對輸入的特征向量x={x1,x2,…xn}(n是樣本數(shù)目),輸出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的維數(shù):yi∈{-1,1}, yi=-1表示樣本(xi,yi)屬于第一類,yi=1表示樣本(xi,yi)屬于另一類。該線性分類器的分類決策為
y(+b)≥1 (2)
式(2)中(w,b)確定分類超平面+b=0。
SVM以最小化結(jié)構(gòu)風(fēng)險為目標(biāo),計(jì)算使得訓(xùn)練樣本集到分類超平面的距離最大化的最優(yōu)分類超平面。其等價于對式(2)求解凸二次規(guī)劃問題。
即尋找使平均距離最小的最優(yōu)對齊路徑。DTW距離越小,T和R所代表的樣本越相似。可以使用動態(tài)規(guī)劃(Dynamic Programming)算法計(jì)算最優(yōu)對齊路徑和DTW距離。
隨著智能手機(jī)和平板電腦等無輸入鍵盤電子設(shè)備的流行,聯(lián)機(jī)手寫識別的研究吸引了越來越多的關(guān)注。而手寫簽名驗(yàn)證和基于3D加速度傳感器的姿態(tài)識別、手寫識別等新應(yīng)用形式的出現(xiàn),也為聯(lián)機(jī)手寫識別的研究注入了新的活力。
支持向量機(jī)(Support Vector Machine,SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的新一代分類識別算法,使用核函數(shù)方法將非線性可分的特征向量映射到高維空間,計(jì)算最大化分類間隔的最優(yōu)分類超平面。在文本分類、語音識別、手寫識別、曲線擬合等領(lǐng)域,SVM已經(jīng)有比較成熟的應(yīng)用。但是,一般的核函數(shù)要求不同樣本的特征向量的維數(shù)相同,限制了SVM在語音識別和聯(lián)機(jī)手寫識別領(lǐng)域的進(jìn)一步發(fā)展。為此,Bahlmann等人使用彈性距離計(jì)算算法--DTW算法--構(gòu)造了GDTW核函數(shù),進(jìn)而提出GDTW-SVM算法。GDTW-SVM的聯(lián)機(jī)手寫識別實(shí)驗(yàn)結(jié)果表明,GDT W-SVM取得了可媲美隱馬爾科夫模型、神經(jīng)網(wǎng)絡(luò)等分類算法的識別率,并且與使用后來提出的基于其它彈性距離計(jì)算構(gòu)造的核函數(shù)的SVM相比,性能不相伯仲。
本文結(jié)合GDTW核函數(shù)和聯(lián)機(jī)手寫識別樣本的特征向量的特點(diǎn),引入新的控制參數(shù)優(yōu)化GDTW核函數(shù)的計(jì)算。實(shí)驗(yàn)結(jié)果表明,本文提出的優(yōu)化方法不僅減少了支持向量的數(shù)目,而且提高了GDTW-SVM運(yùn)行效率。
1 聯(lián)機(jī)手寫識別過程
1.1 聯(lián)機(jī)手寫識別流程介紹
聯(lián)機(jī)手寫識別的過程與通用模式識別的過程基本相同,由數(shù)據(jù)采集和預(yù)處理、特征提取、分類識別、后處理四個步驟組成。
在數(shù)據(jù)采集和預(yù)處理階段,首先使用傳感器采集原始物理信息,比較常見的是加速度、速度、位移、起筆和落筆;然后,對原始信息進(jìn)行傳感器矯正、去噪等預(yù)處理。
特征提取是手寫識別的重要步驟之一,對分類器的設(shè)計(jì)和分類結(jié)果有著重要的影響,選擇合適的特征不僅可以提高識別率,也可以節(jié)省計(jì)算存儲空間、運(yùn)算時間、特征提取費(fèi)用。聯(lián)機(jī)手寫識別中比較常見特征提取方法有加速度、位移、DCT變換等。
分類識別是手寫識別的核心階段,大多數(shù)分類器在實(shí)際分類應(yīng)用之前,需要使用訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練,不斷地修正特征提取方法和方案、分類器的判決規(guī)則和參數(shù)。目前,分類識別的訓(xùn)練階段需要人工干預(yù)以達(dá)到最佳的識別率。
一些識別系統(tǒng)在分類識別之后使用后處理進(jìn)一步提高識別率。例如,數(shù)字“1”和小寫字母“1”在很多情況下難以分辨,但是在后處理階段結(jié)合上下文信息,決定當(dāng)前字符是數(shù)字“1”還是小寫字母“1”。
1.2 聯(lián)機(jī)手寫識別實(shí)驗(yàn)
本文聯(lián)機(jī)手寫識別實(shí)驗(yàn)采用了Bahlmann等人和Bothe等人使用的方法。所使用的樣本數(shù)據(jù)庫是免費(fèi)的聯(lián)機(jī)手寫數(shù)據(jù)庫UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60個書寫者的共11640個手寫樣本。這些樣本包含ASCII字符、拉丁字符和西班牙字符,而每個字符包含80個訓(xùn)練樣本和140個測試樣本。每個樣本由一劃或多劃組成,數(shù)據(jù)庫提供每個筆劃的坐標(biāo)序列。
坐標(biāo)序列由等時間間隔采集的筆尖的水平坐標(biāo)xi和垂直坐標(biāo)yi組成。而在本文實(shí)驗(yàn)中,樣本的坐標(biāo)序列不經(jīng)過任何去噪等預(yù)處理,直接對每個坐標(biāo)點(diǎn),使用字符的重心(μx,μy)和垂直坐標(biāo)的方差σy計(jì)算列向量
式(1)中,ang是求虛數(shù)相角的函數(shù)。每個字符樣本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐標(biāo)點(diǎn)數(shù)目,即特征向量的維數(shù),每個字符樣本的NT可以不相同。
本文的聯(lián)機(jī)手寫識別實(shí)驗(yàn)假設(shè)每個字符不需要分析其上下文即可完成識別,所以,特征提取之后使用本文所述的分類算法進(jìn)行分類識別,并且將其輸出結(jié)果作為最終識別結(jié)果,不經(jīng)過任何后處理。
2 GDTW-SVM算法
2.1 支持向量機(jī)
假設(shè)線性分類器對輸入的特征向量x={x1,x2,…xn}(n是樣本數(shù)目),輸出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的維數(shù):yi∈{-1,1}, yi=-1表示樣本(xi,yi)屬于第一類,yi=1表示樣本(xi,yi)屬于另一類。該線性分類器的分類決策為
y(+b)≥1 (2)
式(2)中(w,b)確定分類超平面+b=0。
SVM以最小化結(jié)構(gòu)風(fēng)險為目標(biāo),計(jì)算使得訓(xùn)練樣本集到分類超平面的距離最大化的最優(yōu)分類超平面。其等價于對式(2)求解凸二次規(guī)劃問題。
即尋找使平均距離最小的最優(yōu)對齊路徑。DTW距離越小,T和R所代表的樣本越相似。可以使用動態(tài)規(guī)劃(Dynamic Programming)算法計(jì)算最優(yōu)對齊路徑和DTW距離。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 最小內(nèi)內(nèi)方差支持向量引導(dǎo)的字典學(xué)習(xí)算法 7次下載
- 支持向量機(jī)網(wǎng)絡(luò)搜索優(yōu)化應(yīng)用程序下載 0次下載
- 支持向量機(jī)的手勢識別 1次下載
- 模糊支持向量機(jī)的改進(jìn)方法 0次下載
- 基于支持向量機(jī)的車牌字符識別_劉連忠 0次下載
- 雙目標(biāo)函數(shù)支持向量機(jī)在情感分析中的應(yīng)用 0次下載
- 支持向量機(jī)的多組分氣體實(shí)驗(yàn) 14次下載
- 基于支持向量機(jī)的數(shù)字調(diào)制識別算法 20次下載
- 支持向量機(jī)語音識別算法在OMAP5912上的移植
- 基于支持向量機(jī)的手勢識別研究
- 基于改進(jìn)支持向量機(jī)的貨幣識別研究
- 基于小波變換與支持向量機(jī)的虹膜識別新算法
- 基于ANN和HMM的聯(lián)機(jī)手寫體漢字識別系統(tǒng)
- SVM在小字符集手寫體漢字識別中的應(yīng)用研究
- 支持向量機(jī)超聲缺陷識別法的研究
- 什么是中斷向量偏移,為什么要做中斷向量偏移? 1300次閱讀
- 機(jī)器學(xué)習(xí)相關(guān)介紹:支持向量機(jī)(低維到高維的映射) 1892次閱讀
- 誤差向量分析實(shí)際的測量與應(yīng)用 2979次閱讀
- 什么是支持向量機(jī) 什么是支持向量 2.1w次閱讀
- 基于貝塞爾曲線和RNN的手寫識別新方法 3887次閱讀
- 支持向量機(jī)的分類思想 5038次閱讀
- 人臉識別閘機(jī)的功能及工作原理_視美泰的人臉識別閘機(jī)方案分析 1.9w次閱讀
- 關(guān)于支持向量機(jī)(SVMs) 4087次閱讀
- 機(jī)器學(xué)習(xí)-8. 支持向量機(jī)(SVMs)概述和計(jì)算 5105次閱讀
- 人臉識別考勤機(jī)優(yōu)缺點(diǎn)分析 2w次閱讀
- 人臉識別考勤機(jī)的工作原理詳解(安裝注意事項(xiàng)和使用方法以及優(yōu)缺點(diǎn)分析) 6w次閱讀
- 基于paddlepaddle的mnist手寫數(shù)字識別的詳細(xì)分析 6271次閱讀
- S Pen手寫筆淺析_S Pen手寫筆工作原理及發(fā)展前景 1.1w次閱讀
- 什么是手寫繪圖板 手寫板哪個品牌好價格怎么樣 6502次閱讀
- 劃片機(jī)視覺識別系統(tǒng)設(shè)計(jì)原理分析 2947次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 6次下載 | 免費(fèi)
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的光纖通信系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 0.61 MB | 2次下載 | 免費(fèi)
- 6基于FPGA的C8051F單片機(jī)開發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33564次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21548次下載 | 免費(fèi)
- 5電氣工程師手冊免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6653次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537796次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191185次下載 | 免費(fèi)
- 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183278次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評論
查看更多