OCR簡稱Optical Character Recognition,它是指對于紙上的打印的文字字符進行識別,將識別結(jié)果以文本方式存儲在計算機器中。根據(jù)識別的字符類型通??煞譃橛∷Ⅲw識別和手寫體識別兩大類。
字符識別原理:通過對特征點形狀的提取,分離器分離字符,然后進行文本的輸出。
我們以手寫字體為例進行講解,識別的步驟如下:
1.打開機器視覺軟件。
2.采集圖像。點擊軟件界面“工具箱”-->“圖像處理”-->“采集圖像”,將采集圖像工具拖至流程欄,如圖一所示。采集圖像的方式有文件、目錄、相機三種方式,我們選擇“文件”下采集,如圖二所示。在電腦的文件夾中,選擇格式為JPG或BMP格式的圖片。
圖一
圖二
3.字符識別工具添加。添加“字符讀取”和“字符集合”工具至流程欄,如圖三所示
字符讀?。河糜谧x取字符文本,需要將標準的字符錄入字符集合中。
字符集合:配合“字符讀取”工具使用,用于存儲字庫模板。
圖三
4.選擇輸入圖像。點擊流程欄的“字符讀取”,選擇輸入的圖像為“Task.1采集圖像”。如圖四所示。
圖四
5.設(shè)置檢測區(qū)域。在區(qū)域設(shè)置中,選擇矩形方框,拖動到檢測的字符區(qū)域,如圖五所示。
圖五
6.銜接“字符集合”,參數(shù)設(shè)置。進行分割參數(shù)設(shè)置(閾值、字符極性、字符寬度、字符 高度)和識別參數(shù)設(shè)置(最小分數(shù)設(shè)置)。如圖六所示。
圖六
通過調(diào)整參數(shù)來達到將字符逐個分割,如圖七所示。
圖七
7.學習字符。如圖八所示,選擇單個學習或全部學習,如圖久所示,將圖像中的字符逐個輸入在學習字符的對話框內(nèi),然后“執(zhí)行”。
圖八
圖九
8.結(jié)果顯示。將“系統(tǒng)工具”下的“數(shù)據(jù)顯示”,將拖至流程欄,點擊“數(shù)據(jù)顯示”,添加數(shù)據(jù)文本為“字符讀取”的文本,點擊確定。
圖十
最終的識別結(jié)果如下圖所示。
以上為手寫字符識別的全部過程,由于手寫字體具有隨機性、自由化程度高,識別起來比印刷字符困難,因此需要大量的學習才能達到快速正確的識別。
總結(jié):
字符識別流程如下圖所示
-
分離器
+關(guān)注
關(guān)注
1文章
81瀏覽量
14880 -
機器視覺
+關(guān)注
關(guān)注
161文章
4320瀏覽量
119996
原文標題:機器視覺知識--手寫字體竟然是這樣識別的?
文章出處:【微信號:GKB1508,微信公眾號:工控幫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論