尤物九九久久国产精品,欧美另类极品videosbesr

引言

手寫數(shù)字識(shí)別是一個(gè)很基礎(chǔ)的模式識(shí)別問題，從傳統(tǒng)特征提取加機(jī)器學(xué)習(xí)訓(xùn)練方法到深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的識(shí)別方法識(shí)別都會(huì)達(dá)到比較高的精度，同時(shí)手寫數(shù)字識(shí)別也是一個(gè)特別不穩(wěn)定，很難具備普適性的模型，需要針對性的數(shù)據(jù)集與訓(xùn)練，然后才得到比較好的識(shí)別精度。

OpenVINO 在2021.4 版本中已經(jīng)加入了手寫數(shù)字識(shí)別的預(yù)訓(xùn)練模型，開始支持手寫數(shù)字識(shí)別，下面讓我們一起探索與嘗試下它的使用方法與效果如何！

模型介紹

在OpenVINO 2021.4版本中支持的手寫數(shù)字識(shí)別模型為handwritten-score-recognition-0003

，支持《digit》 or 《digit》?！禿igit》格式的數(shù)字識(shí)別與小數(shù)點(diǎn)識(shí)別。該模型的結(jié)構(gòu)有兩個(gè)部分組成，前面是一個(gè)典型的CNN骨干網(wǎng)絡(luò)，采用的是VGG-16類似的架構(gòu)，實(shí)現(xiàn)特征提取；后面是一個(gè)雙向的LSTM網(wǎng)絡(luò)，實(shí)現(xiàn)序列預(yù)測；最終的預(yù)測結(jié)果基于CTC解析即可。其輸入與輸出格式如下：

輸入格式為：［NCHW］= ［1x1x32x64］

輸出格式為：［WxBxL］=［16x1x13］

其中13表示“0123456789._#”，#表示空白、_表示非數(shù)字的字符

對輸出格式的解碼方式支持CTC貪心與Beam搜索，演示程序使用CTC貪心解碼，這種方式相對簡單，前面一篇文章中我們已經(jīng)詳細(xì)介紹過了，后面就直接套用即可！

模型使用與演示

使用該模型必須是基于常見文字檢測得到的ROI區(qū)域，然后轉(zhuǎn)化為灰度圖象，使用該模型完成預(yù)測，關(guān)于場景文字檢測，在前面一篇文章中我已經(jīng)詳細(xì)交代過了，這里就不再贅述。這里小可腦洞大開，針對常見的文本圖象，采用OpenCV二值圖象輪廓分析來完成數(shù)字ROI區(qū)域得截取，同樣取得了不錯(cuò)得效果。基本的流程是這樣：

Step 1：讀取圖象并二值化

代碼如下

Mat src = imread（“D:/images/zsxq/ocr.png”）;

imshow（“input”， src）;

Mat gray， binary;

cvtColor（src， gray， COLOR_BGR2GRAY）;

adaptiveThreshold（gray， binary， 255， ADAPTIVE_THRESH_GAUSSIAN_C， THRESH_BINARY_INV， 25， 10）;

其中adaptiveThreshold函數(shù)實(shí)現(xiàn)對灰度圖象自適應(yīng)二值化，參數(shù)blockSize=25表示高斯窗口大小，constants=10表示自適應(yīng)常量值。需要注意的是參數(shù)blockSize值必須為奇數(shù)。

Step 2：使用輪廓分析過填充過濾小噪點(diǎn)

代碼如下

std：：vector《vector《Point》》 contours;

std：：vector《Vec4i》 hireachy;

findContours（binary， contours， hireachy， RETR_EXTERNAL， CHAIN_APPROX_SIMPLE）;

int image_height = src.rows;

int image_width = src.cols;

for （size_t t = 0; t 《 contours.size（）; t++） {

double area = contourArea（contours［t］）;

if （area 《 10） {

drawContours（binary， contours， t， Scalar（0）， -1， 8）;

}

上面的代碼findContours表示輪廓發(fā)現(xiàn)，RETR_EXTERNAL表示采用發(fā)現(xiàn)最外層輪廓，CHAIN_APPROX_SIMPLE表示采用簡單的鏈?zhǔn)骄幋a收集輪廓上的像素點(diǎn)集。contourArea表示計(jì)算一個(gè)輪廓的面積，計(jì)算方式基于格林積分公式。drawContours表示繪制輪廓，其中thickness參數(shù)為-1表示填充，大于零表示繪制邊緣。這里通過對白色噪點(diǎn)填充為黑色，完成噪聲去除，

Step 3：膨脹預(yù)處理

對第二步輸出的圖象我們不能直接通過輪廓發(fā)現(xiàn)截取ROI，然后交給數(shù)字識(shí)別網(wǎng)絡(luò)去識(shí)別，原因是這樣會(huì)導(dǎo)致ROI區(qū)域的寬高比失衡，導(dǎo)致輸入的數(shù)字resize之后發(fā)現(xiàn)畸變，識(shí)別精度會(huì)降低，所以通過膨脹操作，把數(shù)字適度的加寬與加高，主要是加寬，這樣保持輸入ROI區(qū)域resize之后不變性，就很容易識(shí)別了。這部分預(yù)處理的代碼如下：

Mat se = getStructuringElement（MORPH_RECT， Size（45， 5））;

Mat temp;

dilate（binary， temp， se）;

其中dilate表示膨脹操作、然后對得到temp圖象。

Step 4：數(shù)字識(shí)別推理與解析

對圖-4進(jìn)行輪廓發(fā)現(xiàn)，截取ROI，遍歷每個(gè)輪廓，調(diào)用識(shí)別推理即可輸出。其中加載模型與獲取推理請求，這里就不再贅述了，截取ROI與推理解析部分的代碼如下：

// 處理輸出結(jié)果

findContours（temp， contours， hireachy， RETR_EXTERNAL， CHAIN_APPROX_SIMPLE）;

for （size_t t = 0; t 《 contours.size（）; t++） {

Rect box = boundingRect（contours［t］）;

Mat roi = gray（box）;

size_t image_size = h*w;

Mat blob_image;

resize（roi， blob_image， Size（w， h））;

// NCHW

unsigned char* data = static_cast《unsigned char*》（input-》buffer（））;

for （size_t row = 0; row 《 h; row++） {

for （size_t col = 0; col 《 w; col++） {

data［row*w + col］ = blob_image.at《uchar》（row， col）;

}

// 執(zhí)行預(yù)測

infer_request.Infer（）;

auto output = infer_request.GetBlob（output_name）;

const float* blob_out = static_cast《PrecisionTrait《Precision：：FP32》：：value_type*》（output-》buffer（））;

const SizeVector reco_dims = output-》getTensorDesc（）.getDims（）;

const int RW = reco_dims［0］;

const int RB = reco_dims［1］;

const int RL = reco_dims［2］;

std：：string ocr_txt = ctc_decode（blob_out， RW， RL）;

std：：cout 《《 ocr_txt 《《 std：：endl;

cv：：putText（src， ocr_txt， box.tl（）， cv：：FONT_HERSHEY_PLAIN， 1.0， cv：：Scalar（255， 0， 0）， 1）;

cv：：rectangle（src， box， Scalar（0， 0， 255）， 2， 8， 0）;

}

首先進(jìn)行輪廓發(fā)現(xiàn)，然后根據(jù)每個(gè)輪廓截取ROI區(qū)域，設(shè)置輸入數(shù)據(jù)，推理，解析輸出采用CTC方式。

擴(kuò)展探索

這里我沒有采用場景文字檢測來獲取ROI，而是采用傳統(tǒng)的二值圖象分析來完成，主要是避免跟前面的文字內(nèi)容重疊，同時(shí)啟發(fā)更多的思路。另外采用膨脹擴(kuò)展。

有時(shí)候并非是上上之選，還可以直接修改ROI大小來擴(kuò)展，這部分其實(shí)可以參考上一篇場景文字識(shí)別的代碼，輪廓發(fā)現(xiàn)獲取外接矩形，直接修改ROI大小的方式，同時(shí)根據(jù)橫縱比過濾非數(shù)字符號(hào)。改動(dòng)部分就是去掉第三步膨脹，然后直接在第四步循環(huán)中添加下面的代碼；

Rect box = boundingRect（contours［t］）;

float rate = box.width / box.height;

if （rate 》 1.5） {

continue;

}

box.x = box.x - 15;

box.width = box.width + 30;

box.y = box.y - 5;

box.height = box.height + 10;

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

數(shù)字識(shí)別

數(shù)字識(shí)別

+關(guān)注

關(guān)注
2

文章
19

瀏覽量
10123

原文標(biāo)題：OpenVINO? 手寫字符識(shí)別模型與使用

文章出處：【微信號(hào)：英特爾物聯(lián)網(wǎng)，微信公眾號(hào)：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

LangChain框架關(guān)鍵組件的使用方法

LangChain，開發(fā)者可以輕松構(gòu)建基于RAG或者Agent流水線的復(fù)雜應(yīng)用體系，而目前我們已經(jīng)可以在LangChain的關(guān)鍵組件LLM，Text Embedding和Reranker中直接調(diào)用OpenVINO進(jìn)行模型部署，提升本地RAG和Agent服務(wù)的性能，接下來就讓我們一起看下這些組件的

發(fā)表于 08-30 16:55 ?268次閱讀

LangChain框架關(guān)鍵組件的<b class='flag-5'>使用方法</b>

DC/DC模擬的基本使用方法和特性確認(rèn)方法

本篇介紹了DC/DC模擬的基本使用方法及確認(rèn)基本特性的方法。

發(fā)表于 08-20 17:08 ?332次閱讀

DC/DC模擬的基本<b class='flag-5'>使用方法</b>和特性確認(rèn)<b class='flag-5'>方法</b>

淺談錫膏的儲(chǔ)存及使用方法

錫膏（焊錫膏）是電子組裝過程中常用的材料，它的儲(chǔ)存和使用方法對保證焊接質(zhì)量和性能至關(guān)重要。以下是詳細(xì)的儲(chǔ)存及使用方法：

發(fā)表于 06-27 10:02 ?484次閱讀

可編程電源使用方法

可編程電源使用方法 可編程電源使用方法 摘要：本文詳細(xì)介紹了可編程電源的使用方法，包括其基本概念、主要功能、選擇原則、操作步驟、注意事項(xiàng)以及實(shí)際應(yīng)用案例，旨在幫助讀者全面了解可編程電源

發(fā)表于 06-10 15:29 ?571次閱讀

手柄控制代碼及使用方法

手柄控制代碼及使用方法

發(fā)表于 05-15 10:19 ?931次閱讀

微軟發(fā)布Windows版OneNote應(yīng)用AI手寫矯正功能

微軟官方解釋稱，這一功能旨在優(yōu)化和調(diào)整手寫字體，使之更加整潔美觀且更具連貫性。這不僅能提升OneNote中的手寫字體可讀性，而且不會(huì)改變原始手寫字效的獨(dú)特風(fēng)格與個(gè)性化特點(diǎn)，方便用戶日后再次審閱及分享。

發(fā)表于 04-18 10:59 ?373次閱讀

如何快速下載OpenVINO Notebooks中的AI大模型

OpenVINO Notebooks是Jupyter Notebook形式的OpenVINO范例程序大集合，方便開發(fā)者快速學(xué)習(xí)并掌握OpenVINO推理程序，并通過Copy&Paste方式將范例中的關(guān)鍵程序應(yīng)用到自己的AI軟件中

發(fā)表于 12-12 14:40 ?974次閱讀

如何快速下載<b class='flag-5'>OpenVINO</b> Notebooks中的AI大模型

sumif函數(shù)求和的使用方法及實(shí)例

，range代表要進(jìn)行條件判斷的數(shù)據(jù)區(qū)域；criteria代表?xiàng)l件，可以是數(shù)字、字符串、表達(dá)式等；[sum_range]代表要進(jìn)行求和的數(shù)據(jù)區(qū)域。 Sumif函數(shù)的使用方法非常簡單，只需要

發(fā)表于 12-03 10:36 ?1334次閱讀

c語言怎么輸出ascii碼對應(yīng)的字符

行字符的存儲(chǔ)和處理。本文將介紹如何在C語言中輸出ASCII碼對應(yīng)的字符。首先，讓我們來了解一下ASCII碼的基本概念。ASCII碼由美國國家標(biāo)準(zhǔn)協(xié)會(huì)（ANSI）于1963年制定，在計(jì)算機(jī)系統(tǒng)中廣泛使用。它將常見字符（如大

發(fā)表于 11-26 10:32 ?6199次閱讀

c語言將小寫字母轉(zhuǎn)換成大寫字母

在C語言中，字符的大小寫轉(zhuǎn)換是常見的操作，而具體實(shí)現(xiàn)該功能的方法有多種，本篇文章將詳盡、詳實(shí)、細(xì)致地介紹C語言中將小寫字母轉(zhuǎn)換成大寫字母的幾種常用方

發(fā)表于 11-26 10:30 ?8009次閱讀

基于手寫辨識(shí)芯片的漢字手寫輸入技術(shù)

電子發(fā)燒友網(wǎng)站提供《基于手寫辨識(shí)芯片的漢字手寫輸入技術(shù).pdf》資料免費(fèi)下載

發(fā)表于 10-30 11:19 ?0次下載

AT32 MCU Printf的功能使用方法

AT32 MCU Printf的功能使用方法

發(fā)表于 10-27 09:27 ?836次閱讀

OpenVINO? C# API詳解與演示

OpenVINO C# API 支持 NuGet 程序包安裝方式，這與 OpenVINO C++ 庫的安裝過程相比，更加簡單。如果使用 Visual Studio 開發(fā) AI 項(xiàng)目，則可以通過 NuGet 程序包管理功能直接安裝即可

發(fā)表于 10-13 16:39 ?611次閱讀

代碼字符串分割方法

的 String#split 來分割。使用 String#split 方法 String 類中 split 方法，是我們平常處理字符串分割最常用的方法之一，它可以根據(jù)給定的分隔符或正

發(fā)表于 09-25 11:42 ?687次閱讀

OpenVINO場景文字檢測與文字識(shí)別教程

OpenVINO是英特爾推出的深度學(xué)習(xí)模型部署框架，當(dāng)前最新版本是OpenVINO2023版本。OpenVINO2023自帶各種常見視覺任務(wù)支持的預(yù)訓(xùn)練模型庫Model Zoo，其中支持場景文字檢測

發(fā)表于 09-24 15:31 ?1310次閱讀