圖像識(shí)別是識(shí)別圖像或視頻中的目標(biāo)或特征的過(guò)程。這項(xiàng)技術(shù)已應(yīng)用于多個(gè)領(lǐng)域,如缺陷檢測(cè)、醫(yī)學(xué)成像和安全監(jiān)控。
圖像識(shí)別的重要性
圖像識(shí)別不僅可以加速處理繁瑣的任務(wù),而且還可以比人工圖像檢查更快速或更準(zhǔn)確地處理圖像。圖像識(shí)別是應(yīng)用于諸多領(lǐng)域的關(guān)鍵技術(shù),也是深度學(xué)習(xí)應(yīng)用的主要驅(qū)動(dòng)因素,如:
視覺(jué)檢查:在制造過(guò)程中識(shí)別零部件是否有缺陷,可以快速檢查裝配線上的數(shù)千個(gè)零部件。
圖像分類(lèi):根據(jù)圖像內(nèi)容對(duì)圖像進(jìn)行分類(lèi)。這在電子商務(wù)領(lǐng)域的圖像檢索和推薦系統(tǒng)等應(yīng)用中特別有用。
自動(dòng)駕駛:識(shí)別圖像中的停車(chē)標(biāo)志或行人的能力對(duì)于自動(dòng)駕駛應(yīng)用至關(guān)重要。
機(jī)器人:機(jī)器人可以利用圖像識(shí)別來(lái)識(shí)別目標(biāo),并通過(guò)識(shí)別路徑上的位置或目標(biāo)來(lái)增強(qiáng)自主導(dǎo)航。
圖像識(shí)別在零部件缺陷視覺(jué)檢查中的應(yīng)用。
圖像識(shí)別是支持這些應(yīng)用的核心技術(shù)。它可以識(shí)別圖像中的目標(biāo)或場(chǎng)景,然后利用這些信息做出決策。而它做出的決策將作為更大的系統(tǒng)的一部分。圖像識(shí)別將會(huì)幫助這些系統(tǒng)增強(qiáng)感知能力,其本質(zhì)是通過(guò)為系統(tǒng)提供洞察力來(lái)支持其做出更好的決策。
圖像識(shí)別與目標(biāo)檢測(cè)
圖像識(shí)別和目標(biāo)檢測(cè)這兩項(xiàng)技術(shù)十分相似,經(jīng)常會(huì)一起使用。圖像識(shí)別用于識(shí)別圖像中的目標(biāo)或場(chǎng)景,而目標(biāo)檢測(cè)用于查找圖像中這些目標(biāo)的實(shí)例和位置。
常見(jiàn)的目標(biāo)檢測(cè)技術(shù)有 Faster R-CNN 和 YOLOv3。
圖像識(shí)別的工作原理
圖像識(shí)別使用的方法
圖像識(shí)別使用了很多方法,包括機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法。使用哪種方法取決于具體應(yīng)用,但一般來(lái)說(shuō),問(wèn)題越復(fù)雜,需要探索深度學(xué)習(xí)方法的可能性就越高。
使用深度學(xué)習(xí)進(jìn)行圖像識(shí)別
圖像識(shí)別的深度學(xué)習(xí)方法可能涉及使用卷積神經(jīng)網(wǎng)絡(luò),從示例圖像中自動(dòng)學(xué)習(xí)相關(guān)特征,然后在新圖像中自動(dòng)識(shí)別這些特征。
圖像識(shí)別的典型深度學(xué)習(xí)工作流:
準(zhǔn)備訓(xùn)練數(shù)據(jù):從一組圖像入手,將其匯集為不同的關(guān)聯(lián)類(lèi)別。這其中可能還包括預(yù)處理步驟。其目的是讓圖像更加一致,從而得到更準(zhǔn)確的模型。
創(chuàng)建深度學(xué)習(xí)模型:雖然您可以從頭構(gòu)建深度學(xué)習(xí)模型,但最好的方法可能是從預(yù)訓(xùn)練模型入手,并將其用作應(yīng)用的起點(diǎn)。
訓(xùn)練模型:模型訓(xùn)練就是將測(cè)試數(shù)據(jù)呈現(xiàn)給模型。之后,模型會(huì)多次遍歷數(shù)據(jù),并自動(dòng)學(xué)習(xí)與圖像相關(guān)的最重要特征。隨著訓(xùn)練的繼續(xù),模型將學(xué)習(xí)更復(fù)雜的特征,直到能夠準(zhǔn)確地辨別訓(xùn)練集中的圖像類(lèi)。
測(cè)試數(shù)據(jù):測(cè)試模型前所未見(jiàn)的新數(shù)據(jù),了解模型對(duì)圖像的識(shí)別情況。如果結(jié)果未能達(dá)到預(yù)期,請(qǐng)重復(fù)執(zhí)行以上四個(gè)步驟,直到準(zhǔn)確度令人滿意。
~~ 小 Tips ~~
深度學(xué)習(xí)方法常用于圖像識(shí)別,因?yàn)檫@些方法可以提供高度準(zhǔn)確且可靠的結(jié)果。深度學(xué)習(xí)往往適用于處理大量訓(xùn)練數(shù)據(jù),而遷移學(xué)習(xí)等方法可以簡(jiǎn)化圖像識(shí)別工作流。Deep Learning Toolbox 提供了一個(gè)框架,用于通過(guò)算法、預(yù)訓(xùn)練模型和 App 設(shè)計(jì)和實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)。
使用機(jī)器學(xué)習(xí)進(jìn)行圖像識(shí)別
圖像識(shí)別的機(jī)器學(xué)習(xí)方法就是從圖像中識(shí)別并提取關(guān)鍵特征,然后將其用作機(jī)器學(xué)習(xí)模型的輸入。
訓(xùn)練數(shù)據(jù):您可以先從一組圖像入手,將其編譯為關(guān)聯(lián)的類(lèi)別。
提取特征:選擇每個(gè)圖像中的相關(guān)特征。特征提取算法可能會(huì)提取可用于區(qū)分?jǐn)?shù)據(jù)類(lèi)的邊緣或角特征。
創(chuàng)建機(jī)器學(xué)習(xí)模型:這些特征會(huì)添加到機(jī)器學(xué)習(xí)模型中,再由機(jī)器學(xué)習(xí)模型將其分為各自不同的類(lèi)別,然后使用這些信息對(duì)新目標(biāo)進(jìn)行分析和分類(lèi)。
圖像識(shí)別的機(jī)器學(xué)習(xí)工作流。
您可以使用各種機(jī)器學(xué)習(xí)算法和特征提取方法。這些算法和方法可有多種組合以供創(chuàng)建準(zhǔn)確的目標(biāo)識(shí)別模型。
使用 HOG 特征和 SVM 分類(lèi)器分類(lèi)數(shù)字的圖像識(shí)別機(jī)器學(xué)習(xí)示例
~~ 小 Tips ~~
使用機(jī)器學(xué)習(xí)進(jìn)行目標(biāo)識(shí)別可以靈活地選擇最佳的特征和分類(lèi)器組合以用于學(xué)習(xí)。這樣,便可以最少的數(shù)據(jù)獲得準(zhǔn)確的結(jié)果。Statistics and Machine Learning Toolbox 提供了一系列函數(shù)和 App,可用于數(shù)據(jù)描述、分析和建模。
圖像識(shí)別:深度學(xué)習(xí)與機(jī)器學(xué)習(xí)
如何知道何時(shí)使用深度學(xué)習(xí),何時(shí)使用機(jī)器學(xué)習(xí)來(lái)進(jìn)行圖像識(shí)別?
從較高層面講,二者區(qū)別在于機(jī)器學(xué)習(xí)需要手動(dòng)選擇特征,而深度學(xué)習(xí)可以自動(dòng)學(xué)習(xí)特征。
使用傳統(tǒng)圖像處理方法進(jìn)行圖像識(shí)別
除了深度學(xué)習(xí)和機(jī)器學(xué)習(xí)之外,很多經(jīng)典的圖像處理方法在處理某些應(yīng)用的圖像識(shí)別方面卓有成效。圖像處理方法往往非常適用于“基于像素”的識(shí)別應(yīng)用,如:
基于顏色的圖像識(shí)別:顏色通??梢詾閳D像識(shí)別提供良好的特征。色調(diào)、飽和度和明度 (HSV) 或紅色、綠色、藍(lán)色 (RGB) 等特征有助于深入了解圖像。
模板匹配:這種方法使用小圖像或模板在較大的圖像中查找匹配區(qū)域。
圖像分割和斑點(diǎn)分析:這種方法使用簡(jiǎn)單的目標(biāo)屬性,如大小、顏色或形狀。
~~ 小 Tips ~~
通常,如果目標(biāo)可以使用圖像分割等簡(jiǎn)單方法進(jìn)行識(shí)別,則最好先使用這種方法。您有的可能是功能強(qiáng)大,不需要成百上千訓(xùn)練圖像的解決方案,也可能是復(fù)雜的解決方案。不管怎么樣,Image Processing Toolbox 都有您需要的所有工具。
使用 MATLAB 進(jìn)行圖像識(shí)別
MATLAB 簡(jiǎn)化了圖像識(shí)別中較為困難的任務(wù)。
1. 圖像標(biāo)注 App:
經(jīng)過(guò)清理和預(yù)處理的數(shù)據(jù)可確保圖像識(shí)別有更大的成功機(jī)會(huì)。使用圖像標(biāo)注器,可以自動(dòng)執(zhí)行圖像裁剪和標(biāo)注過(guò)程。
以交互方式標(biāo)注圖像和視頻。
2. 探索深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法:
一開(kāi)始時(shí),您可能并不清楚到底是使用深度學(xué)習(xí)還是機(jī)器學(xué)習(xí)方法。MATLAB 讓您可以嘗試各種方法組合。探索深度學(xué)習(xí)預(yù)訓(xùn)練模型或機(jī)器學(xué)習(xí)分類(lèi)算法。
您可以使用 ONNX(開(kāi)放式神經(jīng)網(wǎng)絡(luò)交換)的導(dǎo)入和導(dǎo)出功能通過(guò) TensorFlow、Keras、PyTorch 和 Caffe2 等框架與網(wǎng)絡(luò)和網(wǎng)絡(luò)架構(gòu)進(jìn)行互操作。
與基于 Python 的框架集成。
3. 自動(dòng)為部署生成代碼:
最終,您的算法可能需要在桌面環(huán)境之外應(yīng)用。MATLAB 提供了代碼生成工具,可用于在任何位置部署圖像識(shí)別算法:Web、嵌入式硬件或產(chǎn)品級(jí)服務(wù)器。
創(chuàng)建算法之后,可以使用自動(dòng)化工作流,通過(guò) GPU Coder 生成 TensorRT 或 CUDA 代碼,以用于硬件在環(huán)測(cè)試。生成的代碼可與現(xiàn)有工程集成,并可用于在桌面 GPU 或嵌入式 GPU(如 NVIDIA Jetson 或 NVIDIA Drive 平臺(tái))上驗(yàn)證目標(biāo)檢測(cè)算法。
審核編輯:湯梓紅
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28103瀏覽量
205845 -
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
518瀏覽量
38210 -
目標(biāo)檢測(cè)
+關(guān)注
關(guān)注
0文章
200瀏覽量
15578 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132312 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
782文章
13621瀏覽量
165941
原文標(biāo)題:關(guān)于圖像識(shí)別,你不得不知的三大要點(diǎn)
文章出處:【微信號(hào):MATLAB,微信公眾號(hào):MATLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論