伴隨著圖像處理技術(shù)的飛速發(fā)展,推動了圖像識別技術(shù)的產(chǎn)生和發(fā)展,并逐漸成為人工智能領(lǐng)域中重要的組成部分,并廣泛地運(yùn)用于面部識別、指紋識別、醫(yī)療診斷等等領(lǐng)域中,發(fā)揮重要作用。
這也給學(xué)生思考課題給了更多的空間,今天小編就來淺談熱門課題方向中圖像識別技術(shù),希望給學(xué)生更多的啟發(fā)!
圖像識別技術(shù)概述
圖像識別技術(shù)的含義
圖像識別是人工智能的一個重要領(lǐng)域,是指利用計算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識別處理。
在具體應(yīng)用實踐中,特別識別除了要弄清識別的對象具有是什么樣的物體外,還應(yīng)該明確其所在的的位置和姿態(tài)。當(dāng)前圖像識別已經(jīng)被廣泛應(yīng)用到各個領(lǐng)域中,例如交通領(lǐng)域中的車牌號識別、交通標(biāo)志識別、軍事領(lǐng)域中的飛行物識別、地形勘察、安全領(lǐng)域中的指紋識別、人臉識別等。
圖像識別技術(shù)的原理
圖像識別原理主要是需處理具有一定復(fù)雜性的信息,處理技術(shù)并不是隨意出現(xiàn)在計算機(jī)中,主要是根據(jù)一些醫(yī)學(xué)研究人員的實踐,結(jié)合計算機(jī)程序?qū)ο嚓P(guān)內(nèi)容模擬并予以實現(xiàn)。該技術(shù)的計算機(jī)實現(xiàn)與人類對圖像識別的基本原理基本類似,在人類感覺及視覺等方面只是計算機(jī)不會受到任何因素的影響。人類不只是結(jié)合儲存在腦海中的圖像記憶進(jìn)行識別,而是利用圖像特征對其分類,再利用各類別特征識別出圖片。計算機(jī)也采用同樣的圖像識別原理,采用對圖像重要特征的分類和提取,并有效排除無用的多余特征,進(jìn)而使圖像識別得以實現(xiàn)。有時計算機(jī)對上述特征的提取比較明顯,有時就比較普通,這將對計算機(jī)圖像識別的效率產(chǎn)生較大影響。
圖像識別技術(shù)的過程
由于圖像識別技術(shù)的產(chǎn)生是基于人工智能的基礎(chǔ)上,所以計算機(jī)圖像識別的過程與人腦識別圖像的過程大體一致,歸納起來,該過程主要包括4個步驟:
1是獲取信息,主要是指將聲音和光等信息通過傳感器向電信號轉(zhuǎn)換,也就是對識別對象的基本信息進(jìn)行獲取,并將其向計算機(jī)可識別的信息轉(zhuǎn)換;
2是信息預(yù)處理,主要是指采用去噪、變換及平滑等操作對圖像進(jìn)行處理,基于此使圖像的重要特點提高;
3是抽取及選擇特征,主要是指在模式識別中,抽取及選擇圖像特征,概括而言就是識別圖像具有種類多樣的特點,如采用一定方式分離,就要識別圖像的特征,獲取特征也被稱為特征抽取;
4是設(shè)計分類器及分類決策,其中設(shè)計分類器就是根據(jù)訓(xùn)練對識別規(guī)則進(jìn)行制定,基于此識別規(guī)則能夠得到特征的主要種類,進(jìn)而使圖像識別的不斷提高辨識率,此后再通過識別特殊特征,最終實現(xiàn)對圖像的評價和確認(rèn)。
圖像識別技術(shù)的常見形式
首先圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。
文字識別的研究是從 1950年開始的,一般是識別字母、數(shù)字和符號,從印刷文字識別到手寫文字識別,應(yīng)用非常廣泛。
數(shù)字圖像處理和識別的研究開始于1965年。數(shù)字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優(yōu)勢,這些都為圖像識別技術(shù)的發(fā)展提供了強(qiáng)大的動力。
物體的識別主要指的是對三維世界的客體及環(huán)境的感知和認(rèn)識,屬于高級的計算機(jī)視覺范疇。它是以數(shù)字圖像處理與識別為基礎(chǔ)的結(jié)合人工智能、系統(tǒng)學(xué)等學(xué)科的研究方向,其研究成果被廣泛應(yīng)用在各種工業(yè)及探測機(jī)器人上。
隨著計算機(jī)及信息技術(shù)的迅速發(fā)展,圖像識別技術(shù)的應(yīng)用逐漸擴(kuò)大到諸多領(lǐng)域,尤其是在面部及指紋識別、衛(wèi)星云圖識別及臨床醫(yī)療診斷等多個領(lǐng)域日益發(fā)揮著重要作用。通常圖像識別技術(shù)主要是指采用計算機(jī)按照既定目標(biāo)對捕獲的系統(tǒng)前端圖片進(jìn)行處理,在日常生活中圖像識別技術(shù)的應(yīng)用也十分普遍,比如車牌捕捉、商品條碼識別及手寫識別等。隨著該技術(shù)的逐漸發(fā)展并不斷完善,未來將具有更加廣泛的應(yīng)用領(lǐng)域。
基于神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)
目前,基于神經(jīng)網(wǎng)絡(luò)的圖像識別是一種比較新型的技術(shù),是以傳統(tǒng)圖像識別方式為基礎(chǔ),有效融合神經(jīng)網(wǎng)絡(luò)算法。在此,神經(jīng)網(wǎng)絡(luò)主要是指人工神經(jīng)網(wǎng)絡(luò),換而言之就是本文中的神經(jīng)網(wǎng)絡(luò)不是動物體的神經(jīng)網(wǎng)絡(luò),而主要是指人類采用人工模擬動物神經(jīng)網(wǎng)絡(luò)方式的一種神經(jīng)網(wǎng)絡(luò)。針對基于神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù),目前,在基于神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)中,遺傳算法有效結(jié)合 BP 神經(jīng)網(wǎng)絡(luò)是最經(jīng)典的一種模型,該模型可在諸多領(lǐng)域中進(jìn)行應(yīng)用。諸如智能汽車監(jiān)控中采用的拍照識別技術(shù),若有汽車從該位置經(jīng)過時,檢測設(shè)備將產(chǎn)生相應(yīng)的反應(yīng),檢測設(shè)備啟動圖像采集裝置,獲取汽車正反面的特征圖像,在對車牌字符進(jìn)行識別的過程中,就采用了基于神經(jīng)網(wǎng)絡(luò)和模糊匹配的兩類算法。
基于非線性降維的圖像識別技術(shù)
采用計算機(jī)識別圖像是基于高維形式的一種識別技術(shù),不管原始圖片的分辨率如何,該圖片產(chǎn)生的數(shù)據(jù)通常都具有多維性特征,這在一定程度上增大了計算機(jī)識別的難度。為使計算機(jī)的圖像識別性能更為高效,采用隨圖像降維方法就是一種最直接而有效的方法。一般情況下,可對降維劃分為非線性降維與線性降維兩類,比如最普遍的線性降維方式就是主成分分與線性奇異分析等,該方式的特點是簡單、理解更容易等,再對數(shù)據(jù)集合采用線性降維方式處理求解的投影圖像使該數(shù)據(jù)集合的低維最優(yōu)。
在信息技術(shù)中作為近年來新興的圖像識別技術(shù)已廣泛應(yīng)用于眾多應(yīng)用領(lǐng)域,隨著信息技術(shù)的日新月異,圖像識別技術(shù)也得到十分迅猛的發(fā)展。在眾多社會領(lǐng)域中,有效應(yīng)用圖像識別技術(shù)將使社會與經(jīng)濟(jì)價值得到充分發(fā)揮。
小編相信,通過本次的科普,很多同學(xué)都對圖像識別有了更深的理解,希望可以拓寬同學(xué)們的思路,利用人工智能的圖像識別技術(shù)解決更多問題,造福社會,造福世界!
-
計算機(jī)
+關(guān)注
關(guān)注
19文章
7174瀏覽量
87152 -
圖像識別
+關(guān)注
關(guān)注
9文章
514瀏覽量
38149 -
AI
+關(guān)注
關(guān)注
87文章
28876瀏覽量
266219
發(fā)布評論請先 登錄
相關(guān)推薦
評論