圖像識(shí)別過(guò)程分為圖像處理和圖像識(shí)別兩個(gè)部分。
圖像處理(imageProcessing)利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需的結(jié)果。
圖像處理可分為模擬圖像處理和數(shù)字圖像處理,而圖像處理一般指數(shù)字圖像處理。
這種處理大多數(shù)是依賴于軟件實(shí)現(xiàn)的。
其目的是去除干擾、噪聲,將原始圖像編程適于計(jì)算機(jī)進(jìn)行特征提取的形式,主要包括圖像采樣、圖像增強(qiáng)、圖像復(fù)原、圖像編碼與壓縮和圖像分割。
1)圖像采集
圖像采集是數(shù)字圖像數(shù)據(jù)提取的主要方式。數(shù)字圖像主要借助于數(shù)字?jǐn)z像機(jī)、掃描儀、數(shù)碼相機(jī)等設(shè)備經(jīng)過(guò)采樣數(shù)字化得到的圖像,也包括一些動(dòng)態(tài)圖像,并可以將其轉(zhuǎn)為數(shù)字圖像,和文字、圖形、聲音一起存儲(chǔ)在計(jì)算機(jī)內(nèi),顯示在計(jì)算機(jī)的屏幕上。圖像的提取是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的形式的第一步。
2)圖像增強(qiáng)
圖像在成像、采集、傳輸、復(fù)制等過(guò)程中圖像的質(zhì)量或多或少會(huì)造成一定的退化,數(shù)字化后的圖像視覺(jué)效果不是十分滿意。為了突出圖像中感興趣的部分,使圖像的主體結(jié)構(gòu)更加明確,必須對(duì)圖像進(jìn)行改善,即圖像增強(qiáng)。通過(guò)圖像增強(qiáng),以減少圖像中的圖像的噪聲,改變?cè)瓉?lái)圖像的亮度、色彩分布、對(duì)比度等參數(shù)。圖像增強(qiáng)提高了圖像的清晰度、圖像的質(zhì)量,使圖像中的物體的輪廓更加清晰,細(xì)節(jié)更加明顯。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,增強(qiáng)后的圖像更加賞欣悅目,為后期的圖像分析和圖像理解奠定基礎(chǔ)。
3)圖像復(fù)原
圖像復(fù)原也稱圖像恢復(fù),由于在獲取圖像時(shí)環(huán)境噪聲的影響、運(yùn)動(dòng)造成的圖像模糊、光線的強(qiáng)弱等原因使得圖像模糊,為了提取比較清晰的圖像需要對(duì)圖像進(jìn)行恢復(fù),圖像恢復(fù)主要采用濾波方法,從降質(zhì)的圖像恢復(fù)原始圖。圖像復(fù)原的另一種特殊技術(shù)是圖像重建,該技術(shù)是從物體橫剖面的一組投影數(shù)據(jù)建立圖像。
4)圖像編碼與壓縮
數(shù)字圖像的顯著特點(diǎn)是數(shù)據(jù)量龐大,需要占用相當(dāng)大的存儲(chǔ)空間。但基于計(jì)算機(jī)的網(wǎng)絡(luò)帶寬和的大容量存儲(chǔ)器無(wú)法進(jìn)行數(shù)據(jù)圖像的處理、存儲(chǔ)、傳輸。為了能快速方便地在網(wǎng)絡(luò)環(huán)境下傳輸圖像或視頻,那么必須對(duì)圖像進(jìn)行編碼和壓縮。目前,圖像壓縮編碼已形成國(guó)際標(biāo)準(zhǔn),如比較著名的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG,該標(biāo)準(zhǔn)主要針對(duì)圖像的分辨率、彩色圖像和灰度圖像,適用于網(wǎng)絡(luò)傳輸?shù)臄?shù)碼相片、彩色照片等方面。由于視頻可以被看作是一幅幅不同的但有緊密相關(guān)的靜態(tài)圖像的時(shí)間序列,因此動(dòng)態(tài)視頻的單幀圖像壓縮可以應(yīng)用靜態(tài)圖像的壓縮標(biāo)準(zhǔn)。圖像編碼壓縮技術(shù)可以減少圖像的冗余數(shù)據(jù)量和存儲(chǔ)器容量、提高圖像傳輸速度、縮短處理時(shí)間。
5)圖像分割技術(shù)
圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割根據(jù)目標(biāo)與背景的先驗(yàn)知識(shí)將圖像表示為物理上有意義的連通區(qū)域的集合。即對(duì)圖像中的目標(biāo)、背景進(jìn)行標(biāo)記、定位,然后把目標(biāo)從背景中分離出來(lái)。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法[2]。由于采集圖像時(shí)會(huì)受到各種條件的影響會(huì)是圖像變的模糊、噪聲干擾,使得圖像分割是會(huì)遇到困難。在實(shí)際的圖像中需根據(jù)景物條件的不同選擇適合的圖像分割方法。圖像分割為進(jìn)一步的圖像識(shí)別、分析和理解奠定了基礎(chǔ)。
圖像識(shí)別將圖像處理得到的圖像進(jìn)行特征提取和分類。識(shí)別方法中基本的也是常用的方法有統(tǒng)計(jì)法(或決策理論法)、句法(或結(jié)構(gòu))方法、神經(jīng)網(wǎng)絡(luò)法、模板匹配法和幾何變換法。
1)統(tǒng)計(jì)法(StatisticMethod)
該方法是對(duì)研究的圖像進(jìn)行大量的統(tǒng)計(jì)分析,找出其中的規(guī)律并提取反映圖像本質(zhì)特點(diǎn)的特征來(lái)進(jìn)行圖像識(shí)別的。它以數(shù)學(xué)上的決策理論為基礎(chǔ),建立統(tǒng)計(jì)學(xué)識(shí)別模型,因而是一種分類誤差最小的方法。常用的圖像統(tǒng)計(jì)模型有貝葉斯(Bayes)模型和馬爾柯夫(Markow)隨機(jī)場(chǎng)(MRF)模型。但是,較為常用的貝葉斯決策規(guī)則雖然從理論上解決了最優(yōu)分類器的設(shè)計(jì)問(wèn)題,其應(yīng)用卻在很大程度受到了更為困難的概率密度估計(jì)問(wèn)題的限制。同時(shí),正是因?yàn)榻y(tǒng)計(jì)方法基于嚴(yán)格的數(shù)學(xué)基礎(chǔ),而忽略了被識(shí)別圖像的空間結(jié)構(gòu)關(guān)系,當(dāng)圖像非常復(fù)雜、類別數(shù)很多時(shí),將導(dǎo)致特征數(shù)量的激增,給特征提取造成困難,也使分類難以實(shí)現(xiàn)。尤其是當(dāng)被識(shí)別圖像(如指紋、染色體等)的主要特征是結(jié)構(gòu)特征時(shí),用統(tǒng)計(jì)法就很難進(jìn)行識(shí)別。
2)句法識(shí)別法(Syntactic Recognition)
該方法是對(duì)統(tǒng)計(jì)識(shí)別方法的補(bǔ)充,在用統(tǒng)計(jì)法對(duì)圖像進(jìn)行識(shí)別時(shí),圖像的特征是用數(shù)值特征描述的,而句法方法則是用符號(hào)來(lái)描述圖像特征的。它模仿了語(yǔ)言學(xué)中句法的層次結(jié)構(gòu),采用分層描述的方法,把復(fù)雜圖像分解為單層或多層的相對(duì)簡(jiǎn)單的子圖像,主要突出被識(shí)別對(duì)象的空間結(jié)構(gòu)關(guān)系信息。模式識(shí)別源于統(tǒng)計(jì)方法,而句法方法則擴(kuò)大了模式識(shí)別的能力,使其不僅能用于對(duì)圖像的分類,而且可以用于對(duì)景物的分析與物體結(jié)構(gòu)的識(shí)別。但是,當(dāng)存在較大的干擾和噪聲時(shí),句法識(shí)別方法抽取子圖像(基元)困難,容易產(chǎn)生誤判率,難以滿足分類識(shí)別精度和可靠度的要求。
3)神經(jīng)網(wǎng)絡(luò)方法(NeuralNetwork)
該方法是指用神經(jīng)網(wǎng)絡(luò)算法對(duì)圖像進(jìn)行識(shí)別的方法。神經(jīng)網(wǎng)絡(luò)系統(tǒng)是由大量的,同時(shí)也是很簡(jiǎn)單的處理單元(稱為神經(jīng)元),通過(guò)廣泛地按照某種方式相互連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),雖然每個(gè)神經(jīng)元的結(jié)構(gòu)和功能十分簡(jiǎn)單,但由大量的神經(jīng)元構(gòu)成的網(wǎng)絡(luò)系統(tǒng)的行為卻是豐富多彩和十分復(fù)雜的。它反映了人腦功能的許多基本特征,是人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)的簡(jiǎn)化、抽象和模擬。句法方法側(cè)重于模擬人的邏輯思維,而神經(jīng)網(wǎng)絡(luò)側(cè)重于模擬和實(shí)現(xiàn)人的認(rèn)知過(guò)程中的感知覺(jué)過(guò)程、形象思維、分布式記憶和自學(xué)習(xí)自組織過(guò)程,與符號(hào)處理是一種互補(bǔ)的關(guān)系。由于神經(jīng)網(wǎng)絡(luò)具有非線性映射逼近、大規(guī)模并行分布式存儲(chǔ)和綜合優(yōu)化處理、容錯(cuò)性強(qiáng)、獨(dú)特的聯(lián)想記憶及自組織、自適應(yīng)和自學(xué)習(xí)能力,因而特別適合處理需要同時(shí)考慮許多因素和條件的問(wèn)題以及信息不確定性(模糊或不精確)問(wèn)題。在實(shí)際應(yīng)用中,由于神經(jīng)網(wǎng)絡(luò)法存在收斂速度慢、訓(xùn)練量大、訓(xùn)練時(shí)間長(zhǎng),且存在局部最小,識(shí)別分類精度不夠,難以適用于經(jīng)常出現(xiàn)新模式的場(chǎng)合,因而其實(shí)用性有待進(jìn)一步提高。
4)模板匹配法(TemplateMatching)
它是一種最基本的圖像識(shí)別方法。所謂模板是為了檢測(cè)待識(shí)別圖像的某些區(qū)域特征而設(shè)計(jì)的陣列,它既可以是數(shù)字量,也可以是符號(hào)串等,因此可以把它看為統(tǒng)計(jì)法或句法的一種特例。所謂模板匹配法就是把已知物體的模板與圖像中所有未知物體進(jìn)行比較,如果某一未知物體與該模板匹配,則該物體被檢測(cè)出來(lái),并被認(rèn)為是與模板相同的物體。模板匹配法雖然簡(jiǎn)單方便,但其應(yīng)用有一定的限制。因?yàn)橐砻魉形矬w的各種方向及尺寸,就需要較大數(shù)量的模板,且其匹配過(guò)程由于需要的存儲(chǔ)量和計(jì)算量過(guò)大而不經(jīng)濟(jì)。同時(shí),該方法的識(shí)別率過(guò)多地依賴于已知物體的模板,如果已知物體的模板產(chǎn)生變形,會(huì)導(dǎo)致錯(cuò)誤的識(shí)別。此外,由于圖像存在噪聲以及被檢測(cè)物體形狀和結(jié)構(gòu)方面的不確定性,模板匹配法在較復(fù)雜的情況下往往得不到理想的效果,難以絕對(duì)精確,一般都要在圖像的每一點(diǎn)上求模板與圖像之間的匹配量度,凡是匹配量度達(dá)到某一閾值的地方,表示該圖像中存在所要檢測(cè)的物體。經(jīng)典的圖像匹配方法利用互相關(guān)計(jì)算匹配量度,或用絕對(duì)差的平方和作為不匹配量度,但是這兩種方法經(jīng)常發(fā)生不匹配的情況,因此,利用幾何變換的匹配方法有助于提高穩(wěn)健性。
5)典型的幾何變換方法主要有霍夫變換HT (Hough Transform)。
霍夫變換是一種快速形狀匹配技術(shù),它對(duì)圖像進(jìn)行某種形式的變換,把圖像中給定形狀曲線上的所有點(diǎn)變換到霍夫空間,而形成峰點(diǎn),這樣,給定形狀的曲線檢測(cè)問(wèn)題就變換為霍夫空間中峰點(diǎn)的檢測(cè)問(wèn)題,可以用于有缺損形狀的檢測(cè),是一種魯棒性(Robust)很強(qiáng)的方法。為了減少計(jì)算量和和內(nèi)存空間以提高計(jì)算效率,又提出了改進(jìn)的霍夫算法,如快速霍夫變換(FHT)、自適應(yīng)霍夫變換(AHT)及隨機(jī)霍夫變換(RHT)。其中隨機(jī)霍夫變換RHT(RandomizedHough Transform)是20世紀(jì)90年代提出的一種精巧的變換算法,其突出特點(diǎn)不僅能有效地減少計(jì)算量和內(nèi)存容量,提高計(jì)算效率,而且能在有限的變換空間獲得任意高的分辨率。
編輯:lyn
-
圖像處理
+關(guān)注
關(guān)注
27文章
1279瀏覽量
56587 -
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
518瀏覽量
38216
原文標(biāo)題:圖像識(shí)別過(guò)程(概述)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論