0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像識別技術(shù)原理 圖像識別算法有哪些

冬至子 ? 來源:CSDN ? 作者:Away-Far ? 2023-07-26 10:29 ? 次閱讀

圖片

圖像識別過程分為圖像處理和圖像識別兩個部分。

01

圖像處理

圖像處理(imageProcessing)利用計算機(jī)對圖像進(jìn)行分析,以達(dá)到所需的結(jié)果。

圖像處理可分為模擬圖像處理和數(shù)字圖像處理,而圖像處理一般指數(shù)字圖像處理。

這種處理大多數(shù)是依賴于軟件實現(xiàn)的。

其目的是去除干擾、噪聲,將原始圖像編程適于計算機(jī)進(jìn)行特征提取的形式,主要包括圖像采樣、圖像增強(qiáng)、圖像復(fù)原、圖像編碼與壓縮和圖像分割。

1)圖像采集

圖像采集是數(shù)字圖像數(shù)據(jù)提取的主要方式。數(shù)字圖像主要借助于數(shù)字?jǐn)z像機(jī)、掃描儀、數(shù)碼相機(jī)等設(shè)備經(jīng)過采樣數(shù)字化得到的圖像,也包括一些動態(tài)圖像,并可以將其轉(zhuǎn)為數(shù)字圖像,和文字、圖形、聲音一起存儲在計算機(jī)內(nèi),顯示在計算機(jī)的屏幕上。圖像的提取是將一個圖像變換為適合計算機(jī)處理的形式的第一步。

2)圖像增強(qiáng)

圖像在成像、采集、傳輸、復(fù)制等過程中圖像的質(zhì)量或多或少會造成一定的退化,數(shù)字化后的圖像視覺效果不是十分滿意。為了突出圖像中感興趣的部分,使圖像的主體結(jié)構(gòu)更加明確,必須對圖像進(jìn)行改善,即圖像增強(qiáng)。通過圖像增強(qiáng),以減少圖像中的圖像的噪聲,改變原來圖像的亮度、色彩分布、對比度等參數(shù)。圖像增強(qiáng)提高了圖像的清晰度、圖像的質(zhì)量,使圖像中的物體的輪廓更加清晰,細(xì)節(jié)更加明顯。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,增強(qiáng)后的圖像更加賞欣悅目,為后期的圖像分析和圖像理解奠定基礎(chǔ)。

3)圖像復(fù)原

圖像復(fù)原也稱圖像恢復(fù),由于在獲取圖像時環(huán)境噪聲的影響、運動造成的圖像模糊、光線的強(qiáng)弱等原因使得圖像模糊,為了提取比較清晰的圖像需要對圖像進(jìn)行恢復(fù),圖像恢復(fù)主要采用濾波方法,從降質(zhì)的圖像恢復(fù)原始圖。圖像復(fù)原的另一種特殊技術(shù)是圖像重建,該技術(shù)是從物體橫剖面的一組投影數(shù)據(jù)建立圖像。

4)圖像編碼與壓縮

數(shù)字圖像的顯著特點是數(shù)據(jù)量龐大,需要占用相當(dāng)大的存儲空間。但基于計算機(jī)的網(wǎng)絡(luò)帶寬和的大容量存儲器無法進(jìn)行數(shù)據(jù)圖像的處理、存儲、傳輸。為了能快速方便地在網(wǎng)絡(luò)環(huán)境下傳輸圖像或視頻,那么必須對圖像進(jìn)行編碼和壓縮。目前,圖像壓縮編碼已形成國際標(biāo)準(zhǔn),如比較著名的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG,該標(biāo)準(zhǔn)主要針對圖像的分辨率、彩色圖像和灰度圖像,適用于網(wǎng)絡(luò)傳輸?shù)臄?shù)碼相片、彩色照片等方面。由于視頻可以被看作是一幅幅不同的但有緊密相關(guān)的靜態(tài)圖像的時間序列,因此動態(tài)視頻的單幀圖像壓縮可以應(yīng)用靜態(tài)圖像的壓縮標(biāo)準(zhǔn)。圖像編碼壓縮技術(shù)可以減少圖像的冗余數(shù)據(jù)量和存儲器容量、提高圖像傳輸速度、縮短處理時間。

5)圖像分割技術(shù)

圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割根據(jù)目標(biāo)與背景的先驗知識將圖像表示為物理上有意義的連通區(qū)域的集合。即對圖像中的目標(biāo)、背景進(jìn)行標(biāo)記、定位,然后把目標(biāo)從背景中分離出來。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法。由于采集圖像時會受到各種條件的影響會是圖像變的模糊、噪聲干擾,使得圖像分割是會遇到困難。在實際的圖像中需根據(jù)景物條件的不同選擇適合的圖像分割方法。圖像分割為進(jìn)一步的圖像識別、分析和理解奠定了基礎(chǔ)。

02

圖像識別

圖像識別將圖像處理得到的圖像進(jìn)行特征提取和分類。識別方法中基本的也是常用的方法有統(tǒng)計法(或決策理論法)、句法(或結(jié)構(gòu))方法、神經(jīng)網(wǎng)絡(luò)法、模板匹配法和幾何變換法。

1)統(tǒng)計法(StatisticMethod)

該方法是對研究的圖像進(jìn)行大量的統(tǒng)計分析,找出其中的規(guī)律并提取反映圖像本質(zhì)特點的特征來進(jìn)行圖像識別的。它以數(shù)學(xué)上的決策理論為基礎(chǔ),建立統(tǒng)計學(xué)識別模型,因而是一種分類誤差最小的方法。常用的圖像統(tǒng)計模型有貝葉斯(Bayes)模型和馬爾柯夫(Markow)隨機(jī)場(MRF)模型。但是,較為常用的貝葉斯決策規(guī)則雖然從理論上解決了最優(yōu)分類器的設(shè)計問題,其應(yīng)用卻在很大程度受到了更為困難的概率密度估計問題的限制。同時,正是因為統(tǒng)計方法基于嚴(yán)格的數(shù)學(xué)基礎(chǔ),而忽略了被識別圖像的空間結(jié)構(gòu)關(guān)系,當(dāng)圖像非常復(fù)雜、類別數(shù)很多時,將導(dǎo)致特征數(shù)量的激增,給特征提取造成困難,也使分類難以實現(xiàn)。尤其是當(dāng)被識別圖像(如指紋、染色體等)的主要特征是結(jié)構(gòu)特征時,用統(tǒng)計法就很難進(jìn)行識別。

2)句法識別法(Syntactic Recognition)

該方法是對統(tǒng)計識別方法的補(bǔ)充,在用統(tǒng)計法對圖像進(jìn)行識別時,圖像的特征是用數(shù)值特征描述的,而句法方法則是用符號來描述圖像特征的。它模仿了語言學(xué)中句法的層次結(jié)構(gòu),采用分層描述的方法,把復(fù)雜圖像分解為單層或多層的相對簡單的子圖像,主要突出被識別對象的空間結(jié)構(gòu)關(guān)系信息。模式識別源于統(tǒng)計方法,而句法方法則擴(kuò)大了模式識別的能力,使其不僅能用于對圖像的分類,而且可以用于對景物的分析與物體結(jié)構(gòu)的識別。但是,當(dāng)存在較大的干擾和噪聲時,句法識別方法抽取子圖像(基元)困難,容易產(chǎn)生誤判率,難以滿足分類識別精度和可靠度的要求。

3)神經(jīng)網(wǎng)絡(luò)方法(NeuralNetwork)

該方法是指用神經(jīng)網(wǎng)絡(luò)算法對圖像進(jìn)行識別的方法。神經(jīng)網(wǎng)絡(luò)系統(tǒng)是由大量的,同時也是很簡單的處理單元(稱為神經(jīng)元),通過廣泛地按照某種方式相互連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),雖然每個神經(jīng)元的結(jié)構(gòu)和功能十分簡單,但由大量的神經(jīng)元構(gòu)成的網(wǎng)絡(luò)系統(tǒng)的行為卻是豐富多彩和十分復(fù)雜的。它反映了人腦功能的許多基本特征,是人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)的簡化、抽象和模擬。句法方法側(cè)重于模擬人的邏輯思維,而神經(jīng)網(wǎng)絡(luò)側(cè)重于模擬和實現(xiàn)人的認(rèn)知過程中的感知覺過程、形象思維、分布式記憶和自學(xué)習(xí)自組織過程,與符號處理是一種互補(bǔ)的關(guān)系。由于神經(jīng)網(wǎng)絡(luò)具有非線性映射逼近、大規(guī)模并行分布式存儲和綜合優(yōu)化處理、容錯性強(qiáng)、獨特的聯(lián)想記憶及自組織、自適應(yīng)和自學(xué)習(xí)能力,因而特別適合處理需要同時考慮許多因素和條件的問題以及信息不確定性(模糊或不精確)問題。在實際應(yīng)用中,由于神經(jīng)網(wǎng)絡(luò)法存在收斂速度慢、訓(xùn)練量大、訓(xùn)練時間長,且存在局部最小,識別分類精度不夠,難以適用于經(jīng)常出現(xiàn)新模式的場合,因而其實用性有待進(jìn)一步提高。

4)模板匹配法(TemplateMatching)

它是一種最基本的圖像識別方法。所謂模板是為了檢測待識別圖像的某些區(qū)域特征而設(shè)計的陣列,它既可以是數(shù)字量,也可以是符號串等,因此可以把它看為統(tǒng)計法或句法的一種特例。所謂模板匹配法就是把已知物體的模板與圖像中所有未知物體進(jìn)行比較,如果某一未知物體與該模板匹配,則該物體被檢測出來,并被認(rèn)為是與模板相同的物體。模板匹配法雖然簡單方便,但其應(yīng)用有一定的限制。因為要表明所有物體的各種方向及尺寸,就需要較大數(shù)量的模板,且其匹配過程由于需要的存儲量和計算量過大而不經(jīng)濟(jì)。同時,該方法的識別率過多地依賴于已知物體的模板,如果已知物體的模板產(chǎn)生變形,會導(dǎo)致錯誤的識別。此外,由于圖像存在噪聲以及被檢測物體形狀和結(jié)構(gòu)方面的不確定性,模板匹配法在較復(fù)雜的情況下往往得不到理想的效果,難以絕對精確,一般都要在圖像的每一點上求模板與圖像之間的匹配量度,凡是匹配量度達(dá)到某一閾值的地方,表示該圖像中存在所要檢測的物體。經(jīng)典的圖像匹配方法利用互相關(guān)計算匹配量度,或用絕對差的平方和作為不匹配量度,但是這兩種方法經(jīng)常發(fā)生不匹配的情況,因此,利用幾何變換的匹配方法有助于提高穩(wěn)健性。

5)典型的幾何變換方法主要有霍夫變換HT (Hough Transform)。

霍夫變換是一種快速形狀匹配技術(shù),它對圖像進(jìn)行某種形式的變換,把圖像中給定形狀曲線上的所有點變換到霍夫空間,而形成峰點,這樣,給定形狀的曲線檢測問題就變換為霍夫空間中峰點的檢測問題,可以用于有缺損形狀的檢測,是一種魯棒性(Robust)很強(qiáng)的方法。為了減少計算量和和內(nèi)存空間以提高計算效率,又提出了改進(jìn)的霍夫算法,如快速霍夫變換(FHT)、自適應(yīng)霍夫變換(AHT)及隨機(jī)霍夫變換(RHT)。其中隨機(jī)霍夫變換RHT(RandomizedHough Transform)是20世紀(jì)90年代提出的一種精巧的變換算法,其突出特點不僅能有效地減少計算量和內(nèi)存容量,提高計算效率,而且能在有限的變換空間獲得任意高的分辨率。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    44

    文章

    3529

    瀏覽量

    133299
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7366

    瀏覽量

    163092
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100009
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2072

    瀏覽量

    108935
  • 圖像處理器
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    15426
收藏 人收藏

    評論

    相關(guān)推薦

    基于DSP的快速紙幣圖像識別技術(shù)研究

    本課題通過對現(xiàn)有圖像識別技術(shù)進(jìn)行研究和分析,針對當(dāng)前DSP(數(shù)字信號處理)技術(shù)的新發(fā)展,提出了基于DSP的快速圖像識別概念??焖?b class='flag-5'>圖像識別
    發(fā)表于 11-05 14:43

    圖像識別模組(包括PCB圖、圖像識別模組源代碼)

    圖像識別模組電路原理圖、圖像識別模組PCB圖、圖像識別模組源代碼、圖像識別模組用戶使用手冊
    發(fā)表于 01-02 19:14 ?121次下載

    基于DSP的快速紙幣圖像識別技術(shù)研究

    本課題通過對現(xiàn)有圖像識別技術(shù)進(jìn)行研究和分析,針對當(dāng)前DSP(數(shù)字信號處理)技術(shù)的新發(fā)展,提出了基于DSP的快速圖像識別概念。快速圖像識別
    發(fā)表于 09-14 15:07 ?159次下載
    基于DSP的快速紙幣<b class='flag-5'>圖像識別</b><b class='flag-5'>技術(shù)</b>研究

    圖像識別技術(shù)原理 深度學(xué)習(xí)的圖像識別應(yīng)用研究

      圖像識別是人工智能領(lǐng)域的一個重要方向。經(jīng)過多年的研究,圖像識別技術(shù)取得了一定的研究進(jìn)展。圖像識別主要包含特征提取和分類識別,而其中的特征
    發(fā)表于 07-19 10:27 ?2次下載

    如何使用Python進(jìn)行圖像識別的自動學(xué)習(xí)自動訓(xùn)練?

    如何使用Python進(jìn)行圖像識別的自動學(xué)習(xí)自動訓(xùn)練? 使用Python進(jìn)行圖像識別的自動學(xué)習(xí)和自動訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫和算法
    的頭像 發(fā)表于 01-12 16:06 ?446次閱讀

    圖像識別技術(shù)原理 圖像識別技術(shù)的應(yīng)用領(lǐng)域

    圖像識別技術(shù)是一種通過計算機(jī)對圖像進(jìn)行分析和理解的技術(shù)。它借助計算機(jī)視覺、模式識別、人工智能等相關(guān)技術(shù)
    的頭像 發(fā)表于 02-02 11:01 ?1778次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法
    的頭像 發(fā)表于 07-16 10:40 ?372次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領(lǐng)域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機(jī)技術(shù)
    的頭像 發(fā)表于 07-16 10:44 ?496次閱讀

    圖像識別技術(shù)的原理是什么

    圖像識別技術(shù)是一種利用計算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計算機(jī)識別
    的頭像 發(fā)表于 07-16 10:46 ?589次閱讀

    圖像識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    一、引言 圖像識別技術(shù)是一種利用計算機(jī)視覺技術(shù)圖像進(jìn)行分析和處理的技術(shù)。隨著計算機(jī)技術(shù)、人工智
    的頭像 發(fā)表于 07-16 10:48 ?304次閱讀

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機(jī)視覺領(lǐng)域的一個重要研究方向,其目標(biāo)是使計算機(jī)能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別
    的頭像 發(fā)表于 07-16 11:02 ?369次閱讀

    圖像識別算法的優(yōu)缺點哪些

    圖像識別算法是一種利用計算機(jī)視覺技術(shù)圖像進(jìn)行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別
    的頭像 發(fā)表于 07-16 11:09 ?595次閱讀

    圖像識別算法的提升哪些

    引言 圖像識別是計算機(jī)視覺領(lǐng)域的核心任務(wù)之一,旨在使計算機(jī)能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機(jī)硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,圖像識別
    的頭像 發(fā)表于 07-16 11:12 ?406次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機(jī)視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,
    的頭像 發(fā)表于 07-16 11:14 ?3849次閱讀

    圖像識別算法哪幾種

    圖像識別算法是計算機(jī)視覺領(lǐng)域的核心技術(shù)之一,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)對圖像中的目標(biāo)、場景和物體的
    的頭像 發(fā)表于 07-16 11:22 ?567次閱讀