0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像處理怎么入門(mén)?

新機(jī)器視覺(jué) ? 來(lái)源:csdn ? 2024-01-08 09:51 ? 次閱讀

最近有人問(wèn)我圖像處理怎么研究,怎么入門(mén),怎么應(yīng)用,我竟一時(shí)語(yǔ)塞。仔細(xì)想想,自己也搞了兩年圖像方面的研究,做個(gè)兩個(gè)創(chuàng)新項(xiàng)目,發(fā)過(guò)兩篇論文,也算是有點(diǎn)心得,于是總結(jié)總結(jié)和大家分享,希望能對(duì)大家有所幫助。在寫(xiě)這篇教程之前我本想多弄點(diǎn)插圖,讓文章看起來(lái)花哨一點(diǎn),后來(lái)我覺(jué)得沒(méi)必要這樣做,大家花時(shí)間沉下心來(lái)讀讀文字沒(méi)什么不好,況且學(xué)術(shù)和技術(shù)本身也不是多么花哨的東西。

一、圖像處理的應(yīng)用

這個(gè)其實(shí)沒(méi)什么好說(shuō)的,一種技術(shù)的應(yīng)用價(jià)值不是靠嘴上說(shuō),而是要看有多少人去搞,很簡(jiǎn)單的道理。其實(shí)我覺(jué)得判斷一項(xiàng)技術(shù)有沒(méi)有價(jià)值、有多大價(jià)值的最簡(jiǎn)單最有效的方法就是看有多少人在研究它。如果大家都在研究,那必然說(shuō)明它很火,至少目前很火,以后的幾年里依然還會(huì)火。因此,如果你不確定圖像處理是不是有價(jià)值,那就查查全國(guó)圖像處理工程師的數(shù)量就行了。

當(dāng)然這里還是簡(jiǎn)單提一下。如果你真的只想問(wèn)“圖像處理有什么用?”,相信百度會(huì)給出比我更專(zhuān)業(yè)的答案。不過(guò)作為圖像處理的行內(nèi)人,我還是從幾個(gè)基本的點(diǎn)來(lái)具體說(shuō)一下。

1、身份認(rèn)證

21世紀(jì)是刷臉的時(shí)代,這一點(diǎn)無(wú)可厚非。首先是銀行,據(jù)說(shuō)重慶的銀行已經(jīng)使用了人臉識(shí)別的驗(yàn)證系統(tǒng)來(lái)進(jìn)行輔助的認(rèn)證。其次是門(mén)禁系統(tǒng),以前是指紋,虹膜,現(xiàn)在就是人臉。指紋、虹膜的識(shí)別雖然準(zhǔn)確,但是有侵犯性,采集的過(guò)程中有侵犯性,驗(yàn)證的過(guò)程中也有侵犯性,反正讓誰(shuí)天天錄指紋(采集指紋信息),用眼睛瞪攝像頭(采集虹膜信息),誰(shuí)都會(huì)覺(jué)得不舒服的,況且手還會(huì)脫皮。相比之下,人臉的識(shí)別就方便多了,拍張照片(采集人臉信息)誰(shuí)都不會(huì)介意。最后是監(jiān)控,一個(gè)攝像頭所拍的監(jiān)控能從不同的角度記錄成百上千的人(比如車(chē)站等密集場(chǎng)所的監(jiān)控),讓警察去辨認(rèn)將是一個(gè)浩大的工程,要是系統(tǒng)能夠自動(dòng)判別人員信息,無(wú)疑會(huì)給辦案帶來(lái)極大方便。

2、監(jiān)控安防

安防監(jiān)控可以說(shuō)是圖像處理領(lǐng)域最有潛力的應(yīng)用領(lǐng)域。如今各個(gè)城市都在瘋狂的安裝監(jiān)控?cái)z像頭,全國(guó)時(shí)刻都有無(wú)數(shù)的攝像頭在錄監(jiān)控,但是安防監(jiān)控的后端處理卻沒(méi)跟上。什么是后端處理,簡(jiǎn)單的說(shuō)就是監(jiān)控錄像的視頻處理。注意這里的視頻處理可就不止包含人臉識(shí)別了,還有行人檢測(cè)、異常檢測(cè)、顯著性檢測(cè)、協(xié)同跟蹤等。人臉識(shí)別之前說(shuō)了,這里簡(jiǎn)單說(shuō)說(shuō)行人異常檢測(cè)。圖像處理中的行人異常檢測(cè)在外行人眼中是一個(gè)非常有魔力的東西。畢竟讓攝像頭通過(guò)監(jiān)控視頻就能判斷出當(dāng)前畫(huà)面中誰(shuí)是好人誰(shuí)是壞人(當(dāng)然直接分為好人和壞人還是太武斷了),在一般思維中貌似是不可能的。但是請(qǐng)不要忽略這樣一個(gè)事實(shí),就是目前大部分監(jiān)控視頻的分析處理都是由人工來(lái)完成的,警察破案時(shí)經(jīng)常動(dòng)不動(dòng)就調(diào)出最近幾天的監(jiān)控視頻,然后從頭看到尾,其工程量之大可想而知。也正是這樣才催生了人們對(duì)智能監(jiān)控方面的研究,因?yàn)橛羞@方面的實(shí)際需求。當(dāng)然我們的視頻分析程序不會(huì)直接給出諸如“好人or壞人”這樣的武斷而片面的判斷結(jié)果。

就當(dāng)前的技術(shù)水平而言,能夠統(tǒng)計(jì)當(dāng)下監(jiān)控畫(huà)面中的人數(shù)(行人檢測(cè))、定位他們的人臉(人臉檢測(cè))、識(shí)別他們的身份(人臉識(shí)別)、判別他們的表情(表情識(shí)別)、檢測(cè)他們的動(dòng)作(異常檢測(cè)),這就已經(jīng)夠了。這樣以后人們就不會(huì)再面對(duì)長(zhǎng)達(dá)幾十甚至上百個(gè)小時(shí)的監(jiān)控視頻發(fā)呆,而是直接分析計(jì)算機(jī)給出的數(shù)據(jù),當(dāng)前畫(huà)面中有多少人、都是誰(shuí)、誰(shuí)的動(dòng)作可疑等??傊酉聛?lái)智能監(jiān)控發(fā)展會(huì)很迅速,因?yàn)樾枨蠛芷惹小?/p>

3、深度學(xué)習(xí)(Deep Learning)

通俗的說(shuō)一句,“圖像處理是深度學(xué)習(xí)應(yīng)用的天堂”。深度學(xué)習(xí)這個(gè)概念可能有人不太熟悉,大家可以自行百度,我這里給出一個(gè)相對(duì)通俗的解釋?zhuān)骸叭绻悴恢朗裁唇猩疃葘W(xué)習(xí),就想想《終結(jié)者》中的T-800”。當(dāng)然這句話(huà)不是我說(shuō)的,是出自業(yè)界的一位大牛之口。當(dāng)然這可能有點(diǎn)小片面,不過(guò)深度學(xué)習(xí)確實(shí)是公認(rèn)的新一代人工智能的基礎(chǔ)。

這里舉兩個(gè)例子。一是谷歌的人工大腦項(xiàng)目。谷歌公司可以說(shuō)是深度學(xué)習(xí)方面的牽頭企業(yè)了,其在2012年公布的谷歌大腦項(xiàng)目,動(dòng)用了1.6萬(wàn)個(gè)計(jì)算節(jié)點(diǎn),訓(xùn)練數(shù)周,得到的人工智能模型能夠自主識(shí)別貓臉圖像,為新一代人工智能開(kāi)辟了道路,之后微軟深度學(xué)習(xí)研究院、百度深度學(xué)習(xí)研究院等機(jī)構(gòu)都開(kāi)始大量投入,各個(gè)高校也搞得風(fēng)聲水起,原因很簡(jiǎn)單,大家都知道它會(huì)火。

第二就是圖像識(shí)別方面的競(jìng)賽。最有權(quán)威的就是ImageNet競(jìng)賽。大家在一個(gè)擁有上千萬(wàn)張,上千類(lèi)別的圖像數(shù)據(jù)庫(kù)上訓(xùn)練和測(cè)試自己的算法,比拼識(shí)別率。近幾年來(lái),摘得桂冠的一直都是深度學(xué)習(xí)模型,確切的說(shuō)是卷積神經(jīng)網(wǎng)絡(luò)。更多有關(guān)ImageNet歷年的競(jìng)賽信息大家可以自行百度。

說(shuō)道深度學(xué)習(xí)在圖像處理的應(yīng)用,不得不提中國(guó)的湯曉鷗教授,說(shuō)他是國(guó)內(nèi)深度學(xué)習(xí)的領(lǐng)頭羊也不為過(guò)。他提出的DeepID人臉識(shí)別算法(一共分為三代),在一些大規(guī)模人臉數(shù)據(jù)庫(kù)上的正確率(若LFW庫(kù))已經(jīng)達(dá)到了99.75%,單純從數(shù)字上講的話(huà)可以說(shuō)已經(jīng)超越了人類(lèi)的識(shí)別率,為此湯教授還開(kāi)辦了公司,開(kāi)發(fā)FaceSDK(雖然還沒(méi)有公布)。不過(guò)拿計(jì)算機(jī)和人腦相比本身就是不合理的,各有所長(zhǎng)嘛。不過(guò)可見(jiàn)DeepLearning在圖像識(shí)別領(lǐng)域的強(qiáng)大威力。至于深度學(xué)習(xí)與圖像處理的關(guān)系這里就不用多說(shuō)了,谷歌大腦識(shí)別的是圖像,深度學(xué)習(xí)競(jìng)賽用的是圖像,DeepID識(shí)別的還是圖像人臉,雖然深度學(xué)習(xí)在其他方面諸如語(yǔ)音識(shí)別等也有應(yīng)用,在圖像處理依然是其主要的應(yīng)用領(lǐng)域。

二、圖像處理研究工具

圖像處理的研究分為算法研究和應(yīng)用兩個(gè)部分。用到的主要編程語(yǔ)言有Matlab、C/C++、Python等,原因很簡(jiǎn)單,它們都有很多相應(yīng)的第三方庫(kù),不用我們從零開(kāi)始編程。

1、Matlab

MathWork公司的Matlab軟件可以說(shuō)是算法研究的利器,它的強(qiáng)大之處在于其方便快捷的矩陣運(yùn)算能力和圖形仿真能力,單從簡(jiǎn)潔性和封裝性來(lái)說(shuō),確實(shí)完爆其他語(yǔ)言。但高度封裝必然會(huì)相應(yīng)的損失一部分靈活性,況且Matlab嚴(yán)格的講更像是一個(gè)工具,而非一門(mén)編程語(yǔ)言。順便提一句,它在2015年編程語(yǔ)言排行榜中位于第20名,僅次于IOS開(kāi)發(fā)的Objective-C。

對(duì)于算法研究人員(尤其是高校的碩士博士),首選工具自然是matlab,因?yàn)樗?jiǎn)便快捷,封裝性好,更重要的是全世界幾乎所有的算法大牛、精英教授都會(huì)首先公布對(duì)應(yīng)的Matlab源碼,然后在逐步改寫(xiě)成其他語(yǔ)言進(jìn)行實(shí)際應(yīng)用。所以,如果你想做圖像處理方面的研究,Matlab是必須掌握的,而且是熟練掌握。當(dāng)你有一些想法需要驗(yàn)證時(shí),最好明智的先用matlab編寫(xiě)出來(lái)測(cè)試。如果你上來(lái)就用看似高大上的C++來(lái)實(shí)驗(yàn),不僅錯(cuò)誤BUG一大堆,到頭來(lái)可能效果還不佳,就算效果好,時(shí)間也會(huì)耽擱不少,畢竟算法開(kāi)發(fā)還是要快的,這樣才能趕在別人之前發(fā)論文??傊灰墙佑|圖像算法,終究逃不過(guò)Matlab,就算你是軟件開(kāi)發(fā)的,不研發(fā)算法,但總得能看懂別人的Matlab算法吧。

對(duì)于之前沒(méi)怎么接觸過(guò)Matlab與圖像處理的人,在這里推薦一本相關(guān)的書(shū)籍《MATLAB圖像處理實(shí)例詳解(附光盤(pán))》。這本書(shū)對(duì)于Matlab圖像處理入門(mén)還是很有幫助的。記得我當(dāng)時(shí)剛上研究生時(shí)就靠?jī)杀緯?shū)入門(mén)的,一是岡薩雷斯的《數(shù)字圖像處理》,二是這本《MATLAB圖像處理實(shí)例詳解》。不過(guò)這里友情提示,在看這類(lèi)教程(不僅僅是Matlab)時(shí)千萬(wàn)不要試圖去記憶所有的工具函數(shù),這種做法是十分愚蠢的。正確的做法是根據(jù)自己的情況快速翻閱這類(lèi)工具書(shū),可以找出里面的有實(shí)際意義的源碼來(lái)敲一敲練練手感,至于具體的工具函數(shù),只需要知道Matlab提供了這方面的功能就行了,以后用到了再回來(lái)查,或者谷歌百度。我覺(jué)得在入門(mén)階段,最重要的不是看了多少書(shū),聽(tīng)了多少課,而是盡快自己敲出一段代碼,運(yùn)行出結(jié)果,來(lái)建立自信和成就感,這才是支持我們走下去的最實(shí)在的動(dòng)力。記得我當(dāng)時(shí)看了沒(méi)多久就自己敲了一個(gè)蹩腳的車(chē)牌檢測(cè)的Matlab程序,現(xiàn)在看來(lái)真是漏洞百出,不過(guò)當(dāng)時(shí)我真的很興奮,很有成就感,覺(jué)得自己能干這行,對(duì)于初學(xué)者來(lái)說(shuō),這種感受彌足珍貴。

2、OpenCv

Opencv是Intel公司開(kāi)發(fā)的C++圖像處理工具包,形象的理解為就是C++版的Matlab。當(dāng)初Intel公司開(kāi)發(fā)這個(gè)工具包的初衷也是方便大家共享,希望大家能夠在一個(gè)共同架構(gòu)的基礎(chǔ)上共同建造摩天大樓,而不是各自在自己的地基上蓋平房。與Matlab不同,Opencv是面向開(kāi)發(fā)的,穩(wěn)定性好,異常處理機(jī)制周全,但有一點(diǎn)需要注意,由于Opencv是開(kāi)源的,那么如果你在項(xiàng)目中直接調(diào)用了它的API,那就意味著你的項(xiàng)目也必須開(kāi)源。因此在真正的產(chǎn)品開(kāi)發(fā)過(guò)程中,往往需要從Opencv庫(kù)里面挖代碼,而不是直接調(diào)用,幸好Intel公司允許我們看源碼,自己編譯一把就可以了。

說(shuō)道C++和Opencv,有一個(gè)問(wèn)題不得不提,那就是深度學(xué)習(xí)領(lǐng)域大名鼎鼎的Caffe框架。這是一個(gè)典型的基于C++和OpenCv的深度學(xué)習(xí)框架,由谷歌深度學(xué)習(xí)團(tuán)隊(duì)、“谷歌大腦”負(fù)責(zé)人之一賈揚(yáng)清學(xué)者編寫(xiě),并公布了源碼。如今各個(gè)深度學(xué)習(xí)機(jī)構(gòu)都在大量使用這個(gè)框架進(jìn)行研究。

這里同樣對(duì)推薦兩本關(guān)于Opencv方面的教程。一本是CSDN博客大牛毛星云寫(xiě)的《OpenCV3編程入門(mén)》,這是它根據(jù)自己多年的博客整理成的書(shū),很詳細(xì),很典型的一本教程,介紹了OpenCv中相對(duì)前沿的知識(shí)。我翻看過(guò)這本教程,中規(guī)中矩,里面的代碼通俗易懂,尤其適合初學(xué)者。當(dāng)然大家同樣要注意不要犯了死讀書(shū)的毛病,只看它的功能,敲代碼練手感即可,不要試圖記憶API函數(shù)。重要的工具用多了自然會(huì)記住,不重要的工具記住了也沒(méi)用。

這里推薦的第二本書(shū)是《圖像識(shí)別與項(xiàng)目實(shí)踐――VC++、MATLAB技術(shù)實(shí)現(xiàn)》,這本書(shū)是一本偏向于工程應(yīng)用的書(shū),我之所以推薦它是因?yàn)樗o出了很多有新意、能運(yùn)行的代碼。其中里面有一個(gè)項(xiàng)目讓我印象很深,是一個(gè)車(chē)牌檢測(cè)的實(shí)例。簡(jiǎn)單描述一下:由于車(chē)牌中的字符數(shù)是固定的,因此它通過(guò)判斷橫向區(qū)域筆畫(huà)的跳變數(shù)以及筆畫(huà)寬度來(lái)定位車(chē)牌區(qū)域。這個(gè)想法讓人耳目一新,并且它還給出了詳細(xì)代碼,我也親身試驗(yàn)過(guò),效果還不錯(cuò)。

這里同樣再?gòu)?qiáng)調(diào)一下,就是一定要盡早入手寫(xiě)程序,建立自信和成就感。我當(dāng)時(shí)學(xué)OpenCv正好用它開(kāi)發(fā)了一個(gè)人臉性別識(shí)別的系統(tǒng),是一個(gè)本科大學(xué)生創(chuàng)新計(jì)劃的需求,效果還可以。

3、Python

Python在今年12月份的編程語(yǔ)言排行榜中名列第5,增長(zhǎng)迅速??梢哉f(shuō)Python已經(jīng)逐漸成為當(dāng)下腳本語(yǔ)言的新標(biāo)準(zhǔn)。Python在圖像處理算法方面除了其自身簡(jiǎn)潔的編程優(yōu)勢(shì)外,還得益于兩個(gè)重要的Python類(lèi)庫(kù)——Numpy和Theano。

Numpy是Python的線(xiàn)性代數(shù)庫(kù),對(duì)于矩陣運(yùn)算能提供很好的支持,并且能夠在此基礎(chǔ)上進(jìn)行很多機(jī)器學(xué)習(xí)相關(guān)算法的開(kāi)發(fā)仿真,這里推薦一本受到大家廣泛認(rèn)可的書(shū)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》,我最近也正在看這本書(shū),里面對(duì)好多機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典算法,小到KNN,大到SVM,都給出了詳細(xì)的介紹以及代碼實(shí)現(xiàn)(Python版)。Theano是Python的機(jī)器學(xué)習(xí)庫(kù),能夠方便的實(shí)現(xiàn)深度學(xué)習(xí)(例如卷積神經(jīng)網(wǎng)絡(luò)CNN)算法,網(wǎng)上很多對(duì)于DeepID算法的復(fù)現(xiàn)都是用的這個(gè)庫(kù)。

人覺(jué)得單從圖像處理的角度評(píng)價(jià)的話(huà),Python并沒(méi)有前面兩個(gè)工具(Matlab和OpenCv)應(yīng)用廣泛,不過(guò)作為通用的腳本語(yǔ)言,我覺(jué)得每個(gè)程序員都應(yīng)該去了解了解它,畢竟俗話(huà)說(shuō)沒(méi)有爛的編程語(yǔ)言,只有爛程序員。我在學(xué)Python時(shí)第一個(gè)自己寫(xiě)的程序就是微信打飛機(jī)的小程序,在我的博客中有詳細(xì)的教程,雖然是參照小甲魚(yú)的《零基礎(chǔ)入門(mén)學(xué)習(xí)Python》視頻教程寫(xiě)的,但還是蠻有成就感的。

三、圖像處理研究方法

我覺(jué)得,圖像處理研究主要可以分為三個(gè)部分:基礎(chǔ)概念、基本思想、算法研究。

1、基礎(chǔ)概念

所謂基礎(chǔ)概念,就是圖像處理里最基本的知識(shí),比如什么是圖像?什么是像素?什么是彩色圖像等等。沒(méi)有一個(gè)明確的界限來(lái)劃定什么是基礎(chǔ)概念什么是高級(jí)知識(shí),因人而異。了解圖像處理的基礎(chǔ)知識(shí),有一本書(shū)是必讀的,就是岡薩雷斯編寫(xiě)的、阮秋琦翻譯的《數(shù)字圖像處理》。這本書(shū)已經(jīng)作為圖像處理領(lǐng)域的經(jīng)典教材使用了三十多年,我自己也把這本書(shū)看了好幾遍,每一遍都會(huì)有新的體會(huì)。我覺(jué)得每一個(gè)搞圖像的都應(yīng)該熟讀這本書(shū)。書(shū)中除了有幾章內(nèi)容在講小波變換、模式識(shí)別等相對(duì)抽象的內(nèi)容外,其他內(nèi)容相對(duì)都是很基礎(chǔ)的,本科生水平就能看懂。而且我建議要盡早看這本書(shū),如果是研究生盡量在進(jìn)入課題之前就看一遍,因?yàn)檫@樣一本經(jīng)典的書(shū)在進(jìn)入課題之后可能就沒(méi)時(shí)間看了,以后也頂多是查閱而已。我當(dāng)初就是在大四的寒假看完了這本書(shū),以后在圖像入門(mén)的過(guò)程中就顯得輕松很多??赐赀@本書(shū),哪怕是只看前幾章,明白了什么是圖像(二維或者三維矩陣)、什么是像素、彩色圖和灰度圖、顏色空間、圖像濾波、圖像噪聲、圖像頻域變換等概念,將來(lái)在進(jìn)行更深一步的研究的話(huà)就會(huì)方便很多了。

2、基本思想

剛開(kāi)始想把這部分內(nèi)容命名為“基本算法”,意在介紹圖像處理中的一些基本算法,后來(lái)仔細(xì)想想決定不這么寫(xiě),因?yàn)閳D像處理是一個(gè)非常大的概念,圖像處理不等于人臉識(shí)別,也不等于模式識(shí)別,直接介紹諸如圖像處理基本算法之類(lèi)的內(nèi)容很容易寫(xiě)成空話(huà),沒(méi)有什么實(shí)際意義。讀者有興趣的話(huà)可以直接谷歌百度“圖像處理十大經(jīng)典算法”,上面有我想說(shuō)的內(nèi)容。

萬(wàn)變不離其宗,算法是死的,重在思想。舉個(gè)例子,我個(gè)人是主攻模式識(shí)別方向,在這個(gè)方向判斷一個(gè)學(xué)生是否入門(mén)有一個(gè)非常簡(jiǎn)單的方法,就是“如果你能把圖像很自然的想象成高維空間中的一個(gè)點(diǎn)”,那就說(shuō)明在模式識(shí)別方面入門(mén)了,可以對(duì)圖像進(jìn)行分類(lèi)了。當(dāng)然標(biāo)準(zhǔn)不是唯一,在其他領(lǐng)域如目標(biāo)檢測(cè)也會(huì)有其他的判斷標(biāo)準(zhǔn),總之我們要對(duì)圖像進(jìn)行處理,那么圖像就不再只是圖像,它可能會(huì)演變成各種不同形式的概念,可能是點(diǎn),可能是面,還可能是一個(gè)坐標(biāo)空間。在目標(biāo)跟蹤的經(jīng)典算法粒子濾波中,將一個(gè)個(gè)的小圖像塊看做一個(gè)個(gè)粒子;在子空間理論中,將一系列圖像放在一起構(gòu)建一個(gè)成分主空間(例如主成分分析PCA算法等等。,我不會(huì)詳細(xì)介紹這些算法,說(shuō)多了就顯得抽象老套,但我要說(shuō)的是我們一定要把圖像本身理解好,它是一個(gè)圖像,是一個(gè)矩陣,是一個(gè)信息的容器,是一種數(shù)據(jù)的表現(xiàn)形式,圖像不一定都必須在視覺(jué)上有意義(比如頻域的圖像)。

總之圖像處理的基本思想還是要立足于圖像本身,要深度到圖像內(nèi)部結(jié)構(gòu)中,思維要靈活。我當(dāng)時(shí)做本科畢設(shè)時(shí),怎么也不知道圖像和高維空間中的點(diǎn)之間有什么對(duì)應(yīng)關(guān)系,后來(lái)總算有一天,突然就明白了,這也就是所謂的量變產(chǎn)生質(zhì)變。總之一定要多想,多總結(jié),主動(dòng)去鉆研,才能夠真正領(lǐng)悟一些東西。最基本的東西往往蘊(yùn)藏著深?yuàn)W的道理,無(wú)論你現(xiàn)在多牛多厲害,都不能放掉最本源的東西。多想想圖像是什么,有什么本質(zhì)屬性,你可能無(wú)法得到準(zhǔn)確的答案,但肯定能得到一些有用的感悟(有點(diǎn)像哲學(xué)問(wèn)題了)。

3、算法研究

算法研究應(yīng)該是圖像處理的核心工作,尤其是各大高校的博士碩士。這里我并不想談那些高大上的算法,我更想說(shuō)的是一些算法研究的一些基礎(chǔ)的東西,比如說(shuō)一些基礎(chǔ)課程,比如說(shuō)矩陣運(yùn)算。

研究圖像處理的算法,離不開(kāi)數(shù)學(xué)。在這里我建議圖像處理方面的碩士一定要上兩門(mén)課:《泛函分析》以及《最優(yōu)化算法》,有的學(xué)校已經(jīng)將這兩門(mén)課列為了研究生階段的必修課程。這兩門(mén)可可以說(shuō)是圖像處理(至少是模式識(shí)別)的基礎(chǔ)。我當(dāng)初沒(méi)上過(guò)最優(yōu)化算法,但后來(lái)也自己補(bǔ)上了,不然真的是寸步難行。至于泛函我當(dāng)時(shí)聽(tīng)課的時(shí)候也不是很懂,但是在之后的研究過(guò)程中發(fā)現(xiàn)很多圖像處理的基本知識(shí)基本理論都和泛函分析中枯燥的定理如出一轍,沒(méi)辦法,有的東西本身就是枯燥的干貨,學(xué)著費(fèi)力,缺它不行。

其次我想說(shuō)的是矩陣運(yùn)算。圖像就是矩陣,圖像處理就是矩陣運(yùn)算。大家為什么都喜歡用Matlab,就是因?yàn)樗木仃囘\(yùn)算能力實(shí)在是太強(qiáng)大,在Matlab的世界中任何變量都是矩陣。同樣OpenCv之所以能流行,不僅僅是因?yàn)樗己玫姆庋b性,也是因?yàn)樗木仃嚫袷?,它定義了Mat基礎(chǔ)類(lèi),允許你對(duì)矩陣進(jìn)行各種操作。Python也不例外,它的Numpy就是一個(gè)專(zhuān)門(mén)的線(xiàn)性代數(shù)庫(kù)。

真正在圖像編程過(guò)程中,那些看著高大上的API函數(shù)歸根到底都是工具,查查手冊(cè)就能找到,真正核心還是在算法,算法是由公式編寫(xiě)的,公式的單元是變量,而圖像屆的變量就是矩陣。所以,熟練去操作矩陣,求秩、求逆、最小二乘,求協(xié)方差,都是家常便飯。所以,如果你有幸能上《矩陣分析》這門(mén)課,一定要把它看懂,那里面都是干貨。

四、小結(jié)

總之,圖像處理就是一個(gè)典型的門(mén)檻低、廳堂深的領(lǐng)域。不需要太多基礎(chǔ),學(xué)過(guò)線(xiàn)性代數(shù),會(huì)一點(diǎn)編程就夠了;但是那些算法卻深不可測(cè),是個(gè)消耗功夫的活兒。在寫(xiě)這篇教程時(shí)我說(shuō)的很直白,就像和大家對(duì)話(huà)一樣,想到什么說(shuō)什么。在最后我想說(shuō)兩句題外話(huà),就是不僅僅針對(duì)圖像處理,對(duì)于其他新技術(shù)的入門(mén)學(xué)習(xí)也是一樣,盡快邁出第一步,盡快去建立自信和成就感,讓自己有勇氣走下去,然后缺什么補(bǔ)什么就行了。我覺(jué)得真正讓人望而卻步的往往不是技術(shù)本身,而是我們對(duì)自身的不自信。唯有果斷開(kāi)工,才能戰(zhàn)勝心魔。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1275

    瀏覽量

    56576
  • OpenCV
    +關(guān)注

    關(guān)注

    29

    文章

    624

    瀏覽量

    41214
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4767

    瀏覽量

    84375
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890

原文標(biāo)題:圖像處理入門(mén)教程

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    零基礎(chǔ) 圖像處理

    今年讀研,導(dǎo)師要我搞圖像處理這方面,但我零基礎(chǔ),就買(mǎi)了本MATLAB圖像處理寶典開(kāi)始看,這樣學(xué)行嗎,唉。。。希望各位高手指導(dǎo)下引導(dǎo)我入門(mén),謝
    發(fā)表于 07-05 09:32

    想要學(xué)習(xí)在DSP的平臺(tái)上進(jìn)行圖像處理,求推薦入門(mén)教材。

    各位大神,本人想要學(xué)習(xí)在DSP的平臺(tái)上進(jìn)行圖像處理,但基礎(chǔ)比較差。圖像處理的算法是有基礎(chǔ)的,但是總覺(jué)得這兩者結(jié)合很困難,希望大神告訴我下有什么好方法
    發(fā)表于 05-20 10:29

    想用DSP做圖像處理,入門(mén)學(xué)習(xí)該買(mǎi)什么樣的開(kāi)發(fā)板?

    想用DSP做圖像處理入門(mén)學(xué)習(xí)該買(mǎi)什么樣的開(kāi)發(fā)板?最好低于500
    發(fā)表于 08-06 16:27

    誰(shuí)有《NI VISION圖像處理寶典》的pdf?

    實(shí)用教程》《NI Vision Builder for Automation Inspection入門(mén)教程》《基于Vision Assistant的圖像處理實(shí)用教程-實(shí)例彩蛋》《NI Calibration Training標(biāo)定
    發(fā)表于 11-26 16:17

    形態(tài)學(xué)圖像處理綜合示例_《OpenCV3編程入門(mén)》書(shū)本配套源代碼

    《OpenCV3編程入門(mén)》書(shū)本配套源代碼:形態(tài)學(xué)圖像處理綜合示例
    發(fā)表于 06-06 15:52 ?8次下載

    形態(tài)學(xué)圖像處理綜合示例_OpenCV3編程入門(mén)-源碼例程

    OpenCV3編程入門(mén)-源碼例程全集-形態(tài)學(xué)圖像處理綜合示例,感興趣的小伙伴們可以瞧一瞧。
    發(fā)表于 09-18 16:55 ?0次下載

    圖像處理技術(shù)是什么_圖像處理技術(shù)現(xiàn)狀和發(fā)展前景

    數(shù)字圖像處理技術(shù)正在向處理算法更優(yōu)化、處理速度更快、處理后的圖像清晰度更高的方向發(fā)展,實(shí)現(xiàn)
    發(fā)表于 01-12 17:47 ?5.5w次閱讀

    Python圖像處理庫(kù)Pillow入門(mén)教程和代碼資料免費(fèi)下載

    Pillow 是Python 里的圖像處理庫(kù)(PIL:Python Image Library),提供了了廣泛的文件格式支持,強(qiáng)大的圖像處理能力,主要包括
    發(fā)表于 01-11 16:20 ?30次下載
    Python<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>庫(kù)Pillow<b class='flag-5'>入門(mén)</b>教程和代碼資料免費(fèi)下載

    圖像處理入門(mén)與研究方法

    安防監(jiān)控可以說(shuō)是圖像處理領(lǐng)域最有潛力的應(yīng)用領(lǐng)域。如今各個(gè)城市都在瘋狂的安裝監(jiān)控?cái)z像頭,全國(guó)時(shí)刻都有無(wú)數(shù)的攝像頭在錄監(jiān)控,但是安防監(jiān)控的后端處理卻沒(méi)跟上。什么是后端處理,簡(jiǎn)單的說(shuō)就是監(jiān)控
    的頭像 發(fā)表于 07-06 09:53 ?1470次閱讀

    圖像處理技術(shù)入門(mén)

    圖像增強(qiáng)技術(shù)的作用,簡(jiǎn)單點(diǎn)說(shuō),就是通過(guò)對(duì)圖像進(jìn)行加工處理,使圖像能更好的在其他領(lǐng)域起作用,比如人臉識(shí)別,圖像分類(lèi)等人工智能領(lǐng)域,又或者是在通
    的頭像 發(fā)表于 02-08 11:04 ?640次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>處理</b>技術(shù)<b class='flag-5'>入門(mén)</b>

    圖像處理的應(yīng)用

    最近有人問(wèn)我圖像處理怎么研究,怎么入門(mén),怎么應(yīng)用,我竟一時(shí)語(yǔ)塞。仔細(xì)想想,自己也搞了兩年圖像方面的研究,做個(gè)兩個(gè)創(chuàng)新項(xiàng)目,發(fā)過(guò)兩篇論文,也算是有點(diǎn)心得,于是總結(jié)總結(jié)和大家分享,希望能對(duì)
    的頭像 發(fā)表于 06-16 10:00 ?1125次閱讀

    如何使用機(jī)器學(xué)習(xí)處理圖像

    圖像處理是利用復(fù)雜的算法對(duì)圖像進(jìn)行技術(shù)分析。在圖像處理中,圖像是輸入,有用的信息是輸出。據(jù)報(bào)道,
    的頭像 發(fā)表于 07-24 15:00 ?686次閱讀

    機(jī)器視覺(jué)之圖像增強(qiáng)和圖像處理

    對(duì)原始獲取圖像進(jìn)行一系列的運(yùn)算處理,稱(chēng)為圖像處理。圖像處理是機(jī)器視覺(jué)技術(shù)的方法基礎(chǔ),包括
    發(fā)表于 10-23 10:43 ?503次閱讀
    機(jī)器視覺(jué)之<b class='flag-5'>圖像</b>增強(qiáng)和<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>

    機(jī)器視覺(jué)之圖像增強(qiáng)和圖像處理

    一、圖像處理技術(shù)概述1.定義對(duì)原始獲取圖像進(jìn)行一系列的運(yùn)算處理,稱(chēng)為圖像處理。
    的頭像 發(fā)表于 10-26 08:07 ?897次閱讀
    機(jī)器視覺(jué)之<b class='flag-5'>圖像</b>增強(qiáng)和<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>

    Workshop!圖像處理和識(shí)別入門(mén)培訓(xùn)

    技術(shù)進(jìn)行結(jié)合,做擴(kuò)展應(yīng)用。實(shí)踐平臺(tái):本次動(dòng)手實(shí)踐主題我們將圍繞“人工智能-圖像處理和識(shí)別入門(mén)”來(lái)展開(kāi)!并使用RT-Thread社區(qū)團(tuán)隊(duì)聯(lián)合英飛凌打造的PSoC62
    的頭像 發(fā)表于 03-20 08:34 ?254次閱讀
    Workshop!<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>和識(shí)別<b class='flag-5'>入門(mén)</b>培訓(xùn)