2020国内在线精品视频,性888XXXx入欧美

最近有人問(wèn)我圖像處理怎么研究，怎么入門(mén)，怎么應(yīng)用，我竟一時(shí)語(yǔ)塞。仔細(xì)想想，自己也搞了兩年圖像方面的研究，做個(gè)兩個(gè)創(chuàng)新項(xiàng)目，發(fā)過(guò)兩篇論文，也算是有點(diǎn)心得，于是總結(jié)總結(jié)和大家分享，希望能對(duì)大家有所幫助。在寫(xiě)這篇教程之前我本想多弄點(diǎn)插圖，讓文章看起來(lái)花哨一點(diǎn)，后來(lái)我覺(jué)得沒(méi)必要這樣做，大家花時(shí)間沉下心來(lái)讀讀文字沒(méi)什么不好，況且學(xué)術(shù)和技術(shù)本身也不是多么花哨的東西。

一、圖像處理的應(yīng)用

這個(gè)其實(shí)沒(méi)什么好說(shuō)的，一種技術(shù)的應(yīng)用價(jià)值不是靠嘴上說(shuō)，而是要看有多少人去搞，很簡(jiǎn)單的道理。其實(shí)我覺(jué)得判斷一項(xiàng)技術(shù)有沒(méi)有價(jià)值、有多大價(jià)值的最簡(jiǎn)單最有效的方法就是看有多少人在研究它。如果大家都在研究，那必然說(shuō)明它很火，至少目前很火，以后的幾年里依然還會(huì)火。因此，如果你不確定圖像處理是不是有價(jià)值，那就查查全國(guó)圖像處理工程師的數(shù)量就行了。

當(dāng)然這里還是簡(jiǎn)單提一下。如果你真的只想問(wèn)“圖像處理有什么用？”，相信百度會(huì)給出比我更專(zhuān)業(yè)的答案。不過(guò)作為圖像處理的行內(nèi)人，我還是從幾個(gè)基本的點(diǎn)來(lái)具體說(shuō)一下。

1、身份認(rèn)證

21世紀(jì)是刷臉的時(shí)代，這一點(diǎn)無(wú)可厚非。首先是銀行，據(jù)說(shuō)重慶的銀行已經(jīng)使用了人臉識(shí)別的驗(yàn)證系統(tǒng)來(lái)進(jìn)行輔助的認(rèn)證。其次是門(mén)禁系統(tǒng)，以前是指紋，虹膜，現(xiàn)在就是人臉。指紋、虹膜的識(shí)別雖然準(zhǔn)確，但是有侵犯性，采集的過(guò)程中有侵犯性，驗(yàn)證的過(guò)程中也有侵犯性，反正讓誰(shuí)天天錄指紋（采集指紋信息），用眼睛瞪攝像頭（采集虹膜信息），誰(shuí)都會(huì)覺(jué)得不舒服的，況且手還會(huì)脫皮。相比之下，人臉的識(shí)別就方便多了，拍張照片（采集人臉信息）誰(shuí)都不會(huì)介意。最后是監(jiān)控，一個(gè)攝像頭所拍的監(jiān)控能從不同的角度記錄成百上千的人（比如車(chē)站等密集場(chǎng)所的監(jiān)控），讓警察去辨認(rèn)將是一個(gè)浩大的工程，要是系統(tǒng)能夠自動(dòng)判別人員信息，無(wú)疑會(huì)給辦案帶來(lái)極大方便。

2、監(jiān)控安防

安防監(jiān)控可以說(shuō)是圖像處理領(lǐng)域最有潛力的應(yīng)用領(lǐng)域。如今各個(gè)城市都在瘋狂的安裝監(jiān)控?cái)z像頭，全國(guó)時(shí)刻都有無(wú)數(shù)的攝像頭在錄監(jiān)控，但是安防監(jiān)控的后端處理卻沒(méi)跟上。什么是后端處理，簡(jiǎn)單的說(shuō)就是監(jiān)控錄像的視頻處理。注意這里的視頻處理可就不止包含人臉識(shí)別了，還有行人檢測(cè)、異常檢測(cè)、顯著性檢測(cè)、協(xié)同跟蹤等。人臉識(shí)別之前說(shuō)了，這里簡(jiǎn)單說(shuō)說(shuō)行人異常檢測(cè)。圖像處理中的行人異常檢測(cè)在外行人眼中是一個(gè)非常有魔力的東西。畢竟讓攝像頭通過(guò)監(jiān)控視頻就能判斷出當(dāng)前畫(huà)面中誰(shuí)是好人誰(shuí)是壞人（當(dāng)然直接分為好人和壞人還是太武斷了），在一般思維中貌似是不可能的。但是請(qǐng)不要忽略這樣一個(gè)事實(shí)，就是目前大部分監(jiān)控視頻的分析處理都是由人工來(lái)完成的，警察破案時(shí)經(jīng)常動(dòng)不動(dòng)就調(diào)出最近幾天的監(jiān)控視頻，然后從頭看到尾，其工程量之大可想而知。也正是這樣才催生了人們對(duì)智能監(jiān)控方面的研究，因?yàn)橛羞@方面的實(shí)際需求。當(dāng)然我們的視頻分析程序不會(huì)直接給出諸如“好人or壞人”這樣的武斷而片面的判斷結(jié)果。

就當(dāng)前的技術(shù)水平而言，能夠統(tǒng)計(jì)當(dāng)下監(jiān)控畫(huà)面中的人數(shù)（行人檢測(cè)）、定位他們的人臉（人臉檢測(cè)）、識(shí)別他們的身份（人臉識(shí)別）、判別他們的表情（表情識(shí)別）、檢測(cè)他們的動(dòng)作（異常檢測(cè)），這就已經(jīng)夠了。這樣以后人們就不會(huì)再面對(duì)長(zhǎng)達(dá)幾十甚至上百個(gè)小時(shí)的監(jiān)控視頻發(fā)呆，而是直接分析計(jì)算機(jī)給出的數(shù)據(jù)，當(dāng)前畫(huà)面中有多少人、都是誰(shuí)、誰(shuí)的動(dòng)作可疑等?？傊酉聛?lái)智能監(jiān)控發(fā)展會(huì)很迅速，因?yàn)樾枨蠛芷惹小?/p>

3、深度學(xué)習(xí)（Deep Learning）

通俗的說(shuō)一句，“圖像處理是深度學(xué)習(xí)應(yīng)用的天堂”。深度學(xué)習(xí)這個(gè)概念可能有人不太熟悉，大家可以自行百度，我這里給出一個(gè)相對(duì)通俗的解釋?zhuān)骸叭绻悴恢朗裁唇猩疃葘W(xué)習(xí)，就想想《終結(jié)者》中的T-800”。當(dāng)然這句話(huà)不是我說(shuō)的，是出自業(yè)界的一位大牛之口。當(dāng)然這可能有點(diǎn)小片面，不過(guò)深度學(xué)習(xí)確實(shí)是公認(rèn)的新一代人工智能的基礎(chǔ)。

這里舉兩個(gè)例子。一是谷歌的人工大腦項(xiàng)目。谷歌公司可以說(shuō)是深度學(xué)習(xí)方面的牽頭企業(yè)了，其在2012年公布的谷歌大腦項(xiàng)目，動(dòng)用了1.6萬(wàn)個(gè)計(jì)算節(jié)點(diǎn)，訓(xùn)練數(shù)周，得到的人工智能模型能夠自主識(shí)別貓臉圖像，為新一代人工智能開(kāi)辟了道路，之后微軟深度學(xué)習(xí)研究院、百度深度學(xué)習(xí)研究院等機(jī)構(gòu)都開(kāi)始大量投入，各個(gè)高校也搞得風(fēng)聲水起，原因很簡(jiǎn)單，大家都知道它會(huì)火。

第二就是圖像識(shí)別方面的競(jìng)賽。最有權(quán)威的就是ImageNet競(jìng)賽。大家在一個(gè)擁有上千萬(wàn)張，上千類(lèi)別的圖像數(shù)據(jù)庫(kù)上訓(xùn)練和測(cè)試自己的算法，比拼識(shí)別率。近幾年來(lái)，摘得桂冠的一直都是深度學(xué)習(xí)模型，確切的說(shuō)是卷積神經(jīng)網(wǎng)絡(luò)。更多有關(guān)ImageNet歷年的競(jìng)賽信息大家可以自行百度。

說(shuō)道深度學(xué)習(xí)在圖像處理的應(yīng)用，不得不提中國(guó)的湯曉鷗教授，說(shuō)他是國(guó)內(nèi)深度學(xué)習(xí)的領(lǐng)頭羊也不為過(guò)。他提出的DeepID人臉識(shí)別算法（一共分為三代），在一些大規(guī)模人臉數(shù)據(jù)庫(kù)上的正確率（若LFW庫(kù)）已經(jīng)達(dá)到了99.75%，單純從數(shù)字上講的話(huà)可以說(shuō)已經(jīng)超越了人類(lèi)的識(shí)別率，為此湯教授還開(kāi)辦了公司，開(kāi)發(fā)FaceSDK（雖然還沒(méi)有公布）。不過(guò)拿計(jì)算機(jī)和人腦相比本身就是不合理的，各有所長(zhǎng)嘛。不過(guò)可見(jiàn)DeepLearning在圖像識(shí)別領(lǐng)域的強(qiáng)大威力。至于深度學(xué)習(xí)與圖像處理的關(guān)系這里就不用多說(shuō)了，谷歌大腦識(shí)別的是圖像，深度學(xué)習(xí)競(jìng)賽用的是圖像，DeepID識(shí)別的還是圖像人臉，雖然深度學(xué)習(xí)在其他方面諸如語(yǔ)音識(shí)別等也有應(yīng)用，在圖像處理依然是其主要的應(yīng)用領(lǐng)域。

二、圖像處理研究工具

圖像處理的研究分為算法研究和應(yīng)用兩個(gè)部分。用到的主要編程語(yǔ)言有Matlab、C/C++、Python等，原因很簡(jiǎn)單，它們都有很多相應(yīng)的第三方庫(kù)，不用我們從零開(kāi)始編程。

1、Matlab

MathWork公司的Matlab軟件可以說(shuō)是算法研究的利器，它的強(qiáng)大之處在于其方便快捷的矩陣運(yùn)算能力和圖形仿真能力，單從簡(jiǎn)潔性和封裝性來(lái)說(shuō)，確實(shí)完爆其他語(yǔ)言。但高度封裝必然會(huì)相應(yīng)的損失一部分靈活性，況且Matlab嚴(yán)格的講更像是一個(gè)工具，而非一門(mén)編程語(yǔ)言。順便提一句，它在2015年編程語(yǔ)言排行榜中位于第20名，僅次于IOS開(kāi)發(fā)的Objective-C。

對(duì)于算法研究人員（尤其是高校的碩士博士），首選工具自然是matlab，因?yàn)樗?jiǎn)便快捷，封裝性好，更重要的是全世界幾乎所有的算法大牛、精英教授都會(huì)首先公布對(duì)應(yīng)的Matlab源碼，然后在逐步改寫(xiě)成其他語(yǔ)言進(jìn)行實(shí)際應(yīng)用。所以，如果你想做圖像處理方面的研究，Matlab是必須掌握的，而且是熟練掌握。當(dāng)你有一些想法需要驗(yàn)證時(shí)，最好明智的先用matlab編寫(xiě)出來(lái)測(cè)試。如果你上來(lái)就用看似高大上的C++來(lái)實(shí)驗(yàn)，不僅錯(cuò)誤BUG一大堆，到頭來(lái)可能效果還不佳，就算效果好，時(shí)間也會(huì)耽擱不少，畢竟算法開(kāi)發(fā)還是要快的，這樣才能趕在別人之前發(fā)論文?？傊灰墙佑|圖像算法，終究逃不過(guò)Matlab，就算你是軟件開(kāi)發(fā)的，不研發(fā)算法，但總得能看懂別人的Matlab算法吧。

對(duì)于之前沒(méi)怎么接觸過(guò)Matlab與圖像處理的人，在這里推薦一本相關(guān)的書(shū)籍《MATLAB圖像處理實(shí)例詳解（附光盤(pán)）》。這本書(shū)對(duì)于Matlab圖像處理入門(mén)還是很有幫助的。記得我當(dāng)時(shí)剛上研究生時(shí)就靠?jī)杀緯?shū)入門(mén)的，一是岡薩雷斯的《數(shù)字圖像處理》，二是這本《MATLAB圖像處理實(shí)例詳解》。不過(guò)這里友情提示，在看這類(lèi)教程（不僅僅是Matlab）時(shí)千萬(wàn)不要試圖去記憶所有的工具函數(shù)，這種做法是十分愚蠢的。正確的做法是根據(jù)自己的情況快速翻閱這類(lèi)工具書(shū)，可以找出里面的有實(shí)際意義的源碼來(lái)敲一敲練練手感，至于具體的工具函數(shù)，只需要知道Matlab提供了這方面的功能就行了，以后用到了再回來(lái)查，或者谷歌百度。我覺(jué)得在入門(mén)階段，最重要的不是看了多少書(shū)，聽(tīng)了多少課，而是盡快自己敲出一段代碼，運(yùn)行出結(jié)果，來(lái)建立自信和成就感，這才是支持我們走下去的最實(shí)在的動(dòng)力。記得我當(dāng)時(shí)看了沒(méi)多久就自己敲了一個(gè)蹩腳的車(chē)牌檢測(cè)的Matlab程序，現(xiàn)在看來(lái)真是漏洞百出，不過(guò)當(dāng)時(shí)我真的很興奮，很有成就感，覺(jué)得自己能干這行，對(duì)于初學(xué)者來(lái)說(shuō)，這種感受彌足珍貴。

2、OpenCv

Opencv是Intel公司開(kāi)發(fā)的C++圖像處理工具包，形象的理解為就是C++版的Matlab。當(dāng)初Intel公司開(kāi)發(fā)這個(gè)工具包的初衷也是方便大家共享，希望大家能夠在一個(gè)共同架構(gòu)的基礎(chǔ)上共同建造摩天大樓，而不是各自在自己的地基上蓋平房。與Matlab不同，Opencv是面向開(kāi)發(fā)的，穩(wěn)定性好，異常處理機(jī)制周全，但有一點(diǎn)需要注意，由于Opencv是開(kāi)源的，那么如果你在項(xiàng)目中直接調(diào)用了它的API，那就意味著你的項(xiàng)目也必須開(kāi)源。因此在真正的產(chǎn)品開(kāi)發(fā)過(guò)程中，往往需要從Opencv庫(kù)里面挖代碼，而不是直接調(diào)用，幸好Intel公司允許我們看源碼，自己編譯一把就可以了。

說(shuō)道C++和Opencv，有一個(gè)問(wèn)題不得不提，那就是深度學(xué)習(xí)領(lǐng)域大名鼎鼎的Caffe框架。這是一個(gè)典型的基于C++和OpenCv的深度學(xué)習(xí)框架，由谷歌深度學(xué)習(xí)團(tuán)隊(duì)、“谷歌大腦”負(fù)責(zé)人之一賈揚(yáng)清學(xué)者編寫(xiě)，并公布了源碼。如今各個(gè)深度學(xué)習(xí)機(jī)構(gòu)都在大量使用這個(gè)框架進(jìn)行研究。

這里同樣對(duì)推薦兩本關(guān)于Opencv方面的教程。一本是CSDN博客大牛毛星云寫(xiě)的《OpenCV3編程入門(mén)》，這是它根據(jù)自己多年的博客整理成的書(shū)，很詳細(xì)，很典型的一本教程，介紹了OpenCv中相對(duì)前沿的知識(shí)。我翻看過(guò)這本教程，中規(guī)中矩，里面的代碼通俗易懂，尤其適合初學(xué)者。當(dāng)然大家同樣要注意不要犯了死讀書(shū)的毛病，只看它的功能，敲代碼練手感即可，不要試圖記憶API函數(shù)。重要的工具用多了自然會(huì)記住，不重要的工具記住了也沒(méi)用。

這里推薦的第二本書(shū)是《圖像識(shí)別與項(xiàng)目實(shí)踐――VC++、MATLAB技術(shù)實(shí)現(xiàn)》，這本書(shū)是一本偏向于工程應(yīng)用的書(shū)，我之所以推薦它是因?yàn)樗o出了很多有新意、能運(yùn)行的代碼。其中里面有一個(gè)項(xiàng)目讓我印象很深，是一個(gè)車(chē)牌檢測(cè)的實(shí)例。簡(jiǎn)單描述一下：由于車(chē)牌中的字符數(shù)是固定的，因此它通過(guò)判斷橫向區(qū)域筆畫(huà)的跳變數(shù)以及筆畫(huà)寬度來(lái)定位車(chē)牌區(qū)域。這個(gè)想法讓人耳目一新，并且它還給出了詳細(xì)代碼，我也親身試驗(yàn)過(guò)，效果還不錯(cuò)。

這里同樣再?gòu)?qiáng)調(diào)一下，就是一定要盡早入手寫(xiě)程序，建立自信和成就感。我當(dāng)時(shí)學(xué)OpenCv正好用它開(kāi)發(fā)了一個(gè)人臉性別識(shí)別的系統(tǒng)，是一個(gè)本科大學(xué)生創(chuàng)新計(jì)劃的需求，效果還可以。

3、Python

Python在今年12月份的編程語(yǔ)言排行榜中名列第5，增長(zhǎng)迅速?？梢哉f(shuō)Python已經(jīng)逐漸成為當(dāng)下腳本語(yǔ)言的新標(biāo)準(zhǔn)。Python在圖像處理算法方面除了其自身簡(jiǎn)潔的編程優(yōu)勢(shì)外，還得益于兩個(gè)重要的Python類(lèi)庫(kù)——Numpy和Theano。

Numpy是Python的線(xiàn)性代數(shù)庫(kù)，對(duì)于矩陣運(yùn)算能提供很好的支持，并且能夠在此基礎(chǔ)上進(jìn)行很多機(jī)器學(xué)習(xí)相關(guān)算法的開(kāi)發(fā)仿真，這里推薦一本受到大家廣泛認(rèn)可的書(shū)《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》，我最近也正在看這本書(shū)，里面對(duì)好多機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典算法，小到KNN，大到SVM，都給出了詳細(xì)的介紹以及代碼實(shí)現(xiàn)（Python版）。Theano是Python的機(jī)器學(xué)習(xí)庫(kù)，能夠方便的實(shí)現(xiàn)深度學(xué)習(xí)（例如卷積神經(jīng)網(wǎng)絡(luò)CNN）算法，網(wǎng)上很多對(duì)于DeepID算法的復(fù)現(xiàn)都是用的這個(gè)庫(kù)。

人覺(jué)得單從圖像處理的角度評(píng)價(jià)的話(huà)，Python并沒(méi)有前面兩個(gè)工具（Matlab和OpenCv）應(yīng)用廣泛，不過(guò)作為通用的腳本語(yǔ)言，我覺(jué)得每個(gè)程序員都應(yīng)該去了解了解它，畢竟俗話(huà)說(shuō)沒(méi)有爛的編程語(yǔ)言，只有爛程序員。我在學(xué)Python時(shí)第一個(gè)自己寫(xiě)的程序就是微信打飛機(jī)的小程序，在我的博客中有詳細(xì)的教程，雖然是參照小甲魚(yú)的《零基礎(chǔ)入門(mén)學(xué)習(xí)Python》視頻教程寫(xiě)的，但還是蠻有成就感的。

三、圖像處理研究方法

我覺(jué)得，圖像處理研究主要可以分為三個(gè)部分：基礎(chǔ)概念、基本思想、算法研究。

1、基礎(chǔ)概念

所謂基礎(chǔ)概念，就是圖像處理里最基本的知識(shí)，比如什么是圖像？什么是像素？什么是彩色圖像等等。沒(méi)有一個(gè)明確的界限來(lái)劃定什么是基礎(chǔ)概念什么是高級(jí)知識(shí)，因人而異。了解圖像處理的基礎(chǔ)知識(shí)，有一本書(shū)是必讀的，就是岡薩雷斯編寫(xiě)的、阮秋琦翻譯的《數(shù)字圖像處理》。這本書(shū)已經(jīng)作為圖像處理領(lǐng)域的經(jīng)典教材使用了三十多年，我自己也把這本書(shū)看了好幾遍，每一遍都會(huì)有新的體會(huì)。我覺(jué)得每一個(gè)搞圖像的都應(yīng)該熟讀這本書(shū)。書(shū)中除了有幾章內(nèi)容在講小波變換、模式識(shí)別等相對(duì)抽象的內(nèi)容外，其他內(nèi)容相對(duì)都是很基礎(chǔ)的，本科生水平就能看懂。而且我建議要盡早看這本書(shū)，如果是研究生盡量在進(jìn)入課題之前就看一遍，因?yàn)檫@樣一本經(jīng)典的書(shū)在進(jìn)入課題之后可能就沒(méi)時(shí)間看了，以后也頂多是查閱而已。我當(dāng)初就是在大四的寒假看完了這本書(shū)，以后在圖像入門(mén)的過(guò)程中就顯得輕松很多?？赐赀@本書(shū)，哪怕是只看前幾章，明白了什么是圖像（二維或者三維矩陣）、什么是像素、彩色圖和灰度圖、顏色空間、圖像濾波、圖像噪聲、圖像頻域變換等概念，將來(lái)在進(jìn)行更深一步的研究的話(huà)就會(huì)方便很多了。

2、基本思想

剛開(kāi)始想把這部分內(nèi)容命名為“基本算法”，意在介紹圖像處理中的一些基本算法，后來(lái)仔細(xì)想想決定不這么寫(xiě)，因?yàn)閳D像處理是一個(gè)非常大的概念，圖像處理不等于人臉識(shí)別，也不等于模式識(shí)別，直接介紹諸如圖像處理基本算法之類(lèi)的內(nèi)容很容易寫(xiě)成空話(huà)，沒(méi)有什么實(shí)際意義。讀者有興趣的話(huà)可以直接谷歌百度“圖像處理十大經(jīng)典算法”，上面有我想說(shuō)的內(nèi)容。

萬(wàn)變不離其宗，算法是死的，重在思想。舉個(gè)例子，我個(gè)人是主攻模式識(shí)別方向，在這個(gè)方向判斷一個(gè)學(xué)生是否入門(mén)有一個(gè)非常簡(jiǎn)單的方法，就是“如果你能把圖像很自然的想象成高維空間中的一個(gè)點(diǎn)”，那就說(shuō)明在模式識(shí)別方面入門(mén)了，可以對(duì)圖像進(jìn)行分類(lèi)了。當(dāng)然標(biāo)準(zhǔn)不是唯一，在其他領(lǐng)域如目標(biāo)檢測(cè)也會(huì)有其他的判斷標(biāo)準(zhǔn)，總之我們要對(duì)圖像進(jìn)行處理，那么圖像就不再只是圖像，它可能會(huì)演變成各種不同形式的概念，可能是點(diǎn)，可能是面，還可能是一個(gè)坐標(biāo)空間。在目標(biāo)跟蹤的經(jīng)典算法粒子濾波中，將一個(gè)個(gè)的小圖像塊看做一個(gè)個(gè)粒子；在子空間理論中，將一系列圖像放在一起構(gòu)建一個(gè)成分主空間（例如主成分分析PCA算法等等。，我不會(huì)詳細(xì)介紹這些算法，說(shuō)多了就顯得抽象老套，但我要說(shuō)的是我們一定要把圖像本身理解好，它是一個(gè)圖像，是一個(gè)矩陣，是一個(gè)信息的容器，是一種數(shù)據(jù)的表現(xiàn)形式，圖像不一定都必須在視覺(jué)上有意義（比如頻域的圖像）。

總之圖像處理的基本思想還是要立足于圖像本身，要深度到圖像內(nèi)部結(jié)構(gòu)中，思維要靈活。我當(dāng)時(shí)做本科畢設(shè)時(shí)，怎么也不知道圖像和高維空間中的點(diǎn)之間有什么對(duì)應(yīng)關(guān)系，后來(lái)總算有一天，突然就明白了，這也就是所謂的量變產(chǎn)生質(zhì)變。總之一定要多想，多總結(jié)，主動(dòng)去鉆研，才能夠真正領(lǐng)悟一些東西。最基本的東西往往蘊(yùn)藏著深?yuàn)W的道理，無(wú)論你現(xiàn)在多牛多厲害，都不能放掉最本源的東西。多想想圖像是什么，有什么本質(zhì)屬性，你可能無(wú)法得到準(zhǔn)確的答案，但肯定能得到一些有用的感悟（有點(diǎn)像哲學(xué)問(wèn)題了）。

3、算法研究

算法研究應(yīng)該是圖像處理的核心工作，尤其是各大高校的博士碩士。這里我并不想談那些高大上的算法，我更想說(shuō)的是一些算法研究的一些基礎(chǔ)的東西，比如說(shuō)一些基礎(chǔ)課程，比如說(shuō)矩陣運(yùn)算。

研究圖像處理的算法，離不開(kāi)數(shù)學(xué)。在這里我建議圖像處理方面的碩士一定要上兩門(mén)課：《泛函分析》以及《最優(yōu)化算法》，有的學(xué)校已經(jīng)將這兩門(mén)課列為了研究生階段的必修課程。這兩門(mén)可可以說(shuō)是圖像處理（至少是模式識(shí)別）的基礎(chǔ)。我當(dāng)初沒(méi)上過(guò)最優(yōu)化算法，但后來(lái)也自己補(bǔ)上了，不然真的是寸步難行。至于泛函我當(dāng)時(shí)聽(tīng)課的時(shí)候也不是很懂，但是在之后的研究過(guò)程中發(fā)現(xiàn)很多圖像處理的基本知識(shí)基本理論都和泛函分析中枯燥的定理如出一轍，沒(méi)辦法，有的東西本身就是枯燥的干貨，學(xué)著費(fèi)力，缺它不行。

其次我想說(shuō)的是矩陣運(yùn)算。圖像就是矩陣，圖像處理就是矩陣運(yùn)算。大家為什么都喜歡用Matlab，就是因?yàn)樗木仃囘\(yùn)算能力實(shí)在是太強(qiáng)大，在Matlab的世界中任何變量都是矩陣。同樣OpenCv之所以能流行，不僅僅是因?yàn)樗己玫姆庋b性，也是因?yàn)樗木仃嚫袷?，它定義了Mat基礎(chǔ)類(lèi)，允許你對(duì)矩陣進(jìn)行各種操作。Python也不例外，它的Numpy就是一個(gè)專(zhuān)門(mén)的線(xiàn)性代數(shù)庫(kù)。

真正在圖像編程過(guò)程中，那些看著高大上的API函數(shù)歸根到底都是工具，查查手冊(cè)就能找到，真正核心還是在算法，算法是由公式編寫(xiě)的，公式的單元是變量，而圖像屆的變量就是矩陣。所以，熟練去操作矩陣，求秩、求逆、最小二乘，求協(xié)方差，都是家常便飯。所以，如果你有幸能上《矩陣分析》這門(mén)課，一定要把它看懂，那里面都是干貨。

四、小結(jié)

總之，圖像處理就是一個(gè)典型的門(mén)檻低、廳堂深的領(lǐng)域。不需要太多基礎(chǔ)，學(xué)過(guò)線(xiàn)性代數(shù)，會(huì)一點(diǎn)編程就夠了；但是那些算法卻深不可測(cè)，是個(gè)消耗功夫的活兒。在寫(xiě)這篇教程時(shí)我說(shuō)的很直白，就像和大家對(duì)話(huà)一樣，想到什么說(shuō)什么。在最后我想說(shuō)兩句題外話(huà)，就是不僅僅針對(duì)圖像處理，對(duì)于其他新技術(shù)的入門(mén)學(xué)習(xí)也是一樣，盡快邁出第一步，盡快去建立自信和成就感，讓自己有勇氣走下去，然后缺什么補(bǔ)什么就行了。我覺(jué)得真正讓人望而卻步的往往不是技術(shù)本身，而是我們對(duì)自身的不自信。唯有果斷開(kāi)工，才能戰(zhàn)勝心魔。

審核編輯：黃飛

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像處理

圖像處理

+關(guān)注

關(guān)注
27

文章
1275

瀏覽量
56576
OpenCV

OpenCV

+關(guān)注

關(guān)注
29

文章
624

瀏覽量
41214
python

python

+關(guān)注

關(guān)注
55

文章
4767

瀏覽量
84375
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5463

瀏覽量
120890

原文標(biāo)題：圖像處理入門(mén)教程

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺(jué)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

零基礎(chǔ) 圖像處理

今年讀研，導(dǎo)師要我搞圖像處理這方面，但我零基礎(chǔ)，就買(mǎi)了本MATLAB圖像處理寶典開(kāi)始看，這樣學(xué)行嗎，唉。。。希望各位高手指導(dǎo)下引導(dǎo)我入門(mén)，謝

發(fā)表于 07-05 09:32

想要學(xué)習(xí)在DSP的平臺(tái)上進(jìn)行圖像處理，求推薦入門(mén)教材。

各位大神，本人想要學(xué)習(xí)在DSP的平臺(tái)上進(jìn)行圖像處理，但基礎(chǔ)比較差。圖像處理的算法是有基礎(chǔ)的，但是總覺(jué)得這兩者結(jié)合很困難，希望大神告訴我下有什么好方法

發(fā)表于 05-20 10:29

想用DSP做圖像處理，入門(mén)學(xué)習(xí)該買(mǎi)什么樣的開(kāi)發(fā)板？

想用DSP做圖像處理，入門(mén)學(xué)習(xí)該買(mǎi)什么樣的開(kāi)發(fā)板？最好低于500

發(fā)表于 08-06 16:27

誰(shuí)有《NI VISION圖像處理寶典》的pdf？

實(shí)用教程》《NI Vision Builder for Automation Inspection入門(mén)教程》《基于Vision Assistant的圖像處理實(shí)用教程-實(shí)例彩蛋》《NI Calibration Training標(biāo)定

發(fā)表于 11-26 16:17

形態(tài)學(xué)圖像處理綜合示例_《OpenCV3編程入門(mén)》書(shū)本配套源代碼

《OpenCV3編程入門(mén)》書(shū)本配套源代碼:形態(tài)學(xué)圖像處理綜合示例

發(fā)表于 06-06 15:52 ?8次下載

形態(tài)學(xué)圖像處理綜合示例_OpenCV3編程入門(mén)-源碼例程

OpenCV3編程入門(mén)-源碼例程全集-形態(tài)學(xué)圖像處理綜合示例，感興趣的小伙伴們可以瞧一瞧。

發(fā)表于 09-18 16:55 ?0次下載

圖像處理技術(shù)是什么_圖像處理技術(shù)現(xiàn)狀和發(fā)展前景

數(shù)字圖像處理技術(shù)正在向處理算法更優(yōu)化、處理速度更快、處理后的圖像清晰度更高的方向發(fā)展，實(shí)現(xiàn)

發(fā)表于 01-12 17:47 ?5.5w次閱讀

Python圖像處理庫(kù)Pillow入門(mén)教程和代碼資料免費(fèi)下載

Pillow 是Python 里的圖像處理庫(kù)（PIL：Python Image Library），提供了了廣泛的文件格式支持，強(qiáng)大的圖像處理能力，主要包括

發(fā)表于 01-11 16:20 ?30次下載

圖像處理的入門(mén)與研究方法

安防監(jiān)控可以說(shuō)是圖像處理領(lǐng)域最有潛力的應(yīng)用領(lǐng)域。如今各個(gè)城市都在瘋狂的安裝監(jiān)控?cái)z像頭，全國(guó)時(shí)刻都有無(wú)數(shù)的攝像頭在錄監(jiān)控，但是安防監(jiān)控的后端處理卻沒(méi)跟上。什么是后端處理，簡(jiǎn)單的說(shuō)就是監(jiān)控

發(fā)表于 07-06 09:53 ?1470次閱讀

圖像處理技術(shù)入門(mén)

圖像增強(qiáng)技術(shù)的作用，簡(jiǎn)單點(diǎn)說(shuō)，就是通過(guò)對(duì)圖像進(jìn)行加工處理，使圖像能更好的在其他領(lǐng)域起作用，比如人臉識(shí)別，圖像分類(lèi)等人工智能領(lǐng)域，又或者是在通

發(fā)表于 02-08 11:04 ?640次閱讀

圖像處理的應(yīng)用

最近有人問(wèn)我圖像處理怎么研究，怎么入門(mén)，怎么應(yīng)用，我竟一時(shí)語(yǔ)塞。仔細(xì)想想，自己也搞了兩年圖像方面的研究，做個(gè)兩個(gè)創(chuàng)新項(xiàng)目，發(fā)過(guò)兩篇論文，也算是有點(diǎn)心得，于是總結(jié)總結(jié)和大家分享，希望能對(duì)

發(fā)表于 06-16 10:00 ?1125次閱讀

如何使用機(jī)器學(xué)習(xí)處理圖像

圖像處理是利用復(fù)雜的算法對(duì)圖像進(jìn)行技術(shù)分析。在圖像處理中，圖像是輸入，有用的信息是輸出。據(jù)報(bào)道，

發(fā)表于 07-24 15:00 ?686次閱讀

機(jī)器視覺(jué)之圖像增強(qiáng)和圖像處理

對(duì)原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱(chēng)為圖像處理。圖像處理是機(jī)器視覺(jué)技術(shù)的方法基礎(chǔ)，包括

發(fā)表于 10-23 10:43 ?503次閱讀

機(jī)器視覺(jué)之圖像增強(qiáng)和圖像處理

一、圖像處理技術(shù)概述1.定義對(duì)原始獲取圖像進(jìn)行一系列的運(yùn)算處理，稱(chēng)為圖像處理。

發(fā)表于 10-26 08:07 ?897次閱讀

Workshop！圖像處理和識(shí)別入門(mén)培訓(xùn)

技術(shù)進(jìn)行結(jié)合，做擴(kuò)展應(yīng)用。實(shí)踐平臺(tái)：本次動(dòng)手實(shí)踐主題我們將圍繞“人工智能-圖像處理和識(shí)別入門(mén)”來(lái)展開(kāi)！并使用RT-Thread社區(qū)團(tuán)隊(duì)聯(lián)合英飛凌打造的PSoC62

發(fā)表于 03-20 08:34 ?254次閱讀