在很多人眼里,深度學(xué)習(xí)是一個(gè)非常神奇的技術(shù),是人工智能的未來(lái),是機(jī)器學(xué)習(xí)的圣杯。今天深視創(chuàng)新帶您一起揭開(kāi)他神秘的面紗,了解什么才是深度學(xué)習(xí)。
當(dāng)我們?cè)?a target="_blank">網(wǎng)絡(luò)上搜索“深度學(xué)習(xí)”的時(shí)候往往還能搜到“人工智能”以及“機(jī)器學(xué)習(xí)”這兩個(gè)關(guān)鍵詞。有很多人甚至認(rèn)為深度學(xué)習(xí)就是人工智能,其實(shí)這些概念之間還是有一些區(qū)別的。因此,在介紹它的工作原理之前,為了讓大家更好的了解深度學(xué)習(xí),我們先來(lái)介紹一下這幾個(gè)概念之間的區(qū)別和聯(lián)系。
人工智能到目前為止還只是一個(gè)概念。它是由麻省理工學(xué)院的約翰·麥卡錫于1956年在達(dá)特矛斯會(huì)議上提出的。在會(huì)上人們把人工智能定義為一門(mén)可以讓機(jī)器的行為看起來(lái)像人一樣智能的技術(shù),但是至今為止我們還沒(méi)能實(shí)現(xiàn)這個(gè)夢(mèng)想。伴隨著隨著計(jì)算機(jī)技術(shù)的發(fā)展以及學(xué)者們不斷的探索,雖然我們目前無(wú)法實(shí)現(xiàn)理想中的人工智能,但已經(jīng)找到了一些實(shí)現(xiàn)它的途徑,那就是機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)不同于我們之前提到的理想中的人工智能。它可以使機(jī)器具有一定的決策能力。它是一種對(duì)已知數(shù)據(jù)進(jìn)行學(xué)習(xí)和分類(lèi)的分類(lèi)器。有人認(rèn)為這并不是真正的智能,于是人們把理想中的人工智能稱(chēng)為強(qiáng)人工智能,而相對(duì)的把機(jī)器學(xué)習(xí)稱(chēng)為弱人工智能。我們現(xiàn)在耳熟能詳?shù)纳疃葘W(xué)習(xí)則是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的算法。所以從算法的角度上來(lái)說(shuō)深度學(xué)習(xí)只是一個(gè)分類(lèi)器而已。
深度學(xué)習(xí)的核心算法是CNN神經(jīng)網(wǎng)絡(luò),即卷積神經(jīng)網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)早在1989年就已經(jīng)問(wèn)世了,最初人們用它解決手寫(xiě)字符的識(shí)別問(wèn)題,但是受限于當(dāng)時(shí)計(jì)算機(jī)的硬件水平,其處理速度較慢,并沒(méi)有推廣到其他應(yīng)用領(lǐng)域。1999年GPU的問(wèn)世為卷積神經(jīng)網(wǎng)絡(luò)重回歷史舞臺(tái)提供了良好的條件。借助GPU高效的處理能力,卷積神經(jīng)網(wǎng)絡(luò)算法開(kāi)始走向應(yīng)用。它優(yōu)秀的分類(lèi)能力逐漸被各個(gè)應(yīng)用領(lǐng)域所認(rèn)可。而當(dāng)Alpha Go戰(zhàn)勝了圍棋冠軍李世石以后,人們對(duì)深度學(xué)習(xí)技術(shù)的期望更是達(dá)到了頂峰。但是我相信,很快人們就會(huì)發(fā)現(xiàn)深度學(xué)習(xí)只是我們目前掌握的一種新的非線(xiàn)性分類(lèi)器。它和其他分類(lèi)器一樣都需要通過(guò)訓(xùn)練才能夠?qū)崿F(xiàn)分類(lèi)的功能。比如通過(guò)水果圖像的訓(xùn)練,它就可以幫助我們判斷圖像中水果的種類(lèi)。
作為一個(gè)機(jī)器學(xué)習(xí)的分類(lèi)器,深度學(xué)習(xí)在很多特征模糊的分類(lèi)領(lǐng)域均有不錯(cuò)的表現(xiàn),比如在自動(dòng)駕駛和照片分類(lèi)等應(yīng)用領(lǐng)域。相比于其他的分類(lèi)器,深度學(xué)習(xí)不僅可以對(duì)圖像的特征進(jìn)行分類(lèi),還可以通過(guò)訓(xùn)練對(duì)圖像中的特征進(jìn)行學(xué)習(xí)。這種特性對(duì)于一些特征不易描述的圖像分類(lèi)任務(wù)是大有裨益的。
是什么給了深度學(xué)習(xí)如此大的神通呢?這就要從它所特有的卷積神經(jīng)網(wǎng)絡(luò)說(shuō)起了。
常用邊緣提取卷積算法。
卷積是一種積分變換的數(shù)學(xué)方法,在圖像處理中應(yīng)用廣泛。很多我們常用的圖像濾波器都是通過(guò)卷積實(shí)現(xiàn)的。比如使用3x3所有元素全為1的卷積核對(duì)圖像進(jìn)行運(yùn)算后可以去除圖像噪聲,突顯圖像整體特征。又比如使用高斯核對(duì)圖像進(jìn)行運(yùn)算可以在保留邊緣的情況下對(duì)圖像噪聲進(jìn)行抑制。此外許多我們熟知的邊緣提取算法也是由特定卷積核實(shí)現(xiàn)的,如canny,sobel,Laplace等。由此我們不難看出,不同的卷積核可以幫我們強(qiáng)化圖像中不同的特征。但是如何選擇正確的卷積核卻是一件非常困難的事情,需要擁有豐富圖像處理經(jīng)驗(yàn)的程序員才能辦到。而深度學(xué)習(xí)最大優(yōu)勢(shì)就在于可通過(guò)權(quán)值訓(xùn)練的方式對(duì)卷積核進(jìn)行訓(xùn)練。
輸入圖像經(jīng)過(guò)卷積、池化,再卷積再池化的過(guò)程,最后將所有圖像數(shù)據(jù)轉(zhuǎn)化為特征向量并輸入到全連接層獲得最終的分類(lèi)結(jié)果。
一個(gè)卷積神經(jīng)網(wǎng)絡(luò)可以擁有多個(gè)卷積層,不同的卷積層可以設(shè)置不同的卷積核尺寸和數(shù)目。通過(guò)卷積,我們可以生成一組特征圖像供后續(xù)算法使用。與圖像濾波處理不同的是,卷積核中的每一個(gè)元素并非人為指定,而是通過(guò)計(jì)算獲得。在這里我們將卷積核中的每個(gè)元素作為網(wǎng)絡(luò)的權(quán)值,并通過(guò)訓(xùn)練逐步修改它們。理論上來(lái)說(shuō),我們可以把圖像上的每個(gè)像素都作為一個(gè)特征值直接輸入到全連接層中,但是,那樣會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)太過(guò)復(fù)雜。于是我們采用卷積層這種共享權(quán)值的方式簡(jiǎn)化我們的網(wǎng)絡(luò)。我們所說(shuō)的權(quán)值共享,并不是指同一個(gè)卷積核中所有權(quán)值都相同,而是說(shuō)在對(duì)整張圖像進(jìn)行卷積的過(guò)程中卷積核是不變的,圖像中所有像素都享有相同卷積核權(quán)值。通過(guò)權(quán)值共享,可以降低網(wǎng)絡(luò)的訓(xùn)練負(fù)擔(dān),縮短分類(lèi)時(shí)間,使網(wǎng)絡(luò)更加實(shí)用。
一般,在卷積層的后面都會(huì)緊跟著一個(gè)池化層。在池化層中,特征圖像會(huì)被降采樣。降采樣的方法也有很多,比如選取指定范圍內(nèi)數(shù)值最大的特征或者使用該范圍所有特征的平均值作為新特征圖的特征值。
池化層可以幫助我們減少后續(xù)特征圖像的運(yùn)算量。此外,采樣處理相當(dāng)于變相縮小圖像,這也使得在后續(xù)的卷積層中對(duì)圖像概況訓(xùn)練成為可能。例如,在較淺的網(wǎng)絡(luò)中我們可以訓(xùn)練出類(lèi)似sobel的檢測(cè)指定邊緣方向的卷積核,而在較深層則能夠訓(xùn)練出凸顯折線(xiàn)或者其他形狀的卷積核。
在經(jīng)過(guò)一系列的卷積層和池化層后,特征數(shù)據(jù)會(huì)被送入全連接層進(jìn)行分類(lèi)。全連接層是一種被稱(chēng)為多層感知器(MLP)的非線(xiàn)性分類(lèi)器。它具有很好的非線(xiàn)性分類(lèi)能力。拋開(kāi)深度學(xué)習(xí)技術(shù)不談,這種分類(lèi)器也可以單獨(dú)使用,只不過(guò)輸入的特征需要人為提取,而不像卷積神經(jīng)網(wǎng)絡(luò)中由前面的網(wǎng)絡(luò)計(jì)算獲得。通過(guò)全連接層的分類(lèi),我們最終可以獲得樣本被分為所有類(lèi)別的概率,統(tǒng)計(jì)這些概率,我們就可以獲得最終的分類(lèi)結(jié)果。
通過(guò)上文的介紹,相信大家對(duì)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)已經(jīng)有了一定的了解。從網(wǎng)絡(luò)的結(jié)構(gòu)上我們不難看出,卷積神經(jīng)網(wǎng)絡(luò)非常適合進(jìn)行模糊特征的分類(lèi),而合理的網(wǎng)絡(luò)結(jié)構(gòu)以及合適的參數(shù)是網(wǎng)絡(luò)能否成功分類(lèi)的關(guān)鍵。如果你想自己搭建網(wǎng)絡(luò),就要了解網(wǎng)絡(luò)中各層的用途以及相互作用關(guān)系,這需要一定的數(shù)學(xué)功底。當(dāng)然從應(yīng)用角度上來(lái)講,我們可以直接使用別人搭建好的網(wǎng)絡(luò)或者算法庫(kù),已縮短我們的研發(fā)周期。
文章來(lái)源:深視創(chuàng)新
審核編輯:劉清
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4733瀏覽量
100415 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
161文章
4320瀏覽量
119991 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237063 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120889
原文標(biāo)題:深度學(xué)習(xí)算法和傳統(tǒng)機(jī)器視覺(jué)結(jié)合,助力工業(yè)外觀(guān)檢測(cè)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論