對于很多初入學(xué)習(xí)人工智能的學(xué)習(xí)者來說,對人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的概念和區(qū)別還不是很了解,有可能你每天都能聽到這個概念,也經(jīng)常提這個概念,但是你真的懂它們之間的關(guān)系嗎?那么接下來就給大家從概念和特點上進(jìn)行闡述。先看下三者的關(guān)系。
人工智能包括了機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)包括了深度學(xué)習(xí),他們是子類和父類的關(guān)系。
下面這張圖則更加細(xì)分。
什么是人工智能?
人工智能(Artificial Intelligence),英文縮寫為AI。是計算機(jī)科學(xué)的一個分支,二十世紀(jì)七十年代以來被稱為世界三大尖端技術(shù)之一(空間技術(shù)、能源技術(shù)、人工智能)。也被認(rèn)為是二十一世紀(jì)三大尖端技術(shù)(基因工程、納米科學(xué)、人工智能)之一。1956年夏季,以麥卡賽、明斯基、羅切斯特和申農(nóng)等為首的一批有遠(yuǎn)見卓識的年輕科學(xué)家在一起聚會,共同研究和探討用機(jī)器模擬智能的一系列有關(guān)問題,并首次提出了“人工智能”這一術(shù)語,它標(biāo)志著“人工智能”這門新興學(xué)科的正式誕生。人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。數(shù)學(xué)常被認(rèn)為是多種學(xué)科的基礎(chǔ)科學(xué),數(shù)學(xué)也進(jìn)入語言、思維領(lǐng)域,人工智能學(xué)科也必須借用數(shù)學(xué)工具。
人工智能實際應(yīng)用:機(jī)器視覺,指紋識別,人臉識別,視網(wǎng)膜識別,虹膜識別,掌紋識別,專家系統(tǒng),自動規(guī)劃,智能搜索,定理證明,博弈,自動程序設(shè)計,智能控制,機(jī)器人學(xué),語言和圖像理解,遺傳編程等。涉及到哲學(xué)和認(rèn)知科學(xué),數(shù)學(xué),神經(jīng)生理學(xué),心理學(xué),計算機(jī)科學(xué),信息論,控制論,不定性論等學(xué)科。研究范疇包括自然語言處理,知識表現(xiàn),智能搜索,推理,規(guī)劃,機(jī)器學(xué)習(xí),知識獲取,組合調(diào)度問題,感知問題,模式識別,邏輯程序設(shè)計軟計算,不精確和不確定的管理,人工生命,神經(jīng)網(wǎng)絡(luò),復(fù)雜系統(tǒng),遺傳算法等。人工智能目前也分為:強人工智能(BOTTOM-UP AI)和弱人工智能(TOP-DOWN AI),有興趣大家可以自行查看下區(qū)別。
什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)(Machine Learning, ML),是人工智能的核心,屬于人工智能的一個分支,是一個大的領(lǐng)域,是讓計算機(jī)擁有像人一樣的學(xué)習(xí)能力,模擬和實現(xiàn)人的學(xué)習(xí)行為和能力,可以像人一樣具有識別和判斷的能力,可以看作是仿生學(xué)。機(jī)器學(xué)習(xí)的核心就是數(shù)據(jù),算法(模型),算力(計算機(jī)運算能力)。以前也有人工智能,機(jī)器學(xué)習(xí)。不過最近幾年網(wǎng)絡(luò)發(fā)展和大數(shù)據(jù)的積累,使得人工智能能夠在數(shù)據(jù)和高運算能力下發(fā)揮它的作用。機(jī)器學(xué)習(xí)應(yīng)用領(lǐng)域十分廣泛,例如:數(shù)據(jù)挖掘、數(shù)據(jù)分類、計算機(jī)視覺、自然語言處理(NLP)、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰(zhàn)略游戲和機(jī)器人運用等。
李飛飛說,機(jī)器是又快又準(zhǔn)確,但是人類聰明呀!機(jī)器學(xué)習(xí)其實是在總結(jié)數(shù)據(jù),預(yù)測未知。它具有高速的計算能力,我們可以通過不斷的學(xué)習(xí)用它來識別各種植物、動物等,并提高準(zhǔn)確率。
機(jī)器學(xué)習(xí)就是設(shè)計一個算法模型來處理數(shù)據(jù),輸出我們想要的結(jié)果,我們可以針對算法模型進(jìn)行不斷的調(diào)優(yōu),形成更準(zhǔn)確的數(shù)據(jù)處理能力。但這種學(xué)習(xí)不會讓機(jī)器產(chǎn)生意識。
機(jī)器學(xué)習(xí)的工作方式:
選擇數(shù)據(jù):將你的數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)和測試數(shù)據(jù)。
模型數(shù)據(jù):使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型。
驗證模型:使用你的驗證數(shù)據(jù)接入你的模型。
測試模型:使用你的測試數(shù)據(jù)檢查被驗證的模型的表現(xiàn)。
使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測。
調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。
機(jī)器學(xué)習(xí)的分類:
基于學(xué)習(xí)策略的分類
機(jī)械學(xué)習(xí)(Rote learning)
示教學(xué)習(xí)(Learning from instruction或Learning by being told)
演繹學(xué)習(xí)(Learning by deduction)
類比學(xué)習(xí) (Learning by analogy)
基于解釋的學(xué)習(xí)(Explanation-based learning, EBL)
歸納學(xué)習(xí)(Learning from induction)
基于所獲取知識的表示形式分類
代數(shù)表達(dá)式參數(shù)
決策樹
形式文法
產(chǎn)生式規(guī)則
形式邏輯表達(dá)式
圖和網(wǎng)絡(luò)
框架和模式(schema)
計算機(jī)程序和其它的過程編碼
神經(jīng)網(wǎng)絡(luò)
多種表示形式的組合
綜合分類
經(jīng)驗性歸納學(xué)習(xí)(empirical inductive learning)
分析學(xué)習(xí)(analytic learning)
類比學(xué)習(xí)
遺傳算法(genetic algorithm)
聯(lián)接學(xué)習(xí)
增強學(xué)習(xí)(reinforcement learning)
學(xué)習(xí)形式分類
監(jiān)督學(xué)習(xí)(supervised learning)
非監(jiān)督學(xué)習(xí)(unsupervised learning)
細(xì)分的話還有半監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。當(dāng)然,后面的深度學(xué)習(xí)也有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的區(qū)分。
監(jiān)督學(xué)習(xí)(Supervised Learning)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。也就是我們輸入的數(shù)據(jù)是有標(biāo)簽的樣本數(shù)據(jù)(有一個明確的標(biāo)識或結(jié)果、分類)。例如我們輸入了 50000 套房子的數(shù)據(jù),這些數(shù)據(jù)都具有房價這個屬性標(biāo)簽。監(jiān)督學(xué)習(xí)就是人們常說的分類,通過已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對應(yīng)的輸出)去訓(xùn)練得到一個最優(yōu)模型(這個模型屬于某個函數(shù)的集合,最優(yōu)則表示在某個評價準(zhǔn)則下是最佳的)。再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進(jìn)行簡單的判斷從而實現(xiàn)分類的目的。就像我輸入了一個人的信息,他是有性別屬性的。我們輸入我們的模型后,我們就明確的知道了輸出的結(jié)果,也可以驗證模型的對錯。
舉個例子,我們從小并不知道什么是手機(jī)、電視、鳥、豬,那么這些東西就是輸入數(shù)據(jù),而家長會根據(jù)他的經(jīng)驗指點告訴我們哪些是手機(jī)、電視、鳥、豬。這就是通過模型判斷分類。當(dāng)我們掌握了這些數(shù)據(jù)分類模型,我們就可以對這些數(shù)據(jù)進(jìn)行自己的判斷和分類了。
在監(jiān)督式學(xué)習(xí)下,輸入數(shù)據(jù)被稱為“訓(xùn)練數(shù)據(jù)”,每組訓(xùn)練數(shù)據(jù)有一個明確的標(biāo)識或結(jié)果,如對防垃圾郵件系統(tǒng)中“垃圾郵件”“非垃圾郵件”,對手寫數(shù)字識別中的“1“,”2“,”3“,”4“等。在建立預(yù)測模型的時候,監(jiān)督式學(xué)習(xí)建立一個學(xué)習(xí)過程,將預(yù)測結(jié)果與“訓(xùn)練數(shù)據(jù)”的實際結(jié)果進(jìn)行比較,不斷的調(diào)整預(yù)測模型,直到模型的預(yù)測結(jié)果達(dá)到一個預(yù)期的準(zhǔn)確率。監(jiān)督式學(xué)習(xí)的常見應(yīng)用場景如分類問題和回歸問題。常見監(jiān)督式學(xué)習(xí)算法有決策樹(ID3,C4.5算法等),樸素貝葉斯分類器,最小二乘法,邏輯回歸(Logistic Regression),支持向量機(jī)(SVM),K最近鄰算法(KNN,K-NearestNeighbor),線性回歸(LR,Linear Regreesion),人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network),集成學(xué)習(xí)以及反向傳遞神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)等等。下圖是幾種監(jiān)督式學(xué)習(xí)算法的比較:
非監(jiān)督學(xué)習(xí)(Unsupervised Learing)是另一種研究的比較多的學(xué)習(xí)方法,它與監(jiān)督學(xué)習(xí)的不同之處,在于我們事先沒有任何訓(xùn)練樣本,而需要直接對數(shù)據(jù)進(jìn)行建模。是否有監(jiān)督(Supervised),就看輸入數(shù)據(jù)是否有標(biāo)簽(Label)。輸入數(shù)據(jù)有標(biāo)簽(即數(shù)據(jù)有標(biāo)識分類),則為有監(jiān)督學(xué)習(xí),沒標(biāo)簽則為無監(jiān)督學(xué)習(xí)(非監(jiān)督學(xué)習(xí))。在很多實際應(yīng)用中,并沒有大量的標(biāo)識數(shù)據(jù)進(jìn)行使用,并且標(biāo)識數(shù)據(jù)需要大量的人工工作量,非常困難。我們就需要非監(jiān)督學(xué)習(xí)根據(jù)數(shù)據(jù)的相似度,特征及相關(guān)聯(lián)系進(jìn)行模糊判斷分類。
半監(jiān)督學(xué)習(xí)(Semi-supervised Learning)是有標(biāo)簽數(shù)據(jù)的標(biāo)簽不是確定的,類似于:肯定不是某某某,很可能是某某某。是監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的一種學(xué)習(xí)方法。半監(jiān)督學(xué)習(xí)使用大量的未標(biāo)記數(shù)據(jù),以及同時使用標(biāo)記數(shù)據(jù),來進(jìn)行模式識別工作。當(dāng)使用半監(jiān)督學(xué)習(xí)時,將會要求盡量少的人員來從事工作,同時,又能夠帶來比較高的準(zhǔn)確性。
在此學(xué)習(xí)方式下,輸入數(shù)據(jù)部分被標(biāo)識,部分沒有被標(biāo)識,這種學(xué)習(xí)模型可以用來進(jìn)行預(yù)測,但是模型首先需要學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)以便合理的組織數(shù)據(jù)來進(jìn)行預(yù)測。半監(jiān)督學(xué)習(xí)有兩個樣本集,一個有標(biāo)記,一個沒有標(biāo)記。分別記作Lable={(xi,yi)},Unlabled={(xi)},并且數(shù)量,L<
1、單獨使用有標(biāo)記樣本,我們能夠生成有監(jiān)督分類算法
2、單獨使用無標(biāo)記樣本,我們能夠生成無監(jiān)督聚類算法
3、兩者都使用,我們希望在1中加入無標(biāo)記樣本,增強有監(jiān)督分類的效果;同樣的,我們希望在2中加入有標(biāo)記樣本,增強無監(jiān)督聚類的效果
一般而言,半監(jiān)督學(xué)習(xí)側(cè)重于在有監(jiān)督的分類算法中加入無標(biāo)記樣本來實現(xiàn)半監(jiān)督分類,也就是在1中加入無標(biāo)記樣本,增強分類效果[1]。應(yīng)用場景包括分類和回歸,算法包括一些對常用監(jiān)督式學(xué)習(xí)算法的延伸,這些算法首先試圖對未標(biāo)識數(shù)據(jù)進(jìn)行建模,在此基礎(chǔ)上再對標(biāo)識的數(shù)據(jù)進(jìn)行預(yù)測。如自訓(xùn)練算法(self-training)、多視角算法(Multi-View)、生成模型(Enerative Models)、圖論推理算法(Graph Inference)或者拉普拉斯支持向量機(jī)(Laplacian SVM)等。
強化學(xué)習(xí)(Reinforcement Learning)也叫再勵學(xué)習(xí)、評價學(xué)習(xí),在智能控制和機(jī)器人領(lǐng)域有許多應(yīng)用。輸入數(shù)據(jù)作為對模型的反饋,不像監(jiān)督模型那樣,輸入數(shù)據(jù)僅僅是作為一個檢查模型對錯的方式。在強化學(xué)習(xí)下,輸入數(shù)據(jù)直接反饋到模型,模型必須對此立刻作出調(diào)整。常見算法包括 Q-Learning、TD 算法(時間差分學(xué)習(xí),Temporal Difference)、SARSA 算法。
在企業(yè)數(shù)據(jù)應(yīng)用的場景下, 人們最常用的可能就是監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)的模型。 在圖像識別等領(lǐng)域,由于存在大量的非標(biāo)識的數(shù)據(jù)和少量的可標(biāo)識數(shù)據(jù), 目前半監(jiān)督式學(xué)習(xí)是一個很熱的話題。 而強化學(xué)習(xí)更多的應(yīng)用在機(jī)器人控制及其他需要進(jìn)行系統(tǒng)控制的領(lǐng)域。
強化學(xué)習(xí)靈感來源于心理學(xué)中的行為主義理論,即有機(jī)體如何在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預(yù)期,產(chǎn)生能獲得最大利益的習(xí)慣性行為。這個方法具有普適性,因此在其他許多領(lǐng)域都有研究,例如博弈論、控制論、運籌學(xué)、信息論、模擬優(yōu)化方法、多主體系統(tǒng)學(xué)習(xí)、群體智能、統(tǒng)計學(xué)以及遺傳算法。 它的本質(zhì)就是解決“決策(decision making)”問題,即學(xué)會自動進(jìn)行決策。它在沒有任何label告訴算法應(yīng)該怎么做的情況下,通過先嘗試做出一些行為——然后得到一個結(jié)果,通過判斷這個結(jié)果是對還是錯來對之前的行為進(jìn)行反饋。由這個反饋來調(diào)整之前的行為,通過不斷的調(diào)整算法能夠?qū)W習(xí)到在什么樣的情況下選擇什么樣的行為可以得到最好的結(jié)果。
重點:強化學(xué)習(xí)其實就是自動進(jìn)行決策,并且可以做連續(xù)決策。強化學(xué)習(xí)有很多應(yīng)用,比如自動直升機(jī),機(jī)器人控制,市場決策,工業(yè)控制,無人駕駛,AlphaGo,玩游戲,還在制造業(yè)、庫存處理、電商、廣告、推薦、金融、醫(yī)療等與我們生活息息相關(guān)的領(lǐng)域也有應(yīng)用。例如一家日本公司 Fanuc,工廠機(jī)器人在拿起一個物體時,會捕捉這個過程的視頻,記住它每次操作的行動,操作成功還是失敗了,積累經(jīng)驗,下一次可以更快更準(zhǔn)地采取行動。
舉個例子:以小孩學(xué)習(xí)走路為例,走路時候小孩需要知道先進(jìn)行決定先邁那條腿,如果第一步作對了,那么就會得到獎勵,錯了,那么記錄下來,再進(jìn)行第二次走路時候進(jìn)行學(xué)習(xí)更正。又比如在向用戶推薦新聞文章的任務(wù)中,非監(jiān)督式會找到用戶先前已經(jīng)閱讀過類似的文章并向他們推薦其一,而強化學(xué)習(xí)將通過向用戶先推薦少量的新聞,并不斷獲得來自用戶的反饋,最后構(gòu)建用戶可能會喜歡的文章的“知識圖”。
總結(jié):
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的核心就是數(shù)據(jù)、算法(模型函數(shù))、算力(計算機(jī)運算能力)。我們研究的核心就是算法,也就是針對某一應(yīng)用需求場景,選擇各種合適的函數(shù)公式進(jìn)行構(gòu)建和疊加形成一個處理數(shù)據(jù)的模型(也就是常說的訓(xùn)練數(shù)據(jù)模型)。
這個模型的作用是什么?就是能夠?qū)⑽覀兊钠胀〝?shù)據(jù)輸入進(jìn)去,經(jīng)過這個模型處理后,輸出數(shù)據(jù)或者一個結(jié)果,這個輸出的就是供我們參考或者使用的。那我們怎么評判這個模型的好壞?例如每年 ImageNet 都會進(jìn)行比賽,那么評判的結(jié)果就是你這個模型算法進(jìn)行數(shù)據(jù)分析和處理的準(zhǔn)確度。例如人臉識別,有的算法識別率 80%,有的達(dá)到 98%。那么這個高識別率的模型算法就要好一些。我們需要改進(jìn)的也就是這個模型算法(也就是調(diào)優(yōu)),其中就會涉及到權(quán)重(Weight)和損失函數(shù)(Loss)。當(dāng)然損失函數(shù)越低說明我們的算法處理數(shù)據(jù)越接近最佳結(jié)果。
整個流程就是:選擇訓(xùn)練數(shù)據(jù)(用于訓(xùn)練模型)->模型設(shè)計和調(diào)優(yōu)(通過訓(xùn)練數(shù)據(jù)進(jìn)行反復(fù)調(diào)優(yōu))->形成比較準(zhǔn)確的模型->輸入真實數(shù)據(jù)(用于模型進(jìn)行數(shù)據(jù)處理)->模型處理數(shù)據(jù)->輸出處理結(jié)果。
舉個例子:我們進(jìn)行預(yù)測某天天氣的狀況,這是一個需求。某天天氣的狀況,會受到很多因素的影響,例如季節(jié)、地理位置、時間、人為因素等等,這些因素可能會有幾十個。在深度學(xué)習(xí)模型里,這些影響結(jié)果的因素我們稱之為特征。我們可以通過一些有標(biāo)簽的天氣數(shù)據(jù)去輸入到我們的模型里,不斷的給各個特征設(shè)置權(quán)重、損失函數(shù),不斷的進(jìn)行調(diào)優(yōu)。最后形成能夠很好的準(zhǔn)確預(yù)測天氣的一個模型。
我們在進(jìn)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的核心,就是在算法這塊,也就是設(shè)計處理問題(數(shù)據(jù))的模型。模型需要針對不同的問題和需求進(jìn)行合理的選擇或者搭配。會涉及到很多數(shù)學(xué)公式和函數(shù)。其實這些數(shù)學(xué)函數(shù)在一些框架里已經(jīng)囊括了,如tensorflow,python 的 numpy 庫。我們需要的就是通過訓(xùn)練數(shù)據(jù)進(jìn)行模型測試訓(xùn)練,調(diào)優(yōu),再應(yīng)用。先有需求和目的:這個模型是干嘛的,處理什么問題的。輸入的數(shù)據(jù)什么樣的,想要有什么輸出結(jié)果才是最好的,能夠達(dá)到我們想要的目的的。是數(shù)據(jù)和需求驅(qū)動我們選擇什么樣的模型和函數(shù)算法。確定了大概的方案模型和算法函數(shù),我們就要給模型不斷的喂數(shù)據(jù)進(jìn)行調(diào)整優(yōu)化,使他能夠輸出更加準(zhǔn)確的數(shù)據(jù)處理結(jié)果,也就是常說的訓(xùn)練模型。當(dāng)模型通過數(shù)據(jù)訓(xùn)練好了后,我們就可以進(jìn)行應(yīng)用了,喂給它真實的數(shù)據(jù)進(jìn)行處理。
接下來看下深度學(xué)習(xí)。深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)的一種,是它的一個大的分支,深度學(xué)習(xí)的概念由Hinton等人于2006年提出,深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。既然叫做學(xué)習(xí),那么自然與我們?nèi)祟惖膶W(xué)習(xí)過程有相似之處,其實就是仿生學(xué),仿照我們?nèi)祟惔竽X的思維方式以及神經(jīng)網(wǎng)絡(luò)的接收和反饋方式進(jìn)行計算機(jī)模擬深度學(xué)習(xí)的。我們的大腦就是一個深度學(xué)習(xí)的超級計算機(jī)。深度學(xué)習(xí)實際上指的的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),普通神經(jīng)網(wǎng)絡(luò)由于訓(xùn)練代價較高,一般只有3-4層,而深度神經(jīng)網(wǎng)絡(luò)由于采用了特殊的訓(xùn)練方法加上一些技術(shù)算法,可以達(dá)到8-10層。深度神經(jīng)網(wǎng)絡(luò)能夠捕捉到數(shù)據(jù)中的深層聯(lián)系,從而能夠得到更精準(zhǔn)的模型,而這些聯(lián)系不容易被普通的機(jī)器學(xué)習(xí)方法所發(fā)覺。
用官方的含義就是:含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。同機(jī)器學(xué)習(xí)方法一樣,深度機(jī)器學(xué)習(xí)方法也有監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之分.不同的學(xué)習(xí)框架下建立的學(xué)習(xí)模型很是不同.例如,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,簡稱CNNs)就是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,而深度置信網(wǎng)(Deep Belief Nets,簡稱DBNs)就是一種無監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型。
深度學(xué)習(xí)整個過程就是數(shù)據(jù)收集、數(shù)據(jù)清洗處理、傳入數(shù)據(jù)進(jìn)行訓(xùn)練模型和學(xué)習(xí)優(yōu)化、經(jīng)過不斷優(yōu)化調(diào)節(jié)后形成高準(zhǔn)確率的識別分類模型,供相應(yīng)的領(lǐng)域進(jìn)行傳入相關(guān)數(shù)據(jù)進(jìn)行應(yīng)用分類。舉個例子,我們?nèi)祟愒趧偝錾鷷r看到一個手機(jī),那么他是不知道這個是什么的,并且有各種各樣形狀和樣式的手機(jī),此時我們的深度學(xué)習(xí)系統(tǒng)初始狀態(tài)就是這樣的。但是經(jīng)過父母和周圍的分類和指導(dǎo),我們漸漸的知道了這種樣子和形狀、功能的物體是手機(jī),那么我們通過大量的數(shù)據(jù)就具有了學(xué)習(xí)和分辨手機(jī)的能力模型,那么這就是我們的深度學(xué)習(xí)系統(tǒng)在經(jīng)過數(shù)據(jù)和算法訓(xùn)練后所具備的功能和學(xué)習(xí)能力。就是這么簡單,可以說就是仿生學(xué)。
2017年CCF青年精英大會,香港中文大學(xué)教授湯曉鷗指出,深度學(xué)習(xí)的三大核心要素,就是算法設(shè)計、高性能的計算能力、大數(shù)據(jù)。我覺得應(yīng)該按照這個順序排序:大數(shù)據(jù)、算法設(shè)計、高性能的計算能力。
例如深度學(xué)習(xí)在語音識別和自然語言領(lǐng)域,微軟研究人員通過與hinton合作,首先將RBM和DBN引入到語音識別聲學(xué)模型訓(xùn)練中,并且在大詞匯量語音識別系統(tǒng)中獲得巨大成功,使得語音識別的錯誤率相對減低30%。但是,DNN還沒有有效的并行快速算法,很多研究機(jī)構(gòu)都是在利用大規(guī)模數(shù)據(jù)語料通過GPU平臺提高DNN聲學(xué)模型的訓(xùn)練效率。在國際上,IBM、google等公司都快速進(jìn)行了DNN語音識別的研究,并且速度飛快。國內(nèi)方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進(jìn)行深度學(xué)習(xí)在語音識別上的研究。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132312 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120890
原文標(biāo)題:機(jī)器學(xué)習(xí)和深度學(xué)習(xí)概念入門
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論