機(jī)器學(xué)習(xí)的本質(zhì),其實(shí)就是模仿人類大腦進(jìn)行學(xué)習(xí)的過(guò)程,通過(guò)讓機(jī)器模仿這種學(xué)習(xí)過(guò)程實(shí)現(xiàn)所謂的“智能”。
經(jīng)過(guò)近幾十年的發(fā)展,機(jī)器學(xué)習(xí)的方法也越來(lái)越成熟,主要有以下幾種:
- 監(jiān)督學(xué)習(xí)
- 無(wú)監(jiān)督學(xué)習(xí)
- 強(qiáng)化學(xué)習(xí)
- 深度學(xué)習(xí)
- 深度強(qiáng)化學(xué)習(xí)
如上圖所示,機(jī)器學(xué)習(xí)是從左往右的發(fā)展方向,每一階段的學(xué)習(xí)方法都比上一代優(yōu)秀了很多。
下面簡(jiǎn)單介紹這幾種機(jī)器學(xué)習(xí)方法的工作原理。
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)指的是讓機(jī)器從現(xiàn)有的標(biāo)注好的已知數(shù)據(jù)中學(xué)習(xí)預(yù)測(cè)模型的學(xué)習(xí)方法。
簡(jiǎn)單來(lái)說(shuō),先給定計(jì)算機(jī)一組標(biāo)記好的數(shù)據(jù),讓計(jì)算機(jī)用回歸或分類的方法計(jì)算出數(shù)據(jù)與標(biāo)記之間的經(jīng)驗(yàn)關(guān)系。
通過(guò)這種方式,計(jì)算機(jī)最終會(huì)得出一個(gè)預(yù)測(cè)模型,訓(xùn)練數(shù)據(jù)越多,預(yù)測(cè)模型越準(zhǔn)確。
而所謂的“回歸”和“分類”方法,是計(jì)算機(jī)的兩種尋找規(guī)律的方式。具體如下:
回歸方法
計(jì)算機(jī)通過(guò)給定的標(biāo)記與數(shù)據(jù)之間的特征值,計(jì)算出標(biāo)記與數(shù)據(jù)之間的經(jīng)驗(yàn)關(guān)系。
這種方法最終得到的預(yù)測(cè)模型其實(shí)就是“經(jīng)驗(yàn)關(guān)系”。當(dāng)訓(xùn)練完成,你可以使用模型對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè),以此來(lái)測(cè)試計(jì)算機(jī)是否已經(jīng)學(xué)習(xí)到了。
分類方法
分類方法指的是讓計(jì)算機(jī)將性質(zhì)相似的數(shù)據(jù)分類為一個(gè)組。這種方法得到的模型是一個(gè)分類器。
訓(xùn)練完成后,你可以使用未知數(shù)據(jù)讓分類器進(jìn)行分類,根據(jù)分類結(jié)果判斷計(jì)算機(jī)的預(yù)測(cè)精度水平。
監(jiān)督學(xué)習(xí)的方法包括:KNN、SVN等。
無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)是相對(duì)于監(jiān)督學(xué)習(xí)來(lái)講的,是對(duì)監(jiān)督學(xué)習(xí)的升級(jí)版。
無(wú)監(jiān)督學(xué)習(xí)指的是從無(wú)標(biāo)注的數(shù)據(jù)集中學(xué)習(xí)預(yù)測(cè)模型的方法。
監(jiān)督學(xué)習(xí)需要給計(jì)算機(jī)標(biāo)記好的訓(xùn)練集,而無(wú)監(jiān)督學(xué)習(xí)不需要人工標(biāo)記訓(xùn)練集,計(jì)算機(jī)會(huì)根據(jù)現(xiàn)有的數(shù)據(jù)集的特征,自動(dòng)對(duì)數(shù)據(jù)集進(jìn)行分類。
無(wú)監(jiān)督學(xué)習(xí)的方法有:聚類、K均值、PCA等
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)最大的區(qū)別,就是它不是一個(gè)分類任務(wù)。
強(qiáng)化學(xué)習(xí)訓(xùn)練時(shí),需要環(huán)境給予反饋,以及對(duì)應(yīng)具體的反饋值。通過(guò)反饋值告訴預(yù)測(cè)模型預(yù)測(cè)結(jié)果是“好”還是“壞”,然后通過(guò)外界的反饋結(jié)果調(diào)整預(yù)測(cè)模型。
深度學(xué)習(xí)
深度學(xué)習(xí)是無(wú)監(jiān)督學(xué)習(xí)的一種,它模仿的是人類大腦神經(jīng)網(wǎng)絡(luò)。
常用的深度學(xué)習(xí)方法有深度神經(jīng)網(wǎng)絡(luò)、深度信念網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等。
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
深度強(qiáng)化學(xué)習(xí)
深度學(xué)習(xí)具有較強(qiáng)的感知能力,但是缺乏一定的決策能力;而強(qiáng)化學(xué)習(xí)具有決策能力,對(duì)感知問(wèn)題束手無(wú)策。因此,深度強(qiáng)化學(xué)習(xí)將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合,優(yōu)勢(shì)互補(bǔ),為復(fù)雜系統(tǒng)的感知決策問(wèn)題提供了解決思路。
該技術(shù)在機(jī)器人、視頻游戲、金融和醫(yī)療領(lǐng)域取得了巨大成功。許多以前無(wú)法解決的問(wèn)題現(xiàn)在通過(guò)創(chuàng)建DRL模型得到了解決。
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7360瀏覽量
87632 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132312 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120890
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論