宜家家具有多種不同的組裝方法。在理想情況下,每種方法都可以組裝出完整的沙發(fā)或椅子。但是,根據(jù)細(xì)節(jié)的不同,每種產(chǎn)品的組裝都有最適用的方法。如果拿到說(shuō)明手冊(cè)和所有正確的零件,就只需按照指示操作即可。如果你已經(jīng)找到了竅門(mén),不妨把手冊(cè)扔到一邊,試試獨(dú)自操作。
深度學(xué)習(xí)也是如此?;诳捎脭?shù)據(jù)的類型和正在研究的問(wèn)題,科學(xué)家將選擇特定的學(xué)習(xí)模型來(lái)訓(xùn)練算法。
在監(jiān)督式學(xué)習(xí)模型中,算法基于有標(biāo)記的數(shù)據(jù)集進(jìn)行學(xué)習(xí),同時(shí)數(shù)據(jù)集提供答案,算法可利用該答案來(lái)評(píng)估其在訓(xùn)練數(shù)據(jù)方面的準(zhǔn)確性。相比之下,無(wú)監(jiān)督式模型使用的是無(wú)標(biāo)記數(shù)據(jù),算法需要自行提取特征和規(guī)律來(lái)理解這些數(shù)據(jù)。半監(jiān)督式學(xué)習(xí)居于二者之間:這種方法使用少量有標(biāo)記的數(shù)據(jù)來(lái)支持大量無(wú)標(biāo)記數(shù)據(jù)。
增強(qiáng)學(xué)習(xí)模型一般用來(lái)訓(xùn)練帶有獎(jiǎng)勵(lì)系統(tǒng)的算法。在特定情況下,如果AI Agent執(zhí)行了最佳的操作,增強(qiáng)學(xué)習(xí)模型會(huì)提供一定反饋。
下面我們來(lái)了解一下適用于每種學(xué)習(xí)模式的數(shù)據(jù)集和問(wèn)題類型。
什么是監(jiān)督式學(xué)習(xí)?
如果您在別人的監(jiān)督之下學(xué)習(xí),有人會(huì)當(dāng)場(chǎng)評(píng)判您是否得出了正確答案。同樣,在監(jiān)督式學(xué)習(xí)中,訓(xùn)練算法時(shí)同樣需要一整套帶有標(biāo)記的數(shù)據(jù)。
完全標(biāo)記意味著訓(xùn)練數(shù)據(jù)集中的每個(gè)示例都標(biāo)記相對(duì)應(yīng)的答案。因此,一個(gè)由花朵圖像組成的有標(biāo)記數(shù)據(jù)集會(huì)告知模型哪些圖片是玫瑰、哪些圖片是雛菊或者水仙。在“看到”新圖像時(shí),模型會(huì)將其與訓(xùn)練示例進(jìn)行比較,以給出正確的標(biāo)記。
在監(jiān)督式機(jī)器學(xué)習(xí)中,算法需要通過(guò)有標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。
監(jiān)督式學(xué)習(xí)有兩個(gè)主要的應(yīng)用領(lǐng)域:分類問(wèn)題和回歸問(wèn)題。
分類問(wèn)題要求算法可以預(yù)測(cè)離散值,將輸入數(shù)據(jù)標(biāo)識(shí)為特定類或組的成員。在由動(dòng)物圖像組成的訓(xùn)練數(shù)據(jù)集中,這意味著每張照片已被預(yù)先標(biāo)記為貓、考拉或海龜?shù)?。然后,算法的評(píng)估標(biāo)準(zhǔn)為,算法對(duì)其他考拉和海龜?shù)男聢D像進(jìn)行分類的準(zhǔn)確程度。
上圖顯示的是貓、考拉還是海龜?分類算法可以區(qū)分差異。
回歸問(wèn)題則要求算法基于連續(xù)數(shù)據(jù)。比如線性回歸:給出一個(gè)特定的x值,求y變量的值。
更貼近現(xiàn)實(shí)的機(jī)器學(xué)習(xí)示例涉及許多變量,例如根據(jù)建筑面積、位置和距離公共交通的遠(yuǎn)近來(lái)預(yù)測(cè)舊金山公寓價(jià)格的算法。
因此,監(jiān)督式學(xué)習(xí)最適合具有一系列可用參考點(diǎn)或真實(shí)值來(lái)訓(xùn)練算法的問(wèn)題。但那些數(shù)據(jù)并不總是現(xiàn)成可用的。
什么是無(wú)監(jiān)督式學(xué)習(xí)?
清晰、完美標(biāo)記的數(shù)據(jù)集并不容易獲得。有時(shí),研究人員會(huì)向算法詢問(wèn)一些他們未知的問(wèn)題。而這正是無(wú)監(jiān)督式學(xué)習(xí)可以發(fā)揮作用的地方。
在無(wú)監(jiān)督式學(xué)習(xí)中,深度學(xué)習(xí)模型會(huì)收到某個(gè)數(shù)據(jù)集,但對(duì)于如何處理該數(shù)據(jù)集卻未獲得明確的指示。訓(xùn)練數(shù)據(jù)集是沒(méi)有特定預(yù)期結(jié)果或正確答案的示例的集合。然后,神經(jīng)網(wǎng)絡(luò)嘗試通過(guò)提取有用的特征并分析其結(jié)構(gòu)來(lái)自動(dòng)發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)。
無(wú)監(jiān)督式學(xué)習(xí)模型自動(dòng)提取特征并在數(shù)據(jù)中找到規(guī)律。
根據(jù)所研究的問(wèn)題,無(wú)監(jiān)督式學(xué)習(xí)模型可以用不同的方式組織數(shù)據(jù)。
聚類:即使不是專業(yè)的鳥(niǎo)類學(xué)家,我們也可以觀察一系列鳥(niǎo)類照片,并根據(jù)其羽毛的顏色、體態(tài)的大小或喙形等線索,對(duì)照片進(jìn)行粗略的對(duì)比分類。這正是聚類這一無(wú)監(jiān)督式學(xué)習(xí)的最常見(jiàn)應(yīng)用類型的運(yùn)作方式:深度學(xué)習(xí)模型尋找相似的訓(xùn)練數(shù)據(jù)并將它們分為一組。
異常檢測(cè):銀行通過(guò)尋找客戶購(gòu)買行為中不尋常的模式來(lái)偵查欺詐交易。例如,如果同一張信用卡于同一天在加利福尼亞和丹麥?zhǔn)褂茫蔷蜁?huì)引起懷疑。同理,無(wú)監(jiān)督式學(xué)習(xí)還可用來(lái)標(biāo)記數(shù)據(jù)集中的異常值。
關(guān)聯(lián):如果您的網(wǎng)上購(gòu)物車?yán)镉心虿?、蘋(píng)果醬和吸管杯,網(wǎng)站可能會(huì)建議您在訂單中添加圍嘴和嬰兒監(jiān)視器。這是一個(gè)關(guān)聯(lián)示例,其中數(shù)據(jù)樣本的某些特征與其他特征相關(guān)聯(lián)。通過(guò)查看某個(gè)數(shù)據(jù)的幾個(gè)關(guān)鍵屬性,無(wú)監(jiān)督式學(xué)習(xí)模型可以預(yù)測(cè)它們通常關(guān)聯(lián)的其他屬性。
自動(dòng)編碼器:自動(dòng)編碼器會(huì)接收輸入數(shù)據(jù),將其壓縮為代碼,然后設(shè)法使用這些匯總結(jié)的代碼重新創(chuàng)建輸入數(shù)據(jù)。這就像從《白鯨記》開(kāi)始,創(chuàng)建SparkNotes版本,然后設(shè)法使用SparkNotes重寫(xiě)原始故事,并作為參考。雖然這是一項(xiàng)簡(jiǎn)便易行的深度學(xué)習(xí)技巧,但讓簡(jiǎn)單的自動(dòng)編碼器發(fā)揮作用的現(xiàn)實(shí)用例卻很少。但是,如果增添一層復(fù)雜性,自動(dòng)編碼器的使用效果就會(huì)成倍增加:通過(guò)在訓(xùn)練期間同時(shí)使用雜亂版本和整潔版本的圖像,自動(dòng)編碼器可以消除圖像、視頻或醫(yī)學(xué)掃描圖等視覺(jué)數(shù)據(jù)中的雜點(diǎn),從而提高圖像質(zhì)量。
由于數(shù)據(jù)中不存在“真值”元素,因此很難衡量使用無(wú)監(jiān)督式學(xué)習(xí)訓(xùn)練的算法的準(zhǔn)確性。但在許多研究領(lǐng)域中,有標(biāo)記數(shù)據(jù)要么難以獲得,要么過(guò)于昂貴。在這些情況下,允許深度學(xué)習(xí)模型完全自由地尋找相關(guān)規(guī)律,可以產(chǎn)生高質(zhì)量的結(jié)果。
什么是半監(jiān)督式學(xué)習(xí)?
可以將半監(jiān)督式學(xué)習(xí)視為一種折衷辦法。
在很大程度上,半監(jiān)督式學(xué)習(xí)的含義正如其名:同時(shí)含有標(biāo)記數(shù)據(jù)和無(wú)標(biāo)記數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集。在從數(shù)據(jù)中提取相關(guān)特征存在困難以及標(biāo)記示例對(duì)專家來(lái)說(shuō)非常耗時(shí)的情況下,這種方法特別有用。
半監(jiān)督式學(xué)習(xí)對(duì)于醫(yī)學(xué)影像尤其有用,在此類影像中,少量有標(biāo)記數(shù)據(jù)可以顯著提高準(zhǔn)確性。
這類學(xué)習(xí)的常見(jiàn)應(yīng)用情境是CT掃描或核磁共振成像 (MRI) 等醫(yī)學(xué)影像。受過(guò)培訓(xùn)的放射科醫(yī)生可以檢查并標(biāo)記腫瘤或疾病的一小部分掃描結(jié)果。但是,手動(dòng)標(biāo)記所有掃描結(jié)果會(huì)花費(fèi)大量的時(shí)間和成本。不過(guò)與完全無(wú)監(jiān)督式模型相比,半監(jiān)督式學(xué)習(xí)中的深度學(xué)習(xí)網(wǎng)絡(luò)仍然可以從小比例的有標(biāo)記數(shù)據(jù)中受益,并提高其數(shù)據(jù)的準(zhǔn)確性。
一種熱門(mén)的訓(xùn)練方法是從一小組有標(biāo)記數(shù)據(jù)開(kāi)始訓(xùn)練,并使用生成式對(duì)抗網(wǎng)絡(luò) (GAN)。
處于競(jìng)爭(zhēng)狀態(tài)的兩個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)都試圖超越對(duì)方,這就是 GAN。其中一個(gè)網(wǎng)絡(luò)名為生成器(generator),試圖創(chuàng)建新數(shù)據(jù)點(diǎn)來(lái)模擬訓(xùn)練數(shù)據(jù)。另一個(gè)網(wǎng)絡(luò)名為鑒別器(discriminator),它會(huì)接收這些新生成的數(shù)據(jù),并評(píng)估它們是訓(xùn)練數(shù)據(jù)的一部分還是虛假數(shù)據(jù)。由于鑒別器可越來(lái)越準(zhǔn)確地區(qū)分虛假數(shù)據(jù)和原始數(shù)據(jù),生成器則提高了其生成令人信服的虛假數(shù)據(jù)的能力,兩種網(wǎng)絡(luò)在正反饋回路中得到改善。
這就是 GAN 的工作原理:標(biāo)記為“D”的鑒別器顯示來(lái)自生成器“G”和訓(xùn)練數(shù)據(jù)集的圖像。鑒別器的任務(wù)是確定來(lái)自生成器的圖像哪些是真實(shí)的、哪些是虛假的。
什么是增強(qiáng)學(xué)習(xí)?
視頻游戲中充滿了增強(qiáng)提示:通過(guò)一關(guān)即可獲得一個(gè)徽章;使用一定數(shù)量的動(dòng)作擊敗壞人即可贏得獎(jiǎng)金;倘若不慎落入陷阱,則游戲結(jié)束。
這些提示可幫助玩家學(xué)習(xí)如何在下一局游戲中有更好的表現(xiàn)。如果沒(méi)有這些反饋,他們只會(huì)在游戲環(huán)境中采取隨機(jī)行動(dòng)。
增強(qiáng)學(xué)習(xí)的運(yùn)作原理與此相同,而視頻游戲則是這類研究的日常測(cè)試環(huán)境。
在這種機(jī)器學(xué)習(xí)中,AI Agent試圖找到實(shí)現(xiàn)特定目標(biāo)的最佳方式或改進(jìn)特定任務(wù)的最優(yōu)方法。當(dāng)Agent采取的行動(dòng)有助實(shí)現(xiàn)目標(biāo)時(shí),它會(huì)獲得獎(jiǎng)勵(lì)??傮w目標(biāo)是預(yù)測(cè)下一步要采取的最佳措施以獲得最終大獎(jiǎng)。
Agent可以從過(guò)去的反饋中吸取教訓(xùn),并探索可能帶來(lái)更大收益的新策略,從而做出選擇。當(dāng)然,正如國(guó)際象棋比賽中短期的移動(dòng)可能無(wú)法助您長(zhǎng)遠(yuǎn)獲得勝利一樣,Agent也會(huì)制定長(zhǎng)期戰(zhàn)略計(jì)劃,最大限度地提高累積的獎(jiǎng)勵(lì)。
這是一個(gè)迭代的過(guò)程:反饋次數(shù)越多,Agent制定的策略就會(huì)越好。這種技術(shù)對(duì)于訓(xùn)練機(jī)器人特別有用,機(jī)器人要在諸如控制自動(dòng)駕駛汽車或管理倉(cāng)庫(kù)中的庫(kù)存等任務(wù)中做出一系列決策。
其實(shí)每種算法都有不同的學(xué)習(xí)方式,您只需選擇最佳方式來(lái)幫助神經(jīng)網(wǎng)絡(luò)掌握訣竅即可。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4717瀏覽量
100003 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1197瀏覽量
24537 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5422瀏覽量
120591
原文標(biāo)題:監(jiān)督式學(xué)習(xí)、無(wú)監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)和增強(qiáng)學(xué)習(xí)之間有何區(qū)別?
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論