0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解一下適用于每種學(xué)習(xí)模式的數(shù)據(jù)集和問(wèn)題類型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-06 16:15 ? 次閱讀

宜家家具有多種不同的組裝方法。在理想情況下,每種方法都可以組裝出完整的沙發(fā)或椅子。但是,根據(jù)細(xì)節(jié)的不同,每種產(chǎn)品的組裝都有最適用的方法。如果拿到說(shuō)明手冊(cè)和所有正確的零件,就只需按照指示操作即可。如果你已經(jīng)找到了竅門(mén),不妨把手冊(cè)扔到一邊,試試獨(dú)自操作。

深度學(xué)習(xí)也是如此?;诳捎脭?shù)據(jù)的類型和正在研究的問(wèn)題,科學(xué)家將選擇特定的學(xué)習(xí)模型來(lái)訓(xùn)練算法

在監(jiān)督式學(xué)習(xí)模型中,算法基于有標(biāo)記的數(shù)據(jù)集進(jìn)行學(xué)習(xí),同時(shí)數(shù)據(jù)集提供答案,算法可利用該答案來(lái)評(píng)估其在訓(xùn)練數(shù)據(jù)方面的準(zhǔn)確性。相比之下,無(wú)監(jiān)督式模型使用的是無(wú)標(biāo)記數(shù)據(jù),算法需要自行提取特征和規(guī)律來(lái)理解這些數(shù)據(jù)。半監(jiān)督式學(xué)習(xí)居于二者之間:這種方法使用少量有標(biāo)記的數(shù)據(jù)來(lái)支持大量無(wú)標(biāo)記數(shù)據(jù)。

增強(qiáng)學(xué)習(xí)模型一般用來(lái)訓(xùn)練帶有獎(jiǎng)勵(lì)系統(tǒng)的算法。在特定情況下,如果AI Agent執(zhí)行了最佳的操作,增強(qiáng)學(xué)習(xí)模型會(huì)提供一定反饋。

下面我們來(lái)了解一下適用于每種學(xué)習(xí)模式的數(shù)據(jù)集和問(wèn)題類型。

什么是監(jiān)督式學(xué)習(xí)?

如果您在別人的監(jiān)督之下學(xué)習(xí),有人會(huì)當(dāng)場(chǎng)評(píng)判您是否得出了正確答案。同樣,在監(jiān)督式學(xué)習(xí)中,訓(xùn)練算法時(shí)同樣需要一整套帶有標(biāo)記的數(shù)據(jù)。

完全標(biāo)記意味著訓(xùn)練數(shù)據(jù)集中的每個(gè)示例都標(biāo)記相對(duì)應(yīng)的答案。因此,一個(gè)由花朵圖像組成的有標(biāo)記數(shù)據(jù)集會(huì)告知模型哪些圖片是玫瑰、哪些圖片是雛菊或者水仙。在“看到”新圖像時(shí),模型會(huì)將其與訓(xùn)練示例進(jìn)行比較,以給出正確的標(biāo)記。

在監(jiān)督式機(jī)器學(xué)習(xí)中,算法需要通過(guò)有標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。

監(jiān)督式學(xué)習(xí)有兩個(gè)主要的應(yīng)用領(lǐng)域:分類問(wèn)題和回歸問(wèn)題。

分類問(wèn)題要求算法可以預(yù)測(cè)離散值,將輸入數(shù)據(jù)標(biāo)識(shí)為特定類或組的成員。在由動(dòng)物圖像組成的訓(xùn)練數(shù)據(jù)集中,這意味著每張照片已被預(yù)先標(biāo)記為貓、考拉或海龜?shù)?。然后,算法的評(píng)估標(biāo)準(zhǔn)為,算法對(duì)其他考拉和海龜?shù)男聢D像進(jìn)行分類的準(zhǔn)確程度。

上圖顯示的是貓、考拉還是海龜?分類算法可以區(qū)分差異。

回歸問(wèn)題則要求算法基于連續(xù)數(shù)據(jù)。比如線性回歸:給出一個(gè)特定的x值,求y變量的值。

更貼近現(xiàn)實(shí)的機(jī)器學(xué)習(xí)示例涉及許多變量,例如根據(jù)建筑面積、位置和距離公共交通的遠(yuǎn)近來(lái)預(yù)測(cè)舊金山公寓價(jià)格的算法。

因此,監(jiān)督式學(xué)習(xí)最適合具有一系列可用參考點(diǎn)或真實(shí)值來(lái)訓(xùn)練算法的問(wèn)題。但那些數(shù)據(jù)并不總是現(xiàn)成可用的。

什么是無(wú)監(jiān)督式學(xué)習(xí)?

清晰、完美標(biāo)記的數(shù)據(jù)集并不容易獲得。有時(shí),研究人員會(huì)向算法詢問(wèn)一些他們未知的問(wèn)題。而這正是無(wú)監(jiān)督式學(xué)習(xí)可以發(fā)揮作用的地方。

在無(wú)監(jiān)督式學(xué)習(xí)中,深度學(xué)習(xí)模型會(huì)收到某個(gè)數(shù)據(jù)集,但對(duì)于如何處理該數(shù)據(jù)集卻未獲得明確的指示。訓(xùn)練數(shù)據(jù)集是沒(méi)有特定預(yù)期結(jié)果或正確答案的示例的集合。然后,神經(jīng)網(wǎng)絡(luò)嘗試通過(guò)提取有用的特征并分析其結(jié)構(gòu)來(lái)自動(dòng)發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)。

無(wú)監(jiān)督式學(xué)習(xí)模型自動(dòng)提取特征并在數(shù)據(jù)中找到規(guī)律。

根據(jù)所研究的問(wèn)題,無(wú)監(jiān)督式學(xué)習(xí)模型可以用不同的方式組織數(shù)據(jù)。

聚類:即使不是專業(yè)的鳥(niǎo)類學(xué)家,我們也可以觀察一系列鳥(niǎo)類照片,并根據(jù)其羽毛的顏色、體態(tài)的大小或喙形等線索,對(duì)照片進(jìn)行粗略的對(duì)比分類。這正是聚類這一無(wú)監(jiān)督式學(xué)習(xí)的最常見(jiàn)應(yīng)用類型的運(yùn)作方式:深度學(xué)習(xí)模型尋找相似的訓(xùn)練數(shù)據(jù)并將它們分為一組。

異常檢測(cè):銀行通過(guò)尋找客戶購(gòu)買行為中不尋常的模式來(lái)偵查欺詐交易。例如,如果同一張信用卡于同一天在加利福尼亞和丹麥?zhǔn)褂茫蔷蜁?huì)引起懷疑。同理,無(wú)監(jiān)督式學(xué)習(xí)還可用來(lái)標(biāo)記數(shù)據(jù)集中的異常值。

關(guān)聯(lián):如果您的網(wǎng)上購(gòu)物車?yán)镉心虿?、蘋(píng)果醬和吸管杯,網(wǎng)站可能會(huì)建議您在訂單中添加圍嘴和嬰兒監(jiān)視器。這是一個(gè)關(guān)聯(lián)示例,其中數(shù)據(jù)樣本的某些特征與其他特征相關(guān)聯(lián)。通過(guò)查看某個(gè)數(shù)據(jù)的幾個(gè)關(guān)鍵屬性,無(wú)監(jiān)督式學(xué)習(xí)模型可以預(yù)測(cè)它們通常關(guān)聯(lián)的其他屬性。

自動(dòng)編碼器:自動(dòng)編碼器會(huì)接收輸入數(shù)據(jù),將其壓縮為代碼,然后設(shè)法使用這些匯總結(jié)的代碼重新創(chuàng)建輸入數(shù)據(jù)。這就像從《白鯨記》開(kāi)始,創(chuàng)建SparkNotes版本,然后設(shè)法使用SparkNotes重寫(xiě)原始故事,并作為參考。雖然這是一項(xiàng)簡(jiǎn)便易行的深度學(xué)習(xí)技巧,但讓簡(jiǎn)單的自動(dòng)編碼器發(fā)揮作用的現(xiàn)實(shí)用例卻很少。但是,如果增添一層復(fù)雜性,自動(dòng)編碼器的使用效果就會(huì)成倍增加:通過(guò)在訓(xùn)練期間同時(shí)使用雜亂版本和整潔版本的圖像,自動(dòng)編碼器可以消除圖像、視頻或醫(yī)學(xué)掃描圖等視覺(jué)數(shù)據(jù)中的雜點(diǎn),從而提高圖像質(zhì)量。

由于數(shù)據(jù)中不存在“真值”元素,因此很難衡量使用無(wú)監(jiān)督式學(xué)習(xí)訓(xùn)練的算法的準(zhǔn)確性。但在許多研究領(lǐng)域中,有標(biāo)記數(shù)據(jù)要么難以獲得,要么過(guò)于昂貴。在這些情況下,允許深度學(xué)習(xí)模型完全自由地尋找相關(guān)規(guī)律,可以產(chǎn)生高質(zhì)量的結(jié)果。

什么是半監(jiān)督式學(xué)習(xí)?

可以將半監(jiān)督式學(xué)習(xí)視為一種折衷辦法。

在很大程度上,半監(jiān)督式學(xué)習(xí)的含義正如其名:同時(shí)含有標(biāo)記數(shù)據(jù)和無(wú)標(biāo)記數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集。在從數(shù)據(jù)中提取相關(guān)特征存在困難以及標(biāo)記示例對(duì)專家來(lái)說(shuō)非常耗時(shí)的情況下,這種方法特別有用。

半監(jiān)督式學(xué)習(xí)對(duì)于醫(yī)學(xué)影像尤其有用,在此類影像中,少量有標(biāo)記數(shù)據(jù)可以顯著提高準(zhǔn)確性。

這類學(xué)習(xí)的常見(jiàn)應(yīng)用情境是CT掃描或核磁共振成像 (MRI) 等醫(yī)學(xué)影像。受過(guò)培訓(xùn)的放射科醫(yī)生可以檢查并標(biāo)記腫瘤或疾病的一小部分掃描結(jié)果。但是,手動(dòng)標(biāo)記所有掃描結(jié)果會(huì)花費(fèi)大量的時(shí)間和成本。不過(guò)與完全無(wú)監(jiān)督式模型相比,半監(jiān)督式學(xué)習(xí)中的深度學(xué)習(xí)網(wǎng)絡(luò)仍然可以從小比例的有標(biāo)記數(shù)據(jù)中受益,并提高其數(shù)據(jù)的準(zhǔn)確性。

一種熱門(mén)的訓(xùn)練方法是從一小組有標(biāo)記數(shù)據(jù)開(kāi)始訓(xùn)練,并使用生成式對(duì)抗網(wǎng)絡(luò) (GAN)。

處于競(jìng)爭(zhēng)狀態(tài)的兩個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)都試圖超越對(duì)方,這就是 GAN。其中一個(gè)網(wǎng)絡(luò)名為生成器(generator),試圖創(chuàng)建新數(shù)據(jù)點(diǎn)來(lái)模擬訓(xùn)練數(shù)據(jù)。另一個(gè)網(wǎng)絡(luò)名為鑒別器(discriminator),它會(huì)接收這些新生成的數(shù)據(jù),并評(píng)估它們是訓(xùn)練數(shù)據(jù)的一部分還是虛假數(shù)據(jù)。由于鑒別器可越來(lái)越準(zhǔn)確地區(qū)分虛假數(shù)據(jù)和原始數(shù)據(jù),生成器則提高了其生成令人信服的虛假數(shù)據(jù)的能力,兩種網(wǎng)絡(luò)在正反饋回路中得到改善。

這就是 GAN 的工作原理:標(biāo)記為“D”的鑒別器顯示來(lái)自生成器“G”和訓(xùn)練數(shù)據(jù)集的圖像。鑒別器的任務(wù)是確定來(lái)自生成器的圖像哪些是真實(shí)的、哪些是虛假的。

什么是增強(qiáng)學(xué)習(xí)?

視頻游戲中充滿了增強(qiáng)提示:通過(guò)一關(guān)即可獲得一個(gè)徽章;使用一定數(shù)量的動(dòng)作擊敗壞人即可贏得獎(jiǎng)金;倘若不慎落入陷阱,則游戲結(jié)束。

這些提示可幫助玩家學(xué)習(xí)如何在下一局游戲中有更好的表現(xiàn)。如果沒(méi)有這些反饋,他們只會(huì)在游戲環(huán)境中采取隨機(jī)行動(dòng)。

增強(qiáng)學(xué)習(xí)的運(yùn)作原理與此相同,而視頻游戲則是這類研究的日常測(cè)試環(huán)境。

在這種機(jī)器學(xué)習(xí)中,AI Agent試圖找到實(shí)現(xiàn)特定目標(biāo)的最佳方式或改進(jìn)特定任務(wù)的最優(yōu)方法。當(dāng)Agent采取的行動(dòng)有助實(shí)現(xiàn)目標(biāo)時(shí),它會(huì)獲得獎(jiǎng)勵(lì)??傮w目標(biāo)是預(yù)測(cè)下一步要采取的最佳措施以獲得最終大獎(jiǎng)。

Agent可以從過(guò)去的反饋中吸取教訓(xùn),并探索可能帶來(lái)更大收益的新策略,從而做出選擇。當(dāng)然,正如國(guó)際象棋比賽中短期的移動(dòng)可能無(wú)法助您長(zhǎng)遠(yuǎn)獲得勝利一樣,Agent也會(huì)制定長(zhǎng)期戰(zhàn)略計(jì)劃,最大限度地提高累積的獎(jiǎng)勵(lì)。

這是一個(gè)迭代的過(guò)程:反饋次數(shù)越多,Agent制定的策略就會(huì)越好。這種技術(shù)對(duì)于訓(xùn)練機(jī)器人特別有用,機(jī)器人要在諸如控制自動(dòng)駕駛汽車或管理倉(cāng)庫(kù)中的庫(kù)存等任務(wù)中做出一系列決策。

其實(shí)每種算法都有不同的學(xué)習(xí)方式,您只需選擇最佳方式來(lái)幫助神經(jīng)網(wǎng)絡(luò)掌握訣竅即可。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:監(jiān)督式學(xué)習(xí)、無(wú)監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)和增強(qiáng)學(xué)習(xí)之間有何區(qū)別?

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    了解一下每種開(kāi)關(guān)中存在的不同電路

    開(kāi)關(guān)是電子設(shè)備不可或缺的部分。幾乎每個(gè)電子設(shè)備中都有個(gè)開(kāi)關(guān),有時(shí)甚至有好幾個(gè)。這是因?yàn)樵O(shè)備在使用時(shí)往往存在多種工作模式。最明顯的模式普是接通或斷開(kāi),但往往有
    的頭像 發(fā)表于 07-03 09:29 ?6439次閱讀
    <b class='flag-5'>了解</b><b class='flag-5'>一下</b><b class='flag-5'>每種</b>開(kāi)關(guān)中存在的不同電路

    適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)

    本文提出了適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)。 ? 自監(jiān)督學(xué)習(xí)算法在自然語(yǔ)言處理、計(jì)
    的頭像 發(fā)表于 09-04 10:07 ?973次閱讀
    <b class='flag-5'>適用于</b>任意<b class='flag-5'>數(shù)據(jù)</b>模態(tài)的自監(jiān)督<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>數(shù)據(jù)</b>增強(qiáng)技術(shù)

    適用于STM32芯片的開(kāi)發(fā)教程

    安富萊的論壇上也有很多有關(guān)單片機(jī)方面的有用的資料,大家可以參考。本文不僅適用于STM32芯片的開(kāi)發(fā),也適用于其它芯片。正文學(xué)習(xí)款新的芯片,需要大家從官方獲取兩方面的資料,
    發(fā)表于 12-09 06:54

    適用于NFC和驗(yàn)證的子系統(tǒng)設(shè)計(jì)

    描述 此參考設(shè)計(jì)是適用于 NFC(近場(chǎng)通信)和驗(yàn)證的子系統(tǒng)設(shè)計(jì)。該子系統(tǒng)設(shè)計(jì)旨在用作參考設(shè)計(jì),支持部件認(rèn)證、訪問(wèn)控制、個(gè)人識(shí)別、無(wú)電池傳感器接口、安全令牌傳輸和本地數(shù)據(jù)的低功耗傳輸。在諸多系統(tǒng)
    發(fā)表于 09-22 09:15

    鈕扣電池都有哪些類型分別適用于哪些設(shè)備?

    鈕扣電池都有哪些類型分別適用于哪些設(shè)備? 鈕扣電池類型 特性 應(yīng)用設(shè)備  1.氧化銀電池:高且穩(wěn)定的電壓自放電每年5% 手表照相機(jī)
    發(fā)表于 11-05 09:47 ?1009次閱讀

    科普一下:機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別和關(guān)系

    深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)個(gè)子域,其相關(guān)算法受到大腦結(jié)構(gòu)與功能(即人工神經(jīng)網(wǎng)絡(luò))的啟發(fā)。深度學(xué)習(xí)如今的全部?jī)r(jià)值皆通過(guò)監(jiān)督式學(xué)習(xí)或經(jīng)過(guò)標(biāo)記的
    發(fā)表于 06-23 12:25 ?8.1w次閱讀
    科普<b class='flag-5'>一下</b>:機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>的區(qū)別和關(guān)系

    宏碁智能佛珠了解一下

    朋友,最近工作順利嗎?家庭幸福嗎?生活美滿嗎?看你心情復(fù)雜,要不要了解一下宏碁剛發(fā)布的智能佛珠?
    的頭像 發(fā)表于 08-08 16:27 ?3468次閱讀

    8種適用于不同機(jī)器學(xué)習(xí)問(wèn)題的常用數(shù)據(jù)

    Amazon 數(shù)據(jù)庫(kù)包含不同領(lǐng)域的多種數(shù)據(jù),如公共交通,生態(tài)資源,衛(wèi)星圖像等。在數(shù)據(jù)官網(wǎng)還有
    的頭像 發(fā)表于 01-29 10:21 ?4196次閱讀

    了解一下機(jī)器學(xué)習(xí)中的基礎(chǔ)知識(shí)

    ,那么機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)都有哪些呢?本文給大家列舉一下機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。 (1)準(zhǔn)確率的概念,準(zhǔn)確率就是分類模型預(yù)測(cè)準(zhǔn)確的比例。 (2)AUC(曲線下面積)則是種考慮到所有可能的分
    的頭像 發(fā)表于 03-31 17:08 ?3721次閱讀

    適用于命名數(shù)據(jù)網(wǎng)絡(luò)的緩存內(nèi)容分類模型

    的 Diffserv模型,提出個(gè)適用于NDN的緩存內(nèi)容分類模型,并給出同時(shí)考慮內(nèi)容分類、路由器本地流行度和內(nèi)容下載時(shí)延的概率緩存算法 Diffcache。實(shí)驗(yàn)結(jié)果表明,該算法可實(shí)現(xiàn)緩存資源的動(dòng)態(tài)分配,在不影響全局命中率和下載時(shí)延的情況
    發(fā)表于 05-12 11:33 ?4次下載

    適用于模式識(shí)別的新型神經(jīng)網(wǎng)絡(luò)

    提出了適用于模式識(shí)別的新型神經(jīng)網(wǎng)絡(luò)模型——局部有監(jiān)督特征映射網(wǎng)絡(luò),描述了該網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和學(xué)習(xí)算法,研究了網(wǎng)絡(luò)的基本性能,最后將其應(yīng)用到了質(zhì)量控制圖的
    發(fā)表于 05-31 16:29 ?5次下載

    適用于汽車應(yīng)用的開(kāi)關(guān)峰值電流模式控制電路優(yōu)化技術(shù)

    適用于汽車應(yīng)用的開(kāi)關(guān)峰值電流模式控制電路優(yōu)化技術(shù)
    發(fā)表于 11-07 08:07 ?0次下載
    <b class='flag-5'>適用于</b>汽車應(yīng)用的開(kāi)關(guān)峰值電流<b class='flag-5'>模式</b>控制電路優(yōu)化技術(shù)

    了解一下“薄膜厚度監(jiān)控”

    光學(xué)鍍膜干貨來(lái)了!了解一下“薄膜厚度監(jiān)控”
    的頭像 發(fā)表于 07-20 10:11 ?762次閱讀
    <b class='flag-5'>了解</b><b class='flag-5'>一下</b>“薄膜厚度監(jiān)控”

    精密平臺(tái)激光焊接機(jī)適用于哪些場(chǎng)景使用

    平臺(tái)激光焊接機(jī)是比較常見(jiàn)的種激光焊接設(shè)備。本篇我們就來(lái)了解一下它究竟適用于哪些行業(yè)場(chǎng)景。平臺(tái)激光焊接機(jī)與大家非常熟悉的手持激光焊接機(jī),無(wú)論是在結(jié)構(gòu)設(shè)計(jì)上,還是在
    的頭像 發(fā)表于 10-26 13:43 ?846次閱讀
    精密平臺(tái)激光焊接機(jī)<b class='flag-5'>適用于</b>哪些場(chǎng)景使用

    增量式編碼器3大特點(diǎn),工作模式,精度,輸出脈沖信號(hào) 一起了解一下

    增量式編碼器3大特點(diǎn),工作模式,精度,輸出脈沖信號(hào)...一起了解一下嗎?在現(xiàn)代工業(yè)自動(dòng)化和控制系統(tǒng)中,增量式編碼器扮演著至關(guān)重要的角色。它可以將機(jī)械運(yùn)動(dòng)轉(zhuǎn)化為電信號(hào),為各類設(shè)備提供精確的位置和速度
    的頭像 發(fā)表于 08-15 14:20 ?238次閱讀
    增量式編碼器3大特點(diǎn),工作<b class='flag-5'>模式</b>,精度,輸出脈沖信號(hào) <b class='flag-5'>一起了解</b><b class='flag-5'>一下</b>嗎