0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入淺出學(xué)人工智能神經(jīng)網(wǎng)絡(luò):GAN原理與應(yīng)用入門(mén)介紹

m3Fp_almosthuma ? 來(lái)源:機(jī)器之心編譯 ? 作者:佚名 ? 2017-08-25 09:47 ? 次閱讀
生成對(duì)抗網(wǎng)絡(luò)(GAN)是一類(lèi)在無(wú)監(jiān)督學(xué)習(xí)中使用的神經(jīng)網(wǎng)絡(luò),其有助于解決按文本生成圖像、提高圖片分辨率、藥物匹配、檢索特定模式的圖片等任務(wù)。Statsbot小組邀請(qǐng)數(shù)據(jù)科學(xué)家AntonKarazeev通過(guò)日常生活實(shí)例深入淺出地介紹GAN原理及其應(yīng)用。

生成對(duì)抗網(wǎng)絡(luò)由IanGoodfellow于2014年提出。GAN不是神經(jīng)網(wǎng)絡(luò)應(yīng)用在無(wú)監(jiān)督學(xué)習(xí)中的唯一途徑,還有玻爾茲曼機(jī)(GeoffreyHinton和TerrySejnowski,1985)和自動(dòng)解碼器(DanaH.Ballard,1987)。三者皆致力于通過(guò)學(xué)習(xí)恒等函數(shù)f(x)=x從數(shù)據(jù)中提取特征,且都依賴馬爾可夫鏈來(lái)訓(xùn)練或生成樣本。

GAN設(shè)計(jì)之初衷就是避免使用馬爾可夫鏈,因?yàn)楹笳叩挠?jì)算成本很高。相對(duì)于玻爾茲曼機(jī)的另一個(gè)優(yōu)點(diǎn)是GAN的限制要少得多(只有幾個(gè)概率分布適用于馬爾可夫鏈抽樣)。

在本文中,我們將講述GAN的基本原理及最流行的現(xiàn)實(shí)應(yīng)用。

GAN原理

讓我們用一個(gè)比喻解釋GAN的原理吧。

假設(shè)你想買(mǎi)塊好表。但是從未買(mǎi)過(guò)表的你很可能難辨真假;買(mǎi)表的經(jīng)驗(yàn)可以免被奸商欺騙。當(dāng)你開(kāi)始將大多數(shù)手表標(biāo)記為假表(當(dāng)然是被騙之后),賣(mài)家將開(kāi)始「生產(chǎn)」更逼真的山寨表。這個(gè)例子形象地解釋了GAN的基本原理:判別器網(wǎng)絡(luò)(手表買(mǎi)家)和生成器網(wǎng)絡(luò)(生產(chǎn)假表的賣(mài)家)。

兩個(gè)網(wǎng)絡(luò)相互博弈。GAN允許生成逼真的物體(例如圖像)。生成器出于壓力被迫生成看似真實(shí)的樣本,判別器學(xué)習(xí)分辨生成樣本和真實(shí)樣本。

判別算法和生成算法有何不同?簡(jiǎn)單地說(shuō):判別算法學(xué)習(xí)類(lèi)之間的邊界(如判別器做的那樣),而生成算法學(xué)習(xí)類(lèi)的分布(如生成器做的那樣)。

如果你準(zhǔn)備深入了解GAN

想要學(xué)習(xí)生成器的分布,應(yīng)該定義數(shù)據(jù)x的參數(shù)p_g,以及輸入噪聲變量p_z(z)的分布。然后G(z,θ_g)將z從潛在空間Z映射到數(shù)據(jù)空間,D(x,θ_d)輸出單個(gè)標(biāo)量——一個(gè)x來(lái)自真實(shí)數(shù)據(jù)而不是p_g的概率。

訓(xùn)練判別器以最大化正確標(biāo)注實(shí)際數(shù)據(jù)和生成樣本的概率。訓(xùn)練生成器用于最小化log(1-D(G(z)))。換句話說(shuō),盡量減少判別器得出正確答案的概率。

可以將這樣的訓(xùn)練任務(wù)看作具有值函數(shù)V(G,D)的極大極小博弈:

換句話說(shuō),生成器努力生成判別器難以辨認(rèn)的圖像,判別器也愈加聰明,以免被生成器欺騙。

「對(duì)抗訓(xùn)練是繼切片面包之后最酷的事情?!?YannLeCun

當(dāng)判別器不能區(qū)分p_g和p_data,即D(x,θ_d)=1/2時(shí),訓(xùn)練過(guò)程停止。達(dá)成生成器與判別器之間判定誤差的平衡。

歷史檔案圖像檢索

一個(gè)有趣的GAN應(yīng)用實(shí)例是在「PrizePapers」中檢索相似標(biāo)記,PrizePapers是海洋史上最具價(jià)值的檔案之一。對(duì)抗網(wǎng)絡(luò)使得處理這些具有歷史意義的文件更加容易,這些文件還包括海上扣留船只是否合法的信息。

每個(gè)查詢到的記錄都包含商家標(biāo)記的樣例——商家屬性的唯一標(biāo)識(shí),類(lèi)似于象形文字的草圖樣符號(hào)。

我們應(yīng)該獲得每個(gè)標(biāo)記的特征表示,但是應(yīng)用常規(guī)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法(包括卷積神經(jīng)網(wǎng)絡(luò))存在一些問(wèn)題:

  • 它們需要大量標(biāo)注圖像;

  • 商標(biāo)沒(méi)有標(biāo)注;

  • 標(biāo)記無(wú)法從數(shù)據(jù)集分割出去。

這種新方法顯示了如何使用GAN從商標(biāo)的圖像中提取和學(xué)習(xí)特征。在學(xué)習(xí)每個(gè)標(biāo)記的表征之后,就可以在掃描文檔上按圖形搜索。

將文本翻譯成圖像

其他研究人員表明,使用自然語(yǔ)言的描述屬性生成相應(yīng)的圖像是可行的。文本轉(zhuǎn)換成圖像的方法可以說(shuō)明生成模型模擬真實(shí)數(shù)據(jù)樣本的性能。

圖片生成的主要問(wèn)題在于圖像分布是多模態(tài)的。例如,有太多的例子完美契合文本描述的內(nèi)容。GAN有助于解決這一問(wèn)題。

我們來(lái)考慮以下任務(wù):將藍(lán)色輸入點(diǎn)映射到綠色輸出點(diǎn)(綠點(diǎn)可能是藍(lán)點(diǎn)的輸出)。這個(gè)紅色箭頭表示預(yù)測(cè)的誤差,也意味著經(jīng)過(guò)一段時(shí)間后,藍(lán)點(diǎn)將被映射到綠點(diǎn)的平均值——這一精確映射將會(huì)模糊我們?cè)噲D預(yù)測(cè)的圖像。

GAN不直接使用輸入和輸出對(duì)。相反,它們學(xué)習(xí)如何給輸入和輸出配對(duì)。

下面是從文本描述中生成圖像的示例:

用于訓(xùn)練GAN的數(shù)據(jù)集:

  • Caltech-UCSD-200-2011是一個(gè)具有200種鳥(niǎo)類(lèi)照片、總數(shù)為11,788的圖像數(shù)據(jù)集。

  • Oxford-102花數(shù)據(jù)集由102個(gè)花的類(lèi)別組成,每個(gè)類(lèi)別包含40到258張圖片不等。

藥物匹配

當(dāng)其它研究員應(yīng)用GAN處理圖片和視頻時(shí),InsilicoMedicine的研究人員提出了一種運(yùn)用GAN進(jìn)行藥物匹配的方法。

我們的目標(biāo)是訓(xùn)練生成器,以盡可能精確地從一個(gè)藥物數(shù)據(jù)庫(kù)中對(duì)現(xiàn)有藥物進(jìn)行按病取藥的操作。

經(jīng)過(guò)訓(xùn)練后,可以使用生成器獲得一種以前不可治愈的疾病的藥方,并使用判別器確定生成的藥方是否治愈了特定疾病。

腫瘤分子生物學(xué)的應(yīng)用

InsilicoMedicine另一個(gè)研究表明,產(chǎn)生一組按參數(shù)定義的新抗癌分子的管道。其目的是預(yù)測(cè)具有抗癌作用的藥物反應(yīng)和化合物。

研究人員提出了一個(gè)基于現(xiàn)有生化數(shù)據(jù)的用于識(shí)別和生成新化合物的對(duì)抗自編碼器(AAE)模型。

「據(jù)我們所知,這是GAN技術(shù)在挖掘癌癥藥物領(lǐng)域的首個(gè)應(yīng)用?!?研究人員說(shuō)。

數(shù)據(jù)庫(kù)中有許多可用的生物化學(xué)數(shù)據(jù),如癌細(xì)胞系百科全書(shū)(CCLE)、腫瘤藥物敏感基因?qū)W(GDSC)和NCI-60癌細(xì)胞系。所有這些都包含針對(duì)癌癥的不同藥物實(shí)驗(yàn)的篩選數(shù)據(jù)。

對(duì)抗自編碼器以藥物濃度和指紋作為輸入并使用生長(zhǎng)抑制率數(shù)據(jù)進(jìn)行訓(xùn)練(GI,顯示治療后癌細(xì)胞的數(shù)量減少情況)。

分子指紋在計(jì)算機(jī)中有一個(gè)固定的位數(shù)表示,每一位代表某些特征的保留狀態(tài)。

隱藏層由5個(gè)神經(jīng)元組成,其中一個(gè)負(fù)責(zé)GI(癌細(xì)胞抑制率),另外4個(gè)由正態(tài)分布判別。因此,一個(gè)回歸項(xiàng)被添加到編碼器代價(jià)函數(shù)中。此外,編碼器只能將相同的指紋映射到相同的潛在向量,這一過(guò)程獨(dú)立于通過(guò)額外的流形代價(jià)集中輸入。

經(jīng)過(guò)訓(xùn)練,網(wǎng)絡(luò)可以從期望的分布中生成分子,并使用GI神經(jīng)元作為輸出化合物的微調(diào)器。

這項(xiàng)工作的成果如下:已訓(xùn)練AAE模型預(yù)測(cè)得到的化合物已被證明是抗癌藥物,和需接受抗癌活性化合物實(shí)驗(yàn)驗(yàn)證的新藥物。

「我們的研究結(jié)果表明,本文提出的AAE模型使用深度生成模型顯著提高了特定抗癌能力和新分子的開(kāi)發(fā)效率?!?/span>

結(jié)論

無(wú)監(jiān)督學(xué)習(xí)是人工智能的下一個(gè)藍(lán)海,我們正朝著這一方向邁進(jìn)。

生成對(duì)抗網(wǎng)絡(luò)可以應(yīng)用于許多領(lǐng)域,從生成圖像到預(yù)測(cè)藥物,所以不要害怕失敗。我們相信GAN有助于建立一個(gè)更好的機(jī)器學(xué)習(xí)的未來(lái)。

原文鏈接:https://blog.statsbot.co/generative-adversarial-networks-gans-engine-and-applications-f96291965b47

本文為機(jī)器之心編譯,轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)。

?------------------------------------------------

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:深入淺出:GAN原理與應(yīng)用入門(mén)介紹

文章出處:【微信號(hào):almosthuman2014,微信公眾號(hào):機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過(guò)深入淺出的語(yǔ)言和諸多實(shí)際應(yīng)用案例,
    發(fā)表于 09-09 13:54

    BP神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個(gè)基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及
    的頭像 發(fā)表于 07-10 15:20 ?741次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的案例分析

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)作為深度學(xué)習(xí)領(lǐng)域的重要分支,自20世紀(jì)80年代以來(lái)一直是人工智能領(lǐng)域的研究熱點(diǎn)。其靈感來(lái)源于生物神經(jīng)網(wǎng)絡(luò),通
    的頭像 發(fā)表于 07-08 18:20 ?658次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型的分類(lèi)有哪些

    詳細(xì)介紹人工神經(jīng)網(wǎng)絡(luò)的分類(lèi),包括前饋神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗
    的頭像 發(fā)表于 07-05 09:13 ?864次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)

    人工智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的計(jì)算模型,具有高度的自適應(yīng)性、學(xué)習(xí)能力和泛化能力。本文將介紹人工智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點(diǎn)
    的頭像 發(fā)表于 07-04 09:42 ?376次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)模型有哪些

    人工智能神經(jīng)網(wǎng)絡(luò)模型是一類(lèi)受人腦啟發(fā)的計(jì)算模型,它們?cè)谠S多領(lǐng)域都取得了顯著的成功。以下是一些常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型: 感知機(jī)(Perceptron) : 感知機(jī)是最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型之一,
    的頭像 發(fā)表于 07-04 09:41 ?481次閱讀

    人工智能人工神經(jīng)網(wǎng)絡(luò)有什么區(qū)別

    人工智能(Artificial Intelligence,簡(jiǎn)稱AI)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡(jiǎn)稱ANN)是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 定義和起源
    的頭像 發(fā)表于 07-04 09:39 ?946次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是什么

    人工智能神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)的計(jì)算模型,其結(jié)構(gòu)和功能非常復(fù)雜。 引言 人工智能神經(jīng)網(wǎng)絡(luò)是一種模擬人腦
    的頭像 發(fā)表于 07-04 09:37 ?436次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)的工作原理是什么

    人工智能神經(jīng)網(wǎng)絡(luò)的工作原理是一個(gè)復(fù)雜且深入的話題,涉及到多個(gè)領(lǐng)域的知識(shí),包括數(shù)學(xué)、計(jì)算機(jī)科學(xué)、生物學(xué)等。 神經(jīng)網(wǎng)絡(luò)的基本概念 神經(jīng)網(wǎng)絡(luò)是一種
    的頭像 發(fā)表于 07-04 09:35 ?502次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)芯片的介紹

    人工智能神經(jīng)網(wǎng)絡(luò)芯片是一類(lèi)專門(mén)為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)的處理器。它們具有高性能、低功耗、可擴(kuò)展等特點(diǎn),廣泛應(yīng)用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。以下是關(guān)于人工智能
    的頭像 發(fā)表于 07-04 09:33 ?544次閱讀

    神經(jīng)網(wǎng)絡(luò)人工智能的關(guān)系是什么

    神經(jīng)網(wǎng)絡(luò)人工智能的關(guān)系是密不可分的。神經(jīng)網(wǎng)絡(luò)人工智能的一種重要實(shí)現(xiàn)方式,而人工智能則是神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 10:25 ?900次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的模型及其應(yīng)用有哪些

    ,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展成為機(jī)器學(xué)習(xí)和人工智能領(lǐng)域的重要技術(shù)之一。本文將詳細(xì)介紹人工神經(jīng)網(wǎng)絡(luò)的模型及其應(yīng)用。 引言
    的頭像 發(fā)表于 07-02 10:04 ?771次閱讀

    神經(jīng)網(wǎng)絡(luò)人工智能的關(guān)系

    化時(shí)代的到來(lái)。本文旨在深入探討神經(jīng)網(wǎng)絡(luò)人工智能之間的關(guān)系,通過(guò)分點(diǎn)表示和歸納,結(jié)合相關(guān)數(shù)字和信息,為讀者提供全面的視角。
    的頭像 發(fā)表于 07-01 14:23 ?640次閱讀

    javascript深入淺出介紹

    JavaScript是一種廣泛使用的腳本語(yǔ)言,用于開(kāi)發(fā)互聯(lián)網(wǎng)應(yīng)用程序。它非常受歡迎,因?yàn)樗梢杂糜诰W(wǎng)頁(yè)開(kāi)發(fā),服務(wù)器端開(kāi)發(fā)以及移動(dòng)應(yīng)用程序開(kāi)發(fā)。本文將深入淺出介紹JavaScript的各個(gè)方面,包括
    的頭像 發(fā)表于 12-03 11:09 ?5.7w次閱讀

    javascript深入淺出

    JavaScript是一種廣泛使用的編程語(yǔ)言,常用于Web開(kāi)發(fā)。下面是對(duì)JavaScript的深入淺出的解釋: JavaScript簡(jiǎn)介 JavaScript是一種解釋型、動(dòng)態(tài)類(lèi)型、基于原型的語(yǔ)言
    的頭像 發(fā)表于 11-16 10:34 ?2230次閱讀