0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GAN原理與應(yīng)用入門

jf_78858299 ? 來源:StatsBot 機器之心 ? 作者:Anton Karazeev ? 2023-03-17 11:15 ? 次閱讀

生成對抗網(wǎng)絡(luò)(GAN)是一類在無監(jiān)督學(xué)習(xí)中使用的神經(jīng)網(wǎng)絡(luò),其有助于解決按文本生成圖像、提高圖片分辨率、藥物匹配、檢索特定模式的圖片等任務(wù)。Statsbot 小組邀請數(shù)據(jù)科學(xué)家 Anton Karazeev 通過日常生活實例深入淺出地介紹 GAN 原理及其應(yīng)用。

生成對抗網(wǎng)絡(luò)由 Ian Goodfellow 于 2014 年提出。GAN 不是神經(jīng)網(wǎng)絡(luò)應(yīng)用在無監(jiān)督學(xué)習(xí)中的唯一途徑,還有玻爾茲曼機(Geoffrey Hinton 和 Terry Sejnowski,1985)和自動解碼器(Dana H. Ballard,1987)。三者皆致力于通過學(xué)習(xí)恒等函數(shù) f(x)= x 從數(shù)據(jù)中提取特征,且都依賴馬爾可夫鏈來訓(xùn)練或生成樣本。

GAN 設(shè)計之初衷就是避免使用馬爾可夫鏈,因為后者的計算成本很高。相對于玻爾茲曼機的另一個優(yōu)點是 GAN 的限制要少得多(只有幾個概率分布適用于馬爾可夫鏈抽樣)。

在本文中,我們將講述 GAN 的基本原理及最流行的現(xiàn)實應(yīng)用。

GAN 原理

讓我們用一個比喻解釋 GAN 的原理吧。

假設(shè)你想買塊好表。但是從未買過表的你很可能難辨真假;買表的經(jīng)驗可以免被奸商欺騙。當你開始將大多數(shù)手表標記為假表(當然是被騙之后),賣家將開始「生產(chǎn)」更逼真的山寨表。這個例子形象地解釋了 GAN 的基本原理:判別器網(wǎng)絡(luò)(手表買家)和生成器網(wǎng)絡(luò)(生產(chǎn)假表的賣家)。

兩個網(wǎng)絡(luò)相互博弈。GAN 允許生成逼真的物體(例如圖像)。生成器出于壓力被迫生成看似真實的樣本,判別器學(xué)習(xí)分辨生成樣本和真實樣本。

圖片

判別算法和生成算法有何不同?簡單地說:判別算法學(xué)習(xí)類之間的邊界(如判別器做的那樣),而生成算法學(xué)習(xí)類的分布(如生成器做的那樣)。

如果你準備深入了解 GAN

想要學(xué)習(xí)生成器的分布,應(yīng)該定義數(shù)據(jù) x 的參數(shù) p_g,以及輸入噪聲變量 p_z(z)的分布。然后 G(z,θ_g)將 z 從潛在空間 Z 映射到數(shù)據(jù)空間,D(x,θ_d)輸出單個標量——一個 x 來自真實數(shù)據(jù)而不是 p_g 的概率。

訓(xùn)練判別器以最大化正確標注實際數(shù)據(jù)和生成樣本的概率。訓(xùn)練生成器用于最小化 log(1-D(G(z)))。換句話說,盡量減少判別器得出正確答案的概率。

可以將這樣的訓(xùn)練任務(wù)看作具有值函數(shù) V(G,D)的極大極小博弈:

圖片

換句話說,生成器努力生成判別器難以辨認的圖像,判別器也愈加聰明,以免被生成器欺騙。

「對抗訓(xùn)練是繼切片面包之后最酷的事情。」- Yann LeCun

當判別器不能區(qū)分 p_g 和 p_data,即 D(x,θ_d)= 1/2 時,訓(xùn)練過程停止。達成生成器與判別器之間判定誤差的平衡。

歷史檔案圖像檢索

一個有趣的 GAN 應(yīng)用實例是在「Prize Papers」中檢索相似標記,Prize Papers 是海洋史上最具價值的檔案之一。對抗網(wǎng)絡(luò)使得處理這些具有歷史意義的文件更加容易,這些文件還包括海上扣留船只是否合法的信息

圖片

每個查詢到的記錄都包含商家標記的樣例——商家屬性的唯一標識,類似于象形文字的草圖樣符號。

我們應(yīng)該獲得每個標記的特征表示,但是應(yīng)用常規(guī)機器學(xué)習(xí)和深度學(xué)習(xí)方法(包括卷積神經(jīng)網(wǎng)絡(luò))存在一些問題:

  • 它們需要大量標注圖像;
  • 商標沒有標注;
  • 標記無法從數(shù)據(jù)集分割出去。

這種新方法顯示了如何使用 GAN 從商標的圖像中提取和學(xué)習(xí)特征。在學(xué)習(xí)每個標記的表征之后,就可以在掃描文檔上按圖形搜索。

將文本翻譯成圖像

其他研究人員表明,使用自然語言的描述屬性生成相應(yīng)的圖像是可行的。文本轉(zhuǎn)換成圖像的方法可以說明生成模型模擬真實數(shù)據(jù)樣本的性能。

圖片生成的主要問題在于圖像分布是多模態(tài)的。例如,有太多的例子完美契合文本描述的內(nèi)容。GAN 有助于解決這一問題。

圖片

我們來考慮以下任務(wù):將藍色輸入點映射到綠色輸出點(綠點可能是藍點的輸出)。這個紅色箭頭表示預(yù)測的誤差,也意味著經(jīng)過一段時間后,藍點將被映射到綠點的平均值——這一精確映射將會模糊我們試圖預(yù)測的圖像。

GAN 不直接使用輸入和輸出對。相反,它們學(xué)習(xí)如何給輸入和輸出配對。

下面是從文本描述中生成圖像的示例:

圖片

用于訓(xùn)練 GAN 的數(shù)據(jù)集:

  • Caltech-UCSD-200-2011 是一個具有 200 種鳥類照片、總數(shù)為 11,788 的圖像數(shù)據(jù)集。
  • Oxford-102 花數(shù)據(jù)集由 102 個花的類別組成,每個類別包含 40 到 258 張圖片不等。

藥物匹配

當其它研究員應(yīng)用 GAN 處理圖片和視頻時,Insilico Medicine 的研究人員提出了一種運用 GAN 進行藥物匹配的方法。

我們的目標是訓(xùn)練生成器,以盡可能精確地從一個藥物數(shù)據(jù)庫中對現(xiàn)有藥物進行按病取藥的操作。

經(jīng)過訓(xùn)練后,可以使用生成器獲得一種以前不可治愈的疾病的藥方,并使用判別器確定生成的藥方是否治愈了特定疾病。

腫瘤分子生物學(xué)的應(yīng)用

Insilico Medicine 另一個研究表明,產(chǎn)生一組按參數(shù)定義的新抗癌分子的管道。其目的是預(yù)測具有抗癌作用的藥物反應(yīng)和化合物。

研究人員提出了一個基于現(xiàn)有生化數(shù)據(jù)的用于識別和生成新化合物的對抗自編碼器(AAE)模型。

圖片

「據(jù)我們所知,這是 GAN 技術(shù)在挖掘癌癥藥物領(lǐng)域的首個應(yīng)用?!? 研究人員說。

數(shù)據(jù)庫中有許多可用的生物化學(xué)數(shù)據(jù),如癌細胞系百科全書(CCLE)、腫瘤藥物敏感基因?qū)W(GDSC)和 NCI-60 癌細胞系。所有這些都包含針對癌癥的不同藥物實驗的篩選數(shù)據(jù)。

圖片

對抗自編碼器以藥物濃度和指紋作為輸入并使用生長抑制率數(shù)據(jù)進行訓(xùn)練(GI,顯示治療后癌細胞的數(shù)量減少情況)。

分子指紋在計算機中有一個固定的位數(shù)表示,每一位代表某些特征的保留狀態(tài)。

圖片

隱藏層由 5 個神經(jīng)元組成,其中一個負責(zé) GI(癌細胞抑制率),另外 4 個由正態(tài)分布判別。因此,一個回歸項被添加到編碼器代價函數(shù)中。此外,編碼器只能將相同的指紋映射到相同的潛在向量,這一過程獨立于通過額外的流形代價集中輸入。

圖片

經(jīng)過訓(xùn)練,網(wǎng)絡(luò)可以從期望的分布中生成分子,并使用 GI 神經(jīng)元作為輸出化合物的微調(diào)器。

這項工作的成果如下:已訓(xùn)練 AAE 模型預(yù)測得到的化合物已被證明是抗癌藥物,和需接受抗癌活性化合物實驗驗證的新藥物。

「我們的研究結(jié)果表明,本文提出的 AAE 模型使用深度生成模型顯著提高了特定抗癌能力和新分子的開發(fā)效率。」

結(jié)論

無監(jiān)督學(xué)習(xí)是人工智能的下一個藍海,我們正朝著這一方向邁進。

生成對抗網(wǎng)絡(luò)可以應(yīng)用于許多領(lǐng)域,從生成圖像到預(yù)測藥物,所以不要害怕失敗。我們相信 GAN 有助于建立一個更好的機器學(xué)習(xí)的未來。

原文鏈接:https://blog.statsbot.co/generative-adversarial-networks-gans-engine-and-applications-f96291965b47

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1129

    瀏覽量

    40638
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4734

    瀏覽量

    100420
收藏 人收藏

    評論

    相關(guān)推薦

    深入淺出學(xué)人工智能神經(jīng)網(wǎng)絡(luò):GAN原理與應(yīng)用入門介紹

    生成對抗網(wǎng)絡(luò)(GAN)是一類在無監(jiān)督學(xué)習(xí)中使用的神經(jīng)網(wǎng)絡(luò),其有助于解決按文本生成圖像、提高圖片分辨率、藥物匹配、檢索特定模式的圖片等任務(wù)。
    的頭像 發(fā)表于 08-25 09:47 ?9702次閱讀
    深入淺出學(xué)人工智能神經(jīng)網(wǎng)絡(luò):<b class='flag-5'>GAN</b>原理與應(yīng)用<b class='flag-5'>入門</b>介紹

    GaN可靠性的測試

    作者:Sandeep Bahl 最近,一位客戶問我關(guān)于氮化鎵(GaN)可靠性的問題:“JEDEC(電子設(shè)備工程聯(lián)合委員會)似乎沒把應(yīng)用條件納入到開關(guān)電源的范疇。我們將在最終產(chǎn)品里使用的任何GaN器件
    發(fā)表于 09-10 14:48

    未找到GaN器件

    您好,有人能告訴我如何在原理圖窗口中添加GaN器件,因為當我在ADS的原理圖窗口中搜索它時,它只顯示GaAs,JFET和BJT器件。我想做一個功率放大器模擬,我需要一個GaN器件。請?zhí)岢瞿愕慕ㄗh
    發(fā)表于 01-17 15:55

    基于GaN的開關(guān)器件

    在過去的十多年里,行業(yè)專家和分析人士一直在預(yù)測,基于氮化鎵(GaN)功率開關(guān)器件的黃金時期即將到來。與應(yīng)用廣泛的MOSFET硅功率器件相比,基于GaN的功率器件具有更高的效率和更強的功耗處理能力
    發(fā)表于 06-21 08:27

    如何正確理解GaN?

    您已了解GaN晶體管出色的性能,您很興奮。樣品總算來到,您將它們放入板中。您打開電源,施加負載,結(jié)果……性能并沒有比以前更好。更糟糕的是,遇到了以前不存在的開關(guān)問題。這些晶體管不好。真遺憾。為何出現(xiàn)這種情況?有沒有可能遺漏了什么?如何正確理解GaN?十分重要!
    發(fā)表于 07-30 06:21

    為什么GaN會在射頻應(yīng)用中脫穎而出?

    鎵(Ga) 是一種化學(xué)元素,原子序數(shù)為31。鎵在自然界中不存在游離態(tài),而是鋅和鋁生產(chǎn)過程中的副產(chǎn)品。GaN 化合物由鎵原子和氮原子排列構(gòu)成,最常見的是纖鋅礦晶體結(jié)構(gòu)。纖鋅礦晶體結(jié)構(gòu)(如下圖所示)呈六
    發(fā)表于 08-01 07:24

    推導(dǎo)GAN公式

    GAN的數(shù)學(xué)推導(dǎo)和案例應(yīng)用
    發(fā)表于 04-13 09:34

    SiC/GaN具有什么優(yōu)勢?

    基于SiC/GaN的新一代高密度功率轉(zhuǎn)換器SiC/GaN具有的優(yōu)勢
    發(fā)表于 03-10 08:26

    什么是GaN?如何面對GaN在測試方面的挑戰(zhàn)?

    什么是GaN?如何面對GaN在測試方面的挑戰(zhàn)?
    發(fā)表于 05-06 07:52

    圖像生成對抗生成網(wǎng)絡(luò)gan_GAN生成汽車圖像 精選資料推薦

    圖像生成對抗生成網(wǎng)絡(luò)ganHello there! This is my story of making a GAN that would generate images of cars
    發(fā)表于 08-31 06:48

    GaN應(yīng)用開關(guān)電源

    PD快充65W常用什么規(guī)格GaN
    發(fā)表于 12-26 19:57

    GaN和SiC區(qū)別

    半導(dǎo)體的關(guān)鍵特性是能帶隙,能帶動電子進入導(dǎo)通狀態(tài)所需的能量。寬帶隙(WBG)可以實現(xiàn)更高功率,更高開關(guān)速度的晶體管,WBG器件包括氮化鎵(GaN)和碳化硅(SiC),以及其他半導(dǎo)體。 GaN和SiC
    發(fā)表于 08-12 09:42

    如何實現(xiàn)高效GaN的電源設(shè)計

    由于可以在較高頻率、電壓和溫度下工作且功率損耗較低,寬禁帶半導(dǎo)體(SiC 和GaN)現(xiàn)在配合傳統(tǒng)硅一同用于汽車和RF 通信等嚴苛應(yīng)用中。隨著效率的提高,對Si、SiC和GaN器件進行安全、精確的測試
    發(fā)表于 11-18 10:38 ?28次下載
    如何實現(xiàn)高效<b class='flag-5'>GaN</b>的電源設(shè)計

    萬丈高樓平地起—GAN入門介紹

    來源:羅姆半導(dǎo)體社區(qū)? 目前, 人工智能 ( AI )領(lǐng)域正在快速發(fā)展,每隔一段時間就取得新的突破。最近突出的一個詞是Generative Adversarial Network(GAN) - 但
    的頭像 發(fā)表于 11-15 17:19 ?467次閱讀

    GaN HEMT 模型初階入門:非線性模型如何幫助進行 GaN PA 設(shè)計?(第一部分,共兩部分)

    GaN HEMT 模型初階入門:非線性模型如何幫助進行 GaN PA 設(shè)計?(第一部分,共兩部分)
    的頭像 發(fā)表于 12-26 10:16 ?1269次閱讀
    <b class='flag-5'>GaN</b> HEMT 模型初階<b class='flag-5'>入門</b>:非線性模型如何幫助進行 <b class='flag-5'>GaN</b> PA 設(shè)計?(第一部分,共兩部分)