0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GAN應(yīng)用缺陷的解決方法分享

電子工程師 ? 來(lái)源:陳翠 ? 2019-02-22 09:44 ? 次閱讀

盡管 GAN 領(lǐng)域的進(jìn)步令人印象深刻,但其在應(yīng)用過(guò)程中仍然存在一些困難。本文梳理了 GAN 在應(yīng)用過(guò)程中存在的一些難題,并提出了最新的解決方法。

使用 GAN 的缺陷

眾所周知,GAN 是由 Generator 生成網(wǎng)絡(luò)和 Discriminator 判別網(wǎng)絡(luò)組成的。

1. Modecollapse(模型奔潰)

注:Mode collapse 是指 GAN 生成的樣本單一,其認(rèn)為滿(mǎn)足某一分布的結(jié)果為 true,其他為 False,導(dǎo)致以上結(jié)果。

自然數(shù)據(jù)分布是非常復(fù)雜,且是多峰值的(multimodal)。也就是說(shuō)數(shù)據(jù)分布有很多的峰值(peak)或眾數(shù)(mode)。每個(gè) mode 都表示相似數(shù)據(jù)樣本的聚集,但與其他 mode 是不同的。

在 modecollapse 過(guò)程中,生成網(wǎng)絡(luò) G 會(huì)生成屬于有限集 mode 的樣本。當(dāng) G 認(rèn)為可以在單個(gè) mode 上欺騙判別網(wǎng)絡(luò) D 時(shí),G 就會(huì)生成該 mode 外的樣本。

GAN應(yīng)用缺陷的解決方法分享

上圖表示 GAN 的輸出沒(méi)有 mode collapse. 下圖則出現(xiàn)了 mode collapse。

判別網(wǎng)絡(luò)最后會(huì)判別來(lái)自該 mode 的樣本是假的。最后,生成網(wǎng)絡(luò) G 會(huì)簡(jiǎn)單地鎖定到另一個(gè) mode。該循環(huán)會(huì)無(wú)限進(jìn)行,就會(huì)限制生成樣本的多樣性。

2. Convergence(收斂)

GAN 訓(xùn)練過(guò)程中遇到的一個(gè)問(wèn)題是什么時(shí)候停止訓(xùn)練?因?yàn)榕袆e網(wǎng)絡(luò) D 損失降級(jí)會(huì)改善生成網(wǎng)絡(luò) G 的損失(反之亦然),因此無(wú)法根據(jù)損失函數(shù)的值來(lái)判斷收斂,如下圖所示:

GAN應(yīng)用缺陷的解決方法分享

典型的GAN損失函數(shù)圖。注意該如何從這個(gè)圖中解釋收斂性。

3. Quality(質(zhì)量)

與前面提到的收斂問(wèn)題一樣,很難量化地判斷生成網(wǎng)絡(luò) G 什么時(shí)候會(huì)生成高質(zhì)量的樣本。另外,在損失函數(shù)中加入感知正則化則在一定程度上可緩解該問(wèn)題。

4. Metrics(度量)

GAN 的目標(biāo)函數(shù)解釋了生成網(wǎng)絡(luò) G 或 判別網(wǎng)絡(luò) D 如何根據(jù)組件來(lái)執(zhí)行,但它卻不表示輸出的質(zhì)量和多樣性。因此,需要許多不同的度量指標(biāo)來(lái)進(jìn)行衡量。

改善性能的技術(shù)

下面總結(jié)了一些可以使 GAN 更加穩(wěn)定使用的技術(shù)。

1. Alternative Loss Functions (替代損失函數(shù))

修復(fù) GAN 缺陷的最流行的補(bǔ)丁是 Wasserstein GAN (https://arxiv.org/pdf/1701.07875.pdf)。該 GAN 用 Earth Mover distance( Wasserstein-1 distance 或 EM distance) 來(lái)替換傳統(tǒng) GAN 的 Jensen Shannon divergence ( J-S 散度)。EM 距離的原始形式很難理解,因此使用了雙重形式。這需要判別網(wǎng)絡(luò)是 1-Lipschitz,通過(guò)修改判別網(wǎng)絡(luò)的權(quán)重來(lái)維護(hù)。

使用 Earth Mover distance 的優(yōu)勢(shì)在于即使真實(shí)的生成數(shù)據(jù)分布是不相交的,它也是連續(xù)的。同時(shí),在生成的圖像質(zhì)量和損失值之間存在一定關(guān)系。使用 Earth Mover distance 的劣勢(shì)在于對(duì)于每個(gè)生成模型 G 都要執(zhí)行許多判別網(wǎng)絡(luò) D 的更新。而且,研究人員認(rèn)為權(quán)重修改是確保 1-Lipschitz 限制的極端方式。

GAN應(yīng)用缺陷的解決方法分享

左圖中 earth mover distance 是連續(xù)的, 即便其分布并不連續(xù), 這不同于優(yōu)圖中的 the Jensen Shannon divergence。

另一個(gè)解決方案是使用均方損失( mean squared loss )替代對(duì)數(shù)損失( log loss )。LSGAN (https://arxiv.org/abs/1611.04076)的作者認(rèn)為傳統(tǒng) GAN 損失函數(shù)并不會(huì)使收集的數(shù)據(jù)分布接近于真實(shí)數(shù)據(jù)分布。

原來(lái) GAN 損失函數(shù)中的對(duì)數(shù)損失并不影響生成數(shù)據(jù)與決策邊界(decision boundary)的距離。另一方面,LSGAN 也會(huì)對(duì)距離決策邊界較遠(yuǎn)的樣本進(jìn)行懲罰,使生成的數(shù)據(jù)分布與真實(shí)數(shù)據(jù)分布更加靠近,這是通過(guò)將均方損失替換為對(duì)數(shù)損失來(lái)完成的。

2. Two Timescale Update Rule(TTUR)

在 TTUR 方法中,研究人員對(duì)判別網(wǎng)絡(luò) D 和生成網(wǎng)絡(luò) G 使用不同的學(xué)習(xí)速度。低速更新規(guī)則用于生成網(wǎng)絡(luò) G ,判別網(wǎng)絡(luò) D使用 高速更新規(guī)則。使用 TTUR 方法,研究人員可以讓生成網(wǎng)絡(luò) G 和判別網(wǎng)絡(luò) D 以 1:1 的速度更新。 SAGAN (https://arxiv.org/abs/1805.08318) 就使用了 TTUR 方法。

3. GradientPenalty (梯度懲罰)

論文Improved Training of WGANs(https://arxiv.org/abs/1704.00028)中,作者稱(chēng)權(quán)重修改會(huì)導(dǎo)致優(yōu)化問(wèn)題。權(quán)重修改會(huì)迫使神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)學(xué)習(xí)更簡(jiǎn)單的相似(simpler approximations)達(dá)到最優(yōu)數(shù)據(jù)分布,導(dǎo)致結(jié)果質(zhì)量不高。同時(shí)如果 WGAN 超參數(shù)設(shè)置不合理,權(quán)重修改可能會(huì)出現(xiàn)梯度消失或梯度爆炸的問(wèn)題,論文作者在損失函數(shù)中加入了一個(gè)簡(jiǎn)單的梯度懲罰機(jī)制以緩解該問(wèn)題。

GAN應(yīng)用缺陷的解決方法分享

加入 GradientPenalty 作為正則化器

DRAGAN (https://arxiv.org/abs/1705.07215)的作者稱(chēng),當(dāng) GAN 的博弈達(dá)到一個(gè)局部平衡態(tài)(local equilibrium state),就會(huì)出現(xiàn) mode collapse 的問(wèn)題。而且判別網(wǎng)絡(luò) D 在這種狀態(tài)下產(chǎn)生的梯度是非常陡(sharp)的。一般來(lái)說(shuō),使用梯度懲罰機(jī)制可以幫助避免這種狀態(tài)的產(chǎn)生,極大增強(qiáng) GAN 的穩(wěn)定性,盡可能減少 mode collapse 問(wèn)題的產(chǎn)生。

4. Spectral Normalization(譜歸一化)

Spectral normalization 是用在判別網(wǎng)絡(luò) D 來(lái)增強(qiáng)訓(xùn)練過(guò)程的權(quán)重正態(tài)化技術(shù) (weight normalization technique),可以確保判別網(wǎng)絡(luò) D 是 K-Lipschitz 連續(xù)的。SAGAN(https://arxiv.org/abs/1805.08318)這樣的實(shí)現(xiàn)也在判別網(wǎng)絡(luò) D 上使用了譜正則化。而且該方法在計(jì)算上要比梯度懲罰方法更加高效。

5. Unrolling andPacking (展開(kāi)和打包)

文章 Mode collapse in GANs(http://aiden.nibali.org/blog/2017-01-18-mode-collapse-gans/)中提到一種預(yù)防 mode hopping 的方法就是在更新參數(shù)時(shí)進(jìn)行預(yù)期對(duì)抗(anticipate counterplay)。展開(kāi)的 GAN ( Unrolled GANs )可以使用生成網(wǎng)絡(luò) G 欺騙判別網(wǎng)絡(luò) D,然后判別網(wǎng)絡(luò) D 就有機(jī)會(huì)進(jìn)行響應(yīng)。

另一種預(yù)防 mode collapse 的方式就是把多個(gè)屬于同一類(lèi)的樣本進(jìn)行打包,然后傳遞給判別網(wǎng)絡(luò) D 。PacGAN (https://arxiv.org/abs/1712.04086)就融入了該方法,并證明可以減少 mode collapse 的發(fā)生。

6. 多個(gè) GAN

一個(gè) GAN 可能不足以有效地處理任務(wù),因此研究人員提出使用多個(gè)連續(xù)的 GAN ,每個(gè) GAN 解決任務(wù)中的一些簡(jiǎn)單問(wèn)題。比如,F(xiàn)ashionGAN(https://www.cs.toronto.edu/~urtasun/publications/zhu_etal_iccv17.pdf)就使用 2 個(gè) GAN 來(lái)執(zhí)行圖像定位翻譯。

GAN應(yīng)用缺陷的解決方法分享

FashionGAN 使用兩個(gè) GANs 進(jìn)行圖像定位翻譯。

因此,可以讓 GAN 慢慢地解決更難的問(wèn)題。比如 Progressive GANs (ProGANs,https://arxiv.org/abs/1710.10196) 就可以生成分辨率極高的高質(zhì)量圖像。

7. Relativistic GANs(相對(duì)生成對(duì)抗網(wǎng)絡(luò))

傳統(tǒng)的 GAN 會(huì)測(cè)量生成數(shù)據(jù)為真的可能性。Relativistic GANs 則會(huì)測(cè)量生成數(shù)據(jù)“逼真”的可能性。研究人員可以使用相對(duì)距離測(cè)量方法(appropriate distance measure)來(lái)測(cè)量相對(duì)真實(shí)性(relative realism),相關(guān)論文鏈接:https://arxiv.org/abs/1807.00734。

GAN應(yīng)用缺陷的解決方法分享

圖 A 表示 JS 散度的最優(yōu)解,圖 B 表示使用標(biāo)準(zhǔn) GAN 損失時(shí)判別網(wǎng)絡(luò) D 的輸出,圖 C 表示輸出曲線的實(shí)際圖。

在論文中,作者提到判別網(wǎng)絡(luò) D 達(dá)到最優(yōu)狀態(tài)時(shí),D 的輸出應(yīng)該聚集到 0.5。但傳統(tǒng)的 GAN 訓(xùn)練算法會(huì)讓判別網(wǎng)絡(luò) D 對(duì)圖像輸出“真實(shí)”(real,1)的可能性,這會(huì)限制判別網(wǎng)絡(luò) D 達(dá)到最優(yōu)性能。不過(guò)這種方法可以很好地解決這個(gè)問(wèn)題,并得到不錯(cuò)的結(jié)果。

經(jīng)過(guò) 5000 次迭代后,標(biāo)準(zhǔn) GAN (左)和相對(duì) GAN (右)的輸出。

8. Self Attention Mechanism(自注意力機(jī)制)

Self Attention GANs(https://arxiv.org/abs/1805.08318)作者稱(chēng)用于生成圖像的卷積會(huì)關(guān)注本地傳播的信息。也就是說(shuō),由于限制性接收域這會(huì)錯(cuò)過(guò)廣泛傳播關(guān)系。

GAN應(yīng)用缺陷的解決方法分享

將 attention map (在黃色框中計(jì)算)添加到標(biāo)準(zhǔn)卷積操作中。

Self-Attention Generative Adversarial Network 允許圖像生成任務(wù)中使用注意力驅(qū)動(dòng)的、長(zhǎng)距依賴(lài)的模型。自注意力機(jī)制是對(duì)正常卷積操作的補(bǔ)充,全局信息(長(zhǎng)距依賴(lài))會(huì)用于生成更高質(zhì)量的圖像,而用來(lái)忽略注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)會(huì)考慮注意力機(jī)制和正常的卷積。(相關(guān)論文鏈接:https://arxiv.org/pdf/1805.08318.pdf)。

使用紅點(diǎn)標(biāo)記的可視化 attention map。

9. 其他技術(shù)

其他可以用來(lái)改善 GAN 訓(xùn)練過(guò)程的技術(shù)包括:

特征匹配

Mini Batch Discrimination(小批量判別)

歷史平均值

One-sided Label Smoothing(單側(cè)標(biāo)簽平滑)

Virtual Batch Normalization(虛擬批量正態(tài)化)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1883

    瀏覽量

    71018
  • Model
    +關(guān)注

    關(guān)注

    0

    文章

    337

    瀏覽量

    24953

原文標(biāo)題:GAN性能不穩(wěn)?這九大技術(shù)可“鎮(zhèn)住”四類(lèi)缺陷

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CAN盒指示燈不亮的解決方法

    CAN盒指示燈不亮可能有多種原因,以下是一些常見(jiàn)的解決方法。
    的頭像 發(fā)表于 09-20 14:53 ?46次閱讀

    一體成型電感表面開(kāi)裂的解決方法

    電子發(fā)燒友網(wǎng)站提供《一體成型電感表面開(kāi)裂的解決方法.docx》資料免費(fèi)下載
    發(fā)表于 07-30 14:22 ?0次下載

    接地網(wǎng)阻值偏大的原因及解決方法

     地網(wǎng)接地電阻測(cè)試儀是保障電氣設(shè)備安全運(yùn)行的重要組成部分,但在實(shí)際使用中,我們可能會(huì)遇到接地網(wǎng)阻值偏大的情況。接下來(lái),鴻蒙小小編介紹造成這種情況的原因,并提供一些解決方法。   1、接地體積不足
    發(fā)表于 06-17 09:19

    鴻蒙OpenHarmony:【常見(jiàn)編譯問(wèn)題和解決方法

    常見(jiàn)編譯問(wèn)題和解決方法
    的頭像 發(fā)表于 05-11 16:09 ?1449次閱讀

    GaN功率HEMT制造中的缺陷及其表征方法

    泛的應(yīng)用范圍內(nèi)推廣,詳細(xì)理解提高產(chǎn)量和可靠性的根本原因至關(guān)重要。本文中,我們總結(jié)了在GaN晶圓加工過(guò)程中常見(jiàn)的一些缺陷,以及用于檢測(cè)這些缺陷的表征技術(shù)。01氮化鎵晶體結(jié)構(gòu)
    的頭像 發(fā)表于 04-18 11:49 ?725次閱讀
    <b class='flag-5'>GaN</b>功率HEMT制造中的<b class='flag-5'>缺陷</b>及其表征<b class='flag-5'>方法</b>

    分析電源電感發(fā)熱解決方法

    電子發(fā)燒友網(wǎng)站提供《分析電源電感發(fā)熱解決方法.docx》資料免費(fèi)下載
    發(fā)表于 03-29 14:39 ?2次下載

    EMI電磁干擾:原理、影響及解決方法詳解?

    EMI電磁干擾:原理、影響及解決方法詳解?|深圳比創(chuàng)達(dá)電子
    的頭像 發(fā)表于 03-21 10:02 ?686次閱讀
    EMI電磁干擾:原理、影響及<b class='flag-5'>解決方法</b>詳解?

    基于深度學(xué)習(xí)的芯片缺陷檢測(cè)梳理分析

    雖然表面缺陷檢測(cè)技術(shù)已經(jīng)不斷從學(xué)術(shù)研究走向成熟的工業(yè)應(yīng)用,但是依然有一些需要解決的問(wèn)題?;谝陨戏治隹梢园l(fā)現(xiàn),由于芯片表面缺陷的獨(dú)特性質(zhì),通用目標(biāo)檢測(cè)算法不適合直接應(yīng)用于芯片表面缺陷檢測(cè)任務(wù),需要提出新的
    發(fā)表于 02-25 14:30 ?945次閱讀
    基于深度學(xué)習(xí)的芯片<b class='flag-5'>缺陷</b>檢測(cè)梳理分析

    PCB壓合問(wèn)題解決方法

    PCB壓合問(wèn)題解決方法
    的頭像 發(fā)表于 01-05 10:32 ?778次閱讀

    網(wǎng)卡硬件故障及解決方法

    網(wǎng)卡硬件故障及解決方法 網(wǎng)卡是計(jì)算機(jī)與網(wǎng)絡(luò)之間進(jìn)行通信的重要組件之一。然而,由于各種原因,網(wǎng)卡硬件故障可能會(huì)導(dǎo)致計(jì)算機(jī)無(wú)法連接到網(wǎng)絡(luò)或者網(wǎng)絡(luò)連接緩慢不穩(wěn)定。本文將介紹常見(jiàn)的網(wǎng)卡硬件故障及解決方法,并
    的頭像 發(fā)表于 12-27 15:17 ?1825次閱讀

    常見(jiàn)的電壓?jiǎn)栴}及其解決方法

    常見(jiàn)的電壓?jiǎn)栴}及其解決方法? 電壓?jiǎn)栴}是常見(jiàn)的電氣故障之一,它可能會(huì)導(dǎo)致設(shè)備故障、損壞甚至危險(xiǎn)。在日常生活和工作中,我們經(jīng)常會(huì)遇到一些電壓?jiǎn)栴},例如電器無(wú)法正常工作、電器過(guò)熱、電器短路等。本文將詳細(xì)
    的頭像 發(fā)表于 12-11 17:16 ?2163次閱讀

    電極片常見(jiàn)缺陷 電極片缺陷檢測(cè)方法 電極片缺陷對(duì)電池性能的影響

    電極片常見(jiàn)缺陷 電極片缺陷檢測(cè)方法 電極片缺陷對(duì)電池性能的影響? 電極片是電池的重要組成部分之一,其質(zhì)量和性能直接影響到電池的工作效率和穩(wěn)定性。然而,電極片在制造和使用過(guò)程中常常會(huì)出現(xiàn)
    的頭像 發(fā)表于 11-10 14:54 ?1193次閱讀

    變頻器過(guò)熱的故障原因和解決方法

    變頻器過(guò)熱的故障原因和解決方法
    的頭像 發(fā)表于 10-24 10:09 ?4725次閱讀

    電感嘯叫的常見(jiàn)原因以及解決方法

    電子發(fā)燒友網(wǎng)站提供《電感嘯叫的常見(jiàn)原因以及解決方法.docx》資料免費(fèi)下載
    發(fā)表于 10-15 11:03 ?2次下載

    舵機(jī)常見(jiàn)的故障原因分析以及解決方法

    舵機(jī)的分析方法和注意事項(xiàng),以及對(duì)舵機(jī)常見(jiàn)故障的解決方法進(jìn)行一個(gè)列舉。
    的頭像 發(fā)表于 09-22 10:14 ?3503次閱讀
    舵機(jī)常見(jiàn)的故障原因分析以及<b class='flag-5'>解決方法</b>