0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于生成對抗網(wǎng)絡(GAN)的框架

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-04-17 16:28 ? 次閱讀

來自瑞士蘇黎世聯(lián)邦理工學院的研究人員們提出了一種基于生成對抗網(wǎng)絡(GAN)的框架,可以以高畫質壓縮圖像,并保證圖像尺寸降到最小。以下是論智對原論文的大致報道。

基于深度神經(jīng)網(wǎng)絡的圖像壓縮系統(tǒng)最近逐漸受到人們的關注。這些系統(tǒng)通常比目前由編碼解碼器驅動的系統(tǒng)(如BPG、WebP和JPEG2000)表現(xiàn)得好,除了能在自然圖像上實現(xiàn)更高的壓縮率之外,他們可以很容易地適應特定目標領域,例如立體圖像或醫(yī)學圖像,并且可以從壓縮版本中直接進行高效地處理和索引。

然而,對于低于像素深度低于0.1bpp的圖像來說,這些算法仍會導致嚴重的畫質下降。隨著比特率趨近于零,想呈現(xiàn)完整地圖像內容就很困難,而且這樣會使峰值信噪比(PSNR)或多比例結構相似性(MS-SSIM)等常見指標將變得毫無意義,因為它們更傾向于精確地保留局部(高熵)結構,而不是保持總體的紋理。

為了進一步提升深度圖像壓縮的質量,開發(fā)超越PSNR和MS-SSIM的新指標非常重要。其中重點關注的是對抗損失,最近的成果表明它能捕捉到全局的語義信息和局部紋理,產(chǎn)生強大的生成器,從而通過語義標簽映射生成在視覺上吸引人的高分辨率圖像。

于是,來自蘇黎世聯(lián)邦理工學院的研究人員們提出并研究了基于生成對抗網(wǎng)絡(GAN)的針對極限壓縮圖像的框架,目標是像素深度低于0.1bpp的圖像。他們提出了一個通用性的GAN公式,用于深度圖像壓縮,可以生成不同程度的圖像內容。與先前的圖像壓縮工作相比,這次的生成器/解碼器在全分辨率的圖像上工作,并用多尺度鑒別器進行訓練。

研究人員對兩種操作模式進行了分別研究:

全局生成壓縮(GC),保留圖像所有內容,同時生成不同尺寸的結構,例如樹上的葉子或者某建筑物陽臺上的窗戶;

選擇性生成壓縮(SC),只通過語義標簽映射生成圖像的部分內容,同時以高還原度保留用戶指定區(qū)域。

上圖是研究人員所提出的壓縮網(wǎng)絡。E代表圖像x的編碼器,或者作為圖像s的語義標簽映射。q將潛在的代碼w量化為w^。G是生成器,產(chǎn)生解壓縮的圖像x^,D是用于對抗訓練的鑒別器。對于SC,F(xiàn)從s中提取特征,經(jīng)過二次采樣的熱圖乘以z^以分配空間位。

GC的典型應用場景是帶寬受限的區(qū)域,在這種情況下用戶想盡可能保留完整的圖像,但沒有足夠的位數(shù)儲存原始像素,無法合成塊狀或模糊的斑點,只能合成內容。SC可以用于視頻場景,如果用戶想要完全保留視頻中的人物,但是看起來吸引人的合成背景能滿足我們的目的,即作為真實的背景。在GC操作模式下,圖像被轉換成比特流格式,并且用算數(shù)編碼進行編碼。SC需要一個原圖的語義或實例標簽映射,它們可以從語義或實例分割網(wǎng)絡得來(例如PSPNet或Mask R-CNN)。相比于編碼的成本,這種圖像壓縮的開銷是少的。另一方面,壓縮圖像的大小根據(jù)語義標簽生成的區(qū)域按比例減少,通常也會降低儲存成本。

經(jīng)過綜合性的研究,在GC方面,研究人員提出的壓縮系統(tǒng)生成的圖像結果比BPG和基于自動編碼器的深度壓縮系統(tǒng)更好(BPG是目前最優(yōu)秀的壓縮算法)。尤其是從Cityscapes數(shù)據(jù)集中選取的街景圖片,用戶更喜歡本次系統(tǒng)生成的圖片,即使BPG使用的位數(shù)是我們的兩倍。據(jù)他們所知,這是第一個證明深度壓縮方法由于BPG的研究。

在SC操作模式中,該系統(tǒng)能將圖像中保留下來的內容和合成內容無縫銜接,即使被許多物體隔開的場景也很自然。利用這種分區(qū)域圖像生成的方法,圖像的像素深度減少了50%,但是沒有明顯降低圖像質量。

結果對比

下面的表格展示了本文提出的方法的結果和最先進的系統(tǒng)在Cityscapes數(shù)據(jù)集上的對比:

此次試驗結果要比BPG好,即使當BPG使用的bpp數(shù)量是我們的兩倍也是如此。在本文中,系統(tǒng)在ADE20K數(shù)據(jù)集和Kodak壓縮基準測試上獲得了相似的結果。

接著,研究人員用經(jīng)過預訓練的PSPNet來測量保留的語義,結果如下:

與BPG相比,我們達到了較高的mIoU的值,利用語義進行訓練時這個值進一步增加

將所提的方法與其他方法對比。同樣一張Kodak Image 13,用本文所提出的方法壓縮與BPG、JPEG2000等方法效果非常不同:

在選擇性合成方面,該方法可以選擇性地保留一部分內容,將剩下的部分重新合成。

左下角的熱圖顯示了合成對象,灰色是合成的部分。同時還顯示了每張圖的bpp,以及由于選擇性生成節(jié)省的尺寸

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4717

    瀏覽量

    99993
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1883

    瀏覽量

    71018

原文標題:基于GAN的極限圖像壓縮框架

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    圖像生成對抗生成網(wǎng)絡gan_GAN生成汽車圖像 精選資料推薦

    圖像生成對抗生成網(wǎng)絡ganHello there! This is my story of making a GAN that would generate images of cars
    發(fā)表于 08-31 06:48

    圖像生成對抗生成網(wǎng)絡

    圖像生成對抗生成網(wǎng)絡ganby Thalles Silva 由Thalles Silva暖身 (Warm up)Let’s say there’s a very cool party going
    發(fā)表于 09-15 09:29

    生成對抗網(wǎng)絡模型綜述

    ,開創(chuàng)性地提出了生成對抗網(wǎng)絡GAN)。生成對抗網(wǎng)絡包含一個生成模型和一個判別模型。其中,
    發(fā)表于 04-03 10:48 ?1次下載
    <b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b>模型綜述

    生成對抗網(wǎng)絡GAN,正在成為新的“深度學習”

    生成對抗網(wǎng)絡由一個生成網(wǎng)絡(Generator)與一個判別網(wǎng)絡(Discriminator)組成。生成
    的頭像 發(fā)表于 06-11 16:04 ?4684次閱讀
    <b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b><b class='flag-5'>GAN</b>,正在成為新的“深度學習”

    生成對抗網(wǎng)絡在計算機視覺領域有什么應用

    生成對抗網(wǎng)絡GAN, Generative Adversarial Networks)的出現(xiàn)是計算機視覺領域又一里程碑式的發(fā)展,它為解決各種圖像預測問題提供了新型工具。以此為目的,本文通過相關文獻
    發(fā)表于 12-06 15:29 ?22次下載
    <b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b>在計算機視覺領域有什么應用

    如何使用生成對抗網(wǎng)絡進行信息隱藏方案資料說明

    針對信息隱藏中含密栽體會留有修改痕跡,從根本上難以抵抗基于統(tǒng)計的隱寫分析算法檢測的問題,提出一種基于生成對抗網(wǎng)絡GAN)的信息隱藏方案。該方案首先利用生成對抗
    發(fā)表于 12-12 16:57 ?6次下載
    如何使用<b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b>進行信息隱藏方案資料說明

    如何使用深度殘差生成對抗網(wǎng)絡設計醫(yī)學影像超分辨率算法

    針對醫(yī)學影像超分辨率重建過程中細節(jié)丟失導致的模糊問題,提出了一種基于深度殘差生成對抗網(wǎng)絡GAN)的醫(yī)學影像超分辨率算法。首先,算法包括生成網(wǎng)絡
    發(fā)表于 01-02 16:59 ?5次下載
    如何使用深度殘差<b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b>設計醫(yī)學影像超分辨率算法

    必讀!生成對抗網(wǎng)絡GAN論文TOP 10

    這篇 GAN 論文來自 NVIDIA Research,提出以一種漸進增大(progressive growing)的方式訓練 GAN,通過使用逐漸增大的 GAN 網(wǎng)絡(稱為 PG-
    的頭像 發(fā)表于 03-20 09:02 ?6423次閱讀
    必讀!<b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b><b class='flag-5'>GAN</b>論文TOP 10

    生成對抗網(wǎng)絡與其他生成模型之間的權衡取舍是什么?

    根據(jù)一些指標顯示,關于生成對抗網(wǎng)絡GAN)的研究在過去兩年間取得了本質的進步。
    的頭像 發(fā)表于 04-29 11:01 ?3731次閱讀

    基于密集卷積生成對抗網(wǎng)絡的圖像修復方法

    差等問題。針對上述問題,文中提出了一種基于密集卷積生成對抗網(wǎng)絡的圖像修復算法。該算法采用生成對抗網(wǎng)絡作為圖像修復的基本框架。首先,利用密集卷
    發(fā)表于 05-13 14:39 ?15次下載

    基于像素級生成對抗網(wǎng)絡的圖像彩色化模型

    基于像素級生成對抗網(wǎng)絡的圖像彩色化模型
    發(fā)表于 06-27 11:02 ?4次下載

    GAN生成對抗網(wǎng)絡 Generative Adversarial Networks

    原文鏈接 1 原理 對于生成對抗網(wǎng)絡GAN,一個簡單的理解是可以將其看做博弈的過程,我們可以將生成模型和判別模型看作博弈的雙方,比如在犯罪分子造假幣和警察識別假幣的過程中:
    的頭像 發(fā)表于 01-12 09:45 ?749次閱讀

    生成對抗網(wǎng)絡GAN的七大開放性問題

    生成對抗網(wǎng)絡在過去一年仍是研究重點,我們不僅看到可以生成高分辨率(1024×1024)圖像的模型,還可以看到那些以假亂真的生成圖像。此外,我們還很興奮能看到一些新的
    的頭像 發(fā)表于 03-17 11:18 ?573次閱讀
    <b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b><b class='flag-5'>GAN</b>的七大開放性問題

    PyTorch教程20.2之深度卷積生成對抗網(wǎng)絡

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程20.2之深度卷積生成對抗網(wǎng)絡.pdf》資料免費下載
    發(fā)表于 06-05 10:21 ?2次下載
    PyTorch教程20.2之深度卷積<b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡</b>

    生成對抗網(wǎng)絡(GANs)的原理與應用案例

    生成對抗網(wǎng)絡(Generative Adversarial Networks,GANs)是一種由蒙特利爾大學的Ian Goodfellow等人在2014年提出的深度學習算法。GANs通過構建兩個
    的頭像 發(fā)表于 07-09 11:34 ?437次閱讀