0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像修復(fù)與處理經(jīng)典論文回顧和精讀

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-07-13 16:18 ? 次閱讀

筆者最近在集中時間學(xué)習(xí)對抗生成網(wǎng)絡(luò)(GAN),特別是深度生成先驗進(jìn)行多用途圖像修復(fù)與處理,需要對圖像修復(fù)與處理經(jīng)典論文進(jìn)行回顧和精讀。

將從圖像修復(fù)與處理的經(jīng)典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始,重啟精讀之路。

d4193df6-0283-11ed-ba43-dac502259ad0.png

DGP提出了一種挖掘GAN中圖像先驗的方式,在多個任務(wù)上揭示了GAN作為一種通用圖像先驗的潛力。

論文提出了同時插值隱變量和生成器的漸變式圖像反演方法,可以應(yīng)用于復(fù)雜圖片的對抗防御,在實驗中DGP所展現(xiàn)出的強大的像素間空間關(guān)系模擬能力也十分有趣。

d43f1a1c-0283-11ed-ba43-dac502259ad0.gif

Deep generative prior的圖像復(fù)原效果

01深度生成先驗

深度圖像先驗DIP僅依靠輸入圖像的統(tǒng)計信息,無法應(yīng)用于需要更一般的圖像統(tǒng)計信息的任務(wù),如圖像上色和圖像編輯。

d46d2f42-0283-11ed-ba43-dac502259ad0.png

我們更感興趣的是研究一種更通用的圖像先驗,即在大規(guī)模自然圖像上訓(xùn)練的GAN生成器用于圖像合成。具體來說,是一個基于GAN-inversion的圖像重構(gòu)過程。

在實踐中,僅僅通過優(yōu)化隱向量z難以準(zhǔn)確重建ImageNet這樣的復(fù)雜真實圖像。訓(xùn)練GAN的數(shù)據(jù)集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓(xùn)練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學(xué)習(xí)了豐富的圖片信息,為了利用這些信息并且實現(xiàn)精確重建,我們讓生成器online地適應(yīng)于每張目標(biāo)圖片,即聯(lián)合優(yōu)化隱向量z和生成器參數(shù)

d4926fdc-0283-11ed-ba43-dac502259ad0.png

我們將此新的目標(biāo)稱為深度生成先驗(DGP),DGP顯著提高了圖像重構(gòu)的效果。設(shè)計合適的距離度量和優(yōu)化策略非常關(guān)鍵,在重建過程中,生成器原始的生成先驗被修改了,輸出真實自然圖像的能力可能會下降。

02判別器指引的漸進(jìn)式重建

從 latent space Z 中隨機抽取幾百個候選的初始 latent code,并選擇在度量L下重構(gòu)效果最好的一個。

在GAN重建中,傳統(tǒng)的距離度量方法是 MSE 或 Perceptual loss。優(yōu)化生成器參數(shù)時,將這些傳統(tǒng)距離度量用在圖像恢復(fù)如上色任務(wù)中,常常無法準(zhǔn)確恢復(fù)顏色,并且重建過程中圖像會變得模糊,需要設(shè)計更好的優(yōu)化方式來保留生成器的原有信息。

我們在該工作中選擇使用與生成器對應(yīng)的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個第三方的任務(wù)上訓(xùn)練,而是在預(yù)訓(xùn)練時就與生成器高度耦合,它天然地適用于調(diào)整生成器的輸出分布。

使用這種基于判別器的距離度量時,重建的過程更加自然和真實,最終顏色恢復(fù)的效果也更好。

d4c46f50-0283-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時判別器第i個block輸出的特征

雖然改進(jìn)的距離度量帶來了更好的效果,但是圖像復(fù)原的結(jié)果仍存在非自然痕跡,因為生成器在針對目標(biāo)圖片優(yōu)化時,淺層參數(shù)匹配好圖片整體布局之前,深層參數(shù)就開始匹配細(xì)節(jié)紋理了。

d4d8fee8-0283-11ed-ba43-dac502259ad0.png

上面的蘋果圖是幾種訓(xùn)練策略的對比,從三行效果可以看出,有的蘋果在訓(xùn)練初期沒被染上色后期還是沒被染上色,我們把這種現(xiàn)象稱作“信息滯留”。

對策就是:使用漸進(jìn)式重建的策略,即在微調(diào)生成器時,先優(yōu)化淺層,再逐漸過渡到深層,讓重建過程“先整體后局部”。

與非漸進(jìn)策略相比,這種漸進(jìn)策略更好地保留了缺失語義和現(xiàn)有語義之間的一致性。

d4ee357e-0283-11ed-ba43-dac502259ad0.png

03重建結(jié)果

使用BigGAN模型,基于ImageNet進(jìn)行訓(xùn)練,使用ImageNet驗證集中的1000張圖像進(jìn)行實驗,取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺上的重建誤差幾乎難以察覺。

d51bea28-0283-11ed-ba43-dac502259ad0.png

04實驗

因為GAN刻畫了自然圖像的先驗,因此可以完成很多的任務(wù):比如上色、補全、超分辨率等等,還能進(jìn)行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評估結(jié)果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

d56bab58-0283-11ed-ba43-dac502259ad0.png

圖像補全

d58cc4f0-0283-11ed-ba43-dac502259ad0.png

超分辨率

d5b1deb6-0283-11ed-ba43-dac502259ad0.png

靈活性

d5c8ecdc-0283-11ed-ba43-dac502259ad0.png

隨機擾動

d5e3a16c-0283-11ed-ba43-dac502259ad0.png

總結(jié)

GAN作為圖像領(lǐng)域最強大的生成式模型之一,學(xué)習(xí)到了豐富的自然圖像流形,可以對自然圖像的恢復(fù)和編輯帶來巨大幫助。

利用好大規(guī)模預(yù)訓(xùn)練模型的能力是深度學(xué)習(xí)目前各個領(lǐng)域的流行前沿,可以減少對訓(xùn)練數(shù)據(jù)的需求,整合相近的研究領(lǐng)域。

未來更強大的生成式模型,將帶來更具實際應(yīng)用價值的圖像恢復(fù)和編輯應(yīng)用,有望在更廣泛的領(lǐng)域落地

d609a812-0283-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1884

    瀏覽量

    71081
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    313

    瀏覽量

    20844
  • 圖像修復(fù)
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2258

原文標(biāo)題:深度學(xué)習(xí)論文精讀[GAN]:利用深度生成先驗進(jìn)行多用途圖像修復(fù)與處理

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    圖像處理器的發(fā)展歷史

    圖像處理器(Image Processor)的發(fā)展歷史是一段充滿創(chuàng)新與突破的歷程,它伴隨著計算機技術(shù)的不斷進(jìn)步和圖像處理需求的日益增長而逐漸成熟。以下是對
    的頭像 發(fā)表于 08-14 09:42 ?239次閱讀

    圖像處理器是什么意思

    圖像處理器(Image Processor)是一種專門用于圖像處理和計算的硬件設(shè)備或芯片,它通過高速數(shù)據(jù)傳輸、圖像編解碼、濾波、變換等多種技
    的頭像 發(fā)表于 08-14 09:28 ?321次閱讀

    經(jīng)典卷積網(wǎng)絡(luò)模型介紹

    經(jīng)典卷積網(wǎng)絡(luò)模型在深度學(xué)習(xí)領(lǐng)域,尤其是在計算機視覺任務(wù)中,扮演著舉足輕重的角色。這些模型通過不斷演進(jìn)和創(chuàng)新,推動了圖像處理、目標(biāo)檢測、圖像生成、語義分割等多個領(lǐng)域的發(fā)展。以下將詳細(xì)探討
    的頭像 發(fā)表于 07-11 11:45 ?306次閱讀

    FPGA設(shè)計經(jīng)驗之圖像處理

    今天和大俠簡單聊一聊基于FPGA的圖像處理,之前也和各位大俠聊過相關(guān)的圖像處理,這里面也超鏈接了幾篇,具體如下: 圖像邊緣檢測算法體驗步驟
    發(fā)表于 06-12 16:26

    Workshop!圖像處理和識別入門培訓(xùn)

    隨著人工智能技術(shù)的快速發(fā)展,圖像處理方面的人才成為市場亟須的高級專業(yè)人才。通過本次實踐,開發(fā)者們將全面了解圖像處理領(lǐng)域相關(guān)知識,并將圖像
    的頭像 發(fā)表于 03-20 08:34 ?203次閱讀
    Workshop!<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>和識別入門培訓(xùn)

    關(guān)于數(shù)字圖像處理的常用技巧

    圖像生成采集處理過程中都會不同程度的引入各種噪聲,因此會導(dǎo)致圖像的質(zhì)量變差。從而影響對圖像的識別。所以必須要對圖像進(jìn)行濾波,所以必須對
    的頭像 發(fā)表于 02-19 09:27 ?685次閱讀
    關(guān)于數(shù)字<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的常用技巧

    圖像處理怎么入門?

    總之圖像處理的基本思想還是要立足于圖像本身,要深度到圖像內(nèi)部結(jié)構(gòu)中,思維要靈活。我當(dāng)時做本科畢設(shè)時,怎么也不知道圖像和高維空間中的點之間有什
    的頭像 發(fā)表于 01-08 09:51 ?324次閱讀

    FPGA圖像處理之CLAHE算法

    在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發(fā)表于 01-04 12:23 ?2104次閱讀
    FPGA<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>之CLAHE算法

    免費開源圖像修復(fù)工具lama-cleaner介紹

    Lama Cleaner 是由 SOTA AI 模型提供支持的免費開源圖像修復(fù)工具。可以從圖片中移除任何不需要的物體、缺陷和人,或者擦除并替換(powered by stable diffusion)圖片上的任何東西。
    的頭像 發(fā)表于 12-04 10:23 ?2061次閱讀
    免費開源<b class='flag-5'>圖像</b><b class='flag-5'>修復(fù)</b>工具lama-cleaner介紹

    FPGA圖像處理方法

    圖像在采集和傳輸?shù)倪^程中,通常會產(chǎn)生噪聲,使圖像質(zhì)量降低,影響后續(xù)處理。因此須對圖像進(jìn)行一些圖像濾波、
    的頭像 發(fā)表于 12-02 13:15 ?913次閱讀

    醫(yī)療圖像處理的關(guān)鍵領(lǐng)域及技術(shù)挑戰(zhàn)

    醫(yī)療圖像處理的最后一部分涉及對所獲取信息的管理,包括用于圖像數(shù)據(jù)存儲、檢索和傳輸?shù)母鞣N技術(shù)。制定了若干標(biāo)準(zhǔn)和技術(shù),用于處理圖像管理的各個方面
    發(fā)表于 10-31 11:43 ?599次閱讀
    醫(yī)療<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的關(guān)鍵領(lǐng)域及技術(shù)挑戰(zhàn)

    常用的圖像處理模塊是什么?

    在實際應(yīng)用中常用的圖像處理模塊有哪些
    發(fā)表于 10-30 06:20

    機器視覺之圖像增強和圖像處理

    一、圖像處理技術(shù)概述1.定義對原始獲取圖像進(jìn)行一系列的運算處理,稱為圖像處理
    的頭像 發(fā)表于 10-26 08:07 ?806次閱讀
    機器視覺之<b class='flag-5'>圖像</b>增強和<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>

    機器視覺之圖像增強和圖像處理

    對原始獲取圖像進(jìn)行一系列的運算處理,稱為圖像處理圖像處理是機器視覺技術(shù)的方法基礎(chǔ),包括
    發(fā)表于 10-23 10:43 ?433次閱讀
    機器視覺之<b class='flag-5'>圖像</b>增強和<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>

    機器視覺:圖像處理技術(shù)、圖像增強技術(shù)

    對原始獲取圖像進(jìn)行一系列的運算處理,稱為圖像處理。圖像處理是機器視覺技術(shù)的方法基礎(chǔ),包括
    發(fā)表于 10-20 10:17 ?953次閱讀
    機器視覺:<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>技術(shù)、<b class='flag-5'>圖像</b>增強技術(shù)