0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于單幅圖像的雨滴去除方法

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-06-25 11:39 ? 次閱讀

北京大學(xué)和新加坡國立大學(xué)的研究人員提出一種新方法去除圖像中的雨滴,通過在生成對(duì)抗網(wǎng)絡(luò)中插入注意力圖,去除雨滴的效果相比以往方法大幅提升。這項(xiàng)工作有很大的實(shí)際意義,比如用在自動(dòng)駕駛中。

附著在玻璃窗戶、擋風(fēng)玻璃或鏡頭上的雨滴會(huì)阻礙背景場景的能見度,并降低圖像的質(zhì)量。圖像質(zhì)量降低的主要原因是有雨滴的區(qū)域與沒有雨滴的區(qū)域相比,包含不同的映象。與沒有雨滴的區(qū)域不同,雨滴區(qū)域是由來自更廣泛環(huán)境的反射光形成的,這是由于雨滴的形狀類似于魚眼鏡頭。此外,在大多數(shù)情況下,相機(jī)的焦點(diǎn)都在背景場景上,使得雨滴的外觀變得模糊。

在這篇論文中,北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所和新加坡國立大學(xué)的研究人員解決了這種圖像能見度降低(visibility degradation)的問題。由于雨滴降低了圖像質(zhì)量,我們的目標(biāo)是去除雨滴并產(chǎn)生清晰的背景,如圖1所示。

圖1:雨滴去除方法的演示。左圖:輸入的有雨滴的圖像。右圖:我們的結(jié)果,大多數(shù)雨滴被去除了,結(jié)構(gòu)細(xì)節(jié)也被恢復(fù)。放大圖片可以更好地觀察修復(fù)質(zhì)量。

我們的方法是全自動(dòng)的。該方法將有利于圖像處理和計(jì)算機(jī)視覺應(yīng)用,特別是哪些需要處理雨滴、灰塵或類似東西的應(yīng)用。

有幾種方法可以解決雨滴的檢測和去除問題。但是,一些方法專用于檢測雨滴而不能將其去除,一些方法不適用于普通相機(jī)拍攝的單個(gè)輸入圖像,或者只能處理小的雨滴,并且產(chǎn)生的輸出很模糊。

我們的工作打算處理大量的雨滴,如圖1所示。一般來說,去除雨滴的問題是難以解決的。因?yàn)槭紫?,被雨滴遮擋的區(qū)域不是固定的。其次,被遮擋區(qū)域的背景場景的信息大部分是完全丟失的。當(dāng)雨滴較大,而且密集地分布在輸入圖像時(shí),問題會(huì)變得更糟。

為了解決這個(gè)問題,我們使用生成對(duì)抗網(wǎng)絡(luò)(GAN)。在這個(gè)網(wǎng)絡(luò)中,產(chǎn)生的輸出將由判別網(wǎng)絡(luò)(discriminative network)進(jìn)行評(píng)估,以確保輸出看起來像真實(shí)的圖像。為了解決問題的復(fù)雜性,生成網(wǎng)絡(luò)( generative network)首先嘗試生成一個(gè)注意力圖(attention map)。注意力圖是這個(gè)網(wǎng)絡(luò)中最重要的部分,因?yàn)樗鼘⒁龑?dǎo)生成網(wǎng)絡(luò)關(guān)注雨滴區(qū)域。 注意力圖由一個(gè)循環(huán)網(wǎng)絡(luò)生成,該循環(huán)網(wǎng)絡(luò)由深層殘差網(wǎng)絡(luò)(ResNets)和一個(gè)卷積LSTM和幾個(gè)標(biāo)準(zhǔn)的卷積層組成。我們稱之為attentive-recurrent network。

生成網(wǎng)絡(luò)的第二部分是一個(gè)自動(dòng)編碼器(autoencoder),它以輸入圖像和注意力圖作為輸入。為了獲得更廣泛的上下文信息,在自動(dòng)編碼器的解碼器側(cè),我們應(yīng)用了多尺度損失(multi-scale losses)。每個(gè)損失都比較了卷積層的輸出和相應(yīng)的ground truth之間的差異。卷積層的輸入是解碼器層的特征。除了這些損失之外,對(duì)于自動(dòng)編碼器的最終輸出,我們應(yīng)用一個(gè)感知損失來獲得與ground truth更全面的相似性。最后的輸出也是生成網(wǎng)絡(luò)的輸出。

在獲得生成圖像輸出后,判別網(wǎng)絡(luò)將檢查它是否真實(shí)。但是,在我們的問題中,尤其是在測試階段,目標(biāo)雨滴區(qū)域并沒有給出。因此,在局部區(qū)域上沒有判別網(wǎng)絡(luò)可以關(guān)注的信息。為了解決這一問題,我們利用注意力圖來引導(dǎo)判別網(wǎng)絡(luò)指向局部目標(biāo)區(qū)域。

總的來說,除了引入一種新的雨滴去除方法外,我們的另一個(gè)主要貢獻(xiàn)是將注意力圖引入到生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)中,這是一種全新的方法,可以有效地去除雨滴。我們將發(fā)布代碼和數(shù)據(jù)集。

雨滴圖像的形成

我們將有雨滴的圖像建模為背景圖像與雨滴效果的結(jié)合:

其中I是彩色的輸入圖像,M是二進(jìn)制掩碼。在掩模中,M(x) = 1表示像素x是雨滴區(qū)域的一部分,否則表示它是背景區(qū)域的一部分。B表示背景圖像,R表示雨滴帶來的效果。運(yùn)算符⊙表示element-wise乘法。

雨滴實(shí)際上是透明的。然而,由于雨滴區(qū)域的形狀和折射率,雨滴區(qū)域的像素不僅受到現(xiàn)實(shí)世界中一個(gè)點(diǎn)的影響,還受到整個(gè)環(huán)境的影響,使得大部分雨滴似乎都有不同于背景場景的意象。此外,由于我們的相機(jī)被假定聚焦在背景場景上,雨滴區(qū)域內(nèi)的圖像大多是模糊的。雨滴的某些部分,尤其是外圍和透明區(qū)域,傳達(dá)了一些有關(guān)背景的信息。我們注意到這些信息可以被我們的網(wǎng)絡(luò)利用。

使用Attentive GAN去除雨滴

圖2:Attentive GAN的架構(gòu)。生成器由一個(gè) attentive-recurrent網(wǎng)絡(luò)和autoencoder組成。判別器由一系列的卷積層組成,并由attention map引導(dǎo)。

圖2顯示了我們提出的網(wǎng)絡(luò)的總體架構(gòu)。根據(jù)生成對(duì)抗網(wǎng)絡(luò)的思想,Attentive GAN有兩個(gè)主要部分:生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)。給定一個(gè)有雨滴的輸入圖像,我們的生成網(wǎng)絡(luò)試圖生成一個(gè)盡可能真實(shí)并且沒有雨滴的圖像。判別網(wǎng)絡(luò)將驗(yàn)證生成網(wǎng)絡(luò)生成的圖像是否看起來真實(shí)。

Attentive GAN的loss可以表示為:

生成網(wǎng)絡(luò)(Generative Network)

如圖2所示,生成網(wǎng)絡(luò)由兩個(gè)子網(wǎng)絡(luò)組成:一個(gè)attentive-recurrent network和一個(gè)contextual autoencoder。

Attentive-Recurrent Network:視覺注意力模型被應(yīng)用于定位目標(biāo)區(qū)域的圖像,以捕獲區(qū)域的特征。

圖3:attention map學(xué)習(xí)過程的可視化

Contextual Autoencoder:背景自動(dòng)編碼器的目的是產(chǎn)生一個(gè)沒有雨滴的圖像。自動(dòng)編碼器的輸入是輸入圖像和Attentive-Recurrent網(wǎng)絡(luò)的最終注意力圖的連接。我們的deep autoencoder有16個(gè)conv-relu塊,并且跳過連接以防止模糊輸出。

圖4:Contextual Autoencoder的結(jié)構(gòu)

判別網(wǎng)絡(luò)(Discriminative Network)

我們的判別網(wǎng)絡(luò)包含7個(gè)卷積層,核為(3,3),全鏈接層為1024,以及一個(gè)具有sigmoid激活函數(shù)的單個(gè)神經(jīng)元。我們從倒數(shù)第三個(gè)卷積層提取特征,然后進(jìn)行乘法運(yùn)算。

圖5:數(shù)據(jù)集的樣本。上:有雨滴的圖像。下:相應(yīng)的ground-truth圖像。

實(shí)驗(yàn)結(jié)果

表1:定量評(píng)估的結(jié)果

圖6:比較幾種不同方法的結(jié)果

圖7:比較我們網(wǎng)絡(luò)架構(gòu)的一些部分

圖8:attentive-recurrent 網(wǎng)絡(luò)生成的注意力圖的可視化

圖9:我們的輸出和Pix2Pix輸出之間的比較。我們的輸出具有更少的偽影和更好的復(fù)原結(jié)構(gòu)

應(yīng)用

為了進(jìn)一步證明我們的可見性增強(qiáng)方法對(duì)于計(jì)算機(jī)視覺應(yīng)用是有用的,我們使用了谷歌視覺API (https://cloud.google.com/vision/)來測試使用我們的輸出是否可以提高識(shí)別性能。結(jié)果如圖10所示。

圖10:一個(gè)改進(jìn)谷歌視覺API結(jié)果的示例。我們的方法增加了主要對(duì)象檢測的分?jǐn)?shù)以及識(shí)別到的對(duì)象數(shù)量。

可以看出,使用我們的輸出,一般的識(shí)別比沒有我們的可見性增強(qiáng)過程要好。此外,我們對(duì)測試數(shù)據(jù)集進(jìn)行評(píng)估,如圖11的統(tǒng)計(jì)數(shù)據(jù)顯示,使用我們的可見性增強(qiáng)輸出在識(shí)別輸入圖像中的主要對(duì)象的平均得分和識(shí)別出的對(duì)象標(biāo)簽數(shù)方面,顯著優(yōu)于沒有可見性增強(qiáng)的輸出。

圖11:基于Google Vision API的改進(jìn)

結(jié)論

我們提出了一種基于單幅圖像的雨滴去除方法。該方法利用生成對(duì)抗網(wǎng)絡(luò),其中生成網(wǎng)絡(luò)通過attentive-recurrent網(wǎng)絡(luò)產(chǎn)生注意力圖(attention map),并將該圖與輸入圖像一起通過contextual autoencoder生成無雨滴圖像。然后,判別網(wǎng)絡(luò)評(píng)估生成的輸出的全局和局部有效性。為了能夠局部驗(yàn)證,我們將注意力圖注入網(wǎng)絡(luò)。該方法的創(chuàng)新之處在于在生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)中使用注意力圖。我們還認(rèn)為,我們的方法是第一種可以處理相對(duì)嚴(yán)重的雨滴圖像的方法,而目前最先進(jìn)的雨滴去除方法尚沒有解決這個(gè)問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    44

    文章

    3529

    瀏覽量

    133272
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1685

    瀏覽量

    45811
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    781

    文章

    13449

    瀏覽量

    165254

原文標(biāo)題:效果驚艷!北大團(tuán)隊(duì)提出Attentive GAN去除圖像中雨滴

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    小編科普一種去除傳輸線的方法

    本文介紹了一種去除傳輸線的方法。
    發(fā)表于 05-21 07:10

    一種通過曲線擬合去除圖像塊效應(yīng)的算法

    基于DCT域的圖像處理方法具有廣泛的應(yīng)用,但是由于需要對(duì)圖像的DCT塊單獨(dú)進(jìn)行處理,導(dǎo)致塊效應(yīng)的產(chǎn)生。本文提出了一種通過曲線擬合去除彩色
    發(fā)表于 08-20 16:58 ?0次下載
    <b class='flag-5'>一種</b>通過曲線擬合<b class='flag-5'>去除</b><b class='flag-5'>圖像</b>塊效應(yīng)的算法

    一種新的DSA圖像增強(qiáng)算法

    DSA是一種重要的醫(yī)學(xué)診斷和介入治療的技術(shù),DSA圖像質(zhì)量對(duì)于醫(yī)生確定病情具有重要意義?,F(xiàn)提出了一種新的DSA圖像增強(qiáng)算法來提高DSA圖像
    發(fā)表于 11-15 15:50 ?22次下載
    <b class='flag-5'>一種</b>新的DSA<b class='flag-5'>圖像</b>增強(qiáng)算法

    一種增強(qiáng)的單幅圖像自學(xué)習(xí)超分辨方法

    針對(duì)圖像超分辨率方法構(gòu)建圖像塊的稀疏表示(SR)系數(shù)存在的主要問題,利用加權(quán)思想提出一種增強(qiáng)的單幅圖像
    發(fā)表于 11-28 10:09 ?1次下載
    <b class='flag-5'>一種</b>增強(qiáng)的<b class='flag-5'>單幅</b><b class='flag-5'>圖像</b>自學(xué)習(xí)超分辨<b class='flag-5'>方法</b>

    基于暗通道原理的單幅遙感圖像高程值提取算法

    根據(jù)單幅遙感圖像估計(jì)高程信息可以應(yīng)用于滑坡、泥石流等自然災(zāi)害的檢測,因此,提出了一種基于暗通道原理的單幅遙感圖像高程值提取算法,并對(duì)山脈的陰
    發(fā)表于 12-05 15:53 ?1次下載
    基于暗通道原理的<b class='flag-5'>單幅</b>遙感<b class='flag-5'>圖像</b>高程值提取算法

    一種圖像拼接的運(yùn)動(dòng)目標(biāo)檢測方法

    圖像拼接中出現(xiàn)的運(yùn)動(dòng)目標(biāo)可能使拼接出現(xiàn)不能正常拼接或者拼接出多重影像的現(xiàn)象。本文提出一種圖像拼接的運(yùn)動(dòng)目標(biāo)檢測方法去除運(yùn)動(dòng)目標(biāo)對(duì)
    發(fā)表于 12-08 10:05 ?2次下載

    最小二乘規(guī)則的單幅圖像超分辨算法

    差異性的角度提出了一種使用迭代最小二乘字典學(xué)習(xí)算法(ILS-DLA),并使用錨定鄰域回歸(ANR)進(jìn)行圖像重建的單幅圖像超分辨算法。迭代最小二乘法的整體優(yōu)化過程極大地縮短了低分辨字典/
    發(fā)表于 12-22 11:04 ?0次下載
    最小二乘規(guī)則的<b class='flag-5'>單幅</b><b class='flag-5'>圖像</b>超分辨算法

    基于鄰域特征學(xué)習(xí)的單幅圖像超分辨重建

    針對(duì)圖像重建過程中待插值點(diǎn)灰度估計(jì)不準(zhǔn)確的問題,提出一種基于鄰域特征學(xué)習(xí)的單幅圖像超分辨回歸分析方法。在輸入低分辨率
    發(fā)表于 02-07 15:59 ?1次下載
    基于鄰域特征學(xué)習(xí)的<b class='flag-5'>單幅</b><b class='flag-5'>圖像</b>超分辨重建

    使用單幅圖像超分辨率算法解決SR資源不足和抗噪性差的問題說明

    針對(duì)單幅圖像超分辨率(SR)復(fù)原樣本資源不足和抗噪性差的問題,提出一種基于結(jié)構(gòu)自相似和形變塊特征的單幅圖像超分辨率算法。首先,該
    發(fā)表于 11-05 11:57 ?1次下載
    使用<b class='flag-5'>單幅</b><b class='flag-5'>圖像</b>超分辨率算法解決SR資源不足和抗噪性差的問題說明

    基于結(jié)構(gòu)自相似性和形變塊特征的單幅圖像超分辨率算法

    針對(duì)單幅圖像超分辨率(SR)復(fù)原樣本資源不足和抗噪性差的問題,提出一種基于結(jié)構(gòu)自相似和形變塊特征的單幅圖像超分辨率算法。首先,該
    發(fā)表于 12-02 16:34 ?8次下載
    基于結(jié)構(gòu)自相似性和形變塊特征的<b class='flag-5'>單幅</b><b class='flag-5'>圖像</b>超分辨率算法

    基于加權(quán)近紅外圖像融合的單幅圖像除霧方法

    傳統(tǒng)圖像除霧方法存在無霧區(qū)域中圖像對(duì)比度過高的問題,導(dǎo)致在某些情況下生成的圖像視覺效果不夠自然。為了得到自然清晰的除霧圖像,提岀了
    發(fā)表于 05-17 15:29 ?7次下載

    可改善圖像失真現(xiàn)象的單幅圖像去霧算法

    利用暗通道先驗(yàn)去霧算法處理包含大塊亮白區(qū)域的圖像時(shí),存在圖像失真的問題。為此,提出一種改進(jìn)的的單幅圖像去霧算法。利用基于
    發(fā)表于 05-25 16:31 ?3次下載

    單幅航攝像片中的薄云去除方法綜述

    單幅航攝像片中的薄云去除方法綜述
    發(fā)表于 06-25 14:10 ?8次下載

    一種澆口蝕刻后的感光膜去除方法

    本發(fā)明涉及一種感光膜去除方法,通過使半導(dǎo)體制造工藝中澆口蝕刻后生成的聚合物去除順暢,可以簡化后處理序列,從而縮短前工藝處理時(shí)間,上述感光膜去除
    發(fā)表于 04-12 16:30 ?456次閱讀
    <b class='flag-5'>一種</b>澆口蝕刻后的感光膜<b class='flag-5'>去除</b><b class='flag-5'>方法</b>

    一種鋰電池內(nèi)水去除工藝方法

    一種鋰電池內(nèi)水去除工藝方法
    的頭像 發(fā)表于 01-04 10:23 ?367次閱讀
    <b class='flag-5'>一種</b>鋰電池內(nèi)水<b class='flag-5'>去除</b>工藝<b class='flag-5'>方法</b>