0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于深度學習的圖像去模糊算法及應用

CVer ? 來源:機器之心 ? 作者:機器之心 ? 2022-10-28 16:00 ? 次閱讀

本文提出了一個圖像去模糊方向的綜述,來自澳大利亞國立大學、中山大學、美國加州大學 Merced 分校、日本樂天研究所的研究者回顧了基于深度學習的圖像去模糊技術研究進展,回顧了圖像去模糊的研究歷史,總結了當前的研究進展,并進行了展望。該綜述近期被計算機視覺旗艦期刊 International Journal of Computer Vision 接收。

06b68bda-5165-11ed-a3b6-dac502259ad0.png

圖像去模糊是計算機底層視覺中的一個經(jīng)典問題,它的目標是將輸入的模糊圖像中恢復成清晰的圖像。近些年,基于深度學習的神經(jīng)網(wǎng)絡在該任務上取得了重大進展。本文對最近發(fā)表的基于深度學習的圖像去模糊方法進行了全面的回顧,主要看點如下:

1.闡述圖像去模糊的研究背景,包括如何定義去模糊、模糊產(chǎn)生的原因、去模糊的方法、質量評估的指標、常見的數(shù)據(jù)集。

2.討論了近些年基于深度學習在圖像去模糊領域中取得的進展,對當前的深度去模糊方法進行全面回顧。

3.分析了當前圖像去模糊存在的挑戰(zhàn)以及未來的研究課題。

06c95710-5165-11ed-a3b6-dac502259ad0.png

背景知識

圖像模糊是由拍攝圖像過程中的各種因素引起,包括相機抖動、目標運動以及離焦等。根據(jù)模糊圖片的不同,一般將模糊圖片分為如下幾類:運動模糊,離焦模糊,高斯模糊,以及混合模糊。

(1)運動模糊:在光照充足的條件下,當曝光時間足夠短時,相機可以捕捉到清晰的圖像。但是,當曝光時間相對于物體或者相機運動過長的時候,圖像會產(chǎn)生模糊,該模糊圖片一般被稱為運動模糊。

(2)離焦模糊:除了運動模糊之外,圖像清晰度還受到目標位置以及相機焦距的影響。在相機的成像區(qū)域中,不同目標的景深是不同的,當相機的對焦系統(tǒng)無法對焦到某些目標時,相機就會拍攝到離焦模糊的圖片。

(3)高斯模糊:高斯模糊是通過高斯卷積得到的一種模糊圖像。

(4)混合模糊:當一個圖片同時被多種因素影響時,造成的模糊就是混合模糊,比如相機拍攝在離焦狀態(tài)下的高速運動物體時,得到的模糊就是一種混合模糊。

為了評估去模糊的效果,通常采用一些圖片評估算法,這些算法包括基于主觀和基于客觀的評測。主觀方法是不需要清晰圖像作參考的,一個具有代表性的指標是 MOS,評測者用 1-5 的等級對圖像質量進行評分,之后對分數(shù)進行平均。對于圖像去模糊的問題,大多數(shù)現(xiàn)有方法都是根據(jù)基于客觀的指標進行評測,該方法可以進一步分為兩類:有參考和無參考的指標。有參考的指標通過將恢復的圖像與清晰圖進行比較來評估圖像質量,包括 PSNR,SSIM, WSNR, MS-SSIM、IFC、NQM、UIQI、VIT、LPIPS 等等,其中 PSNR 跟 SSIM 是最常用的指標。

與有參考的指標不同,無參考指標僅使用去模糊的圖像就可以衡量其質量。常見的指標包括 BIQI、BLINDS、BRISQUE、CORNIA、NIQE、SSEQ 等。此外,也有人通過測量去模糊算法對不同視覺任務(例如目標檢測和識別)準確性的影響,來評估圖像去模糊算法的性能。

非盲圖像去模糊

圖像去模糊的任務是根據(jù)給定的模糊圖像,恢復潛在的清晰圖像。當已知圖片模糊核的情況下,則該問題也可以被稱為非盲圖像去模糊。盡管已知了模糊核,但是由于傳感器噪聲和高頻信息的丟失,該任務仍然具有挑戰(zhàn)性。

一些基于非深度學習的方法通常使用自然圖像先驗,例如全局或者局部圖像先驗,在空間域 或頻域中重建清晰的圖像。為了恢復出更好的圖片,近些年,一些基于空間反卷積和深度神經(jīng)網(wǎng)絡的方法相繼被提出。本文在下面表格中總結了現(xiàn)有的基于深度學習的非盲方法,這些方法可以大致分為兩組:第一組是基于反卷積去噪,而第二組是基于先驗去噪聲:

06e70490-5165-11ed-a3b6-dac502259ad0.png

盲圖像去模糊

當模糊圖的模糊核未知時,圖像去模糊任務被稱為盲圖像去模糊。早期的盲圖像去模糊方法側重于去除均勻的模糊核。然而,真實世界的模糊圖像,其不同區(qū)域通常是由不同的模糊核生成,因此其模糊核是非均勻的。為了解決盲圖像的去模糊任務,多種基于深度學習的圖像去模糊算法被提出。本文在下面表格中總結了現(xiàn)有的基于深度學習的盲圖像去模糊方法,這些方法通常采用各種不同的網(wǎng)絡框架,包括多尺度網(wǎng)絡、對抗神經(jīng)網(wǎng)絡、級聯(lián)網(wǎng)絡、再模糊網(wǎng)絡等等。

070f1e26-5165-11ed-a3b6-dac502259ad0.png

07456788-5165-11ed-a3b6-dac502259ad0.png

07503ba4-5165-11ed-a3b6-dac502259ad0.png

損失函數(shù)

為了更好的訓練深度去模糊網(wǎng)絡,各種各樣的損失函數(shù)被提出。早期的方法大部分是基于像素級內容的損失函數(shù),用于測量網(wǎng)絡訓練過程中的去模糊圖片跟清晰圖片的重建誤差??紤]到像素級內容的損失不能準確衡量去模糊圖像的質量,各種其他的損失函數(shù)被提出,包括基于對抗的損失函數(shù)、基于感知的損失函數(shù)、基于相對模糊的損失函數(shù)、基于光流的損失函數(shù)等等。

模型性能對比

本本總結了具有代表性的圖像去模糊跟視頻去模糊算法在主流數(shù)據(jù)集上的 PSNR/SSIM 指標。

07746ab0-5165-11ed-a3b6-dac502259ad0.png

07aaeedc-5165-11ed-a3b6-dac502259ad0.png

此外,本文總結了不同損失函數(shù)對去模糊方法的影響,模型在 non-reference 的評價指標上的表現(xiàn),以及模型的速度。

特定場景的圖像去模糊

當前,絕大部分基于深度學習的圖像去模糊算法是不區(qū)分場景的,也就是他們是對常見的自然與人為設計的場景進行去模糊。但是,在現(xiàn)實生活中,經(jīng)常會遇到一些特定場景的圖像去模糊。比如人臉去模糊、文本去模糊、雙目去模糊。本文總結了這些不同場景的特點,以及各自的深度去模糊算法。

機遇與挑戰(zhàn)

盡管圖像去模糊算法在主流數(shù)據(jù)集上取得了重大進展,但把真實世界的模糊圖恢復成清晰的圖像仍然具有挑戰(zhàn)性。本文最后總結了圖像去模糊算法現(xiàn)在面臨的挑戰(zhàn)并討論了未來可能的研究機會,包括真實數(shù)據(jù)采集、損失函數(shù)、評價指標、模型規(guī)模、無監(jiān)督學習等等。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 深度學習
    +關注

    關注

    73

    文章

    5463

    瀏覽量

    120890

原文標題:頂刊IJCV 2022!基于深度學習的圖像去模糊綜述來了!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    模糊控制設計

    請問如圖設計模糊控制器,輸入三個隸屬度函數(shù),想以隸屬度最大方法決定輸出值,輸出位離散的1,2,5三個值,為何輸出圖像沒有最后的5,去模糊化應選擇哪個方法?多謝!
    發(fā)表于 01-08 21:25

    基于深度學習的監(jiān)督圖像分類算法研究,MATLAB制作的。求助:程序代碼修改補充,有償

    關鍵詞:圖像檢索;深度學習;哈希算法;
    發(fā)表于 04-01 16:12

    新結構重心法去模糊單元電路設計

    摘要:為解決模糊控制器電路設計中的去模糊運算問題,提出了一種數(shù)?;旌想娐穼崿F(xiàn)的模糊控制器去模糊運算單元電路設計。通過對折疊型Gilbert乘法器電路作適當?shù)臄U展,提出了
    發(fā)表于 05-27 09:00 ?8次下載

    基于像素領域信息約束的FCM圖像分割算法

    ,通過約束系數(shù)自適應調節(jié)控制鄰域信息約束強度,自優(yōu)化迭代更新聚類中心和聚類隸屬度矩陣,使模糊目標函數(shù)收斂到最小,并利用像素最優(yōu)聚類隸屬度去模糊化操作實現(xiàn)圖像分割。實驗結果表明,該算法
    發(fā)表于 11-06 16:27 ?8次下載
    基于像素領域信息約束的FCM<b class='flag-5'>圖像</b>分割<b class='flag-5'>算法</b>

    基于LO正則化去模糊算法

    隨著視頻監(jiān)控技術的發(fā)展、監(jiān)控攝像頭的普及和人們對安全信息需求的提升,監(jiān)控中圖像去模糊技術得到迫切需求。基于圖像強度和梯度的LO正則化去模糊算法
    發(fā)表于 11-08 14:28 ?2次下載
    基于LO正則化<b class='flag-5'>去模糊</b><b class='flag-5'>算法</b>

    基于尺度迭代深度神經(jīng)網(wǎng)絡的圖像去模糊算法

    盡管使用神經(jīng)網(wǎng)絡進行圖片去模糊并不是一個新想法,但騰訊優(yōu)圖實驗室別出心裁的將物理直覺結合進來以促進模型訓練。在騰訊優(yōu)圖實驗室新算法的論文中,其網(wǎng)絡模仿了一種被稱為“由粗到精”的成熟的圖像恢復策略。該
    的頭像 發(fā)表于 05-30 17:28 ?4454次閱讀

    基于深度學習的多目標跟蹤算法技術

    基于深度學習算法圖像和視頻識別任務中取得了廣泛的應用和突破性的進展。
    的頭像 發(fā)表于 10-27 07:28 ?1.3w次閱讀

    一種多粒度融合的模糊規(guī)則系統(tǒng)圖像特征學習算法

    大規(guī)模的數(shù)據(jù),且通常被視汋黑盦模型,解釋性較差。針對上述挑戰(zhàn),以基于模糊規(guī)則推理的TSK模糊系統(tǒng)(TSK-FS)為基礎,提出了一種適用于不同規(guī)模數(shù)據(jù)集且易于理解的特征學習方法—一多粒度融合的
    發(fā)表于 03-31 14:04 ?9次下載
    一種多粒度融合的<b class='flag-5'>模糊</b>規(guī)則系統(tǒng)<b class='flag-5'>圖像</b>特征<b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    基于深度學習圖像去模糊方法相關實驗

    質量差、攝影者專業(yè)水平低、拍攝環(huán)境惡劣等,往往導致最終得到的圖像含有眀昰的模糊以及噪聲。如何倢計算機自動地從模糊圖像中把清晰的像恢復出來,從而為其他的
    發(fā)表于 04-08 09:34 ?9次下載
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>圖像</b><b class='flag-5'>去模糊</b>方法相關實驗

    深度學習算法簡介 深度學習算法是什么 深度學習算法有哪些

    。深度學習算法作為其中的重要組成部分,不僅可以為諸如人工智能、圖像識別以及自然語言處理等領域提供支持,同時也受到了越來越多的關注和研究。在本文中,我們將著重介紹
    的頭像 發(fā)表于 08-17 16:02 ?8690次閱讀

    什么是深度學習算法?深度學習算法的應用

    。 在深度學習中,使用了一些快速的算法,比如卷積神經(jīng)網(wǎng)絡以及深度神經(jīng)網(wǎng)絡,這些算法在大量數(shù)據(jù)處理和圖像
    的頭像 發(fā)表于 08-17 16:03 ?2066次閱讀

    深度學習算法的選擇建議

    深度學習算法的選擇建議 隨著深度學習技術的普及,越來越多的開發(fā)者將它應用于各種領域,包括圖像識別
    的頭像 發(fā)表于 08-17 16:11 ?626次閱讀

    深度學習框架和深度學習算法教程

    深度學習框架和深度學習算法教程 深度學習是機器
    的頭像 發(fā)表于 08-17 16:11 ?1031次閱讀

    去模糊算法適對發(fā)射點擴散函數(shù)(PSF)的假設要求最低

    ? ? ? ? 長期以來,在顯微鏡領域獲得高分辨率圖像一直是一個挑戰(zhàn)。去卷積是一種增強圖像清晰度的方法,它通常會放大樣品和圖像之間的噪聲。波士頓大學的研究人員最近開發(fā)了一種新的去模糊
    的頭像 發(fā)表于 11-02 09:15 ?584次閱讀
    <b class='flag-5'>去模糊</b><b class='flag-5'>算法</b>適對發(fā)射點擴散函數(shù)(PSF)的假設要求最低

    消卷積在圖像處理中的應用策略與實踐

    去模糊算法對三維圖像堆棧的每個二維平面進行操作。最近鄰算法是最常見的去模糊技術,其通過模糊相鄰平
    的頭像 發(fā)表于 04-24 11:43 ?513次閱讀