0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于顏色感知背景的文檔圖像陰影去除

CVer ? 來源:CSIG文檔圖像分析與識別專 ? 2023-06-12 14:20 ? 次閱讀

6c0443f6-08df-11ee-962d-dac502259ad0.png

本文簡要介紹今年CVPR 2023的錄用論文“Document Image Shadow Removal Guided by Color-Aware Background”的主要工作?,F(xiàn)有的文檔圖像陰影去除方法 [1,2]依賴于固定值背景而忽略文檔的其他印刷顏色,可能會對具有復(fù)雜背景的圖像造成顏色失真或陰影殘留問題。為了解決上述問題,作者提出了顏色感知背景提取網(wǎng)絡(luò)(CBENet)提取彩色背景用于指導(dǎo)陰影去除網(wǎng)絡(luò)(BGShadowNet)進(jìn)行陰影去除。BGShadowNet分為兩個階段,在階段一采用背景約束解碼器生成一個粗略的結(jié)果,在階段二通過在編碼-解碼模型中嵌入基于背景的注意力模塊(BAModule)維持文檔外觀的一致性,用細(xì)節(jié)增強(qiáng)模塊(DEModule)提高紋理細(xì)節(jié)來改進(jìn)初步去陰影的結(jié)果。在兩個基準(zhǔn)數(shù)據(jù)集RDD和Kligler上定性和定量的實(shí)驗(yàn)證實(shí)了本文所提出方法的優(yōu)越性。

一、研究背景

目前的文檔陰影去除算法 [1,2]通常假設(shè)文檔的背景顏色是一個固定值。用聚類 [1]或是深度學(xué)習(xí) [2]的方法得到背景顏色指導(dǎo)文檔圖像陰影的去除。但是這樣的做法會忽略文檔中存在的其它印刷顏色,對文檔背景復(fù)雜的圖像可能會造成顏色失真或陰影殘留的問題。如圖1(d)存在顏色失真和陰影殘留,(f) 存在陰影殘留。而本文提出的基于顏色感知背景的文檔圖像陰影去除方法能很好地避免這兩個問題。

6c0f9da0-08df-11ee-962d-dac502259ad0.png

圖1 本文基于顏色感知背景的方法可以更好地去除文檔圖像陰影,避免顏色失真和陰影殘留。

二、方法原理簡述

6c2bc534-08df-11ee-962d-dac502259ad0.png

圖2 模型結(jié)構(gòu)圖

圖2是模型的整體結(jié)構(gòu)圖,它包含顏色感知背景提取網(wǎng)絡(luò)(Color-aware Background Extraction Network, CBENet)和陰影去除網(wǎng)絡(luò)(Background-guided Shadow Removal Network , BGShadowNet)。CBENet采用U-Net [3]結(jié)構(gòu)用于提取顏色隨空間變化的彩色背景,提供一些有用的顏色信息幫助BGShadowNet進(jìn)行陰影去除。彩色背景的GT計算過程如下,首先將無陰影的圖像分為16×16的Patch,然后對于每個區(qū)域,根據(jù)像素強(qiáng)度聚類成兩個簇,分別是背景和文字。一般來說背景比文字亮一些,用更亮的簇的均值作為這個Patch的背景顏色。最后對這個區(qū)域做平滑,避免邊界顏色過度不平滑。圖3展示了彩色背景的可視化。

6c4022fe-08df-11ee-962d-dac502259ad0.png

圖3 彩色背景可視化:(a) 陰影圖像,(b) 局部背景圖像,(c) 最終背景圖像。

BGShadowNet包含兩個階段,階段1的目的是生成一個粗略的陰影去除圖像,采用U-Net [3]結(jié)構(gòu)。為了利用背景圖像的編碼特征,在解碼的時候?qū)BENet的編碼特征集成到對應(yīng)的層級,最后生成一個粗略的去陰影結(jié)果。在階段2對階段1的結(jié)果進(jìn)行改進(jìn)和提升。輸入粗略的去陰影結(jié)果和原圖的堆疊,進(jìn)入一個編碼-解碼網(wǎng)絡(luò)(DenseUnet [4]),在基于背景的注意力模塊(Background-based Attention Module, BAModule)結(jié)合彩色背景信息保持文檔外觀的一致性。在細(xì)節(jié)增強(qiáng)模塊(Detail Enhancement Module, DEModule)利用底層特征來恢復(fù)粗糙結(jié)果的紋理細(xì)節(jié)。最后的結(jié)果經(jīng)過判別器判斷文檔的真實(shí)性。

6c604994-08df-11ee-962d-dac502259ad0.png

圖4 BAModule結(jié)構(gòu)圖

有相似背景的區(qū)域應(yīng)該具有類似的外觀(顏色和光照)。然而,粗略的去除陰影結(jié)果中可能存在光照或顏色偽影。為了保持圖像的整體一致性,本文引入了一種基于背景的注意力模塊(BAModule),其結(jié)構(gòu)如圖4所示。編碼特征和背景特征堆疊后經(jīng)過卷積生成顏色感知注意力圖與堆疊后的輸入特征相乘得到輸出特征。

由于網(wǎng)絡(luò)中存在多個卷積和下采樣操作,高層次的特征可能會丟失部分細(xì)節(jié)信息,導(dǎo)致細(xì)節(jié)模糊的結(jié)果。與高層次特征相比,CNN層的低層特征通常包含更多的紋理細(xì)節(jié)。因此,本文引入了一個細(xì)節(jié)增強(qiáng)模塊(DEModule) 來利用網(wǎng)絡(luò)中的低層特征,恢復(fù)粗略結(jié)果的紋理細(xì)節(jié),其結(jié)構(gòu)如圖5所示。取編碼器前兩層的編碼特征堆疊后經(jīng)過兩次卷積得到特征圖M,全局平均池化后得到6c852228-08df-11ee-962d-dac502259ad0.png,計算兩者之間的余弦相似度得到S。通過以下公式對S進(jìn)行量化得到量化編碼圖E,和量化級別L一起得到反映低層信息的相對統(tǒng)計信息的量化計數(shù)圖C。C通過卷積后與上采樣后的結(jié)果堆疊得到絕對統(tǒng)計信息H。H通過圖5右側(cè)的分支生成新的量化級別與量化編碼圖E相乘后得到輸出特征。

6c8d038a-08df-11ee-962d-dac502259ad0.png

6c99d31c-08df-11ee-962d-dac502259ad0.png

圖5 DEModule結(jié)構(gòu)圖

網(wǎng)絡(luò)的Loss包括CBENet的背景重建Loss,第二個是階段1和階段2輸出結(jié)果的Loss,第三個是結(jié)構(gòu)一致性損失,最后一個是對抗損失。

6cb0250e-08df-11ee-962d-dac502259ad0.png

三、主要實(shí)驗(yàn)結(jié)果及可視化效果

本文構(gòu)建了一個真實(shí)的文檔陰影去除數(shù)據(jù)集RDD,4371份用于訓(xùn)練,545用于測試。測試的數(shù)據(jù)集還包括Kligler [5]。表1實(shí)驗(yàn)結(jié)果證明本文方法的有效性。兩個數(shù)據(jù)集上的RMSE、PSNR和SSIM都優(yōu)于現(xiàn)有的文檔陰影去除方法。

表1 RDD和Kligler測試集的實(shí)驗(yàn)結(jié)果

6cc08b6a-08df-11ee-962d-dac502259ad0.png

6ce7665e-08df-11ee-962d-dac502259ad0.png

6d272262-08df-11ee-962d-dac502259ad0.png

圖6 各種陰影去除方法的可視化比較:(a) 輸入圖像,(b) Jung,(c) DSC,(d) Fu,(e) DHAN,(f) CANet,(g) BEDSR-Net,(h) 本文的BGShadowNet,以及 (i) 真實(shí)標(biāo)注圖像。

用戶測試的實(shí)驗(yàn)結(jié)果也表明本文的方法去陰影的效果排名最高。有20.32%的志愿者認(rèn)為本文的方法去陰影的效果最好。

表2展示了本文提出的BAModule和DEModule的消融實(shí)驗(yàn),圖7是對應(yīng)的可視化結(jié)果。表3展示了彩色背景的消融實(shí)驗(yàn)。

表2 在RDD和Kligler上的消融實(shí)驗(yàn),BASE1:一個DenseUnet;BASE2:兩個堆疊的DenseUnet;BGShadowNet1:沒有Stage2;BGShadowNet2:沒有DEModule和BAModule;BGShadowNet3:沒有BAModule;BGShadowNet4:沒有DEModule。

6d48767e-08df-11ee-962d-dac502259ad0.png

6d5b0154-08df-11ee-962d-dac502259ad0.png

圖7 消融實(shí)驗(yàn)的可視化比較:(a) 輸入圖像,(b) BASE1,(c) BASE2,(d) BGShadowNet1,(e) BGShadowNet2,(f) BGShadowNet3,(g) BGShadowNet4,以及 (h) 本文的BGShadowNet。

表3 在RDD數(shù)據(jù)集上彩色背景的消融實(shí)驗(yàn)

6d7ee75e-08df-11ee-962d-dac502259ad0.png

四、總結(jié)及討論

1. 為了解決現(xiàn)有方法對具有復(fù)雜背景的圖像造成顏色失真或陰影殘留問題,本文提出了顏色感知背景提取網(wǎng)絡(luò)(CBENet)提取彩色背景用于指導(dǎo)陰影去除網(wǎng)絡(luò)(BGShadowNet)進(jìn)行陰影去除。

2. 本文提出基于背景的注意力模塊(BAModule)維持文檔外觀的一致性,以及細(xì)節(jié)增強(qiáng)模塊(DEModule)提高紋理細(xì)節(jié)。

3. 當(dāng)圖像受到嚴(yán)重的噪聲干擾時,本文方法的陰影去除結(jié)果可能會包含一些殘留噪聲,導(dǎo)致與周圍環(huán)境的亮度不均勻。

五、相關(guān)資源

論文地址:https://openaccess.thecvf.com/content/CVPR2023/papers/Zhang_Document_Image_Shadow_Removal_Guided_by_Color-Aware_Background_CVPR_2023_paper.pdf

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40375
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3112

    瀏覽量

    48658
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24619

原文標(biāo)題:CVPR 2023 | 基于顏色感知背景的文檔圖像陰影去除

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    給照片輕松換背景(讓ps更輕松)

    給照片輕松換背景(讓ps更輕松)在PS圖象處理時常常會遇到去除圖象背景操作,通過PS去除有時候非常的墨跡,通過“照片輕松換背景”軟件可以輕輕
    發(fā)表于 09-19 10:00

    如何去除背景

    如何去除圖片中的綠色背景,而保留藍(lán)色區(qū)域
    發(fā)表于 02-08 21:48

    對彩色原圖像分割后將目標(biāo)還原成彩色圖像

    當(dāng)對彩色圖像進(jìn)行二值化處理后,如何將獲得的二值化圖像轉(zhuǎn)變?yōu)樵噬?b class='flag-5'>圖像中的顏色,比如上傳圖像中的綠色為背景
    發(fā)表于 02-09 09:09

    改變表格控件,表格一整行背景顏色 字體顏色,一個單元格背景顏色 字體顏色?

    改變表格控件,表格一整行背景顏色 字體顏色,一個單元格背景顏色 字體顏色?
    發(fā)表于 03-22 10:15

    怎么設(shè)置去除Altium陰影部分重疊報錯?

    陰影部分重疊報錯應(yīng)該怎么設(shè)置來去除這報錯
    發(fā)表于 09-17 05:09

    LabVIEW背景顏色設(shè)為和其他程序或圖像中一樣

    LabVIEW背景顏色設(shè)為和其他程序或圖像中一樣 有時候LabVIEW背景色要和其他程序或者圖片的顏色保持一致,如果要求不高可以大致設(shè)置一下
    發(fā)表于 10-30 20:11

    基于超像素和局部顏色恒常性的自適應(yīng)陰影去除

    為快速有效地去除監(jiān)控視頻中運(yùn)動目標(biāo)的投射陰影,提出了一種基于超像素和陰影區(qū)域的局部顏色恒常性的自適應(yīng)陰影
    發(fā)表于 12-11 16:23 ?1次下載

    基于暗原色先驗(yàn)原理的顏色空間轉(zhuǎn)換算法去除圖像濃霧

    在濃霧天氣下,針對基于常規(guī)偏振特性去霧算法去霧效果不理想的特點(diǎn),提出了一種基于暗原色先驗(yàn)原理的顏色空間轉(zhuǎn)化算法去除偏振圖像的濃霧。相比傳統(tǒng)的成像技術(shù),偏振圖像探測技術(shù)在復(fù)雜環(huán)境下的目標(biāo)
    發(fā)表于 12-28 16:29 ?2次下載
    基于暗原色先驗(yàn)原理的<b class='flag-5'>顏色</b>空間轉(zhuǎn)換算法<b class='flag-5'>去除</b><b class='flag-5'>圖像</b>濃霧

    LCD顯示器不同色溫下相同顏色感知圖像增強(qiáng)方法

    本文針對 LCD 顯示器不同色溫下相同顏色感知圖像增強(qiáng)方法研究,對于提升不同色溫下的圖像處理能力具有重要性研究意義,對于 LCD 顯示器自身的圖像顯示技術(shù)應(yīng)用能力提升也具有重要性研究意
    發(fā)表于 02-20 08:00 ?10次下載
    LCD顯示器不同色溫下相同<b class='flag-5'>顏色感知</b><b class='flag-5'>圖像</b>增強(qiáng)方法

    如何使用RGB顏色傳感器進(jìn)行反射式顏色感

    利用Avago Technologies的RGB顏色傳感器進(jìn)行反射式顏色感測 摘要—反射式顏色感測通常是通過具有多個光源的光電二極管或涂有包含單個光源的濾色鏡的光電二極管來實(shí)現(xiàn)的。本文介紹了
    的頭像 發(fā)表于 05-06 15:31 ?5957次閱讀
    如何使用RGB<b class='flag-5'>顏色</b>傳感器進(jìn)行反射式<b class='flag-5'>顏色感</b>測

    基于全局背景光估計和顏色校正的圖像增強(qiáng)算法

    針對水下成像過程中的圖像降質(zhì)和顏色衰減現(xiàn)象,提出一種基于全局背景光估計和顏色校正的圖像增強(qiáng)算法。利用霧
    發(fā)表于 03-19 11:00 ?6次下載
    基于全局<b class='flag-5'>背景</b>光估計和<b class='flag-5'>顏色</b>校正的<b class='flag-5'>圖像</b>增強(qiáng)算法

    可解析圖片顏色及設(shè)置多彩陰影控件PaletteImageView

    控制控件四個角的圓角大?。ㄈ绻丶O(shè)置成正方向,隨著圓角半徑增大,可以將控件變成圓形) 可以控制控件的陰影半徑大小 可以分別控制陰影在x方向和y方向上的偏移量 可以將圖片中的顏色解析出六種主題
    發(fā)表于 03-23 09:09 ?1次下載

    顏色感應(yīng)器能判別物體的有無嗎?

    使用光電二極管或光敏電阻等光傳感器來感知物體發(fā)射或反射的光線。不同顏色的物體會吸收或反射不同波長的光,顏色感應(yīng)器通過測量光的強(qiáng)度和波長來確定物體的顏色。這種測量過程可
    的頭像 發(fā)表于 06-05 16:15 ?678次閱讀
    <b class='flag-5'>顏色感</b>應(yīng)器能判別物體的有無嗎?

    用于顏色感知的超低功耗垂直集成的尖峰視錐感受器陣列

    pW的功耗(與人眼視錐感受器功耗相當(dāng)),實(shí)現(xiàn)了高生物相似性的顏色感知能力的模擬。該成果將為低功耗的動態(tài)視覺處理系統(tǒng)提供基礎(chǔ)元件,并為高智能仿生機(jī)器人的發(fā)展提供重要參考價值。
    的頭像 發(fā)表于 06-21 09:36 ?768次閱讀
    用于<b class='flag-5'>顏色感知</b>的超低功耗垂直集成的尖峰視錐感受器陣列

    顏色感應(yīng)器能判別物體的有無嗎?

    使用光電二極管或光敏電阻等光傳感器來感知物體發(fā)射或反射的光線。不同顏色的物體會吸收或反射不同波長的光,顏色感應(yīng)器通過測量光的強(qiáng)度和波長來確定物體的顏色。這種測量過程可
    的頭像 發(fā)表于 06-26 12:01 ?566次閱讀
    <b class='flag-5'>顏色感</b>應(yīng)器能判別物體的有無嗎?