0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于圖像修復(fù)詳細(xì)解析全局和局部一致性的圖像補(bǔ)全

中科院長春光機(jī)所 ? 來源:AI公園 ? 作者:Chu-Tak Li ? 2021-04-25 14:21 ? 次閱讀

全局一致讓圖像補(bǔ)全的內(nèi)容契合上下文,局部一致性讓紋理更加真實(shí)。

這里只是對我們之前所學(xué)內(nèi)容的一個簡單回顧。

對于圖像修復(fù),填充像素的紋理細(xì)節(jié)是很重要的。有效的像素和填充的像素應(yīng)該是一致的,填充的圖像應(yīng)該看起來真實(shí)。

粗略的說,研究者采用逐像素的重建損失(即L2損失)來確保我們可以用“正確”的結(jié)構(gòu)來填補(bǔ)缺失的部分。另一方面,GAN損失(即對抗損失)和/或[紋理損失]應(yīng)用于獲得具有更清晰的生成像素紋理細(xì)節(jié)的填充圖像。

86c2640c-a554-11eb-aece-12bb97331649.png

圖1,一個例子來說明為圖像修復(fù)任務(wù)生成新的片段的需求。

對于基于patch的方法,一個很大的假設(shè)是我們相信我們可以在缺失區(qū)域之外找到相似的patch,這些相似的補(bǔ)丁將有助于填充缺失區(qū)域。這個假設(shè)對于自然場景可能是正確的,因?yàn)樘炜蘸筒萜涸谝粋€圖像中可能有許多相似的patch。如果缺失區(qū)域之外沒有任何類似的patch,就像圖1中所示的人臉圖像修復(fù)的情況。在這種情況下,我們找不到眼睛的patch來填補(bǔ)相應(yīng)的缺失部分。因此,魯棒的修復(fù)算法應(yīng)該能夠生成新的片段。

現(xiàn)有的基于GAN的修復(fù)方法利用一個鑒別器(對抗損失)來增強(qiáng)填充區(qū)域的銳度,將填充區(qū)域輸入到鑒別器(即欺騙鑒別器)。有些人可能會在預(yù)訓(xùn)練的網(wǎng)絡(luò)中比較缺失區(qū)域內(nèi)部和外部的局部神經(jīng)響應(yīng),以確保缺失區(qū)域內(nèi)部和外部的局部小塊的紋理細(xì)節(jié)相似。如果我們同時考慮圖像的局部和全局信息來加強(qiáng)局部和全局一致性呢?我們會得到更好的完整圖像嗎?讓我們看看。

dd9b2c415e79130a8a90436ea607b41c.png

圖2,上下文編碼器神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

如何處理高分辨率圖像?我們之前已經(jīng)討論過第一種基于GAN的修復(fù)方法,上下文編碼器。他們假設(shè)測試圖像總是128×128和一個64×64中心缺失的洞。然后,我們還在上一篇文章中介紹了上下文編碼器的改進(jìn)版本,稱為Multi-Scale Neural Patch Synthesis。他們提出了一種多尺度的方法來處理測試圖像,最大的分辨率為512×512,中心缺失的孔為256×256。簡而言之,他們采用了三種不同尺度的圖像網(wǎng)絡(luò),即128×128、256×256和512×512。因此,速度是他們提出的方法的瓶頸。使用Titan X GPU填充512×512的圖像大約需要1分鐘。這是個有趣的問題!我們?nèi)绾翁幚砀叻直媛蕡D像,只需一個單一的的網(wǎng)絡(luò)?給你幾秒鐘的思考時間,你可能會從圖2所示的架構(gòu)中發(fā)現(xiàn)一些提示(注意中間層)。一個快速的解決方案是去掉中間的全連接層,并采用全卷積網(wǎng)絡(luò)!你很快就會知道怎么做,為什么要這樣做!

介紹

現(xiàn)有的方法大多假設(shè)可以找到相似的圖像patch來填補(bǔ)同一幅圖像中缺失的部分。這種情況并不總是適用于圖像修復(fù),見圖1。更準(zhǔn)確地說,我們應(yīng)該看整個圖像,了解它的上下文,然后根據(jù)它的上下文來填補(bǔ)缺失的部分。

如果使用全連接層,輸入圖像的大小必須是固定的。因此,網(wǎng)絡(luò)不能處理不同分辨率的測試圖像?;叵胍幌?,完全連接的層完全連接了兩層之間的所有神經(jīng)元,因此它對前一層輸出大小的變化很敏感,測試圖像的大小必須固定。另一方面,對于卷積層,神經(jīng)元之間沒有全連接。更小的輸入特征映射將導(dǎo)致更小的輸出特征映射。所以,如果一個網(wǎng)絡(luò)只由卷積層組成,它就可以處理不同大小的輸入圖像。我們稱這種網(wǎng)絡(luò)為全卷積網(wǎng)絡(luò)(FCNs)。

方案

采用膨脹卷積代替全連接層,這樣我們?nèi)匀豢梢岳斫鈭D像的上下文,構(gòu)建一個全卷積網(wǎng)絡(luò)(Fully Convolutional Network, FCN)來處理不同大小的圖像。

使用兩個鑒別器來保證完成(填充)圖像的局部和全局一致性。一個鑒別器在全局意義上看整個圖像,而一個在局部意義上看被填充區(qū)域周圍的子圖像。

使用簡單的后處理。有時很明顯可以看出生成的像素和有效像素之間的區(qū)別。為了進(jìn)一步提高圖像的視覺質(zhì)量,本文采用了兩種傳統(tǒng)的方法,即Fast Marching method和Poisson image blend。這兩種技術(shù)超出了本文的范圍。之后,在一定程度上將后處理步驟以細(xì)化網(wǎng)絡(luò)的形式嵌入到網(wǎng)絡(luò)中。我們將在后面的文章中討論它。

貢獻(xiàn)

提出一種全卷積的網(wǎng)絡(luò)擴(kuò)展卷積圖像修復(fù)。它允許我們在不使用全連接的層的情況下理解圖像的上下文,因此訓(xùn)練過的網(wǎng)絡(luò)可以用于不同大小的圖像。這個架構(gòu)實(shí)際上是后來基于深度學(xué)習(xí)的圖像修復(fù)方法的基礎(chǔ)。這就是為什么我認(rèn)為這篇文章是圖像修復(fù)的一個里程碑。

建議使用兩個判別器(一個局部的和一個全局的)。多尺度鑒別器似乎可以在不同尺度上提供較好的完整圖像紋理細(xì)節(jié)。

強(qiáng)調(diào)圖像修復(fù)任務(wù)中產(chǎn)生新片段的重要性。實(shí)際上,訓(xùn)練數(shù)據(jù)是非常重要的。簡單地說,你不能生成你以前沒見過的東西。

方法

23cde22ddb2a6fe927bad6a65ddd06d7.png

圖3,提出方法的結(jié)構(gòu)

圖3顯示了提出的方法的網(wǎng)絡(luò)架構(gòu)。它由三個網(wǎng)絡(luò)組成,分別是Completion網(wǎng)絡(luò)(即生成器,既用于訓(xùn)練又用于測試)、局部鑒別器和全局鑒別器(用于剛訓(xùn)練時作為輔助網(wǎng)絡(luò)用于學(xué)習(xí))??焖倩仡櫼幌逻@個GAN框架。Generator負(fù)責(zé)補(bǔ)全圖像以欺騙discriminator,而discriminator負(fù)責(zé)將完整圖像與真實(shí)圖像區(qū)分開來。

CNNs中的膨脹卷積

膨脹卷積的概念對于讀者理解本文的網(wǎng)絡(luò)設(shè)計是很重要的。所以,我想盡力為那些不熟悉膨脹卷積的讀者解釋一下。對于非常了解它的讀者,也請快速回顧一下。

8ec4650026be64f8c470958ef264d46b.png

圖4,標(biāo)準(zhǔn)卷積和膨脹卷積的圖解

在論文中,作者用了半頁的篇幅來描述cnn、標(biāo)準(zhǔn)卷積和擴(kuò)張卷積。并給出了相應(yīng)的卷積方程供參考。我需要澄清一點(diǎn),膨脹卷積并不是本文作者提出的,他們是將其用于圖像修復(fù)。

這里,我想用一個簡單的圖來說明標(biāo)準(zhǔn)卷積和膨脹卷積的區(qū)別。

圖4(a)是帶有3×3 kernel, stride=1, padding=1,膨脹率=1的標(biāo)準(zhǔn)卷積層。這種情況的設(shè)置中,8×8輸入給出8×8的輸出,每個相鄰的9個位置在輸出中貢獻(xiàn)一個元素。

圖4(b)也是一個標(biāo)準(zhǔn)的卷積層。這次我們使用5×5 kernel,stride=1, padding=2(為了保持相同的輸入和輸出大?。┖团蛎浡?1。在這種情況下,每個相鄰的25個位置對輸出的每個元素都有貢獻(xiàn)。這意味著對于輸出的每個值,我們必須更多地考慮(查看)輸入。我們通常指更大的感受野。對于一個大的感受野,更多的來自遙遠(yuǎn)空間位置的特征將被考慮進(jìn)去,在輸出時給出每個值。

然而,對于圖4(b)中的情況,我們使用一個更大的kernel (5×5)來獲得更大的感受野。這意味著需要學(xué)習(xí)更多的參數(shù)(3×3=9,而5×5=25)。有沒有辦法在不增加更多參數(shù)的情況下增加感受野?答案是膨脹卷積。

圖4(c)是一個膨脹卷積層,使用3×3 kernel, stride=1, padding=2,膨脹率=2。當(dāng)比較圖4(b)和(c)中的kernel的覆蓋時,我們可以看到它們都覆蓋了輸入處的5×5局部空間區(qū)域。3×3的kernel可以通過跳過連續(xù)的空間位置來獲得5×5 kernel的感受野。跳躍的step是由膨脹率決定的。例如,一個3×3內(nèi)核的膨脹率=2給出5×5感受野,一個3×3核的膨脹率=3給出一個7×7的感受野,以此類推。顯然,膨脹卷積通過跳過連續(xù)的空間位置來增加感受野,而不需要添加額外的參數(shù)。這樣做的優(yōu)點(diǎn)是,我們有更大的感受野,同時有相同數(shù)量的參數(shù)。缺點(diǎn)是我們會跳過一些位置(我們可能會因此丟失一些信息)。

為什么要用膨脹卷積?

在回顧了膨脹卷積的概念之后,我將討論為什么作者在他們的模型中使用膨脹卷積。你們中的一些人可能已經(jīng)猜到原因了。

如前所述,了解整個圖像的上下文對于圖像修復(fù)的任務(wù)是重要的。以前的方法使用全連接層作為中間層,以便理解上下文。記住,標(biāo)準(zhǔn)卷積層在局部區(qū)域執(zhí)行卷積,而全連接層則完全連接所有的神經(jīng)元(即每個輸出值取決于所有的輸入值)。然而,全連接層限制了輸入圖像的大小,并引入了更多的可學(xué)習(xí)參數(shù)。

為了解決這些限制,我們使用膨脹卷積來構(gòu)建一個全卷積的網(wǎng)絡(luò),允許不同大小的輸入。另一方面,通過調(diào)整標(biāo)準(zhǔn)kernel(通常是3×3)的膨脹率,我們可以在不同的層次上擁有更大的感受野,以幫助理解整個圖像的上下文。

ff7e1307aebc01881d03635d3afa43ee.png

圖5,不同大小的感受野的影響。

圖5是一個展示膨脹卷積的有用性的例子。你可能認(rèn)為(a)是帶有3×3核(較小的感受野)的標(biāo)準(zhǔn)卷積,(b)是帶有3×3核且擴(kuò)張率≥2(較大的感受野)的膨脹卷積。位置p1和p2在孔內(nèi)區(qū)域,p1靠近邊界,p2大致在中心點(diǎn)。對于(a),可以看到p1位置的感受野(影響區(qū)域)可以覆蓋有效區(qū)域。這意味著可以使用有效像素來填充位置p1的像素。另一方面,p2位置的感受野不能覆蓋有效區(qū)域,因此不能使用有效區(qū)域的信息進(jìn)行生成。

對于(b),我們使用膨脹卷積來增加感受野。這一次,兩個位置的感受野都可以覆蓋有效區(qū)域。讀者現(xiàn)在可以認(rèn)識到擴(kuò)張卷積的有效性了。

Completion網(wǎng)絡(luò)

讓我們回到Completion 網(wǎng)絡(luò)的結(jié)構(gòu),如圖3所示。

3530ea7ee88d9d0d15a8182c79b9e052.png

表1,Completion網(wǎng)絡(luò)結(jié)構(gòu)。,每個卷積層后面都是ReLU,除了最后一個后面是Sigmoid

Completion 網(wǎng)絡(luò)是一個全卷積的網(wǎng)絡(luò),接受不同大小的輸入圖像。該網(wǎng)絡(luò)對輸入進(jìn)行2次2倍的下采樣。這意味著,如果輸入是256×256,中間層的輸入大小是64×64。為了充分利用有效像素,保證像素精度,我們用有效像素替換孔區(qū)域以外的像素。

上下文判別器

讓我們來談?wù)劸植亢腿峙袆e器。沒有什么特別的,就像單個判別器的情況一樣。唯一的不同是這次我們有兩個。

07b107b0272cab8079b6d24f142bfd9b.png

表2,局部和全局鑒別器的結(jié)構(gòu),F(xiàn)C代表全連接層,連接層(c)的最終FC后面是Sigmoid

局部和全局判別器的架構(gòu)基本相同。全局判別器的輸入圖像大小為256×256(整個圖像,用于全局一致性),而局部判別器的輸入為128×128,圍繞缺失區(qū)域的中心,用于局部一致性。

需要注意的一點(diǎn)是,在訓(xùn)練過程中,總有一個區(qū)域是缺失的。在測試過程中,圖像中可能存在多個缺失區(qū)域。除此之外,對于local discriminator,由于真實(shí)圖像沒有填充區(qū)域,所以對真實(shí)圖像采用128×128 patch的隨機(jī)選擇。

訓(xùn)練策略和損失函數(shù)

與之前一樣,使用兩個損失函數(shù)來訓(xùn)練網(wǎng)絡(luò),即L2損失和對抗損失(GAN損失)。

d5ed709ddb09d404f9d49f92df55f333.png

C(x, M_c)將completion網(wǎng)絡(luò)表示為函數(shù)。x是輸入圖像,M_c是表示缺失區(qū)域的二進(jìn)制掩碼。缺失區(qū)域?yàn)?,外部區(qū)域?yàn)?。你可以看到L2損失是在缺失區(qū)域內(nèi)計算的。注意,補(bǔ)全的圖像的外部區(qū)域的像素直接被有效像素替換。

f149b6ac49a8097021d9445be443e6bc.png

D(x, M_d)將兩個鑒別器表示為一個函數(shù)。M_d是一個隨機(jī)掩碼,用于為局部判別器隨機(jī)選擇一個圖像patch。這是一個標(biāo)準(zhǔn)的GAN損失。我們希望該判別器不能區(qū)分完整的圖像和真實(shí)的圖像,從而得到具有真實(shí)紋理細(xì)節(jié)的完整圖像。

df8ac4e156bd236a4a8f8fa52692dafa.png

這是訓(xùn)練網(wǎng)絡(luò)的聯(lián)合損失函數(shù)。alpha是一個加權(quán)超參數(shù),以平衡L2損失和GAN損失。

6afffd60f0835b967be2c0c9004ce2e9.png

作者將他們的訓(xùn)練分為三個階段。i) 訓(xùn)練僅帶L2損失的completion網(wǎng)絡(luò),迭代次數(shù)為T_C。ii) 修正completion網(wǎng)絡(luò),使用GAN損失訓(xùn)練判別器進(jìn)行T_D迭代。iii) 交替訓(xùn)練completion網(wǎng)絡(luò)和判別器,直到訓(xùn)練結(jié)束。

對于穩(wěn)定訓(xùn)練,除completion網(wǎng)絡(luò)的最后一層和判別器外,所有卷積層都采用批處理歸一化(BN)。

為了生成訓(xùn)練數(shù)據(jù),他們隨機(jī)地將圖像的最小邊緣大小調(diào)整到[256,384]像素范圍。然后,他們隨機(jī)截取256×256圖像補(bǔ)丁作為輸入圖像。對于掩模圖像,隨機(jī)生成一個區(qū)域,每個邊的范圍為[96,128]。

簡單的后處理:如前所述,作者還采用了傳統(tǒng)的Fast Marching方法,隨后采用泊松圖像混合,進(jìn)一步提高完成圖像的視覺質(zhì)量。

實(shí)驗(yàn)

作者使用Places2數(shù)據(jù)集中的8097967張訓(xùn)練圖像訓(xùn)練他們的網(wǎng)絡(luò)。聯(lián)合損失函數(shù)中的alpha加權(quán)超參數(shù)設(shè)置為0.0004,batch大小為96。

本文中,completion網(wǎng)絡(luò)訓(xùn)練為T_C = 90000次迭代,訓(xùn)練判別器T_D = 10,000次迭代,最后聯(lián)合訓(xùn)練所有網(wǎng)絡(luò)400,000次迭代。他們聲稱,整個訓(xùn)練過程在一臺4個k80 GPU的電腦上大約需要2個月的時間。

91449e11caf8471664152013a9c2323f.png

表3,所提出方法的用時

他們使用Intel Core i7-5960X 3.00 GHz 8核CPU和NVIDIA GeForce TITAN X GPU對CPU和GPU進(jìn)行評估。實(shí)際上,速度相當(dāng)快,只需半秒多一點(diǎn)就可以完成1024×1024的一張圖片。

aaa41d3dbd3833beba0be36a2ec22060.png

圖6,和已有方法的對比

圖6顯示了與一些現(xiàn)有方法的比較??偟膩碚f,基于patch的方法可以用局部一致的圖像patch來完成,但可能不會是全局一致的。最近的基于GAN的方法,上下文編碼器(第5行),傾向于給出模糊的完整圖像。該方法提供了局部和全局一致的完整圖像。

6cb26e7d69916932ac39cce7c22527d3.png

圖7,和上下文編碼器的對比,在同樣的數(shù)據(jù)集上訓(xùn)練填補(bǔ)中心缺失孔洞

為了與最先進(jìn)的基于GAN的修復(fù)方法進(jìn)行比較,作者進(jìn)行了中心區(qū)域補(bǔ)全,結(jié)果如圖7所示。可以看出,CE對于中心區(qū)域補(bǔ)全的性能優(yōu)于任意區(qū)域補(bǔ)全(圖6)。在我看來,CE與本文方法在圖7中具有相似的性能。讀者可以放大看其中的差異。

20fde37cd94845882ec07aa7615975ca.png

圖8,不同判別器的效果

作者對這兩種判別器進(jìn)行了消融研究。從圖8(b)和(c)可以看出,當(dāng)不使用局部判別器時,補(bǔ)全的區(qū)域看起來更加模糊。另一方面,對于(d),如果只使用局部判別器,我們可以得到良好的局部一致紋理細(xì)節(jié),但不能保證全局一致性。對于(e)中的full方法,我們獲得了局部和全局一致的結(jié)果。

26982d89229105d171b8fe04f2958b38.png

圖9,簡單后處理的結(jié)果

圖9顯示了簡單后處理的效果。對于圖9(b),我們可以很容易地觀察到邊界。

46947a6ddea6750ba2f8c8ff06a5a5dc.png

圖10,使用不同的數(shù)據(jù)集的修復(fù)結(jié)果

圖10顯示了在不同數(shù)據(jù)集上訓(xùn)練的模型的修復(fù)結(jié)果。注意,Places2包含了大約800萬張不同場景的訓(xùn)練圖像,而ImageNet包含了100萬張用于目標(biāo)分類的訓(xùn)練圖像。我們可以看到,在Places2上訓(xùn)練模型的結(jié)果比在ImageNet上訓(xùn)練的結(jié)果稍好一些。

7ea1eed967350b087437a89e81360e31.png

圖11,用提出的方法來做目標(biāo)移除的例子

圖像修復(fù)的一個潛在應(yīng)用是物體移除。圖11顯示了使用所提方法刪除目標(biāo)的一些例子。

1f7b12ad905639c2f1227cc719a51829.png

圖12,更多特定數(shù)據(jù)集的結(jié)果

本文的作者還考慮了域特定的圖像修復(fù)。他們在CelebA數(shù)據(jù)集和CMP Facade數(shù)據(jù)集上微調(diào)了他們的預(yù)訓(xùn)練模型,這兩個數(shù)據(jù)集分別由202599和606張圖像組成。他們使用了Places2數(shù)據(jù)集上的預(yù)訓(xùn)練模型。對于新的數(shù)據(jù)集,他們從無到有訓(xùn)練判別器,然后進(jìn)行completion網(wǎng)絡(luò)和判別器交替訓(xùn)練。

圖12顯示了本文方法對特定領(lǐng)域圖像的修復(fù)結(jié)果。對于面部修復(fù),該方法能夠生成眼睛和嘴等新的片段。對于立面的修復(fù),本文提出的方法還能夠生成與整個圖像局部和全局一致的窗口等片段。

作者還對完整的面部圖像進(jìn)行了用戶研究。結(jié)果表明,在10個用戶中,使用該方法得到的77.0%的完整人臉被視為真實(shí)人臉。另一方面,96.5%的真實(shí)面孔可以被這10個用戶正確識別。

限制和討論

以下是作者對其局限性和未來發(fā)展方向的幾點(diǎn)看法。

84bb8cf27f502e2eb6fa004ccb42d4fe.png

圖13,失敗的例子 i) mask在圖像的邊緣 ii) 復(fù)雜的場景

對于圖13左側(cè)的情況,我們可以看到缺失的部分位于上方圖像的邊框。作者聲稱,在這種情況下,可以從鄰近位置借用的信息更少,因此基于GAN的方法(第3行和第4行)比傳統(tǒng)的基于patch的方法(第2行)表現(xiàn)更差。另一個原因是這個例子是自然場景,所以基于patch的方法可以很好地工作。

對于圖13右側(cè)的例子,場景要復(fù)雜得多。根據(jù)這個mask,我們想要移除一個人,我們需要填充一些建筑的細(xì)節(jié)來完成這個復(fù)雜的場景。在這種情況下,所有的方法都不能正常工作。因此,在復(fù)雜的場景中填補(bǔ)缺失的部分仍然是的挑戰(zhàn)。

3b30bf7e26479e733bf4be88f5891c00.png

圖14,舉例說明生成新片段的重要性,我們只能生成之前在訓(xùn)練中看到的內(nèi)容。

作者提供了額外的例子來強(qiáng)調(diào)另外兩點(diǎn)。i) 產(chǎn)生諸如眼睛、鼻子、嘴巴等新穎片段的重要性。ii)訓(xùn)練數(shù)據(jù)集的重要性。

對于無法找到相似的圖像patch來填補(bǔ)缺失部分的情況,基于patch的方法(第2行和第3行)無法正常工作,如圖14所示。因此,一個魯棒的修復(fù)算法必須能夠生成新的片段。

為了進(jìn)一步顯示訓(xùn)練數(shù)據(jù)集選擇的重要性,作者比較了在Places2 (General dataset, (d))和CelebA (Face dataset, (e))上訓(xùn)練的兩個模型。顯然,(d)無法用合理的面部細(xì)節(jié)來填補(bǔ)缺失的部分,因?yàn)樗窃跊]有任何對齊的面部圖像的Places2上訓(xùn)練的。另一方面,(e)工作得很好,因?yàn)樗窃贑elebA上訓(xùn)練的,一個有許多對齊的人臉圖像的數(shù)據(jù)集。因此,我們只能生成我們在訓(xùn)練中看到的東西。全面的修復(fù)還有很長的路要走。

總結(jié)

所提議的結(jié)構(gòu)是后來大多數(shù)修復(fù)論文的基礎(chǔ)。膨脹卷積的全卷積網(wǎng)絡(luò)允許我們在不使用全連接的層的情況下理解圖像的上下文,因此網(wǎng)絡(luò)可以獲取不同大小的輸入圖像。

多尺度的鑒別器(在這里我們有兩個鑒別器,實(shí)際上有些可能有三個?。?對于在不同尺度上增強(qiáng)完整圖像的紋理細(xì)節(jié)是很有用的。

當(dāng)場景很復(fù)雜的時候,補(bǔ)上缺失的部分仍然很有挑戰(zhàn)性。另一方面,自然場景是比較容易修復(fù)的。

要點(diǎn)

在這里,我想列出一些對以后的文章有用的觀點(diǎn)。

請記住,膨脹卷積的全卷積網(wǎng)絡(luò)是一種典型的圖像修復(fù)網(wǎng)絡(luò)結(jié)構(gòu)。它允許不同大小的輸入,并提供類似于全連接層的功能(即幫助理解圖像的上下文)。

事實(shí)上,人臉圖像的修復(fù)相對來說比一般的圖像修復(fù)簡單。這是因?yàn)槲覀兛偸窃谌四様?shù)據(jù)集上訓(xùn)練一個模型來進(jìn)行人臉圖像修復(fù),而該數(shù)據(jù)集由許多對齊的人臉圖像組成。對于一般的圖像修復(fù),我們可以訓(xùn)練一個更多樣化的數(shù)據(jù)集,如Places2,它包含來自不同類別(如城市、建筑和許多其他類別)的數(shù)百萬張圖像。對于一個模型來說,學(xué)習(xí)生成所有具有良好視覺質(zhì)量的東西要困難得多。不管怎樣,還有很長的路要走。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1883

    瀏覽量

    71018
  • patch
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    8312
  • 圖像修復(fù)
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2257

原文標(biāo)題:圖像修復(fù):全局和局部的一致性補(bǔ)全

文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    級聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊

    電子發(fā)燒友網(wǎng)站提供《級聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊.pdf》資料免費(fèi)下載
    發(fā)表于 08-29 10:48 ?0次下載
    級聯(lián)<b class='flag-5'>一致性</b>和移相器校準(zhǔn)應(yīng)用手冊

    LIN一致性測試規(guī)范2.1

    電子發(fā)燒友網(wǎng)站提供《LIN一致性測試規(guī)范2.1.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 17:14 ?2次下載

    銅線鍵合焊接一致性:如何突破技術(shù)瓶頸?

    在微電子封裝領(lǐng)域,銅線鍵合技術(shù)以其低成本、高效率和良好的電氣性能等優(yōu)勢,逐漸成為芯片與基板連接的主流方式。然而,銅線鍵合過程中的焊接一致性問題是制約其進(jìn)步發(fā)展和應(yīng)用的關(guān)鍵難題。焊接一致性不僅
    的頭像 發(fā)表于 07-04 10:12 ?1365次閱讀
    銅線鍵合焊接<b class='flag-5'>一致性</b>:如何突破技術(shù)瓶頸?

    為什么主機(jī)廠愈來愈重視CAN一致性測試?

    新能源汽車迅猛發(fā)展下整車CAN網(wǎng)絡(luò)架構(gòu)日益復(fù)雜,總線故障等潛在問題時刻影響著運(yùn)行安全。整車零部件通過CAN一致性測試必將是安全保障的第道門檻。CAN一致性測試,就是要求整車CAN網(wǎng)絡(luò)中的節(jié)點(diǎn)都滿足
    的頭像 發(fā)表于 05-29 08:24 ?904次閱讀
    為什么主機(jī)廠愈來愈重視CAN<b class='flag-5'>一致性</b>測試?

     QSFP一致性測試的專業(yè)測試設(shè)備

    、高速度的光纖接口模塊,廣泛應(yīng)用于數(shù)據(jù)中心、高速以太網(wǎng)和光纖通信等領(lǐng)域。本文將詳細(xì)探討QSFP一致性測試的目的、測試內(nèi)容、測試方法以及測試的重要等方面。 QSFP一致性測試的目的是確
    的頭像 發(fā)表于 03-14 10:40 ?411次閱讀
     QSFP<b class='flag-5'>一致性</b>測試的專業(yè)測試設(shè)備

    企業(yè)數(shù)據(jù)備份體系化方法論的七大原則:深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別

    在數(shù)字化時代,數(shù)據(jù)備份成為了企業(yè)信息安全的核心環(huán)節(jié)。但在備份過程中,兩個關(guān)鍵概念——應(yīng)用一致性和崩潰一致性,常常被誤解或混淆。本文旨在闡明這兩個概念的差異,并分析它們在數(shù)據(jù)備份中的重要,以便讀者
    的頭像 發(fā)表于 03-11 14:05 ?328次閱讀
    企業(yè)數(shù)據(jù)備份體系化方法論的七大原則:深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用<b class='flag-5'>一致性</b>與崩潰<b class='flag-5'>一致性</b>的區(qū)別

    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別

    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別 在數(shù)字化時代,數(shù)據(jù)備份成為了企業(yè)信息安全的核心環(huán)節(jié)。但在備份過程中,兩個關(guān)鍵概念——應(yīng)用一致性和崩潰一致性,常常被誤解或混淆。
    的頭像 發(fā)表于 03-11 11:29 ?642次閱讀
    深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用<b class='flag-5'>一致性</b>與崩潰<b class='flag-5'>一致性</b>的區(qū)別

    DDR一致性測試的操作步驟

    DDR一致性測試的操作步驟? DDR(雙數(shù)據(jù)率)一致性測試是對DDR內(nèi)存模塊進(jìn)行測試以確保其性能和可靠。在進(jìn)行DDR一致性測試時,需要遵循
    的頭像 發(fā)表于 02-01 16:24 ?1070次閱讀

    微美全息(NASDAQ:WIMI)探索全局-局部特征自適應(yīng)融合網(wǎng)絡(luò)框架在圖像場景分類中的創(chuàng)新運(yùn)用

    面臨著許多挑戰(zhàn),如復(fù)雜的場景等。然而,現(xiàn)有的圖像場景分類方法往往只關(guān)注全局局部特征的提取,而忽略了全局和局部特征之間的互補(bǔ)關(guān)聯(lián)。為了解決這
    的頭像 發(fā)表于 01-05 16:08 ?298次閱讀
    微美全息(NASDAQ:WIMI)探索<b class='flag-5'>全局</b>-<b class='flag-5'>局部</b>特征自適應(yīng)融合網(wǎng)絡(luò)框架在<b class='flag-5'>圖像</b>場景分類中的創(chuàng)新運(yùn)用

    MM32F0140 FlexCAN一致性測試 (2)

    MM32F0140 FlexCAN一致性測試 (2)
    的頭像 發(fā)表于 11-10 18:23 ?546次閱讀
    MM32F0140 FlexCAN<b class='flag-5'>一致性</b>測試 (2)

    MM32F0140 FlexCAN一致性測試(1)

    MM32F0140 FlexCAN一致性測試 (1)
    的頭像 發(fā)表于 11-10 17:50 ?515次閱讀
    MM32F0140 FlexCAN<b class='flag-5'>一致性</b>測試(1)

    什么是鋰離子電池不一致性?如何提高鋰離子電池的一致性

    什么是鋰離子電池不一致性?鋰離子電池不穩(wěn)定的原因?如何提高鋰離子電池的一致性? 鋰離子電池不一致性是指同批次或不同批次的鋰離子電池在性能上出現(xiàn)不
    的頭像 發(fā)表于 11-10 14:49 ?1312次閱讀

    分布式系統(tǒng)中常見的一致性模型

    什么是一致性模型? 在分布式系統(tǒng)中,C(一致性) 和 A(可用)始終存在矛盾。若想保證可用,就必須通過復(fù)制、分片等方式冗余存儲。而旦進(jìn)
    的頭像 發(fā)表于 11-10 11:33 ?705次閱讀
    分布式系統(tǒng)中常見的<b class='flag-5'>一致性</b>模型

    如何保證緩存一致性

    “ 本文的參考文章是2022年HOT 34上Intel Rob Blakenship關(guān)于CXL緩存一致性篇介紹?!?/div>
    的頭像 發(fā)表于 10-19 17:42 ?850次閱讀
    如何保證緩存<b class='flag-5'>一致性</b>

    如何解決數(shù)據(jù)庫與緩存一致性

    緩存一致性 每次逢年過節(jié)的時候搶票非常艱難,放票的時候那么多人同時去搶票,如果所有人查詢、購票等都去訪問數(shù)據(jù)庫,那數(shù)據(jù)庫的壓力得有多大,這時候很多都會引入緩存, 把車票信息放入緩存,這樣可以減少
    的頭像 發(fā)表于 09-25 15:25 ?909次閱讀
    如何解決數(shù)據(jù)庫與緩存<b class='flag-5'>一致性</b>