日本高清中文字幕阿v免费,caoporm免费在线视频,国产在线观看免费

該文是商湯研究院、南京科技以及哈工大聯(lián)合提出的一種采用動(dòng)態(tài)濾波器卷積進(jìn)行視頻去模糊的方法。
由于相機(jī)抖動(dòng)、目標(biāo)運(yùn)動(dòng)以及景深變化會(huì)導(dǎo)致視頻中存在spatially variant blur現(xiàn)象。現(xiàn)有的去模糊方法通常在模糊視頻中估計(jì)光流進(jìn)行對(duì)齊。這種方法會(huì)因光流估計(jì)的不夠精確導(dǎo)致生成的視頻存在偽影，或無(wú)法有效去除模糊。為克服光流估計(jì)的局限性，作者提出了一種的STFAN框架(同時(shí)進(jìn)行對(duì)齊和去模糊)。它采用了類似FRVSR的思路進(jìn)行視頻去模糊(它前一幀的模糊以及去模糊圖像聯(lián)合當(dāng)前幀模糊圖像作為輸出，經(jīng)CNN后輸出當(dāng)前幀去模糊圖像)，其CNN架構(gòu)采用了空間自使用濾波器進(jìn)行對(duì)齊與去模糊。

作者提出一種新的FAC操作進(jìn)行對(duì)齊，然后從當(dāng)前幀移除空間可變模糊。最后，作者設(shè)計(jì)了一個(gè)重建網(wǎng)絡(luò)用于復(fù)原清晰的圖像。
作者在合成數(shù)據(jù)與真實(shí)數(shù)據(jù)進(jìn)行了量化對(duì)比分析，所提方法取得了SOTA性能(同時(shí)考慮了精度、速度以及模型大小)。

文章作者: Happy

Abstract

論文將視頻去模糊中的近鄰幀對(duì)齊與非均勻模糊移除問(wèn)題建模為element-wise filter adaptive convolution processes。論文的創(chuàng)新點(diǎn)包含：

提出一個(gè)濾波器自適應(yīng)卷積計(jì)算單元，它用于特征域的對(duì)齊與去模糊；
提出一個(gè)新穎的STFAN用于視頻去模糊，它集成幀對(duì)齊、去模糊到同一個(gè)框架中，而無(wú)需明顯的運(yùn)動(dòng)估計(jì)；
從精度、速度以及模型大小方面對(duì)所提方法進(jìn)行了量化評(píng)估，取得了SOTA性能。

Method

?上圖給出了文中所用到的網(wǎng)絡(luò)架構(gòu)示意圖。從中可以看出，它包含三個(gè)子模塊：特征提取、STFAN以及重建模塊。它的輸入包含三個(gè)圖像(前一幀模糊圖像，前一幀去模糊圖像以及當(dāng)前幀模糊圖像)，由STFAN生成對(duì)齊濾波器與去模糊濾波器，然后采用FAC操作進(jìn)行特征對(duì)齊與模糊移除。最后采用重建模塊進(jìn)行清晰圖像生成。

FAC

?關(guān)于如何進(jìn)行代碼實(shí)現(xiàn)，見(jiàn)文末，這里就不再進(jìn)行更多的介紹。

網(wǎng)絡(luò)架構(gòu)

?如前所述，該網(wǎng)絡(luò)架構(gòu)包含三個(gè)模塊，這里將分別針對(duì)三個(gè)子模塊進(jìn)行簡(jiǎn)單的介紹。

特征提取網(wǎng)絡(luò)。該模塊用于從模糊圖像$B_t$中提取特征$E_t$，它由三個(gè)卷積模塊構(gòu)成，每個(gè)卷積模塊包含一個(gè)stride=2的卷積以及兩個(gè)殘差模塊(激活函數(shù)選擇LeakyReLU)。這里所提取的特征被送入到STFAN模塊中采用FAC操作進(jìn)行去模糊。該網(wǎng)絡(luò)的配置參數(shù)如下：

注：上述兩個(gè)濾波器生成模塊均包含一個(gè)卷積和兩個(gè)殘差模塊并后接一個(gè)1x1卷積用于得到期望的輸出通道?；谒玫降膬山M濾波器，采用FAC對(duì)前一幀的去模糊特征與當(dāng)前幀的幀特征進(jìn)行對(duì)齊，同時(shí)在特征層面進(jìn)行模糊移除。最后，將兩者進(jìn)行拼接送入到重建模塊中。該模塊的配置參數(shù)如下：

重建模塊。該模塊以STFAN中的融合特征作為輸入，輸出清晰的去模糊圖像。該模塊的配置參數(shù)如下所示。

損失函數(shù)

?為更有效的訓(xùn)練所提網(wǎng)絡(luò)，作者考慮如下兩種損失函數(shù)：

MSE Loss。它用于度量去模糊圖像R與真實(shí)圖像S之間的差異。
Perceptional Loss。它用于度量去模糊圖像R與真實(shí)圖像S在特征層面的相似性。

總體的損失定義為：
$$ L_{deblur} = L_{mse} + 0.01 * L_{perceptual}$$

Experiments

Dataset

?訓(xùn)練數(shù)據(jù)源自《Deep video deblurring for hand-held camars》，它包含71個(gè)視頻(6708對(duì)數(shù)據(jù))，被劃分為61用于訓(xùn)練(5708對(duì)數(shù)據(jù))，10個(gè)用于測(cè)試(1000對(duì)數(shù)據(jù))。

?在數(shù)據(jù)增廣方面，作者將每個(gè)視頻劃分為長(zhǎng)度為20的序列。

?為增廣運(yùn)動(dòng)的多樣性，對(duì)序列數(shù)據(jù)進(jìn)行隨機(jī)逆序。對(duì)每個(gè)序列數(shù)據(jù)，執(zhí)行相同的圖像變換(包含亮度、對(duì)比度調(diào)整(從[0.8, 1.2]范圍內(nèi)均勻采樣))、幾何變換(包含隨機(jī)水平/垂直鏡像)以及裁剪。

?為提升模塊在真實(shí)場(chǎng)景的魯棒性，對(duì)序列圖像添加了高斯(N(0, 0.01))隨機(jī)噪聲。

Training Settings

?整個(gè)網(wǎng)絡(luò)采用kaiming方式進(jìn)行初始化，采用Adam優(yōu)化器( [公式] )，初始學(xué)習(xí)率設(shè)為1e-4,每400k迭代乘以0.1。總計(jì)迭代次數(shù)為900k。

Results

?下面兩圖給出了不同去模糊方法的量化對(duì)比以及視覺(jué)效果對(duì)比。更多實(shí)驗(yàn)結(jié)果以及相關(guān)分析請(qǐng)查閱原文。

小結(jié)

?本文提出一種新穎的基于動(dòng)態(tài)濾波器卷積的時(shí)空網(wǎng)絡(luò)用于視頻去模塊。該網(wǎng)路可以動(dòng)態(tài)的生成用于對(duì)齊與去模糊的濾波器?；谒蔀V波器以及FAC單元，該網(wǎng)絡(luò)可以執(zhí)行時(shí)序?qū)R與特征去模糊。這種無(wú)明顯運(yùn)動(dòng)估計(jì)的方法使得它可以處理動(dòng)態(tài)場(chǎng)景中的空間可變的模塊現(xiàn)象。

結(jié)合論文所提供的網(wǎng)絡(luò)架構(gòu)，以及論文附加文檔中所提供的相關(guān)參數(shù)，簡(jiǎn)單的整理代碼如下：了精度、速度以及模型大小)。

參考代碼

結(jié)合論文所提供的網(wǎng)絡(luò)架構(gòu)，以及論文附加文檔中所提供的相關(guān)參數(shù)，參考代碼如下：

import torch
import torch.nn as nn
import torch.nn.functional as F

# 論文中各個(gè)模塊中設(shè)計(jì)的殘差模塊(文中未提到是否有BN層，因此這里未添加BN)。
class ResBlock(nn.Module):
    def __init__(self, inc):
        super(ResBlock, self).__init__()
        self.conv1 = nn.Conv2d(inc, inc, 3, 1, 1)
        self.lrelu = nn.LeakyReLU(0.1)
        self.conv2 = nn.Conv2d(inc, inc, 3, 1, 1)
    def forward(self, x):
        res = self.conv2(self.lrelu(self.conv1(x)))
        return res + x

# 特征提取模塊
class FeatureExtract(nn.Module):
    def __init__(self):
        super(FeatureExtract, self).__init__()
        self.net = nn.Sequential(nn.Conv2d(3, 32, 3, 1, 1),
                                ResBlock(32),
                                ResBlock(32),
                                nn.Conv2d(32, 64, 3, 2, 1),
                                ResBlock(64),
                                ResBlock(64),
                                nn.Conv2d(64, 128, 3, 2, 1),
                                ResBlock(128),
                                ResBlock(128))
    def forward(self, x):
        return self.net(x)
    
# 重建模塊
# (注：ConvTranspose的參數(shù)參考附件文檔設(shè)置，pad參數(shù)是估計(jì)所得，只有這組參數(shù)能夠滿足論文的相關(guān)特征之間的尺寸關(guān)系，如有問(wèn)題，請(qǐng)反饋更新)
class ReconBlock(nn.Module):
    def __init__(self):
        super(ReconBlock, self).__init__()
        self.up1  = nn.ConvTranspose2d(256, 64, 4, 2, 1)
        self.res2 = ResBlock(64)
        self.res3 = ResBlock(64)
        self.up4  = nn.ConvTranspose2d(64, 32, 3, 2, 1)
        self.res5 = ResBlock(32)
        self.res6 = ResBlock(32)
        self.conv7 = nn.Conv2d(32, 3, 3, 1, 1)

    def forward(self, feat, inputs):
        N, C, H, W = feat.size()
        up1  = self.up1(feat, output_size=(H * 2, W * 2))
        res2 = self.res2(up1)
        res3 = self.res3(res2)
        
        up4  = self.up4(res3, output_size=(H * 4, W * 4))
        res5 = self.res5(up4)
        res6 = self.res6(res5)
        
        conv7 = self.conv7(res6)
        return conv7 + inputs
    
# FAC（以下代碼源自本人博客[動(dòng)態(tài)濾波器卷積在CV中的應(yīng)用]中的相關(guān)分析）
def unfold_and_permute(tensor, kernel, stride=1, pad=-1):
    if pad < 0:
        pad = (kernel - 1) // 2
    tensor = F.pad(tensor, (pad, pad, pad, pad))
    tensor = tensor.unfold(2, kernel, stride)
    tensor = tensor.unfold(3, kernel, stride)
    N, C, H, W, _, _ = tensor.size()
    tensor = tensor.reshape(N, C, H, W, -1)
    tensor = tensor.permute(0, 2, 3, 1, 4)
    return tensor

def weight_permute_reshape(tensor, F, S2):
    N, C, H, W = tensor.size()
    tensor = tensor.permute(0, 2, 3, 1)
    tensor = tensor.reshape(N, H, W, F, S2)
    return tensor

# Filter_adaptive_convolution
def FAC(feat, filters, kernel_size):
    N, C, H, W = feat.size()
    pad = (kernel_size - 1) // 2
    feat = unfold_and_permute(feat, kernel_size, 1, pad)
    weight = weight_permute_reshape(filters, C, kernel_size**2)

    output = feat * weight
    output = output.sum(-1)
    output = output.permute(0,3,1,2)
    return output

# Architecture
class STFAN(nn.Module):
    def __init__(self, kernel_size=5):
        super(STFAN, self).__init__()
        filters = 128 * kernel_size ** 2
        self.ext = nn.Sequential(nn.Conv2d(9,32,3,1,1),
                                 ResBlock(32),
                                 ResBlock(32),
                                 nn.Conv2d(32,64,3,2,1),
                                 ResBlock(64),
                                 ResBlock(64),
                                 nn.Conv2d(64,128,3,2,1),
                                 ResBlock(128),
                                 ResBlock(128))
        self.align = nn.Sequential(nn.Conv2d(128,128,3,1,1),
                                   ResBlock(128),
                                   ResBlock(128),
                                   nn.Conv2d(128, filters, 1))
        self.deblur1 = nn.Conv2d(filters, 128, 1, 1)
        self.deblur2 = nn.Sequential(nn.Conv2d(256,128,3,1,1),
                                     ResBlock(128),
                                     ResBlock(128),
                                     nn.Conv2d(128, filters, 1))
        self.conv22 = nn.Conv2d(256, 128, 3, 1, 1)

    def forward(self, pre, cur, dpre):
        ext = self.ext(torch.cat([dpre, pre, cur], dim=1))
        align = self.align(ext)

        d1 = self.deblur1(align)
        deblur = self.deblur2(torch.cat([ext, d1], dim=1))
        return align, deblur


class Net(nn.Module):
    def __init__(self, kernel_size=5):
        super(Net, self).__init__()
        self.kernel_size = kernel_size
        self.feat = FeatureExtract()
        self.stfan = STFAN()
        self.fusion = nn.Conv2d(256, 128, 3, 1, 1)
        self.recon = ReconBlock()

    def forward(self, pre, cur, dpre, fpre):
        # Feature Extract.
        feat = self.feat(cur)

        # STFAN
        align, deblur = self.stfan(pre, cur, dpre)

        # Align and Deblur
        falign  = FAC(fpre, align, self.kernel_size)
        fdeblur = FAC(feat, deblur, self.kernel_size)
        fusion = torch.cat([falign, fdeblur], dim=1)

        # fpre for next
        fpre  = self.fusion(fusion)

        # Reconstruction
        out = self.recon(fusion, cur)
        return out, fpre
    
def demo():
    pre = torch.randn(4, 3, 64, 64)
    cur = torch.randn(4, 3, 64, 64)
    dpre = torch.randn(4, 3, 64, 64)
    fpre = torch.randn(4, 128, 16, 16)

    model = Net()
    model.eval()

    with torch.no_grad():
        output = model(pre, cur, dpre, fpre)
    print(output[0].size())
    print(output[1].size())

if __name__ == "__main__":
    demo()

本文章著作權(quán)歸作者所有，任何形式的轉(zhuǎn)載都請(qǐng)注明出處。更多動(dòng)態(tài)濾波，圖像質(zhì)量，超分辨相關(guān)請(qǐng)關(guān)注我的專欄深度學(xué)習(xí)從入門到精通。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1787

文章
46061

瀏覽量
235020
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8306

瀏覽量
131845

評(píng)論

相關(guān)推薦

關(guān)于\"OPA615\"的SOTA的跨導(dǎo)大小的疑問(wèn)求解

關(guān)于OPA615的SOTA部分，看datasheet的page9的figure22，我們可以知道跨導(dǎo)大小大概是35mA/V左右，并且可以知道其Chold輸出一般在5mA以內(nèi)，但是我從社區(qū)里面找到

發(fā)表于 09-13 06:25

伺服電機(jī)慣量大小如何選用

伺服電機(jī)慣量大小的選用是一個(gè)綜合性的過(guò)程，需要考慮多個(gè)因素以確保系統(tǒng)的性能、穩(wěn)定性和精度。以下是一些關(guān)鍵的選用原則和步驟：一、考慮應(yīng)用場(chǎng)景

發(fā)表于 09-07 09:59 ?200次閱讀

影響伺服系統(tǒng)穩(wěn)態(tài)速度精度的因素

伺服系統(tǒng)是一種高精度、高響應(yīng)速度的控制系統(tǒng)，廣泛應(yīng)用于工業(yè)自動(dòng)化、機(jī)器人、航空航天等領(lǐng)域。伺服系統(tǒng)的性能直接影響到設(shè)備的運(yùn)行精度和穩(wěn)定性。伺服電機(jī)的

發(fā)表于 07-29 10:46 ?250次閱讀

ESP8266的的GPIO速度能達(dá)到多少？

ESP8266的的GPIO速度能達(dá)到多少,自帶內(nèi)存有多少,跑應(yīng)用,或是充時(shí)應(yīng)用緩存用,我需要ADC高速,高精度采樣,通過(guò)wifi發(fā)出應(yīng)用: ADC(TTL or CMOS)->

發(fā)表于 07-12 07:41

NB81是否支持OneNet SOTA功能？應(yīng)該如何激活SOTA？

NB81是否支持OneNet SOTA功能？可以支持，應(yīng)該如何激活SOTA？

發(fā)表于 06-04 06:14

國(guó)產(chǎn)貼片機(jī)速度與精度：不同種類與性能的比較

在SMT行業(yè)中，貼片機(jī)作為核心設(shè)備，其速度與精度直接決定了生產(chǎn)效率和產(chǎn)品質(zhì)量。國(guó)產(chǎn)貼片機(jī)近年來(lái)在技術(shù)革新和性能優(yōu)化上取得了顯著進(jìn)展，不僅在速度上滿足了市場(chǎng)需求，同時(shí)在

發(fā)表于 05-30 10:54 ?544次閱讀

國(guó)產(chǎn)貼片機(jī)<b class='flag-5'>速度</b>與<b class='flag-5'>精度</b>：不同種類與<b class='flag-5'>性能</b>的比較

西安電子科技大學(xué)何剛團(tuán)隊(duì)在IJCAI 2024發(fā)布視頻人臉恢復(fù)研究新成果

　人臉恢復(fù)是一項(xiàng)通過(guò)提升圖像質(zhì)量來(lái)使面部特征更加清晰的技術(shù)，主要包括去模糊、去噪、恢復(fù)等步驟。而視頻人臉恢復(fù)則是將此技術(shù)應(yīng)用到視頻序列中，除了要處理每一幀的圖像質(zhì)量外

發(fā)表于 05-24 10:17 ?417次閱讀

旋變位置不變的情況下，當(dāng)使能SOTA功能與關(guān)閉SOTA功能時(shí)，APP中DSADC采樣得到的旋變sin和cos兩者值不一樣，為什么？

旋變位置不變的情況下，當(dāng)使能SOTA功能與關(guān)閉SOTA功能時(shí)，APP中DSADC采樣得到的旋變sin和cos兩者值不一樣，用示波器采的輸入到MCU端的差分電壓是一樣的，難道是SOTA使能后影響了MCU芯片內(nèi)部的等效阻抗嗎，有專家

發(fā)表于 05-17 08:13

MOS管為什么還要考慮電流大小呢？

當(dāng)MOS管驅(qū)動(dòng)能力不足時(shí)，我們會(huì)使用推挽電路來(lái)放大電流，但是MOS管明明是壓控型器件，為什么要去考慮電流大小呢？

發(fā)表于 04-28 14:40 ?1205次閱讀

MOS管為什么還要<b class='flag-5'>考慮</b>電流<b class='flag-5'>大小</b>呢？

消卷積在圖像處理中的應(yīng)用策略與實(shí)踐

去模糊算法對(duì)三維圖像堆棧的每個(gè)二維平面進(jìn)行操作。最近鄰算法是最常見(jiàn)的去模糊技術(shù)，其通過(guò)模糊相鄰平面（使用數(shù)字模糊濾波器的z + 1和z-1）對(duì)每個(gè)z平面進(jìn)行操作，然后從z平面減

發(fā)表于 04-24 11:43 ?417次閱讀

變頻器閉環(huán)控制速度控制精度一般是多少？

我查閱了部分變頻器廠商的說(shuō)明書，在閉環(huán)編碼器反饋矢量控制時(shí)速度控制精度在0.02%，我想著能夠做出這么高的精度嗎？0.02%這么高的精度，以50HZ兩級(jí)對(duì)電機(jī)為例，

發(fā)表于 02-28 12:16

Meta發(fā)布新型無(wú)監(jiān)督視頻預(yù)測(cè)模型“V-JEPA”

Meta，這家社交媒體和科技巨頭，近日宣布推出一種新型的無(wú)監(jiān)督視頻預(yù)測(cè)模型，名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注，因?yàn)樗ㄟ^(guò)抽象性預(yù)測(cè)生成

發(fā)表于 02-19 11:19 ?822次閱讀

解讀大模型FP量化的解決方案

在 LLaMA, BERT 以及 ViTs 模型上，4-bit 量化皆取得了遠(yuǎn)超 SOTA 的結(jié)果。特別是，這篇文章展示了 4-bit 量化的 LLaMA-13B 模型，在零樣本推理任務(wù)上達(dá)到

發(fā)表于 11-24 11:15 ?774次閱讀

AD625的增益精度怎么能達(dá)到0.05%的精度??？

運(yùn)放用的AD625，增益精度能達(dá)到0.02%，外圍可編程的放大電路，怎么能達(dá)到0.05%的精度啊？算了幾天都不行，電阻目前選用的是0.1%的精度

發(fā)表于 11-20 06:05

去模糊算法適對(duì)發(fā)射點(diǎn)擴(kuò)散函數(shù)（PSF）的假設(shè)要求最低

? ? ? ? 長(zhǎng)期以來(lái)，在顯微鏡領(lǐng)域獲得高分辨率圖像一直是一個(gè)挑戰(zhàn)。去卷積是一種增強(qiáng)圖像清晰度的方法，它通常會(huì)放大樣品和圖像之間的噪聲。波士頓大學(xué)的研究人員最近開(kāi)發(fā)了一種新的去模糊算法，可以

發(fā)表于 11-02 09:15 ?511次閱讀

搜索歷史

視頻去模糊-STFAN, 達(dá)到速度，精度和模型大小同步考慮的SOTA性能

Abstract

Method