亚洲综合无码日韩国产加勒比,欧美日韩福利电影一区二区三区四区

這是我最近才看到的一篇論文，它提出了動態(tài)ReLU (Dynamic ReLU, DY-ReLU)，可以將全局上下文編碼為超函數(shù)，并相應(yīng)地調(diào)整分段線性激活函數(shù)。

與傳統(tǒng)的ReLU相比，DY-ReLU的額外計算成本可以忽略不計，但表示能力明顯增強，并且實現(xiàn)簡單，所以可以非常簡單的對我們現(xiàn)有的模型進行修改。

Dynamic ReLU (DY-ReLU)

對于給定的輸入向量(或張量)x，DY-ReLU被定義為具有可學(xué)習(xí)參數(shù)θ(x)的函數(shù)fθ(x)(x)，該參數(shù)適應(yīng)于輸入x，它包括兩個功能:

超函數(shù)θ(x):用于計算激活函數(shù)的參數(shù)。

激活函數(shù)fθ(x)(x):使用參數(shù)θ(x)生成所有通道的激活。

1、函數(shù)定義

設(shè)傳統(tǒng)的或靜態(tài)的ReLU為y = max(x, 0)。ReLU可以推廣為每個通道c的參數(shù)分段線性函數(shù)。

其中coeffcients ( akc , bkc )是超函數(shù)(x)的輸出，如下:

其中K是函數(shù)的個數(shù)，C是通道的個數(shù)。論文中K=2。

2、超函數(shù)θ(x)的實現(xiàn)

使用輕量級網(wǎng)絡(luò)對超函數(shù)進行建模，這個超函數(shù)類似于SENet中的SE模塊(稍后會介紹)。

輸出有2KC個元素，對應(yīng)于a和b的殘差。2σ(x)-1用于對-1到1之間的殘差進行歸一化，其中σ(x)表示s型函數(shù)。最終輸出計算為初始化和殘差之和，如下所示:

其中λ是標量，這個公式也就是我們上面的圖

3、與先前研究的關(guān)系

可以看到DY-ReLU的三種特殊情況相當于ReLU、Leaky ReLU和PReLU。

4、DY-ReLU的變體

DY-ReLU-A:激活函數(shù)是空間和通道共享的。

DY-ReLU-B:激活函數(shù)是空間共享和通道相關(guān)的。

DY-ReLU-C:激活的是空間和通道分開的。

結(jié)果展示

1、消融研究

所有三種變化都比基線有所改善，但通道分開的DY-ReLU(變化B和C)明顯優(yōu)于通道共享的DY-ReLU(變化A)。

所以根據(jù)上面結(jié)果，使用DY-ReLU-B進行ImageNet分類，使用DY-ReLU-C進行COCO關(guān)鍵點檢測。

2、ImageNet分類

使用MobileNetV2 (×0.35和×1.0)，用不同的激活函數(shù)代替ReLU。所提出的方法明顯優(yōu)于所有先前的工作，包括具有更多計算成本的Maxout。這表明DY-ReLU不僅具有更強的表示能力，而且計算效率高。

上圖繪制了5萬張驗證圖像在不同區(qū)塊(從低到高)的DY-ReLU輸入輸出值。可以看到學(xué)習(xí)到的DY-ReLU在特征上是動態(tài)的，因為對于給定的輸入x，激活值(y)在一個范圍內(nèi)(藍點覆蓋的范圍)變化。

下圖分析DY-ReLU中兩段之間的夾角(即斜率差|a1c-a2c|)。激活函數(shù)在較高水平上具有較低的彎曲。

3、COCO關(guān)鍵點估計

當使用MobileNetV3作為骨干時，刪除SENet模塊，使用DY-ReLU替代ReLU和h-Swish后，結(jié)果也有提高。

總結(jié)

可以看到，只是使用DY-ReLU替換現(xiàn)有的激活函數(shù)，模型的表現(xiàn)明顯優(yōu)于基線模型。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴