0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不同于針對(duì)壓縮單個(gè)權(quán)重的方法

YCqV_FPGA_EETre ? 來源:未知 ? 2019-11-27 15:49 ? 次閱讀

引言

這篇文章介紹一種不同于針對(duì)壓縮單個(gè)權(quán)重的方法:多個(gè)權(quán)重?cái)?shù)據(jù)組合為向量,將向量視為一個(gè)整體,映射到其他向量空間,完成壓縮。作者在resnet-50上做了實(shí)驗(yàn),將100MB權(quán)重壓縮到了5MB(實(shí)現(xiàn)了20倍壓縮比例),同時(shí)在imageNet上測(cè)試的top-1精度保持的很好(76.1%)。Resnet是一種經(jīng)典的殘差網(wǎng)絡(luò),在2015年的imageNet大賽中獲得第一名,被廣泛應(yīng)用在圖像識(shí)別和分類中。向量壓縮方法在resnet上的成功運(yùn)用,會(huì)大大推動(dòng)resnet在硬件加速中的應(yīng)用。 1

背景介紹

也許是神經(jīng)網(wǎng)絡(luò)較強(qiáng)的泛化能力和較窄的應(yīng)用場(chǎng)景之間的矛盾,造成了網(wǎng)絡(luò)參數(shù)存在很大冗余。因此各種壓縮方法五花八門,層出不窮。

有的是將權(quán)重?cái)?shù)據(jù)低精度化,比如前一篇介紹的二值網(wǎng)絡(luò),還有三值,四值網(wǎng)絡(luò),8bit,16bit定點(diǎn)網(wǎng)絡(luò)等等。這些主要是考慮整體上降低每個(gè)權(quán)重的表達(dá)精度。但是隨著精度降低越大,網(wǎng)絡(luò)的分類能力就會(huì)越低。

另一類方法是向量量化。其主要思想是將原始高維權(quán)重空間分割成低維子空間的乘積,然后對(duì)子空間進(jìn)行重新映射,通過映射到某個(gè)新的集合來完成整體數(shù)據(jù)的壓縮。實(shí)際上是尋找不同向量之間的共性,用同一個(gè)新向量來替代,實(shí)現(xiàn)聚類。這樣就減少了不同子向量的個(gè)數(shù),實(shí)現(xiàn)了數(shù)據(jù)壓縮。

還有一種方法是剪枝。即去除一些不重要的網(wǎng)絡(luò)連接或者參數(shù),比如在LSTM優(yōu)化中使用的structured compression,就是直接去除多個(gè)相鄰的不重要的權(quán)重參數(shù)。

利用以上的方法產(chǎn)生了多個(gè)壓縮的網(wǎng)絡(luò)結(jié)構(gòu),比如squeezeNet,NASNet,ShuffleNet,MobileNet等。這些網(wǎng)絡(luò)是從網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)開始,就權(quán)衡數(shù)據(jù)量和分類精度,來實(shí)現(xiàn)既有小的權(quán)重?cái)?shù)據(jù),同時(shí)又有好的表現(xiàn)力。

2

壓縮方法

這篇論文的創(chuàng)新性在于在采用向量壓縮的基礎(chǔ)上,最小化激活函數(shù)的輸入而不是權(quán)重的均方差。相比于傳統(tǒng)方法,其在測(cè)試集中有更好的分類能力,同時(shí)不需要任何監(jiān)督過程,只是給出一定數(shù)量的輸入圖片就行了。

圖2.1 綠色的線是論文的方法,在測(cè)試集和中有更好的分類能力,而傳統(tǒng)方法會(huì)在壓縮過程中引入噪聲,造成分類精度的降低

論文首先從全連接的量化講解,之后推廣到卷積的壓縮。假設(shè)一個(gè)全連接層有權(quán)重: 將每列W分割成m個(gè)連續(xù)的子向量,然后讓網(wǎng)絡(luò)學(xué)習(xí)一個(gè)字典可以表示這mC_out個(gè)向量。子向量維度為d=C_in/m。假設(shè)字典有k個(gè)數(shù)據(jù){C_1, C_2, …, C_k}。任何一個(gè)d維向量都被映射到這個(gè)空間中,于是一個(gè)W的列向量映射為: 這個(gè)字典是通過最小化權(quán)重的均方差來學(xué)習(xí): 從實(shí)際來講,我們要減小的并不是權(quán)重之間的差異,而是結(jié)果的差異。所以論文從更直觀的角度來最小化輸出結(jié)果: 其中,

是全連接層的輸出結(jié)果。

具體實(shí)現(xiàn)步驟為:

1) 為了匹配W子向量,輸入x也進(jìn)行相對(duì)應(yīng)的分割。由BxC_inàBxmxd;

2) 對(duì)每個(gè)子W向量進(jìn)行聚類,分配字典中的向量c:

其中v是W的子向量,c為字典中向量。X^為x的子空間。

2) 更新字典數(shù)據(jù)c:假設(shè)對(duì)應(yīng)c向量已經(jīng)分配了一定數(shù)量的v,那么通過以下方法來更新c:

全連接進(jìn)行的是矩陣運(yùn)算,而卷積層是由卷積核來實(shí)現(xiàn)圖像的卷積。兩者不同,如何將前面的方法用到卷積層呢?其實(shí)向量壓縮算法本身不在做什么運(yùn)算,而是在于對(duì)權(quán)重的重新分類。從這點(diǎn)來看,一個(gè)卷積層權(quán)重為: 其中KxK為一個(gè)卷積核大小,可以作為一個(gè)基本的子向量單位。我們可以選擇拆分的W的字向量大小為hxKxK。如果h=1,那么一個(gè)卷積核就被當(dāng)做一個(gè)要映射的子向量。而輸出不再是矩陣乘法而是卷積運(yùn)算: 這樣就能夠應(yīng)用以上方法來對(duì)卷積層權(quán)重進(jìn)行壓縮了。

圖2.2 卷積層權(quán)重?cái)?shù)據(jù)進(jìn)行KxK子空間分解

3

實(shí)驗(yàn)結(jié)果

論文在resnet-18和resnet-50上進(jìn)行了實(shí)驗(yàn)。3x3卷積的子空間被設(shè)置為9或者18,而pointwise的權(quán)重子空間設(shè)置為4或者8.字典的大小設(shè)置了四種不同數(shù)量:256,512,1024,2048。在開始量化前,從訓(xùn)練集中隨機(jī)取得1024幅圖片作為量化輸入,執(zhí)行2節(jié)中的量化步驟。結(jié)果綜合了存儲(chǔ)減小和分類精度兩方面,如下圖所示: 圖3.1 resnet-18和resnet-50的壓縮比例

從圖中看出,采用小的子空間和大的字典元素?cái)?shù)目有更好的分類精度,但是壓縮率低。在實(shí)際應(yīng)用中可以根據(jù)需要來調(diào)節(jié)這些參數(shù)獲得你期望的壓縮率和識(shí)別精度。

圖3.1 resnet-18和resnet-50的壓縮比例

從圖中看出,采用小的子空間和大的字典元素?cái)?shù)目有更好的分類精度,但是壓縮率低。在實(shí)際應(yīng)用中可以根據(jù)需要來調(diào)節(jié)這些參數(shù)獲得你期望的壓縮率和識(shí)別精度。

圖3.2 k=256下,兩個(gè)網(wǎng)絡(luò)的壓縮率和top-1精確度

結(jié)論

本文介紹了一種利用向量壓縮來降低復(fù)雜的神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)量的方法,通過resnet上的實(shí)驗(yàn),能夠看出這種方法相對(duì)于單純的壓縮單個(gè)權(quán)重,可以保持良好的精確度,同時(shí)能夠獲得一定壓縮比例。

文獻(xiàn)

1 Pierre Stock, A.J., R′emi Gribonval, Benjamin Graham, Herv′e J′egou, And the Bit Goes Down Revisiting the Quantization of Neural Networks. arXiv preprint, 2019.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:【網(wǎng)絡(luò)壓縮二】向量壓縮方法

文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    為什么Platform Cable USB II和Xilinx并行電纜IV分配引腳不同于14引腳Jtag標(biāo)準(zhǔn)引腳分配?

    為什么Platform Cable USB II和Xilinx并行電纜IV分配引腳不同于14引腳Jtag標(biāo)準(zhǔn)引腳分配(如http://hri.sourceforge.net/tools/jtag_faq_org.html#_Toc63218715中所示),它們真的不同嗎?如果是,那么自定義適配器將此14針轉(zhuǎn)換為標(biāo)準(zhǔn)
    發(fā)表于 08-13 09:41

    求大佬分享一種針對(duì)高斯類波形使用Mu-law壓縮方法

    本文描述了一種針對(duì)高斯類波形使用Mu-law壓縮方法——例如CPRI接口中使用的基帶IQ數(shù)據(jù)。Mu-law壓縮在音頻應(yīng)用中很常見,實(shí)現(xiàn)效率很高,但對(duì)基帶信號(hào)來說在保真度方面會(huì)有過多的
    發(fā)表于 05-24 06:52

    為什么起振后的直流工作點(diǎn)電流不同于起振前的靜態(tài)工作點(diǎn)電流呢?

    為什么起振后的直流工作點(diǎn)電流不同于起振前的靜態(tài)工作點(diǎn)電流呢?
    發(fā)表于 03-28 13:44

    基于反饋信息的特征權(quán)重調(diào)整方法

    訓(xùn)練集的分布對(duì)文本分類質(zhì)量有重要影響。該文對(duì)兩類文本分類中的數(shù)據(jù)集偏斜問題進(jìn)行研究,提出一種基于反饋信息的特征權(quán)重調(diào)整方法,該方法綜合考慮正確分類和錯(cuò)誤分類的
    發(fā)表于 04-01 08:59 ?13次下載

    單個(gè)晶體管頻帶壓縮放大器電路圖

    單個(gè)晶體管頻帶壓縮放大器電路圖
    發(fā)表于 06-27 10:05 ?500次閱讀
    <b class='flag-5'>單個(gè)</b>晶體管頻帶<b class='flag-5'>壓縮</b>放大器電路圖

    無線視頻的壓縮方法

    無線視頻的壓縮方法              無線視頻典型的壓縮方法有H.263和J
    發(fā)表于 01-06 14:40 ?591次閱讀

    一種漏洞威脅基礎(chǔ)評(píng)分指標(biāo)權(quán)重分配方法

    針對(duì)通用漏洞評(píng)分系統(tǒng)( CVSS)的基礎(chǔ)評(píng)分指標(biāo)權(quán)重分配過多依賴專家經(jīng)驗(yàn)導(dǎo)致客觀性不足的問題,提出一種漏洞威脅基礎(chǔ)評(píng)分指標(biāo)權(quán)重分配方法。首先,對(duì)評(píng)分要素的相對(duì)重要性進(jìn)行排序;然后,采用
    發(fā)表于 12-01 16:24 ?0次下載
    一種漏洞威脅基礎(chǔ)評(píng)分指標(biāo)<b class='flag-5'>權(quán)重</b>分配<b class='flag-5'>方法</b>

    一種新的DEA公共權(quán)重生成方法

    針對(duì)傳統(tǒng)數(shù)據(jù)包絡(luò)分析(DEA)公共權(quán)重生成方法不同時(shí)具備線性、規(guī)模無關(guān)優(yōu)點(diǎn)的問題,根據(jù)軍事訓(xùn)練績效評(píng)估需求,提出了一種新的DEA公共權(quán)重生成方法。該方法以DEA有效單位為計(jì)算基礎(chǔ),首先
    發(fā)表于 01-13 11:03 ?0次下載

    一種約束權(quán)重的改進(jìn)多目標(biāo)跟蹤方法

    針對(duì)高斯混合概率假設(shè)密度( GM-PHD)濾波器未檢查一對(duì)一假設(shè)以及難以跟蹤跨越目標(biāo)的問題,在其基礎(chǔ)上提出一種約束權(quán)重的改進(jìn)多目標(biāo)跟蹤方法。通過構(gòu)建權(quán)重矩陣,從所有生成的目標(biāo)中尋找
    發(fā)表于 02-24 13:55 ?0次下載
    一種約束<b class='flag-5'>權(quán)重</b>的改進(jìn)多目標(biāo)跟蹤<b class='flag-5'>方法</b>

    面向“邊緣”應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行量化與壓縮詳細(xì)方法

    針對(duì)卷積神經(jīng)網(wǎng)絡(luò)( CNN)推理計(jì)算所需內(nèi)存空間和資源過大,限制了其在嵌入式等“邊緣”設(shè)備上部署的問題,提出結(jié)合網(wǎng)絡(luò)權(quán)重裁剪及面向嵌入式硬件平臺(tái)數(shù)據(jù)類型的數(shù)據(jù)量化的神經(jīng)網(wǎng)絡(luò)壓縮方法。首
    發(fā)表于 12-26 17:01 ?4次下載
    面向“邊緣”應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行量化與<b class='flag-5'>壓縮</b>詳細(xì)<b class='flag-5'>方法</b>

    蘋果折疊屏專利曝光將不同于華為的橫向折疊設(shè)計(jì)而采用了縱向折疊

    從曝出的蘋果折疊屏專利可以看出,可折疊iPhone不同于華為、三星、小米等公司折疊屏手機(jī)設(shè)計(jì)不同,是采用縱向折疊,而非橫向折疊。 另一張簡圖顯示,顯示屏可以向后折疊。在這種形態(tài)下,兩部分顯示屏之間有一定角度,坐在顯示屏兩側(cè)的用戶,可以同時(shí)看到相同的內(nèi)容。
    發(fā)表于 02-27 09:10 ?1566次閱讀
    蘋果折疊屏專利曝光將<b class='flag-5'>不同于</b>華為的橫向折疊設(shè)計(jì)而采用了縱向折疊

    一種不同于雙線性插值的上采樣方法

    我們可以看到,該網(wǎng)絡(luò)將傳統(tǒng)的非線性插值替換成 DUpsample,同時(shí)在 feature fuse 方面,不同于之前方法將 Decoder 中的特征上采樣與 Encoder 特征融合,本工作將 Encoder 中的特征下采樣與 Decoder 融合,大大減少了計(jì)算量 ,這
    的頭像 發(fā)表于 04-08 14:47 ?6255次閱讀
    一種<b class='flag-5'>不同于</b>雙線性插值的上采樣<b class='flag-5'>方法</b>

    可解決高沖突證據(jù)合成問題的證據(jù)權(quán)重確定方法

    為對(duì)證據(jù)源進(jìn)行合理修正,解決高沖突證據(jù)合成時(shí)存在的問題,提岀了一種新的證據(jù)權(quán)重確定方法。首先利用證據(jù)之間的局部沖突和相似性求出各個(gè)證據(jù)的全局沖突系數(shù);其次取全局沖突系數(shù)的反值作為證據(jù)的權(quán)重并利用該
    發(fā)表于 04-22 14:07 ?0次下載
    可解決高沖突證據(jù)合成問題的證據(jù)<b class='flag-5'>權(quán)重</b>確定<b class='flag-5'>方法</b>

    一種基于用戶偏好的權(quán)重搜索及告警選擇方法

    用戶在現(xiàn)有交互方式下選擇最為嚴(yán)重的告警時(shí)完全依據(jù)其個(gè)人偏好,而未考慮處理不同告警所需成本的差異性問題。為此,提出一種基于用戶偏好的權(quán)重搜索及告警選擇方法。挖掘用戶對(duì)不同嚴(yán)重程度告警的偏好值,針對(duì)
    發(fā)表于 04-29 16:26 ?4次下載
    一種基于用戶偏好的<b class='flag-5'>權(quán)重</b>搜索及告警選擇<b class='flag-5'>方法</b>

    折彎機(jī)專用激光保護(hù)裝置為什么不同于一般安全光幕

    折彎機(jī)專用激光保護(hù)裝置為什么不同于一般安全光幕
    的頭像 發(fā)表于 07-06 14:05 ?515次閱讀
    折彎機(jī)專用激光保護(hù)裝置為什么<b class='flag-5'>不同于</b>一般安全光幕