0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊 AI Lab 開(kāi)源世界首款自動(dòng)化模型壓縮框架PocketFlow

羅欣 ? 來(lái)源:AI科技評(píng)論 ? 作者:佚名 ? 2018-09-18 11:51 ? 次閱讀

AI科技評(píng)論按:騰訊 AI Lab 機(jī)器學(xué)習(xí)中心今日宣布成功研發(fā)出世界上首款自動(dòng)化深度學(xué)習(xí)模型壓縮框架—— PocketFlow,并即將在近期發(fā)布開(kāi)源代碼。根據(jù)雷鋒網(wǎng)AI科技評(píng)論了解,這是一款面向移動(dòng)端AI開(kāi)發(fā)者的自動(dòng)模型壓縮框架,集成了當(dāng)前主流的模型壓縮與訓(xùn)練算法,結(jié)合自研超參數(shù)優(yōu)化組件實(shí)現(xiàn)了全程自動(dòng)化托管式的模型壓縮與加速。開(kāi)發(fā)者無(wú)需了解具體算法細(xì)節(jié),即可快速地將AI技術(shù)部署到移動(dòng)端產(chǎn)品上,實(shí)現(xiàn)用戶數(shù)據(jù)的本地高效處理。

隨著AI技術(shù)的飛速發(fā)展,越來(lái)越多的公司希望在自己的移動(dòng)端產(chǎn)品中注入AI能力,但是主流的深度學(xué)習(xí)模型往往對(duì)計(jì)算資源要求較高,難以直接部署到消費(fèi)級(jí)移動(dòng)設(shè)備中。在這種情況下,眾多模型壓縮與加速算法應(yīng)運(yùn)而生,能夠在較小的精度損失(甚至無(wú)損)下,有效提升 CNN 和 RNN 等網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算效率,從而使得深度學(xué)習(xí)模型在移動(dòng)端的部署成為可能。但是,如何根據(jù)實(shí)際應(yīng)用場(chǎng)景,選擇合適的模型壓縮與加速算法以及相應(yīng)的超參數(shù)取值,往往需要較多的專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn),這無(wú)疑提高了這項(xiàng)技術(shù)對(duì)于一般開(kāi)發(fā)者的使用門(mén)檻。

在此背景下,騰訊AI Lab機(jī)器學(xué)習(xí)中心研發(fā)了 PocketFlow 開(kāi)源框架,以實(shí)現(xiàn)自動(dòng)化的深度學(xué)習(xí)模型壓縮與加速,助力AI技術(shù)在更多移動(dòng)端產(chǎn)品中的廣泛應(yīng)用。通過(guò)集成多種深度學(xué)習(xí)模型壓縮算法,并創(chuàng)新性地引入超參數(shù)優(yōu)化組件,極大地提升了模型壓縮技術(shù)的自動(dòng)化程度。開(kāi)發(fā)者無(wú)需介入具體的模型壓縮算法及其超參數(shù)取值的選取,僅需指定設(shè)定期望的性能指標(biāo),即可通過(guò) PocketFlow 得到符合需求的壓縮模型,并快速部署到移動(dòng)端應(yīng)用中。

框架介紹

PocketFlow 框架主要由兩部分組件構(gòu)成,分別是模型壓縮/加速算法組件和超參數(shù)優(yōu)化組件,具體結(jié)構(gòu)如下圖所示。

開(kāi)發(fā)者將未壓縮的原始模型作為 PocketFlow 框架的輸入,同時(shí)指定期望的性能指標(biāo),例如模型的壓縮和/或加速倍數(shù);在每一輪迭代過(guò)程中,超參數(shù)優(yōu)化組件選取一組超參數(shù)取值組合,之后模型壓縮/加速算法組件基于該超參數(shù)取值組合,對(duì)原始模型進(jìn)行壓縮,得到一個(gè)壓縮后的候選模型;基于對(duì)候選模型進(jìn)行性能評(píng)估的結(jié)果,超參數(shù)優(yōu)化組件調(diào)整自身的模型參數(shù),并選取一組新的超參數(shù)取值組合,以開(kāi)始下一輪迭代過(guò)程;當(dāng)?shù)K止時(shí),PocketFlow 選取最優(yōu)的超參數(shù)取值組合以及對(duì)應(yīng)的候選模型,作為最終輸出,返回給開(kāi)發(fā)者用作移動(dòng)端的模型部署。

具體地,PocketFlow 通過(guò)下列各個(gè)算法組件的有效結(jié)合,實(shí)現(xiàn)了精度損失更小、自動(dòng)化程度更高的深度學(xué)習(xí)模型的壓縮與加速:

a) 通道剪枝(channel pruning)組件:在CNN網(wǎng)絡(luò)中,通過(guò)對(duì)特征圖中的通道維度進(jìn)行剪枝,可以同時(shí)降低模型大小和計(jì)算復(fù)雜度,并且壓縮后的模型可以直接基于現(xiàn)有的深度學(xué)習(xí)框架進(jìn)行部署。在CIFAR-10圖像分類(lèi)任務(wù)中,通過(guò)對(duì) ResNet-56 模型進(jìn)行通道剪枝,可以實(shí)現(xiàn)2.5倍加速下分類(lèi)精度損失0.4%,3.3倍加速下精度損失0.7%。

b) 權(quán)重稀疏化(weight sparsification)組件:通過(guò)對(duì)網(wǎng)絡(luò)權(quán)重引入稀疏性約束,可以大幅度降低網(wǎng)絡(luò)權(quán)重中的非零元素個(gè)數(shù);壓縮后模型的網(wǎng)絡(luò)權(quán)重可以以稀疏矩陣的形式進(jìn)行存儲(chǔ)和傳輸,從而實(shí)現(xiàn)模型壓縮。對(duì)于 MobileNet 圖像分類(lèi)模型,在刪去50%網(wǎng)絡(luò)權(quán)重后,在 ImageNet 數(shù)據(jù)集上的 Top-1 分類(lèi)精度損失僅為0.6%。

c) 權(quán)重量化(weight quantization)組件:通過(guò)對(duì)網(wǎng)絡(luò)權(quán)重引入量化約束,可以降低用于表示每個(gè)網(wǎng)絡(luò)權(quán)重所需的比特?cái)?shù);團(tuán)隊(duì)同時(shí)提供了對(duì)于均勻和非均勻兩大類(lèi)量化算法的支持,可以充分利用 ARMFPGA 等設(shè)備的硬件優(yōu)化,以提升移動(dòng)端的計(jì)算效率,并為未來(lái)的神經(jīng)網(wǎng)絡(luò)芯片設(shè)計(jì)提供軟件支持。以用于 ImageNet 圖像分類(lèi)任務(wù)的 ResNet-18 模型為例,在8比特定點(diǎn)量化下可以實(shí)現(xiàn)精度無(wú)損的4倍壓縮。

d) 網(wǎng)絡(luò)蒸餾(network distillation)組件:對(duì)于上述各種模型壓縮組件,通過(guò)將未壓縮的原始模型的輸出作為額外的監(jiān)督信息,指導(dǎo)壓縮后模型的訓(xùn)練,在壓縮/加速倍數(shù)不變的前提下均可以獲得0.5%-2.0%不等的精度提升。

e) 多GPU訓(xùn)練(multi-GPU training)組件:深度學(xué)習(xí)模型訓(xùn)練過(guò)程對(duì)計(jì)算資源要求較高,單個(gè)GPU難以在短時(shí)間內(nèi)完成模型訓(xùn)練,因此團(tuán)隊(duì)提供了對(duì)于多機(jī)多卡分布式訓(xùn)練的全面支持,以加快使用者的開(kāi)發(fā)流程。無(wú)論是基于 ImageNet 數(shù)據(jù)的Resnet-50圖像分類(lèi)模型還是基于 WMT14 數(shù)據(jù)的 Transformer 機(jī)器翻譯模型,均可以在一個(gè)小時(shí)內(nèi)訓(xùn)練完畢。[1]

f) 超參數(shù)優(yōu)化(hyper-parameter optimization)組件:多數(shù)開(kāi)發(fā)者對(duì)模型壓縮算法往往不甚了解,但超參數(shù)取值對(duì)最終結(jié)果往往有著巨大的影響,因此團(tuán)隊(duì)引入了超參數(shù)優(yōu)化組件,采用了包括強(qiáng)化學(xué)習(xí)等算法以及 AI Lab 自研的 AutoML 自動(dòng)超參數(shù)優(yōu)化框架來(lái)根據(jù)具體性能需求,確定最優(yōu)超參數(shù)取值組合。例如,對(duì)于通道剪枝算法,超參數(shù)優(yōu)化組件可以自動(dòng)地根據(jù)原始模型中各層的冗余程度,對(duì)各層采用不同的剪枝比例,在保證滿足模型整體壓縮倍數(shù)的前提下,實(shí)現(xiàn)壓縮后模型識(shí)別精度的最大化。

性能展示

通過(guò)引入超參數(shù)優(yōu)化組件,不僅避免了高門(mén)檻、繁瑣的人工調(diào)參工作,同時(shí)也使得 PocketFlow 在各個(gè)壓縮算法上全面超過(guò)了人工調(diào)參的效果。以圖像分類(lèi)任務(wù)為例,在 CIFAR-10 和 ImageNet 等數(shù)據(jù)集上, PocketFlow 對(duì) ResNet 和 MobileNet 等多種 CNN 網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行有效的模型壓縮與加速。[1]

在 CIFAR-10 數(shù)據(jù)集上,PocketFlow 以 ResNet-56 作為基準(zhǔn)模型進(jìn)行通道剪枝,并加入了超參數(shù)優(yōu)化和網(wǎng)絡(luò)蒸餾等訓(xùn)練策略,實(shí)現(xiàn)了2.5倍加速下分類(lèi)精度損失0.4%,3.3倍加速下精度損失0.7%,且顯著優(yōu)于未壓縮的ResNet-44模型; [2] 在 ImageNet 數(shù)據(jù)集上,PocketFlow 可以對(duì)原本已經(jīng)十分精簡(jiǎn)的 MobileNet 模型繼續(xù)進(jìn)行權(quán)重稀疏化,以更小的模型尺寸取得相似的分類(lèi)精度;與 Inception-V1 、ResNet-18 等模型相比,模型大小僅為后者的約20~40%,但分類(lèi)精度基本一致(甚至更高)。

相比于費(fèi)時(shí)費(fèi)力的人工調(diào)參,PocketFlow 框架中的 AutoML 自動(dòng)超參數(shù)優(yōu)化組件僅需10余次迭代就能達(dá)到與人工調(diào)參類(lèi)似的性能,在經(jīng)過(guò)100次迭代后搜索得到的超參數(shù)組合可以降低約0.6%的精度損失;通過(guò)使用超參數(shù)優(yōu)化組件自動(dòng)地確定網(wǎng)絡(luò)中各層權(quán)重的量化比特?cái)?shù),PocketFlow 在對(duì)用于 ImageNet 圖像分類(lèi)任務(wù)的ResNet-18模型進(jìn)行壓縮時(shí),取得了一致性的性能提升;當(dāng)平均量化比特?cái)?shù)為4比特時(shí),超參數(shù)優(yōu)化組件的引入可以將分類(lèi)精度從63.6%提升至68.1%(原始模型的分類(lèi)精度為70.3%)。

深度學(xué)習(xí)模型的壓縮與加速是當(dāng)前學(xué)術(shù)界的研究熱點(diǎn)之一,同時(shí)在工業(yè)界中也有著廣泛的應(yīng)用前景。隨著PocketFlow的推出,開(kāi)發(fā)者無(wú)需了解模型壓縮算法的具體細(xì)節(jié),也不用關(guān)心各個(gè)超參數(shù)的選擇與調(diào)優(yōu),即可基于這套自動(dòng)化框架,快速得到可用于移動(dòng)端部署的精簡(jiǎn)模型,從而為AI能力在更多移動(dòng)端產(chǎn)品中的應(yīng)用鋪平了道路。

參考文獻(xiàn)

[1] Zhuangwei Zhuang, Mingkui Tan, Bohan Zhuang, Jing Liu, Jiezhang Cao, Qingyao Wu, Junzhou Huang, Jinhui Zhu, “Discrimination-aware Channel Pruning for Deep Neural Networks", In Proc. of the 32nd Annual Conference on Neural Information Processing Systems, NIPS '18, Montreal, Canada, December 2018.

[2] Jiaxiang Wu, Weidong Huang, Junzhou Huang, Tong Zhang, “Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization”, In Proc. of the 35th International Conference on Machine Learning, ICML ’18, Stockholm, Sweden, July 2018.

本文來(lái)源:AI科技評(píng)論

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29819

    瀏覽量

    268111
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1637

    瀏覽量

    49382
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Llama 3 與開(kāi)源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開(kāi)源AI模型扮演著越來(lái)越重要的角色。它們不僅推動(dòng)了技術(shù)的創(chuàng)新,還促進(jìn)了全球開(kāi)發(fā)者社區(qū)的合作。Llama 3,作為一個(gè)新興的
    的頭像 發(fā)表于 10-27 14:42 ?290次閱讀

    ai模型ai框架的關(guān)系是什么

    AI模型AI框架是人工智能領(lǐng)域中兩個(gè)重要的概念,它們之間的關(guān)系密切且復(fù)雜。 AI模型的定義
    的頭像 發(fā)表于 07-16 10:07 ?3.7w次閱讀

    AI模型AI框架的關(guān)系

    在探討AI模型AI框架的關(guān)系時(shí),我們首先需要明確兩者的基本概念及其在人工智能領(lǐng)域中的角色。AI模型
    的頭像 發(fā)表于 07-15 11:42 ?862次閱讀

    機(jī)械自動(dòng)化和電氣自動(dòng)化區(qū)別是什么

    機(jī)械自動(dòng)化和電氣自動(dòng)化是現(xiàn)代工業(yè)生產(chǎn)中兩個(gè)重要的領(lǐng)域,它們?cè)谠S多方面有著密切的聯(lián)系,但也存在一些明顯的區(qū)別。 一、基本概念 機(jī)械自動(dòng)化 機(jī)械自動(dòng)化是指利用機(jī)械設(shè)備、傳感器、控制系統(tǒng)等技
    的頭像 發(fā)表于 07-01 09:33 ?3506次閱讀

    機(jī)械自動(dòng)化自動(dòng)化的一種嗎

    引言 自動(dòng)化技術(shù)是指利用控制裝置對(duì)生產(chǎn)過(guò)程進(jìn)行控制,以實(shí)現(xiàn)生產(chǎn)過(guò)程的自動(dòng)化。機(jī)械自動(dòng)化自動(dòng)化技術(shù)的一種,它主要涉及到使用機(jī)械設(shè)備和控制系統(tǒng)來(lái)實(shí)現(xiàn)生產(chǎn)過(guò)程的
    的頭像 發(fā)表于 07-01 09:32 ?1490次閱讀

    產(chǎn)線自動(dòng)化改造,智能空調(diào)壓縮機(jī)中的工業(yè)RFID技術(shù)應(yīng)用

    通過(guò)RFID技術(shù)的應(yīng)用,空調(diào)壓縮機(jī)的生產(chǎn)過(guò)程變得更加自動(dòng)化和智能。自動(dòng)化的裝配線減少了對(duì)人工操作的依賴,降低了因人為錯(cuò)誤導(dǎo)致的生產(chǎn)成本。
    的頭像 發(fā)表于 06-21 11:03 ?232次閱讀

    工業(yè)自動(dòng)化自動(dòng)化區(qū)別是什么

    工業(yè)自動(dòng)化自動(dòng)化是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。在這篇文章中,我們將詳細(xì)探討它們之間的區(qū)別,以及它們?cè)诂F(xiàn)代工業(yè)生產(chǎn)中的應(yīng)用。 一、自動(dòng)化的定義 自動(dòng)化是指通過(guò)使用機(jī)器、計(jì)算機(jī)和其他
    的頭像 發(fā)表于 06-11 11:13 ?1470次閱讀

    IBM開(kāi)源AI模型,推動(dòng)AI企業(yè)應(yīng)用

    IBM近日宣布,將把一系列先進(jìn)的人工智能模型開(kāi)源軟件的形式發(fā)布,此舉標(biāo)志著人工智能技術(shù)在企業(yè)應(yīng)用上的新篇章。公司表示,隨著watsonx平臺(tái)推出滿一年,該平臺(tái)將迎來(lái)重大更新,新增的數(shù)據(jù)和自動(dòng)化功能將使企業(yè)能夠更輕松地集成和部署
    的頭像 發(fā)表于 05-22 09:25 ?441次閱讀

    Yellow.ai業(yè)界首創(chuàng)生成式AI代理模型

    生成式人工智能客戶服務(wù)自動(dòng)化領(lǐng)域企業(yè) Yellow.ai 推出了 Orchestrator LLM,這是業(yè)界首創(chuàng)的代理模式,可在進(jìn)行個(gè)性、情境
    的頭像 發(fā)表于 05-10 16:25 ?577次閱讀

    紅帽發(fā)布RHEL AI開(kāi)發(fā)者預(yù)覽版,集成IBM Granite模型,簡(jiǎn)化AI開(kāi)發(fā)流程

    RHEL AI依托InstructLab開(kāi)源項(xiàng)目,結(jié)合IBM Research的開(kāi)源授權(quán)Granite大型語(yǔ)言模型與InstructLab模型
    的頭像 發(fā)表于 05-08 15:01 ?451次閱讀

    鴻蒙OS開(kāi)發(fā)實(shí)戰(zhàn):【自動(dòng)化測(cè)試框架】使用指南

    為支撐HarmonyOS操作系統(tǒng)的自動(dòng)化測(cè)試活動(dòng)開(kāi)展,我們提供了支持JS/TS語(yǔ)言的單元及UI測(cè)試框架,支持開(kāi)發(fā)者針對(duì)應(yīng)用接口進(jìn)行單元測(cè)試,并且可基于UI操作進(jìn)行UI自動(dòng)化腳本的編寫(xiě)。 本指南重點(diǎn)介紹
    的頭像 發(fā)表于 04-08 14:49 ?1244次閱讀
    鴻蒙OS開(kāi)發(fā)實(shí)戰(zhàn):【<b class='flag-5'>自動(dòng)化</b>測(cè)試<b class='flag-5'>框架</b>】使用指南

    cubemx ai導(dǎo)入onnx模型壓縮失敗了怎么解決?

    cubemx ai導(dǎo)入onnx模型壓縮失敗。請(qǐng)問(wèn)我怎么解決
    發(fā)表于 03-19 07:58

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開(kāi)發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個(gè)開(kāi)源的機(jī)器學(xué)習(xí)框架
    的頭像 發(fā)表于 03-01 16:25 ?772次閱讀

    HamronyOS自動(dòng)化測(cè)試框架使用指南

    概述 為支撐 HarmonyOS 操作系統(tǒng)的自動(dòng)化測(cè)試活動(dòng)開(kāi)展,我們提供了支持 JS/TS 語(yǔ)言的單元及 UI 測(cè)試框架,支持開(kāi)發(fā)者針對(duì)應(yīng)用接口進(jìn)行單元測(cè)試,并且可基于 UI 操作進(jìn)行 UI 自動(dòng)化
    發(fā)表于 12-19 10:26

    明治傳感亮相世界頂級(jí)自動(dòng)化大展

    風(fēng)向標(biāo),展現(xiàn)了工業(yè)自動(dòng)化和數(shù)字領(lǐng)域的最新成果和技術(shù)趨勢(shì)。再次登上SPS這個(gè)世界級(jí)舞臺(tái),無(wú)疑是令所有志奮領(lǐng)青年興奮又激動(dòng)的年度盛事!如約而至精彩亮相作為值得信賴的
    的頭像 發(fā)表于 11-21 08:24 ?710次閱讀
    明治傳感亮相<b class='flag-5'>世界</b>頂級(jí)<b class='flag-5'>自動(dòng)化</b>大展