无码高潮少妇毛多水多免费看,欧美?v电影高清在线观看

深度學(xué)習(xí)在模型及其數(shù)據(jù)集方面正以驚人的速度增長(zhǎng)。在應(yīng)用方面，深度學(xué)習(xí)市場(chǎng)以圖像識(shí)別為主，其次是光學(xué)字符識(shí)別，以及面部和物體識(shí)別。根據(jù) Allied 市場(chǎng)研究，6 年全球深度學(xué)習(xí)市場(chǎng)價(jià)值為 85.2020 億美元，預(yù)計(jì)到 179 年將達(dá)到 96.2030 億美元，39 年至 2 年的復(fù)合年增長(zhǎng)率為 2021.2030%。

在某個(gè)時(shí)間點(diǎn)，人們認(rèn)為大型和復(fù)雜的模型表現(xiàn)更好，但現(xiàn)在它幾乎是一個(gè)神話。隨著邊緣AI的發(fā)展，越來(lái)越多的技術(shù)將大型復(fù)雜模型轉(zhuǎn)換為可以在邊緣上運(yùn)行的簡(jiǎn)單模型，所有這些技術(shù)結(jié)合起來(lái)執(zhí)行模型壓縮。

什么是模型壓縮？

模型壓縮是在計(jì)算能力和內(nèi)存較低的邊緣設(shè)備上部署SOTA（最先進(jìn)的）深度學(xué)習(xí)模型的過(guò)程，而不會(huì)影響模型在準(zhǔn)確性、精度、召回率等方面的性能。模型壓縮大致減少了模型中的兩件事，即大小和延遲。減小大小的重點(diǎn)是通過(guò)減少模型參數(shù)來(lái)簡(jiǎn)化模型，從而降低執(zhí)行中的 RAM 要求和內(nèi)存中的存儲(chǔ)要求。延遲減少是指減少模型進(jìn)行預(yù)測(cè)或推斷結(jié)果所花費(fèi)的時(shí)間。模型大小和延遲通常同時(shí)存在，大多數(shù)技術(shù)都會(huì)減少兩者。

流行的模型壓縮技術(shù)

修剪：

修剪是最流行的模型壓縮技術(shù)，它通過(guò)刪除冗余和無(wú)關(guān)緊要的參數(shù)來(lái)工作。神經(jīng)網(wǎng)絡(luò)中的這些參數(shù)可以是連接器、神經(jīng)元、通道，甚至是層。它很受歡迎，因?yàn)樗瑫r(shí)減小了模型的大小并改善了延遲。

修剪

修剪可以在訓(xùn)練模型時(shí)或訓(xùn)練后完成。有不同類型的修剪技術(shù)，即權(quán)重/連接修剪、神經(jīng)元修剪、過(guò)濾器修剪和層修剪。

量化：

當(dāng)我們刪除神經(jīng)元、連接、過(guò)濾器、層等時(shí)。在修剪以減少加權(quán)參數(shù)的數(shù)量時(shí)，權(quán)重的大小在量化期間減小。在此過(guò)程中，大型集中的值將映射到較小集中的值。與輸入網(wǎng)絡(luò)相比，輸出網(wǎng)絡(luò)的值范圍較窄，但保留了大部分信息。有關(guān)此方法的更多詳細(xì)信息，您可以在此處閱讀我們關(guān)于模型量化的深入文章。

知識(shí)蒸餾：

在知識(shí)蒸餾過(guò)程中，在一個(gè)非常大的數(shù)據(jù)集上訓(xùn)練一個(gè)復(fù)雜而龐大的模型。微調(diào)大型模型后，它可以很好地處理看不見(jiàn)的數(shù)據(jù)。一旦獲得，這些知識(shí)就會(huì)轉(zhuǎn)移到較小的神經(jīng)網(wǎng)絡(luò)或模型中。同時(shí)使用教師網(wǎng)絡(luò)（較大的模型）和學(xué)生網(wǎng)絡(luò)（較小的模型）。這里存在兩個(gè)方面，知識(shí)蒸餾，我們不調(diào)整教師模型，而在遷移學(xué)習(xí)中，我們使用精確的模型和權(quán)重，在一定程度上改變模型，并根據(jù)相關(guān)任務(wù)進(jìn)行調(diào)整。

知識(shí)蒸餾系統(tǒng)

知識(shí)、蒸餾算法和師生架構(gòu)模型是典型知識(shí)蒸餾系統(tǒng)的三個(gè)主要部分，如上圖所示。

低矩陣分解：

矩陣構(gòu)成了大多數(shù)深度神經(jīng)結(jié)構(gòu)的大部分。該技術(shù)旨在通過(guò)應(yīng)用矩陣或張量分解并將它們制成更小的矩陣來(lái)識(shí)別冗余參數(shù)。這種技術(shù)應(yīng)用于密集的DNN（深度神經(jīng)網(wǎng)絡(luò)）時(shí)，降低了CNN（卷積神經(jīng)網(wǎng)絡(luò)）層的存儲(chǔ)要求和分解，并縮短了推理時(shí)間。具有二維且秩為 r 的權(quán)重矩陣 A 可以分解為更小的矩陣，如下所示。

低矩陣分解

模型的準(zhǔn)確性和性能在很大程度上取決于適當(dāng)?shù)姆纸夂椭冗x擇。低秩分解過(guò)程中的主要挑戰(zhàn)是更難實(shí)現(xiàn)，并且是計(jì)算密集型的?？傮w而言，與全秩矩陣表示相比，密集層矩陣的因式分解可產(chǎn)生更小的模型和更快的性能。

由于邊緣人工智能，模型壓縮策略變得非常重要。這些方法是相互補(bǔ)充的，可以在整個(gè) AI 管道的各個(gè)階段使用。像TensorFlow和Pytorch這樣的流行框架現(xiàn)在包括修剪和量化等技術(shù)。最終，該領(lǐng)域使用的技術(shù)數(shù)量將會(huì)增加。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

RAM

RAM

+關(guān)注

關(guān)注
8

文章
1364

瀏覽量
114445
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46669

瀏覽量
237106
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5466

瀏覽量
120891

評(píng)論

相關(guān)推薦

騰訊 AI Lab 開(kāi)源世界首款自動(dòng)化模型壓縮框架PocketFlow

移動(dòng)端AI開(kāi)發(fā)者的自動(dòng)模型壓縮框架，集成了當(dāng)前主流的模型壓縮與訓(xùn)練算法，結(jié)合自研超參數(shù)優(yōu)化組件實(shí)現(xiàn)了全程自動(dòng)化托管式的

發(fā)表于 09-18 11:51 ?4243次閱讀

模型壓縮技術(shù)，加速AI大模型在終端側(cè)的應(yīng)用

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）當(dāng)前，全球眾多科技企業(yè)都在積極研究AI大模型，然而因?yàn)閰?shù)規(guī)模太大，要想實(shí)現(xiàn)AI大模型在邊/端側(cè)部署，需要用到模型

發(fā)表于 04-24 01:26 ?2470次閱讀

邊緣AI應(yīng)用越來(lái)越普遍，AI模型在邊緣端如何部署？

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）在人工智能時(shí)代，越來(lái)越多的AI應(yīng)用需要從云端擴(kuò)展到邊緣端，比如智能耳機(jī)、智能攝像機(jī)、智能手環(huán)、物流機(jī)器人等，在邊緣端部署AI已經(jīng)成為趨勢(shì)。如今

發(fā)表于 07-04 00:11 ?2495次閱讀

NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)

發(fā)表于 03-12 08:09

cubemx ai導(dǎo)入onnx模型后壓縮失敗了怎么解決？

cubemx ai導(dǎo)入onnx模型后壓縮失敗。請(qǐng)問(wèn)我怎么解決

發(fā)表于 03-19 07:58

硬件幫助將AI移動(dòng)到邊緣

雖然人工智能和機(jī)器學(xué)習(xí)計(jì)算通常在數(shù)據(jù)中心中大規(guī)模地執(zhí)行，但是最新的處理設(shè)備使得能夠?qū)?b class='flag-5'>AI / ML能力嵌入到網(wǎng)絡(luò)邊緣的IoT設(shè)備中。邊緣的AI可以快速響應(yīng)，無(wú)需等待云的響應(yīng)。如果可以在

發(fā)表于 05-29 10:38

EdgeBoard FZ5 邊緣AI計(jì)算盒及計(jì)算卡

科技攜手百度，推出系列高性能及高性價(jià)比EdgeBoard 邊緣AI計(jì)算卡/計(jì)算盒，助力AI項(xiàng)目落地?？伸`活適配海量的且不斷迭代的AI模型，并

發(fā)表于 08-31 14:12

【HarmonyOS HiSpark AI Camera】邊緣計(jì)算安全監(jiān)控系統(tǒng)

項(xiàng)目名稱：邊緣計(jì)算安全監(jiān)控系統(tǒng)試用計(jì)劃：理由：本人熱愛(ài)嵌入式技術(shù)，希望通過(guò)嵌入式智能技術(shù)改善人們生活。希望基于鴻蒙系和linux統(tǒng)構(gòu)建一個(gè)邊緣計(jì)算的智能監(jiān)控平臺(tái)，來(lái)保證工廠運(yùn)行的安全。

發(fā)表于 09-25 10:11

網(wǎng)絡(luò)邊緣實(shí)施AI的原因

將AI推向邊緣的影響通過(guò)在邊緣運(yùn)行ML模型可以使哪些具體的AI項(xiàng)目更容易運(yùn)行？

發(fā)表于 02-23 06:21

嵌入式邊緣AI應(yīng)用開(kāi)發(fā)指南

如果在沒(méi)有嵌入式處理器供應(yīng)商提供的合適工具和軟件的支持下，既想設(shè)計(jì)高能效的邊緣人工智能(AI)系統(tǒng)，同時(shí)又要加快產(chǎn)品上市時(shí)間，這項(xiàng)工作難免會(huì)冗長(zhǎng)乏味。面臨的一系列挑戰(zhàn)包括選擇恰當(dāng)?shù)纳疃葘W(xué)習(xí)模型

發(fā)表于 11-03 06:53

壓縮模型會(huì)加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡(jiǎn)單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對(duì)推理時(shí)間沒(méi)有影響。aiRun 程序在 8

發(fā)表于 01-29 06:24

ST MCU邊緣AI開(kāi)發(fā)者云 - STM32Cube.AI

意法半導(dǎo)體（ST）為嵌入式AI開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家擴(kuò)展了面向嵌入式AI開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家的解決方案，推出了一套業(yè)界首創(chuàng)的全新工具和服務(wù)，通過(guò)輔助硬件和軟件決策，將邊緣AI

發(fā)表于 02-02 09:52

訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么解決？

訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦，試了好幾個(gè)模型壓縮了也不行，ram占用過(guò)大，有無(wú)解決方案？

發(fā)表于 08-04 09:16

邊緣AI的模型壓縮技術(shù)

在某個(gè)時(shí)間點(diǎn)，人們認(rèn)為大型和復(fù)雜的模型表現(xiàn)更好，但現(xiàn)在它幾乎是一個(gè)神話。隨著邊緣AI的發(fā)展，越來(lái)越多的技術(shù)將大型復(fù)雜模型轉(zhuǎn)換為可以在

發(fā)表于 10-19 14:22 ?1013次閱讀

邊緣計(jì)算ai技術(shù)是什么？

邊緣計(jì)算ai技術(shù)是什么？邊緣計(jì)算AI技術(shù)是指將人工智能技術(shù)

發(fā)表于 08-24 15:49 ?1123次閱讀

搜索歷史

邊緣AI的模型壓縮技術(shù)

評(píng)論

騰訊 AI Lab 開(kāi)源世界首款自動(dòng)化模型壓縮框架PocketFlow

模型壓縮技術(shù)，加速AI大模型在終端側(cè)的應(yīng)用

邊緣AI應(yīng)用越來(lái)越普遍，AI模型在邊緣端如何部署？

NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

cubemx ai導(dǎo)入onnx模型后壓縮失敗了怎么解決？

硬件幫助將AI移動(dòng)到邊緣

EdgeBoard FZ5 邊緣AI計(jì)算盒及計(jì)算卡

【HarmonyOS HiSpark AI Camera】邊緣計(jì)算安全監(jiān)控系統(tǒng)

網(wǎng)絡(luò)邊緣實(shí)施AI的原因

嵌入式邊緣AI應(yīng)用開(kāi)發(fā)指南

壓縮模型會(huì)加速推理嗎？

ST MCU邊緣AI開(kāi)發(fā)者云 - STM32Cube.AI

訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么解決？

邊緣AI的模型壓縮技術(shù)

邊緣計(jì)算ai技術(shù)是什么？