0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯品# 物聯(lián)網(wǎng)市場性能最高的 NPU

eeDesigner ? 來源:Parag Beeraka ? 作者:Parag Beeraka ? 2024-06-26 17:28 ? 次閱讀

隨著人工智能AI) 在我們的日常生活中繼續(xù)發(fā)揮更大的影響力和影響,該領(lǐng)域正在從基于云的推理遷移到邊緣和端點推理。基于邊緣的推理為各種物聯(lián)網(wǎng)設(shè)備帶來智能,使數(shù)據(jù)能夠在本地處理并實時做出決策,同時提高數(shù)據(jù)隱私和安全性。

Arm 的 Ethos NPU 如何增強邊緣和端點的 AI 性能?

多年來,Arm 一直在開發(fā)邊緣 AI 加速器,以支持對邊緣和端點推理工作負載日益增長的需求。通過 Arm 的 Ethos-U55 和 Ethos-U65 NPU,我們推出了兩款非常成功的產(chǎn)品,為邊緣和端點的 AI 應(yīng)用帶來了高性能、高能效的解決方案。

Ethos-U55 部署在許多基于 Cortex-M 的異構(gòu)系統(tǒng)中。Ethos-U65 將 Ethos-U 系列的適用性擴展到基于 Cortex-A 的系統(tǒng),同時提供兩倍的設(shè)備端機器學習 (ML) 性能。這兩款產(chǎn)品都提供了統(tǒng)一的工具鏈,便于開發(fā)和支持常見的 ML 網(wǎng)絡(luò)操作,包括卷積神經(jīng)網(wǎng)絡(luò) (CNN) 和遞歸神經(jīng)網(wǎng)絡(luò) (RNN)。

Transformer 架構(gòu)對 AI 開發(fā)有何影響?

Transformer 架構(gòu)于 2017 年推出,徹底改變了生成式 AI,并成為許多新神經(jīng)網(wǎng)絡(luò)的首選架構(gòu)。基于 Transformer 的模型可以使用注意力機制處理順序數(shù)據(jù),并在許多 AI 任務(wù)中取得了最先進的結(jié)果,例如機器翻譯、自然語言理解、語音識別、分割和圖像字幕。

這些模型可以進行調(diào)整和壓縮,以便在邊緣設(shè)備上高效運行,而不會對準確性造成太大影響,并在許多邊緣和端點用例中展示最先進的進步。

Ethos-U85 NPU 在邊緣和端點工作負載方面的主要優(yōu)勢是什么?

在我們之前的 Ethos-U 系列 NPU 成功的基礎(chǔ)上,我們推出了一款新產(chǎn)品 Ethos-U85。這帶來了一個加速器,其特點是具有與以前的 Ethos-U NPU 相同的高性能、節(jié)能理念,同時使用基于 Transformer 的網(wǎng)絡(luò)在邊緣和端點上實現(xiàn)當前和即將到來的工作負載。

Ethos-U85 是 Arm Ethos-U 產(chǎn)品線的第三代 NPU,也是迄今為止性能最高、能效最高的 Ethos NPU。與前代產(chǎn)品相比,它的性能提升了 4 倍,能效提高了 20%,在流行網(wǎng)絡(luò)上的利用率高達 85%。這解決了物聯(lián)網(wǎng)應(yīng)用的需求,在這些應(yīng)用中,我們看到更高的性能需求,例如工廠自動化和商用或智能家居攝像頭。它還設(shè)計用于與 Cortex-M 以及基于 Cortex-A 的系統(tǒng)一起運行,并可承受高 DRAM 延遲。

Ethos-U85 的一些主要功能包括:

支持從 128 到 2048 MAC/周期的配置 – 256 GOPS/s 到 4 TOP/s(1GHz)。

支持 int8 權(quán)重和 int8 或 int16 激活。

支持 transformer 架構(gòu)網(wǎng)絡(luò),以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,吞吐量翻倍。

29 至 267 KB 的內(nèi)部 SRAM 和多達 6 個 128 位 AXI5 接口。

支持重量壓縮,具有標準和快速重量解碼器。

支持擴展壓縮。

除了目前 Ethos-U55 和 U65 支持的算子外,Ethos-U85 還將通過支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等操作,為轉(zhuǎn)換器網(wǎng)絡(luò)和 DeeplabV3 語義分割網(wǎng)絡(luò)提供原生硬件支持。

Ethos-U85 還支持元素運算符鏈接。鏈接將元素運算與先前運算相結(jié)合,使SRAM不必寫入然后讀取中間張量。這可以通過減少需要在 NPU 和內(nèi)存之間傳輸?shù)臄?shù)據(jù)量來提高 NPU 的效率。與 Ethos-U65 相比,鏈是 Ethos-U85 中幾個改進的效率功能之一,此外還有快速權(quán)重解碼器、改進的 MAC 陣列的電源效率和改進的元素效率。


Ethos-U85 系統(tǒng)配置

Ethos-U85 可用于與 Ethos-U55 和 Ethos-U65 相同的系統(tǒng)配置流程,我們正在引入從基于 Cortex-A 的系統(tǒng)直接驅(qū)動 Ethos-U85 的功能。

Ethos-U85 還將支持與之前的 Ethos-U 系列產(chǎn)品建立的相同軟件工具鏈,該系列使用 TFLmicro 運行時。這將擴展已經(jīng)使用Cortex-A/Cortex-M和Ethos-U55/Ethos-U65的系統(tǒng)進行投資的價值,因為Ethos-U85在此基礎(chǔ)上構(gòu)建并利用該價值來實現(xiàn)基于變壓器網(wǎng)絡(luò)的更廣泛的用例。將來,我們希望啟用對 ExecuTorch 的支持,這是邊緣設(shè)備的 PyTorch 運行時。

Ethos-U85 支持的算子將在 NPU 本身上加速,而如果有任何不支持的特殊算子,那么其中一些可以在使用 CMSIS-NN 的基于 Cortex-M 的系統(tǒng)上加速。例如,在 tinyLlama 的情況下,該模型完全映射到 Ethos-U85,沒有將操作員回退到 CPU。

最后,作為 Corstone-320 的一部分,Ethos-U85 構(gòu)建在我們最新的物聯(lián)網(wǎng)參考設(shè)計平臺的核心。這有助于在各種基于 AI 的物聯(lián)網(wǎng)解決方案中加速高性能片上系統(tǒng) (SoC) 的開發(fā)和部署。

在邊緣釋放所有 AI 功能

Ethos-U85 將帶來在邊緣和端點設(shè)備上執(zhí)行許多最先進的 AI 功能所需的計算能力。隨著人工智能世界的發(fā)展,我們的合作伙伴將擁有可靠、高效和高性能的基于 Ethos-U 的解決方案。我們希望看到 Ethos-U85 部署在新興的邊緣 AI 用例中,例如智能家居、零售或工業(yè)環(huán)境中,這些領(lǐng)域需要支持最新 AI 框架的更高性能計算。

在 Arm,我們?yōu)槟軌驗槲覀兊暮献骰锇楹蜕鷳B(tài)系統(tǒng)提供尖端的硬件和軟件解決方案而感到自豪。借助 Ethos-U85,我們正在打開一個充滿邊緣和基于端點的 AI 推理用例的可能性世界,這些用例將改變世界。隨著我們繼續(xù)在 Arm 上構(gòu)建邊緣 AI 的未來,Arm 正在將邊緣 AI 創(chuàng)新提升到一個新的水平。

在此處了解有關(guān) Arm Ethos-U85 的更多信息。

作者: Parag Beeraka,物聯(lián)網(wǎng)細分市場高級總監(jiān)手臂

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2894

    文章

    43264

    瀏覽量

    366326
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28860

    瀏覽量

    266176
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46047

    瀏覽量

    234940
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    247

    瀏覽量

    18380
收藏 人收藏

    評論

    相關(guān)推薦

    【MiCOKit申請】聯(lián)網(wǎng)在電力市場的應(yīng)用

    ,基于云計算的聯(lián)網(wǎng)監(jiān)控平臺,基于MSP430的智能溫室控制系統(tǒng),基于ARM的金屬探傷儀。對電子及軟件知識有較為系統(tǒng)的了解。項目描述:該項目為東南大學電氣工程學院在研項目,目前已經(jīng)完成市場調(diào)研,系統(tǒng)
    發(fā)表于 08-19 15:13

    聯(lián)網(wǎng)將為PLC市場帶來新機遇

    隨著中國聯(lián)網(wǎng)示范應(yīng)用的推進、聯(lián)網(wǎng)面向各個行業(yè)應(yīng)用的不斷深入和完善,中國聯(lián)網(wǎng)
    發(fā)表于 01-14 18:34

    聯(lián)網(wǎng)應(yīng)用驅(qū)動MCU市場增長

    聯(lián)網(wǎng)(IOT)應(yīng)用中使用的微控制器單元(MCU)正在興起,對整個MCU市場的增長產(chǎn)生了積極的影響。全球領(lǐng)先的關(guān)鍵信息和分析供應(yīng)商IHS稱,聯(lián)網(wǎng)汽車、可穿戴電子產(chǎn)品、樓宇自動化等
    發(fā)表于 06-29 11:45

    搶占聯(lián)網(wǎng)市場,優(yōu)質(zhì)聯(lián)網(wǎng)卡必不可少

    聯(lián)網(wǎng)持續(xù)火熱,巨頭爭相布局,市場競爭愈演愈烈,企業(yè)該如何搶占聯(lián)網(wǎng)市場?  
    發(fā)表于 02-26 15:20

    工業(yè)市場應(yīng)用在聯(lián)網(wǎng)發(fā)揮作用

    設(shè)備的正常運作。其他市場聯(lián)網(wǎng)在其他市場也有很多的發(fā)展機遇。例如借助聯(lián)網(wǎng)可以提高員工在非工作
    發(fā)表于 09-07 14:41

    聯(lián)網(wǎng)(IoT)市場如何形成?

    聯(lián)網(wǎng)迅速推進。然而,對于這樣一個龐大的新興市場和技術(shù)領(lǐng)域,仍有不少“塵埃待定”,特別考慮到我們常常反復(fù)預(yù)測的,到2020年將有200億至500億連接的電子設(shè)備-這斷言沒有被行業(yè)觀察家和分析師嘲笑或
    發(fā)表于 10-31 09:10

    遠程醫(yī)療:聯(lián)網(wǎng)設(shè)備市場的前沿

    效,而且更易于所有人使用。 新的連網(wǎng)設(shè)備 越來越多FDA批準的設(shè)備被引入普通消費者市場,這證明新的連網(wǎng)設(shè)備市場真正賦予了聯(lián)網(wǎng)遠程醫(yī)療的概念。 Withings就是一家主流消費
    發(fā)表于 11-20 06:48

    遠程醫(yī)療:聯(lián)網(wǎng)設(shè)備市場的前沿

    使用。 新的連網(wǎng)設(shè)備 據(jù)羿戓信息所了解,越來越多FDA批準的設(shè)備被引入普通消費者市場,這證明新的連網(wǎng)設(shè)備市場真正賦予了聯(lián)網(wǎng)遠程醫(yī)療的概念。 Withings就是一家主流消費
    發(fā)表于 12-08 21:37

    遠程醫(yī)療:聯(lián)網(wǎng)設(shè)備市場的前沿

    效,而且更易于所有人使用。 新的連網(wǎng)設(shè)備 越來越多FDA批準的設(shè)備被引入普通消費者市場,這證明新的連網(wǎng)設(shè)備市場真正賦予了聯(lián)網(wǎng)遠程醫(yī)療的概念。 Withings就是一家主流消費
    發(fā)表于 12-20 06:14

    聯(lián)網(wǎng)芯片

    聯(lián)網(wǎng)被業(yè)內(nèi)認為是繼計算機、互聯(lián)網(wǎng)之后世界產(chǎn)業(yè)技術(shù)第三次革命,其市場規(guī)模達到萬億級,前景可謂無限光明。根據(jù) IDC 測算,到2021年將會有250 億臺設(shè)備
    發(fā)表于 11-21 16:48

    聯(lián)網(wǎng)市場規(guī)模擴大對無線模組有哪些影響

      隨著萬互聯(lián)的聯(lián)網(wǎng)時代到來,數(shù)以千億的聯(lián)網(wǎng)設(shè)備接入網(wǎng)絡(luò),
    發(fā)表于 02-02 17:08

    中國的聯(lián)網(wǎng)市場適用的頻段有哪些呢?

    聯(lián)網(wǎng)無線技術(shù)標準都使用什么頻段?中國的聯(lián)網(wǎng)市場適用的頻段會有哪些呢?
    發(fā)表于 05-18 07:06

    迅為RK3568開發(fā)板瑞微安卓11核心板NPU邊緣計算人工智能聯(lián)網(wǎng)

    檢測、高低溫壞境檢測,7*24小時長期穩(wěn)定運行。主要面向聯(lián)網(wǎng)網(wǎng)關(guān)、NVR存儲、工控平板、工業(yè)檢測、工控盒、卡拉OK、云終端、車載中控等行業(yè)定制市場。 44.jpg
    發(fā)表于 03-23 15:28

    邊緣智能市場要素:海量需求,聯(lián)網(wǎng)切分

    本帖最后由 我愛方案網(wǎng) 于 2022-8-23 15:43 編輯 聯(lián)網(wǎng)把沉睡數(shù)十年的邊緣計算學說推到市場浪尖,是神經(jīng)元理論把CPU帶到NPU時代,它賦能本地學習能力,算力和決策
    發(fā)表于 08-23 15:42

    采用NPU IP的AI類芯片已在全球出貨超過1億顆

    原股份(原,股票代碼:688521.SH)今日宣布集成了原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片已在全球范圍內(nèi)出貨超過1億顆,主要應(yīng)用于
    的頭像 發(fā)表于 02-29 10:26 ?331次閱讀