0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm NN成功適配openEuler Embedded,提供高性能神經(jīng)網(wǎng)絡(luò)推理能力

openEuler ? 來源:openEuler ? 2023-06-01 15:15 ? 次閱讀

近期,RISC-V SIG 完成了 Arm NN 在 openEuler Embedded 系統(tǒng)的適配,于 2023 年 1 月合入系統(tǒng)構(gòu)建工程代碼庫,經(jīng)測(cè)試驗(yàn)證可用,實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)加速庫在 openEuler Embedded 嵌入式系統(tǒng)上的加速和優(yōu)化。

系統(tǒng)構(gòu)建工程下載地址:https://gitee.com/openeuler/yocto-meta-openeuler

支持 Arm NN 的 openEuler Embedded 系統(tǒng)已向社區(qū)開放

openEuler Embedded 是基于 openEuler 社區(qū)面向嵌入式場(chǎng)景的 Linux 版本,由于嵌入式系統(tǒng)應(yīng)用受到多個(gè)因素的約束,如資源、功耗、多樣性等, 所以通過嵌入式處理器內(nèi)核進(jìn)行機(jī)器學(xué)習(xí)成為了技術(shù)發(fā)展需要,ARM 推出 Arm NN 加速庫就是解決方法之一,將機(jī)器學(xué)習(xí)運(yùn)用到嵌入式系統(tǒng)中。提供高性能神經(jīng)網(wǎng)絡(luò)推理能力,支持邊、端協(xié)同工作,提升資源利用率。

61c36dea-fffc-11ed-90ce-dac502259ad0.jpg

目標(biāo)檢測(cè)是在嵌入式平臺(tái)上運(yùn)行機(jī)器學(xué)習(xí)的工作負(fù)載之一

以目標(biāo)檢測(cè)為示例,驗(yàn)證 ArmNN 的推理加速效果:

模型:yolov3 tiny(FLOAT32 量化)

訓(xùn)練數(shù)據(jù):COCO

測(cè)試數(shù)據(jù):640*480 H264 視頻

通過實(shí)驗(yàn)證明,在精度損失可接受范圍內(nèi),Arm NN 加速可達(dá)到百倍的性能提升。如下圖所示,其中橫軸表示檢測(cè)圖片序號(hào),縱軸表示推理耗時(shí)(單位:us):

61e00e3c-fffc-11ed-90ce-dac502259ad0.jpg

注:musl-ref 是指基于 MuslC 的 Openeuler Embedded 且不做任何加速,musl-acc 是指基于的 Openeuler Embedded 且使能 ArmNN 的指令加速和優(yōu)化。

為了適配 openEuler Embedded 系統(tǒng), Arm NN 軟件需兼容 yocto-meta-openeuler,并在上做了很多準(zhǔn)備工作,如 tensorflow 的適配,Compute Library 的適配,flatbuffers 的使用等。openEuler Embedded Arm NN 的構(gòu)建代碼位于 meta-openeuler/recipes-arm 層上,社區(qū)開發(fā)者可根據(jù)需要自行構(gòu)建 ArmNN 軟件。

Arm NN:融合主流神經(jīng)網(wǎng)絡(luò)框架,為用戶提供高效的 AI 應(yīng)用平臺(tái)

Arm NN SDK 是一套開源 Linux 軟件和工具,支持在高能效的設(shè)備上運(yùn)行機(jī)器學(xué)習(xí)工作負(fù)載。它橋接了現(xiàn)有神經(jīng)網(wǎng)絡(luò)框架與高能效的 Arm Cortex CPUs、Arm Mali GPU 或 Arm 機(jī)器學(xué)習(xí)處理器。

61f802a8-fffc-11ed-90ce-dac502259ad0.jpg

Arm NN 填補(bǔ)了現(xiàn)有 NN 框架和底層 IP 之間的空白。它可以幫助 TensorFlow 和 Caffe 等現(xiàn)有神經(jīng)網(wǎng)絡(luò)框架實(shí)現(xiàn)高效轉(zhuǎn)換,并在 Arm Cortex CPU 和 Arm Mali GPU 上高效運(yùn)行,無需修改。

主要優(yōu)勢(shì)

更輕松地在嵌入式系統(tǒng)上運(yùn)行 TensorFlow 和 Caffe;

Compute Library 內(nèi)部的一流優(yōu)化函數(shù),讓用戶充分發(fā)揮底層平臺(tái)的強(qiáng)大性能;

無論面向何種內(nèi)核類型,編程模式都是相同的;

現(xiàn)有軟件能夠自動(dòng)利用新硬件特性;

作為開源軟件,能夠相對(duì)簡單地進(jìn)行擴(kuò)展,從而適應(yīng) Arm 合作伙伴的其他內(nèi)核類型。

Arm NN 為 openEuler Embedded 系統(tǒng)帶來人工智能的新活力

Arm NN 為 openEuler Embedded 提供全系統(tǒng)的神經(jīng)網(wǎng)絡(luò)優(yōu)化方案,支持在高能效的設(shè)備上運(yùn)行機(jī)器 學(xué)習(xí)工作負(fù)載。為了充分利用不同平臺(tái)的軟硬件特性,在 Linux 系統(tǒng)上提供 ARM CPU 上的神經(jīng)網(wǎng)絡(luò)加速能力,使用硬件指令加速庫接口,使其面向目標(biāo)硬件。目前,Arm NN 軟件庫在 openEuler Embedded 系統(tǒng)上的適配工作基本完成, RISC-V SIG 也將持續(xù)研發(fā)更多新功能,并移植最新的 openEuler Embedded 系統(tǒng)鏡像。為了加快 openEuler Embedded 系統(tǒng)人工智能應(yīng)用場(chǎng)景落地,我們誠邀感興趣的朋友和測(cè)試志愿者加入并下載開發(fā)版鏡像,共同探索并解決可能存在的問題,推動(dòng) openEuler 人工智能開發(fā)生態(tài)的繁榮發(fā)展!

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:Arm NN 成功適配 openEuler Embedded,提供高性能神經(jīng)網(wǎng)絡(luò)推理能力

文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核助力微控制器效率提升

    自然會(huì)想到Arm Cortex-M系列處理器內(nèi)核,那么如果您想要強(qiáng)化它的性能并且減少內(nèi)存消耗,CMSIS-NN就是您最好的選擇。基于CMSIS-NN內(nèi)核的
    發(fā)表于 07-23 08:08

    針對(duì)Arm嵌入式設(shè)備優(yōu)化的神經(jīng)網(wǎng)絡(luò)推理引擎

    專門針對(duì)Arm嵌入式設(shè)備優(yōu)化的神經(jīng)網(wǎng)絡(luò)推理引擎Tengine + HCL,不同人群的量身定制
    發(fā)表于 01-15 08:00

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反向傳播優(yōu)化輸入變量權(quán)重的層,以提高模型的預(yù)測(cè)
    發(fā)表于 07-12 08:02

    可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實(shí)現(xiàn)關(guān)鍵詞識(shí)別

    更勝一籌。關(guān)鍵詞識(shí)別神經(jīng)網(wǎng)絡(luò)管道由于要保持“永遠(yuǎn)在線”,KWS 應(yīng)用的功耗預(yù)算受到很大限制。雖然 KWS 應(yīng)用也可在專用 DSP 或高性能 CPU 上運(yùn)行,但更適合在 Arm Cortex-M 微控制器
    發(fā)表于 07-26 09:46

    圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡要介紹

    為提升識(shí)別準(zhǔn)確率,采用改進(jìn)神經(jīng)網(wǎng)絡(luò),通過Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過程分為兩步:圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征,將數(shù)據(jù)處理成規(guī)范的格式,而改進(jìn)神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-23 08:07

    充分利用Arm NN進(jìn)行GPU推理

    的是要知道它提供的選項(xiàng)來提高推理性能。作為開發(fā)人員,您會(huì)尋找可以壓縮的每一毫秒,尤其是在需要實(shí)現(xiàn)實(shí)時(shí)推理時(shí)。讓我們看一下Arm NN中可用的
    發(fā)表于 04-11 17:33

    使用Streamline分析在Linux上運(yùn)行的Arm NN機(jī)器學(xué)習(xí)應(yīng)用程序

    討論的示例是在 Arm 上運(yùn)行 ML 推理的 Linux 應(yīng)用程序。我們之前已經(jīng)在 MNIST 數(shù)據(jù)集上訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò) 來識(shí)別手寫數(shù)字。使用 Arm
    發(fā)表于 08-11 15:46

    ARM Cortex-M系列芯片神經(jīng)網(wǎng)絡(luò)推理庫CMSIS-NN詳解

    1、ARM Cortex-M系列芯片神經(jīng)網(wǎng)絡(luò)推理庫CMSIS-NN詳解CMSIS-NN是用于ARM
    發(fā)表于 08-19 16:06

    在Linux上使用Arm NN分析和優(yōu)化運(yùn)行推理的機(jī)器學(xué)習(xí)應(yīng)用程序的步驟

    的示例是在 Arm 上運(yùn)行 ML 推理的 Linux 應(yīng)用程序。我們之前已經(jīng)在MNIST 數(shù)據(jù)集上訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò) 來識(shí)別手寫數(shù)字。使用Arm N
    發(fā)表于 09-27 14:24

    如何用PyArmNN加速樹莓派上的ML推理

    本指南向您展示如何訓(xùn)練可以識(shí)別圖像中的火焰的神經(jīng)網(wǎng)絡(luò)。的能力識(shí)別火災(zāi)意味著神經(jīng)網(wǎng)絡(luò)可以使火災(zāi)探測(cè)系統(tǒng)更加可靠和有效。本指南將向您展示如何使用Python應(yīng)用程序編程接口(api)進(jìn)行以下操作
    發(fā)表于 08-02 15:40

    用CMSIS-NN版本轉(zhuǎn)換Arm Cortex-M的神經(jīng)網(wǎng)絡(luò):r0p0指南

    2. 概覽 本指南向您展示了如何將神經(jīng)網(wǎng)絡(luò)從任何框架轉(zhuǎn)換成一個(gè)基于 Arm Cortex-M-M 裝置的實(shí)施工具, 使用 Arm CMSIS- NN 庫。 此教程用于不再支持的 CMS
    發(fā)表于 08-11 07:06

    構(gòu)建ARM NN自定義后端插件21.08版教程

    Arm NNN是CPU、GPUs和NPUs的推論中繼器。 Arm NNN能夠彌合現(xiàn)有NN框架與基本IP之間的缺口。 Arm NN能夠高效翻譯
    發(fā)表于 08-22 07:27

    測(cè)量神經(jīng)網(wǎng)絡(luò)的抽象推理能力

    神經(jīng)網(wǎng)絡(luò)是否可以學(xué)習(xí)抽象推理,還是僅僅淺顯地學(xué)習(xí)統(tǒng)計(jì)數(shù)據(jù)學(xué)習(xí),是最近學(xué)術(shù)界辯論的主題。
    的頭像 發(fā)表于 07-13 09:37 ?5078次閱讀
    測(cè)量<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的抽象<b class='flag-5'>推理</b><b class='flag-5'>能力</b>

    人工神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    人工神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別? 人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)是一種模仿人腦神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu)和功能的計(jì)算模型,也被稱為
    的頭像 發(fā)表于 08-22 16:45 ?3940次閱讀

    具有小浮點(diǎn)的高性能神經(jīng)網(wǎng)絡(luò)

    電子發(fā)燒友網(wǎng)站提供《具有小浮點(diǎn)的高性能神經(jīng)網(wǎng)絡(luò).pdf》資料免費(fèi)下載
    發(fā)表于 09-13 17:07 ?0次下載
    具有小浮點(diǎn)的<b class='flag-5'>高性能</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>