0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用神經(jīng)處理單元集群轉換邊緣AI

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Saumitra Jagdale ? 2022-10-19 10:57 ? 次閱讀

隨著人工智能領域獲得牽引力,這些設備變得越來越計算和耗電。隨后,邊緣設備上的處理負載隨著系統(tǒng)架構的性能和復雜性而顯著增加。因此,在系統(tǒng)中灌輸了更高分辨率的圖像和更復雜的算法,隨著對AI處理的需求不斷增長,以實現(xiàn)高TOPS性能,這需要進一步優(yōu)化。

Synopsys 發(fā)布了神經(jīng)處理單元 (NPU)、知識產權 (IP) 內核和工具鏈,以滿足 AI 片上系統(tǒng) (SoC) 中日益復雜的神經(jīng)網(wǎng)絡模型的性能需求。其新的設計軟件 ARC NPX6 和 NPX6FS NPU IP 可處理實時計算的需求,同時為 AI 應用消耗超低功耗。此外,該公司的新 MetaWare MX 開發(fā)工具提供了一個完整的編譯環(huán)境,具有自動化神經(jīng)網(wǎng)絡算法分區(qū),可最大限度地提高最新 NPU 上應用軟件開發(fā)的資源效率。

使用新的設計軟件 ARC NPX6 和 NPX6FS NPU IP 以及元軟件 MX 開發(fā)工具包,設計人員可以利用最新的神經(jīng)網(wǎng)絡模型,滿足不斷升級的性能期望,并加快其下一代智能 SoC 的上市時間。ARC NPX6 NPU IP 系列包括許多處理深度學習算法覆蓋的產品,包括對象識別、圖像質量增強和場景分割等計算機視覺任務,以及音頻和自然語言處理等大型 AI 應用。設計中的單個內核可以從 4K MAC 擴展到 96K MAC,以實現(xiàn)超過 250 TOPS 和超過 440 TOPS 的單個 AI 引擎性能,并且很少。

NPX6 NPU IP 包含對多達 8 個 NPU 的多 NPU 群集的硬件和軟件支持,稀疏性為 3500 TOPS。由于硬件和軟件中的高級帶寬功能以及內存層次結構(每個內核中包含L1內存以及用于訪問常見L2內存的高性能,低延遲連接),可以擴展到大量MAC數(shù)量。對于受益于神經(jīng)網(wǎng)絡內部 BF16 或 FP16 的應用,提供了可選的張量浮點單元。

poYBAGNPZ7iAFPArAAGDfudyRsU033.png

MetaWare MX 開發(fā)工具包為應用軟件開發(fā)提供了軟件編程環(huán)境,包括神經(jīng)網(wǎng)絡軟件開發(fā)工具包 (NN SDK) 和虛擬模型支持。NN SDK 會自動將使用流行框架(如巨炬、張量流或 ONNX)訓練的神經(jīng)網(wǎng)絡轉換為 NPX 優(yōu)化的可執(zhí)行代碼。

這個概念是,NPX6 NPU處理器IP隨后可用于制造各種產品,從幾個TOPS到數(shù)千個TOPS,所有這些都可以使用單個工具鏈編寫。

NPX6 網(wǎng)絡輸出電源的主要特性:

可擴展的實時 AI/神經(jīng)處理器 IP,具有多達 3,500 個 TOPS 的性能,支持 CNN、RNN/LSTM、變壓器、推薦器網(wǎng)絡和其他神經(jīng)網(wǎng)絡。

功率效率(高達 30 TOPS/W)在業(yè)界無與倫比。

卷積加速器的 1-24 個內核,增加了 4K MAC/內核

張量加速器,支持張量運算符集體系結構并允許變量激活 (TOSA)

軟件開發(fā)套件

用于自動混合模式量化的工具

降低帶寬的架構和軟件工具特性

通過并行處理各個層來減少延遲。

設計軟件 ARC VPX 矢量 DSP 無縫集成。

生產力很高。張量流和巨炬框架,以及ONNX交換標準,由元軟件MX開發(fā)工具包支持。

此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 標準,用于隨機硬件故障檢測和系統(tǒng)功能安全開發(fā)流程。這些處理器具有符合 ISO 26262 的特定安全機制,可處理下一代區(qū)域性設計的混合關鍵性和虛擬化需求,以及全面的安全文檔。

ARC 元軟件 MX 開發(fā)工具包包括神經(jīng)網(wǎng)絡軟件開發(fā)工具包 (SDK)、編譯器和調試器、虛擬平臺 SDK、運行時和庫以及高級仿真模型。它提供了一個統(tǒng)一的工具鏈環(huán)境來加速應用程序開發(fā),并在MAC資源之間智能地劃分算法以實現(xiàn)最佳處理。MetaWare MX 安全開發(fā)工具包包含安全手冊和安全指南,可幫助開發(fā)人員滿足 ISO 26262 標準,并為安全關鍵型汽車應用的 ISO 26262 合規(guī)性測試做準備。

利用 NPU 集群加速邊緣 AI 應用

為了滿足人工智能應用不斷增長的性能和復雜需求,恩智浦NPU IP核提供高性能、可擴展的實時人工智能和神經(jīng)處理IP,具有多達3500個TOPS,支持各種神經(jīng)網(wǎng)絡,如CNN、RNN/LSTM、變壓器和推薦器網(wǎng)絡。

此外,它通過并行處理各個層來減少延遲。此外,高生產力的元軟件 MX 開發(fā)工具包支持張量流和巨魔框架以及 ONNX 交換格式。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19118

    瀏覽量

    228867
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4749

    瀏覽量

    100434
  • 人工智能
    +關注

    關注

    1791

    文章

    46698

    瀏覽量

    237194
收藏 人收藏

    評論

    相關推薦

    使用 ADI 的 MAX78002 MCU 開發(fā)邊緣 AI 應用

    的物聯(lián)網(wǎng)設備上運行。 Analog Devices, Inc. 的微控制器單元 (MCU) 可以通過集成的低功耗卷積神經(jīng)網(wǎng)絡 (CNN) 加速器來解決邊緣處理限制,以
    的頭像 發(fā)表于 10-17 11:39 ?1270次閱讀
    使用 ADI 的 MAX78002 MCU 開發(fā)<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 應用

    NVIDIA IGX平臺加速實時邊緣AI應用

    實時邊緣 AI 對于醫(yī)療、工業(yè)和科學計算至關重要,因為這些任務關鍵型應用需要即時數(shù)據(jù)處理、低延遲和高可靠性,以確保作出及時準確的決策。這些挑戰(zhàn)不僅涉及硬件平臺上的高帶寬傳感器處理
    的頭像 發(fā)表于 09-09 10:14 ?463次閱讀
    NVIDIA IGX平臺加速實時<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>應用

    使用邏輯和轉換優(yōu)化數(shù)字駕駛艙處理單元

    電子發(fā)燒友網(wǎng)站提供《使用邏輯和轉換優(yōu)化數(shù)字駕駛艙處理單元.pdf》資料免費下載
    發(fā)表于 09-05 11:08 ?0次下載
    使用邏輯和<b class='flag-5'>轉換</b>優(yōu)化數(shù)字駕駛艙<b class='flag-5'>處理</b><b class='flag-5'>單元</b>

    基于FPGA的類腦計算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計算系統(tǒng)

    模擬器,可為 SNN 算法開發(fā)者和神經(jīng)學家提供理想滿意的類腦仿真實驗平臺。 (2)本設計提供的基于 NEST 仿真器的 FPGA 集群的硬件加速服務可以為實驗環(huán)境不理 想,應用計算復雜周期長的用戶帶來
    發(fā)表于 06-25 18:35

    邊緣AI網(wǎng)關,將具備更強大的計算和學習能力

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)網(wǎng)關又稱網(wǎng)間連接器、協(xié)議轉換器。網(wǎng)關在網(wǎng)絡層以上實現(xiàn)網(wǎng)絡互連,是復雜的網(wǎng)絡互連設備,僅用于兩個高層協(xié)議不同的網(wǎng)絡互連。 ? 邊緣AI網(wǎng)關是指在邊緣計算環(huán)境
    的頭像 發(fā)表于 06-06 00:26 ?3438次閱讀

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    近年來,隨著人工智能和邊緣計算的發(fā)展,一種名為AI邊緣盒子的新型設備正逐漸引起廣泛關注。作為一種集成了邊緣計算和AI算法
    的頭像 發(fā)表于 05-29 14:24 ?839次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計算盒子詳解

    邊緣計算單元多接入能力怎么算

    邊緣計算作為一種分布式計算模式,其多接入能力是評估其性能和擴展性的重要指標之一。在實際應用中,我們需要考慮多個因素來計算邊緣計算單元的多接入能力。這包括帶寬和網(wǎng)絡延遲、處理能力、并發(fā)連
    的頭像 發(fā)表于 05-16 17:51 ?277次閱讀

    AI邊緣計算盒子優(yōu)勢有哪些?如何實現(xiàn)低延遲處理?

    AI邊緣計算盒子作為一種集成人工智能技術的邊緣計算設備,其優(yōu)勢主要體現(xiàn)在以下幾個方面,萬物縱橫為您詳細介紹: 邊緣計算盒子 1. 低延遲處理
    的頭像 發(fā)表于 05-09 16:07 ?563次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>計算盒子優(yōu)勢有哪些?如何實現(xiàn)低延遲<b class='flag-5'>處理</b>?

    面向邊緣AI應用的全新RZ/V2H

    一款新的64位 MPU RZ/V2H ,為瑞薩電子的RZ/V系列帶來了針對邊緣AI的重大升級。邊緣AI是指在連接網(wǎng)絡的邊緣進行的
    的頭像 發(fā)表于 05-07 14:56 ?7364次閱讀
    面向<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>應用的全新RZ/V2H

    risc-v多核芯片在AI方面的應用

    得RISC-V多核芯片能夠更好地適應AI算法的不同需求,包括深度學習、神經(jīng)網(wǎng)絡等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具競爭力。 再者,RISC-V的多核設計可以進
    發(fā)表于 04-28 09:20

    全新AMD銳龍8000F系列處理器整機正式發(fā)售 配備神經(jīng)處理單元(NPU)

    器,將由AMD渠道品牌整機合作伙伴提供整機進行銷售。全新AMD銳龍8000F系列處理器為提高效率進行了低功耗優(yōu)化,其中的AMD銳龍7 8700F配備了尖端的神經(jīng)處理單元(NPU),它提
    的頭像 發(fā)表于 04-18 11:05 ?805次閱讀
    全新AMD銳龍8000F系列<b class='flag-5'>處理</b>器整機正式發(fā)售 配備<b class='flag-5'>神經(jīng)</b><b class='flag-5'>處理</b><b class='flag-5'>單元</b>(NPU)

    恩智浦推出首次搭載專屬神經(jīng)處理單元(NPU)的MCX N系列!

    恩智浦半導體強勢推出新品MCX N系列產品,首次集成恩智浦專用神經(jīng)處理單元(NPU), 可助力實現(xiàn)高性能、低功耗的邊緣安全智能。
    的頭像 發(fā)表于 03-14 09:46 ?1079次閱讀

    NanoEdge AI的技術原理、應用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯(lián)網(wǎng)(IoT)設備和傳感器。這種技術的核心思想是將數(shù)據(jù)處理和分析從云端轉移到設備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    什么是AI邊緣計算,AI邊緣計算的特點和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人工智能技術引入邊緣計算的新興領域,旨在將計算
    的頭像 發(fā)表于 02-01 11:42 ?796次閱讀

    算力強勁的AI邊緣計算盒子# 邊緣計算

    AI邊緣計算
    成都華江信息
    發(fā)布于 :2023年11月24日 16:31:06