0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

靈活應(yīng)變的計算平臺才能滿足運行卷積神經(jīng)網(wǎng)絡(luò)的嵌入式 AI 的要求

Xilinx賽靈思官微 ? 來源:djl ? 作者:賽靈思Dale Hitt ? 2019-07-26 16:42 ? 次閱讀

人工智能新興應(yīng)用通過帶可配置加速的片上系統(tǒng)器件來滿足日益嚴格的性能和效率需求

隨著智能安全、機器人無人駕駛汽車等應(yīng)用越來越依靠嵌入式人工智能技術(shù)來提高性能,交付全新的用戶體驗,傳統(tǒng)計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調(diào)整優(yōu)化。我們需要靈活應(yīng)變的計算平臺來滿足運行一流卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的嵌入式 AI 的要求。

放眼未來,適應(yīng)于更多前沿神經(jīng)網(wǎng)絡(luò)的靈活性是我們的主要關(guān)注點。今天廣受歡迎的 CNN 正加速被新型的先進架構(gòu)所取代。然而,傳統(tǒng)的 SoC 設(shè)計要使用當(dāng)前的神經(jīng)網(wǎng)絡(luò)架構(gòu)知識,從開發(fā)開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經(jīng)網(wǎng)絡(luò)可能會讓傳統(tǒng) SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預(yù)見的未來不斷提升的需求,就必須采用更加靈活的自適應(yīng)計算平臺。我們可利用用戶可配置的多核片上系統(tǒng) (MPSoC) 器件,整合主應(yīng)用處理器和可擴展的可編程邏輯結(jié)構(gòu),包含可配置的存儲器架構(gòu)和滿足可變精度推斷所需的信號處理技術(shù),從而滿足上述要求。

推 斷 精 度

在傳統(tǒng)的 SoC 中,決定性能的特性如存儲器架構(gòu)和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優(yōu)化至晶體管層面,這就能根據(jù)需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優(yōu)化推斷精度,根據(jù)平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執(zhí)行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經(jīng)網(wǎng)絡(luò)的每層做出不同優(yōu)化,從而以最大的效率提供所需的性能。

存 儲 器 架 構(gòu)

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結(jié)構(gòu)能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統(tǒng)計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優(yōu)化芯片資源的利用率。此外,典型的子系統(tǒng)只有有限的片上集成高速緩存,必須與片外存儲設(shè)備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數(shù)存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯 片 面 積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結(jié)構(gòu)上實現(xiàn)的推斷引擎可能僅占用傳統(tǒng) SoC 八分之一的芯片面積,這就能讓開發(fā)人員在更小的器件中構(gòu)建功能更強大的引擎。

此外,MPSoC 器件系列為設(shè)計人員提供了實現(xiàn)推斷引擎的豐富選擇,能支持最節(jié)能、成本效率最高、面積占用最小的方案,從而滿足系統(tǒng)性能要求。一些通過汽車應(yīng)用認證的部件具備硬件功能安全特性,達到業(yè)界標準的 ISO 26262 ASIL-C 安全規(guī)范,這對自動駕駛應(yīng)用而言至關(guān)重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統(tǒng)以及可擴展的可編程邏輯結(jié)構(gòu),這就能在單個芯片上整合控制處理、機器學(xué)習(xí)算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現(xiàn),功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統(tǒng)計算平臺即便現(xiàn)在也無法用這么低的功耗運行實時 CNN 應(yīng)用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應(yīng)和更復(fù)雜功能的日益嚴格的要求?;诳删幊?MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發(fā)人員不能在自己的項目中輕松地實現(xiàn)這些優(yōu)勢,那么這種可配置型多平行計算架構(gòu)的優(yōu)勢就僅限于學(xué)術(shù)領(lǐng)域。成功需要適當(dāng)?shù)墓ぞ邅韼椭_發(fā)人員優(yōu)化目標推斷引擎的實現(xiàn)。為了滿足有關(guān)需求,賽靈思不斷擴展開發(fā)工具生態(tài)系統(tǒng)和機器學(xué)習(xí)軟件堆棧,并與專業(yè)合作伙伴合作,一起簡化和加速計算機視覺和視頻監(jiān)控等應(yīng)用的實現(xiàn)。

面 向 未 來 的 靈 活 性

利用 SoC 的可配置性為手頭應(yīng)用創(chuàng)建最佳平臺,也使得 AI 開發(fā)人員能夠靈活地跟上神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展演進的要求。業(yè)界可能遷移到新型神經(jīng)網(wǎng)絡(luò)的可能性,對于平臺開發(fā)人員來說是一個巨大的風(fēng)險。可重配置的 MPSoC 通過重配置并用當(dāng)前最先進的策略來構(gòu)建最高效的處理引擎,能夠讓開發(fā)人員靈活地響應(yīng)神經(jīng)網(wǎng)絡(luò)架構(gòu)方式的變化。

AI 越來越多地嵌入到各種設(shè)備中,包括工業(yè)控制、醫(yī)療設(shè)備、安全系統(tǒng)、機器人和自動駕駛汽車等。利用可編程邏輯結(jié)構(gòu)的 MPSoC 器件的靈活應(yīng)變加速技術(shù),是提供保持競爭力所需的快速響應(yīng)和高級功能的關(guān)鍵。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5060

    文章

    18975

    瀏覽量

    302093
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7435

    瀏覽量

    163525
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    131126
收藏 人收藏

    評論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)解決方案讓自動駕駛成為現(xiàn)實

    、成本及功耗的要求。輕型嵌入式神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的應(yīng)用可分為三個階段:訓(xùn)練、轉(zhuǎn)
    發(fā)表于 12-21 17:11

    卷積神經(jīng)網(wǎng)絡(luò)如何使用

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發(fā)表于 07-17 07:21

    什么是圖卷積神經(jīng)網(wǎng)絡(luò)?

    卷積神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 08-20 12:05

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點是什么

    卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點
    發(fā)表于 05-05 18:12

    嵌入式神經(jīng)網(wǎng)絡(luò)有哪些挑戰(zhàn)

    能?! ∵@些挑戰(zhàn)如果處理不當(dāng),將構(gòu)成重大威脅。一方面,必須要克服硬件限制條件,以在嵌入式平臺上執(zhí)行NN。另一方面,必須要克服挑戰(zhàn)的第二部分,以便快速達成解決方案,因為上市時間是關(guān)鍵。還原至硬件解決方案以加速上市時間也不是一個明智選擇,因為它無法提供
    發(fā)表于 06-30 11:01

    可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實現(xiàn)關(guān)鍵詞識別

    我們可以對神經(jīng)網(wǎng)絡(luò)架構(gòu)進行優(yōu)化,使之適配微控制器的內(nèi)存和計算限制范圍,并且不會影響精度。我們將在本文中解釋和探討深度可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實現(xiàn)關(guān)鍵詞識別的潛力
    發(fā)表于 07-26 09:46

    嵌入式AI平臺有哪些?

    11.2.2 修剪神經(jīng)網(wǎng)絡(luò) 21.2.3 嵌入式終端優(yōu)化 21.3 GPU 21.4 ARM 31.5 FPGA結(jié)構(gòu)的并行計算 41.5.1 介紹 41.5.2 流水線計算 41.5
    發(fā)表于 10-27 06:45

    嵌入式中的人工神經(jīng)網(wǎng)絡(luò)的相關(guān)資料分享

    人工神經(jīng)網(wǎng)絡(luò)AI中具有舉足輕重的地位,除了找到最好的神經(jīng)網(wǎng)絡(luò)模型和訓(xùn)練數(shù)據(jù)集之外,人工神經(jīng)網(wǎng)絡(luò)的另一個挑戰(zhàn)是如何在嵌入式設(shè)備上實現(xiàn)它,同時
    發(fā)表于 11-09 08:06

    輕量化神經(jīng)網(wǎng)絡(luò)的相關(guān)資料下載

    視覺任務(wù)中,并取得了巨大成功。然而,由于存儲空間和功耗的限制,神經(jīng)網(wǎng)絡(luò)模型在嵌入式設(shè)備上的存儲與計算仍然是一個巨大的挑戰(zhàn)。前面幾篇介紹了如何在嵌入式
    發(fā)表于 12-14 07:35

    如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢

    巡線智能車控制中的CNN網(wǎng)絡(luò)有何應(yīng)用?嵌入式單片機中的神經(jīng)網(wǎng)絡(luò)該怎樣去使用?如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢?
    發(fā)表于 12-21 07:47

    如何實現(xiàn)開發(fā)嵌入式神經(jīng)網(wǎng)絡(luò)

    已經(jīng)有很多關(guān)于將人工智能用于日益智能的車輛的文章。但是,您如何將在服務(wù)器群上開發(fā)的神經(jīng)網(wǎng)絡(luò) (NN) 壓縮到量產(chǎn)汽車中資源受限的嵌入式硬件中呢?本文探討了我們應(yīng)該如何授權(quán)汽車生產(chǎn) AI 研發(fā)工程師在
    發(fā)表于 12-23 06:30

    卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過程

    以前的神經(jīng)網(wǎng)絡(luò)幾乎都是部署在云端(服務(wù)器上),設(shè)備端采集到數(shù)據(jù)通過網(wǎng)絡(luò)發(fā)送給服務(wù)器做inference(推理),結(jié)果再通過網(wǎng)絡(luò)返回給設(shè)備端。如今越來越多的神經(jīng)網(wǎng)絡(luò)部署在
    發(fā)表于 12-23 06:16

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    分析了目前的特殊模型結(jié)構(gòu),最后總結(jié)并討論了卷積神經(jīng)網(wǎng)絡(luò)在相關(guān)領(lǐng)域的應(yīng)用,并對未來的研究方向進行展望。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN) 在
    發(fā)表于 08-02 10:39

    靈活應(yīng)變計算平臺滿足嵌入式AI要求

    隨著智能安全、機器人或無人駕駛汽車等應(yīng)用越來越依靠嵌入式人工智能技術(shù)來提高性能,交付全新的用戶體驗,傳統(tǒng)計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際
    的頭像 發(fā)表于 10-02 09:45 ?2971次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)原理:卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法

    一。其主要應(yīng)用領(lǐng)域在計算機視覺和自然語言處理中,最初是由Yann LeCun等人在20世紀80年代末和90年代初提出的。隨著近年來計算機硬件性能的提升和深度學(xué)習(xí)技術(shù)的發(fā)展,CNN在很多領(lǐng)域取得了重大的進展和應(yīng)用。 一、卷積
    的頭像 發(fā)表于 08-17 16:30 ?1391次閱讀