0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI Engine架構(gòu)的構(gòu)成及應(yīng)用優(yōu)勢(shì)

FPGA技術(shù)驛站 ? 來(lái)源:TeacherGaoFPGAHub ? 作者:TeacherGaoFPGAHub ? 2022-03-09 15:47 ? 次閱讀

AI Engine陣列是由一系列的AI EngineTile構(gòu)成。每個(gè)AI Engine Tile包含一個(gè)AI Engine,一個(gè)存儲(chǔ)單元和一個(gè)互連單元,如下圖所示。可以看到相鄰兩行AI Engine Tile的存儲(chǔ)單元與AI Engine的位置正好相反。

da237382-9e02-11ec-952b-dac502259ad0.png

存儲(chǔ)單元可被東西南北四個(gè)方向的AI Engine共享,當(dāng)然這也跟AI Engine的位置有關(guān)。例如圖中紅色AI Engine可訪問(wèn)與之相鄰的4個(gè)存儲(chǔ)單元(黃色標(biāo)記)。最右側(cè)的橙色AI Engine就只能訪問(wèn)三個(gè)存儲(chǔ)單元,因?yàn)槠湮挥谶吔?。每個(gè)方向的存儲(chǔ)單元都有對(duì)應(yīng)的存儲(chǔ)器接口,AI Engine在訪問(wèn)相應(yīng)方向的存儲(chǔ)單元時(shí)正是通過(guò)這些接口實(shí)現(xiàn)的。每次訪問(wèn)的最大位寬為256。

水平方向相鄰的兩個(gè)AI Engine之間還有級(jí)聯(lián)端口,用于傳送累加器的結(jié)果。仍以上圖為例,最下方的一行AI Engine可從左至右級(jí)聯(lián),倒數(shù)第二行的AI Engine可從右至左級(jí)聯(lián)。同時(shí),最下方級(jí)聯(lián)至最右側(cè)時(shí)可與倒數(shù)第二行最右側(cè)的AI Engine級(jí)聯(lián),形成蛇形級(jí)聯(lián)。

互連單元采用AIX4 Stream接口將數(shù)據(jù)在東西南北四個(gè)方向傳送。同時(shí)每個(gè)AI Engine Tile的存儲(chǔ)單元都包含一個(gè)DMA。每個(gè)DMA由一個(gè)獨(dú)立的S2MM和一個(gè)獨(dú)立的MM2S構(gòu)成。前者用于將數(shù)據(jù)從Stream上取下來(lái)寫(xiě)入到存儲(chǔ)單元,后者用于將存儲(chǔ)單元的數(shù)據(jù)上傳到Stream,如下圖所示。

da32f7a8-9e02-11ec-952b-dac502259ad0.png

再看AI Engine自身,如下圖所示。每個(gè)AIEngine包含一個(gè)程序存儲(chǔ)單元,大小為16KB,有2個(gè)Stream輸入接口和2個(gè)Stream輸出接口,均為32位。因此,每個(gè)時(shí)鐘周期可從一個(gè)Stream上獲取一個(gè)32位數(shù)據(jù)或每4個(gè)時(shí)鐘周期可從一個(gè)Stream上獲取一個(gè)128位數(shù)據(jù)。每個(gè)AI Engine還有4個(gè)存儲(chǔ)單元訪問(wèn)接口,但每個(gè)時(shí)鐘周期只可以有兩次讀操作和一次寫(xiě)操作。

da4b3c8c-9e02-11ec-952b-dac502259ad0.png

至此,我們可以看到AI Engine有三種數(shù)據(jù)源:存儲(chǔ)單元、AXI4-Stream和級(jí)聯(lián)接口。因此,編程時(shí)需要充分了解AIE的數(shù)據(jù)訪問(wèn)能力:2個(gè)32位AXI4-Stream輸入,2個(gè)32位AXI4-Stream輸出,1個(gè)384位級(jí)聯(lián)Stream輸入,1個(gè)384位級(jí)聯(lián)Stream輸出,2個(gè)256位讀操作和1個(gè)256位寫(xiě)操作。

AI Engine本身是一個(gè)高度優(yōu)化的SIMD(Single Instruction Multiple Data)& VLIW(Very Long Instruction Word)處理器,包含1個(gè)標(biāo)量處理單元,1個(gè)向量處理單元,2個(gè)讀地址發(fā)生器,1個(gè)寫(xiě)地址發(fā)生器,1個(gè)取指和譯碼單元,如下圖所示。正因?yàn)橛?個(gè)讀地址發(fā)送器和1個(gè)寫(xiě)地址發(fā)生器,所以每次訪問(wèn)可實(shí)現(xiàn)2個(gè)256讀操作和1個(gè)256寫(xiě)操作。

da7e52ca-9e02-11ec-952b-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19103

    瀏覽量

    228834
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29824

    瀏覽量

    268121

原文標(biāo)題:AIE(12)—AI Engine架構(gòu)概覽

文章出處:【微信號(hào):Lauren_FPGA,微信公眾號(hào):FPGA技術(shù)驛站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算
    發(fā)表于 03-12 08:09

    AI芯片熱潮和架構(gòu)創(chuàng)新有什么作用

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨(dú)立融資
    發(fā)表于 04-23 14:59

    AI芯片熱潮和架構(gòu)創(chuàng)新是什么

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨(dú)立融資
    發(fā)表于 04-24 11:29

    基于ATCA的測(cè)試系統(tǒng)架構(gòu)是如何構(gòu)成的?

    ATCA在測(cè)試領(lǐng)域有哪些應(yīng)用實(shí)例?基于ATCA的測(cè)試系統(tǒng)架構(gòu)是如何構(gòu)成的?
    發(fā)表于 05-11 07:01

    UltraScale DSP48 Slice架構(gòu)優(yōu)勢(shì)是什么?

    UltraScale DSP48 Slice架構(gòu)優(yōu)勢(shì)是什么?UltraScale內(nèi)存架構(gòu)優(yōu)勢(shì)是什么?
    發(fā)表于 05-24 06:34

    Openharmony的ACE engine lite部分是否需要MMU的支持?

    `M7架構(gòu)的能不能跑OpenHarmony的ACE ENGINE?目前對(duì)ace依賴(lài)的環(huán)境還不熟悉,如果支持ACE的話(huà),需要修改哪些部分呢?`
    發(fā)表于 05-31 09:25

    基于docker技術(shù)的工業(yè)App架構(gòu)是如何構(gòu)成

    基于docker技術(shù)的工業(yè)App架構(gòu)是如何構(gòu)成的?
    發(fā)表于 09-28 06:35

    XILINX FPGA 芯片整體架構(gòu)是如何構(gòu)成

    XILINX FPGA 芯片整體架構(gòu)是如何構(gòu)成的?XILINX FPGA 芯片有哪些資源?
    發(fā)表于 10-29 06:26

    STM32芯片的架構(gòu)是如何構(gòu)成

    STM32是什么?有哪幾種分類(lèi)?STM32芯片的架構(gòu)是如何構(gòu)成的?
    發(fā)表于 10-29 07:53

    基于CMSIS標(biāo)準(zhǔn)的軟件架構(gòu)是怎樣構(gòu)成

    CMSIS標(biāo)準(zhǔn)是什么意思?基于CMSIS標(biāo)準(zhǔn)的軟件架構(gòu)是怎樣構(gòu)成的?
    發(fā)表于 11-04 06:06

    【CC3200AI實(shí)驗(yàn)教程11】瘋殼·AI語(yǔ)音人臉識(shí)別-AI語(yǔ)音系統(tǒng)架構(gòu)

    CC3200AI實(shí)驗(yàn)教程——瘋殼·開(kāi)發(fā)板系列AI語(yǔ)音系統(tǒng)架構(gòu)AI語(yǔ)音識(shí)別系統(tǒng)的系統(tǒng)架構(gòu)如圖1.0.1所示。圖1.0.1
    發(fā)表于 08-30 14:54

    【CC3200AI實(shí)驗(yàn)教程14】瘋殼·AI語(yǔ)音人臉識(shí)別-AI人臉系統(tǒng)架構(gòu)

    CC3200AI實(shí)驗(yàn)教程——瘋殼·開(kāi)發(fā)板系列AI人臉系統(tǒng)架構(gòu)AI人臉識(shí)別系統(tǒng)由7大塊組成,分別是攝像頭、CC3200、串口調(diào)試助手、路由器、公網(wǎng)、服務(wù)器、數(shù)據(jù)庫(kù)以及百度
    發(fā)表于 08-31 16:35

    Map Service Engine Based On We

    Abstract:A design and implementation of map service engine based on web is introduced
    發(fā)表于 07-23 10:43 ?17次下載

    Qualcomm推出人工智能引擎AI Engine

    優(yōu)勢(shì)包括即時(shí)響應(yīng)、隱私保護(hù)增強(qiáng)和可靠性提升。得益于人工智能引擎AI Engine的支持,驍龍核心硬件架構(gòu)——Qualcomm? Hexagon? 向量處理器、Qualcomm? Adr
    發(fā)表于 03-20 18:07 ?1838次閱讀

    螞蟻數(shù)科發(fā)布新一代融合AI風(fēng)控引擎“AIR Engine

    在數(shù)字化浪潮的推動(dòng)下,金融科技領(lǐng)域的風(fēng)控技術(shù)正迎來(lái)新的突破。近日,螞蟻數(shù)科旗下的蟻盾風(fēng)控團(tuán)隊(duì)正式發(fā)布了新一代融合AI風(fēng)控引擎——“AIR Engine(AIFUSERiskEngine)”,該引擎在原有的決策式AI
    的頭像 發(fā)表于 06-26 18:20 ?1180次閱讀