0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思分享:智能引擎中所的AI引擎技術(shù)分析

454398 ? 來(lái)源:Xilinx技術(shù)社區(qū) ? 作者:Olivier Tremois ? 2020-10-11 11:14 ? 次閱讀

作者:Olivier Tremois(AI 引擎工具市場(chǎng)營(yíng)銷(xiāo)部門(mén))和 Florent Werbrouck(賽靈思技術(shù)支持產(chǎn)品應(yīng)用工程師

Versal ACAP 簡(jiǎn)介

Versal 自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 是基于 TSMC 7nm FinFET 工藝技術(shù)構(gòu)建的最新一代賽靈思器件。它利用高帶寬片上網(wǎng)絡(luò) (NoC) 將代表處理器系統(tǒng) (PS) 的標(biāo)量引擎、代表可編程邏輯 (PL) 的自適應(yīng)引擎與智能引擎有機(jī)結(jié)合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡(jiǎn)介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級(jí)聯(lián)接口相連的二維AI 引擎拼塊陣列。在當(dāng)前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個(gè)拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進(jìn)行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過(guò) PL 和 NoC 接口拼塊來(lái)實(shí)現(xiàn)的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲(chǔ)器映射接口通過(guò) NoC 接口拼塊來(lái)實(shí)現(xiàn)的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲(chǔ)器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數(shù)量因器件而異?!禫ersal 架構(gòu)和產(chǎn)品數(shù)據(jù)手冊(cè):簡(jiǎn)介》(DS950) 中羅列了 AI 引擎陣列的大小。
https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-...

AI 引擎拼塊架構(gòu)

現(xiàn)在,我們來(lái)詳細(xì)了解下此陣列,看看 AI 引擎拼塊的內(nèi)部。

每個(gè) AI 引擎拼塊都包含:

  • 1 個(gè)拼塊互連模塊,用于處理 AXI4-Stream 和存儲(chǔ)器映射 AXI4 輸入/輸出
  • 1 個(gè)存儲(chǔ)器模塊,其中包含 32 KB 數(shù)據(jù)內(nèi)存,細(xì)分為 8 個(gè)內(nèi)存 bank、1 個(gè)內(nèi)存接口、DMA 和各種鎖定。
  • 1 個(gè) AI 引擎

AI 引擎可訪問(wèn)全部 4 個(gè)方向中的多達(dá) 4 個(gè)內(nèi)存模塊(作為 1 個(gè)連續(xù)存儲(chǔ)器塊)。這意味著除了拼塊本地的內(nèi)存,AI 引擎還可以訪問(wèn) 3 個(gè)相鄰拼塊的本地內(nèi)存(除非拼塊位于陣列邊緣)。

  • 北側(cè)內(nèi)存模塊
  • 南側(cè)內(nèi)存模塊
  • 東側(cè)或西側(cè)內(nèi)存模塊(取決于 AI 引擎和內(nèi)存模塊所在的行和相對(duì)布局)。

AI 引擎架構(gòu)

AI 引擎屬于高度優(yōu)化的處理器,包含下列主要特色:

  • 32 位標(biāo)量 RISC 處理器(名為 Scalar Unit)
  • 1 個(gè) 512b SIMD 矢量單元(可提供矢量定點(diǎn)/整數(shù)單元)和 1 個(gè)單精度浮點(diǎn) (SPFP) 矢量單元
  • 3 個(gè)地址生成器單元 (AGU)
  • 超長(zhǎng)指令字 (VLIW) 功能
  • 3 個(gè)數(shù)據(jù)內(nèi)存端口(2 個(gè)負(fù)載端口,1 個(gè)存儲(chǔ)端口)
  • 直接流傳輸接口(2 個(gè)輸入流,2 個(gè)輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創(chuàng)建嵌入多項(xiàng)指令的單一程序用于指定并行性將是一項(xiàng)冗長(zhǎng)且近乎不可能的任務(wù)。因此 AI 引擎陣列模型編程與 Kahn 處理網(wǎng)絡(luò) (Kahn Process Networks) 之間的共通之處在于自主計(jì)算進(jìn)程通過(guò)通信邊緣實(shí)現(xiàn)彼此互連,從而生成處理網(wǎng)絡(luò)。

(請(qǐng)參閱 https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf )

在 AI 引擎框架中,Graph 邊緣是緩存和數(shù)據(jù)流,而計(jì)算進(jìn)程則被稱(chēng)為內(nèi)核。在Graph中,內(nèi)核經(jīng)過(guò)例化,彼此相連并連接到設(shè)計(jì)其余部分(NoC 或 PL)。

編程流程分為 2 個(gè)階段:

單內(nèi)核編程:

內(nèi)核用于描述特定計(jì)算進(jìn)程。每個(gè)內(nèi)核都將在單一 AI 引擎拼塊上運(yùn)行。但請(qǐng)注意,多個(gè)內(nèi)核可在同一個(gè) AI 引擎拼塊上運(yùn)行,并共享處理時(shí)間。任意 C/C++ 代碼均可用于對(duì) AI 引擎進(jìn)行編程。標(biāo)量處理器將處理大部分代碼。如果您的目標(biāo)是設(shè)計(jì)高性能內(nèi)核,那么應(yīng)考慮采用矢量處理器,它使用稱(chēng)為內(nèi)部函數(shù)的專(zhuān)用函數(shù)。這些函數(shù)專(zhuān)用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發(fā)掘出巨大的處理性能。賽靈思將提供預(yù)構(gòu)建內(nèi)核(包含在庫(kù)內(nèi)),以供用戶(hù)在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內(nèi)核創(chuàng)建Graph。此框架包含 Graph 節(jié)點(diǎn)和連接聲明。這些節(jié)點(diǎn)可包含在 AI 引擎陣列內(nèi)或可編程邏輯(HLS 內(nèi)核)中。為了完全掌握內(nèi)核位置,將有一系列方法可用來(lái)約束布局(內(nèi)核、緩存、系統(tǒng)內(nèi)存等)。Graph 將例化并使用緩存和數(shù)據(jù)流將內(nèi)核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來(lái)數(shù)據(jù)傳輸。

賽靈思將提供預(yù)構(gòu)建 Graph(包含在庫(kù)內(nèi)),以供用戶(hù)在其應(yīng)用中使用。

在運(yùn)行時(shí)以及仿真期間,AI 引擎應(yīng)用由 PS 進(jìn)行控制。

賽靈思將根據(jù)應(yīng)用的操作系統(tǒng)提供多種 API,如下所述。

  • Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應(yīng)用
  • 裸機(jī)驅(qū)動(dòng)程序

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    131126
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
  • 可編程邏輯
    +關(guān)注

    關(guān)注

    7

    文章

    514

    瀏覽量

    44056
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI模型市場(chǎng)分析

    隨著人工智能技術(shù)的快速發(fā)展,AI模型已成為全球科技競(jìng)爭(zhēng)的新高地、未來(lái)產(chǎn)業(yè)的新賽道以及經(jīng)濟(jì)發(fā)展的新引擎。下面,AI部落小編分析了當(dāng)前
    的頭像 發(fā)表于 11-01 09:51 ?87次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨(dú)特的
    的頭像 發(fā)表于 09-25 14:11 ?233次閱讀

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機(jī)器學(xué)習(xí) ( ML ) 架構(gòu)來(lái)提供突破性的 AI
    的頭像 發(fā)表于 09-18 09:16 ?285次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>機(jī)器學(xué)習(xí)陣列指南

    深入理解渲染引擎:打造逼真圖像的關(guān)鍵

    在數(shù)字世界中,圖像渲染是創(chuàng)造逼真視覺(jué)效果的核心技術(shù)。渲染引擎,作為這一過(guò)程中的關(guān)鍵組件,負(fù)責(zé)將二維或三維的模型、紋理、光照等數(shù)據(jù)轉(zhuǎn)化為人們?nèi)庋劭梢?jiàn)的二維圖像。本文將深入探討渲染引擎的工作原理及其在打
    的頭像 發(fā)表于 06-29 08:28 ?263次閱讀
    深入理解渲染<b class='flag-5'>引擎</b>:打造逼真圖像的關(guān)鍵

    螞蟻數(shù)科發(fā)布新一代融合AI風(fēng)控引擎“AIR Engine”

    在數(shù)字化浪潮的推動(dòng)下,金融科技領(lǐng)域的風(fēng)控技術(shù)正迎來(lái)新的突破。近日,螞蟻數(shù)科旗下的蟻盾風(fēng)控團(tuán)隊(duì)正式發(fā)布了新一代融合AI風(fēng)控引擎——“AIR Engine(AIFUSERiskEngine)”,該
    的頭像 發(fā)表于 06-26 18:20 ?1179次閱讀

    富唯智能AI邊緣控制器:工業(yè)自動(dòng)化的智慧引擎

    隨著工業(yè)4.0時(shí)代的到來(lái),工業(yè)自動(dòng)化成為了推動(dòng)制造業(yè)轉(zhuǎn)型升級(jí)的關(guān)鍵力量。在這樣的背景下,富唯智能憑借其自主研發(fā)的AI邊緣控制器,成為了工業(yè)自動(dòng)化的智慧引擎,為制造業(yè)的智能化、數(shù)字化發(fā)展
    的頭像 發(fā)表于 05-22 15:32 ?473次閱讀
    富唯<b class='flag-5'>智能</b><b class='flag-5'>AI</b>邊緣控制器:工業(yè)自動(dòng)化的智慧<b class='flag-5'>引擎</b>

    火山引擎攜手OPPO、vivo等成立智能終端大模型聯(lián)盟

    在字節(jié)跳動(dòng)2024年春季火山引擎Force原動(dòng)力大會(huì)上,火山引擎攜手OPPO、vivo、榮耀、小米、三星及華碩等業(yè)界翹楚,正式宣布成立智能終端大模型聯(lián)盟。這一聯(lián)盟的成立,旨在共同推動(dòng)大模型技術(shù)
    的頭像 發(fā)表于 05-16 10:25 ?444次閱讀

    勒科技新型高性能800G硅光引擎即將亮相OFC 2024

    南通勒光電科技有限公司(簡(jiǎn)稱(chēng)“勒科技”)在近日重磅推出了專(zhuān)為AI集群和數(shù)據(jù)中心設(shè)計(jì)的新一代產(chǎn)品——新型高性能800G硅光引擎。這款備受矚目的創(chuàng)新產(chǎn)品即將在盛大的2024年度光纖通信
    的頭像 發(fā)表于 03-22 10:07 ?799次閱讀

    勒科技聯(lián)合劍橋科技發(fā)布新型800G硅光引擎

    南通勒光電科技有限公司,業(yè)界簡(jiǎn)稱(chēng)“勒科技”,近日正式揭曉了其專(zhuān)為AI集群和數(shù)據(jù)中心量身打造的新一代產(chǎn)品——高性能800G硅光引擎。這款創(chuàng)新產(chǎn)品即將在美國(guó)圣地亞哥的年度盛事——202
    的頭像 發(fā)表于 03-22 10:00 ?850次閱讀

    開(kāi)放原子開(kāi)源大賽—基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開(kāi)發(fā)正式啟動(dòng)!

    “基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開(kāi)發(fā)”是開(kāi)放原子全球開(kāi)源大賽下開(kāi)設(shè)的新興及應(yīng)用題之一,本次題旨在鼓勵(lì)更多開(kāi)發(fā)者基于Ope
    發(fā)表于 03-13 10:45

    AMD發(fā)布適用于Linux系統(tǒng)的XDNA驅(qū)動(dòng),助力APU AI引擎

    AMD于去年推出了Ryzen 7040“鳳凰城”系列APU,其中首次搭載了基于Xilinx IP的XDNA架構(gòu)AI引擎。借助此引擎,PyTorch和TensorFlow等機(jī)器學(xué)習(xí)框架的運(yùn)行速度得以顯著提高。
    的頭像 發(fā)表于 01-30 14:04 ?859次閱讀

    恩智浦發(fā)布新一代智能語(yǔ)音技術(shù)組合的語(yǔ)音識(shí)別引擎

    恩智浦發(fā)布新一代智能語(yǔ)音技術(shù)組合的語(yǔ)音識(shí)別引擎。本文將探討開(kāi)發(fā)人員在嵌入式語(yǔ)音控制設(shè)計(jì)中面臨的挑戰(zhàn)、恩智浦新的Speech to Intent引擎,以及您如何在應(yīng)用中使用它。
    的頭像 發(fā)表于 01-26 09:15 ?705次閱讀
    恩智浦發(fā)布新一代<b class='flag-5'>智能</b>語(yǔ)音<b class='flag-5'>技術(shù)</b>組合的語(yǔ)音識(shí)別<b class='flag-5'>引擎</b>

    AI引擎內(nèi)核與計(jì)算圖編程指南

    電子發(fā)燒友網(wǎng)站提供《AI引擎內(nèi)核與計(jì)算圖編程指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 10:50 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內(nèi)核與計(jì)算圖編程指南

    如何以HAE(諧波分析引擎) 方式改善智能電網(wǎng)的集成度

    電子發(fā)燒友網(wǎng)站提供《如何以HAE(諧波分析引擎) 方式改善智能電網(wǎng)的集成度.pdf》資料免費(fèi)下載
    發(fā)表于 11-28 11:48 ?0次下載
    如何以HAE(諧波<b class='flag-5'>分析</b><b class='flag-5'>引擎</b>) 方式改善<b class='flag-5'>智能</b>電網(wǎng)的集成度

    讓x86處理器也有AI智能,解讀AMD Ryzen AI引擎

    在完成收購(gòu)不久之后,AMD就成功地將AI
    的頭像 發(fā)表于 11-13 16:30 ?750次閱讀
    讓x86處理器也有<b class='flag-5'>AI</b><b class='flag-5'>智能</b>,解讀AMD Ryzen <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>