99久久国产自偷自偷免费一区,91专区在线

一、NoC前世今生

NoC是相對于SoC的新一代片上互連技術，從計算機發(fā)展的歷史可以看到NoC 必將是SoC 之后的下一代主流技術，SoC 通常指在單一芯片上實現(xiàn)的數(shù)字計算機系統(tǒng)，總線結(jié)構(gòu)是該系統(tǒng)的主要特征，由于其可以提供高性能的互連而被廣泛運用。然而隨著半導體工藝技術的持續(xù)發(fā)展，出現(xiàn)了一些與總線相關的問題：總線地址空間有限，由于使用單一時鐘整個芯片均同步的限制。一個典型的SoC系統(tǒng)主要包含以下結(jié)構(gòu)：

A.至少一個微控制器(MCU)或微處理器(MPU)或數(shù)字信號處理器(DSP)，但是也可以有多個處理器內(nèi)核;

B.存儲器可以是RAM、ROM、EEPROM和閃存中的一種或多種；

C.用于提供時間脈沖信號的振蕩器和鎖相環(huán)電路；

D.由計數(shù)器和計時器、電源電路組成的外設；

E.不同標準的連線接口，如USB、火線、以太網(wǎng)、通用異步收發(fā)和序列周邊接口等；

F.用于在數(shù)字信號和模擬信號之間轉(zhuǎn)換的ADC/DAC；

G.電壓調(diào)理電路及穩(wěn)壓器；

目前的SOC架構(gòu)各個組件之間的通訊還是以AMBA總線為主，AMBA包含AHB/ASB/APB/AXI這四種主要的總線協(xié)議，而這些協(xié)議無一例外的都是基于中斷和仲裁機制的。然而，隨著商業(yè)應用開始不斷追求指令運行并存性和預測性，芯片中集成的核數(shù)目將不斷增多，基于總線架構(gòu)的SoC將逐漸難以滿足不斷增長的計算需求。其主要表現(xiàn)為：

A.可擴展性差：SoC系統(tǒng)設計是從系統(tǒng)需求分析開始，確定硬件系統(tǒng)中的模塊。為了使系統(tǒng)能夠正確工作，SoC中各物理模塊在芯片上的位置是相對固定的；一旦在物理設計完畢后，要進行修改，實際上就有可能是一次重新設計的過程；另一方面，基于總線架構(gòu)的SoC，由于總線架構(gòu)固有的仲裁通信機制，即同一時刻只能有一對處理器核心進行通信，限制了可以在其上擴展的處理器核心的數(shù)量；

B.平均通信效率低：SoC中采用基于獨占機制的總線架構(gòu)，其各個功能模塊只有在獲得總線控制權(quán)后才能和系統(tǒng)中其他模塊進行通信；從整體來看，一個模塊取得總線仲裁權(quán)進行通信時，系統(tǒng)中的其他模塊必須等待，直到總線空閑；

C.單一時鐘同步問題：總線結(jié)構(gòu)要求全局同步，然而隨著工藝特征尺寸越來越小，工作頻率迅速上升，達到10GHz以后，連線延時造成的影響將嚴重到無法設計全局時鐘樹的程度，而且由于時鐘網(wǎng)絡龐大，其功耗將占據(jù)芯片總功耗的大部分；二、AMD Versal器件NoC介紹

AMD Versal系列器件上的NoC網(wǎng)絡主要架構(gòu)如下圖所示：

AMD Versal可編程芯片網(wǎng)絡(NoC)是使用的互連網(wǎng)絡，用于在可編程邏輯(PL)、處理系統(tǒng)(PS)中的IP端點之間共享數(shù)據(jù)。這種設備范圍的基礎設施是高速、集成化并帶有專用開關的數(shù)據(jù)路徑。可以對NoC進行邏輯配置以表示復雜的拓撲，使用一系列水平和垂直路徑以及一組可定制的體系結(jié)構(gòu)。

NoC是為可擴展性而設計的。它是由一系列相互連接的水平(HNoC)和垂直(VNoC)路徑，由一組可定制的硬件實現(xiàn)支持。可以以不同方式配置的組件，以滿足設計時間，速度和邏輯利用需求。HNoC和VNoC是連接集成塊的專用高帶寬路徑，在處理器系統(tǒng)和可編程邏輯(PL)之間不需要消耗大量可編程邏輯的數(shù)量。

NoC支持端到端服務質(zhì)量(QoS)，以有效地管理事務和平衡每個流量流的競爭延遲和帶寬需求。NoC組件包括NoC主單元(NMU)、NoC從單元(NSU)和NoC包交換機(NPS)和NoC模間橋(NIDB)。NMU為交通入口點，而NSU是交通出口點。所有ip都有一定數(shù)量的主連接和從連接。NIDB將兩個超級邏輯區(qū)域(slr)連接在一起，提供芯片之間的高帶寬。NPS是橫條交換機，用于完全形成網(wǎng)絡。

AMD Versal系列器件的NoC支持如下特性：

A.PL對PL通信；

B.PL到CIPS的通信；

C.CIPS到PL通信；

D.CIPS到DDR內(nèi)存通信；

E.CIPS到AI引擎的通信；

F.高帶寬數(shù)據(jù)傳輸；

G.支持標準的AXI4接口到NoC，支持AXI4-Lite需要軟橋；

H.支持時鐘域交叉；

I.內(nèi)部寄存器編程互連編程NoC寄存器；

J.多種路由選擇：基于物理地址；根據(jù)目的接口設置；虛擬地址支持；

K.通過強化SSIT橋接實現(xiàn)芯片間連接；

L.在SSIT配置中，從源芯片PMC傳輸比特流到目標芯片PMC；

M.可編程路由表的負載平衡和死鎖避免；

N.調(diào)試和性能分析功能；

O.端到端數(shù)據(jù)保護的可靠性，可用性，可服務性(RAS)；

P.在整個NoC中有效地支持虛擬通道和服務質(zhì)量(QoS)，管理事務并平衡每個事務的競爭延遲和帶寬需求；

Q.NoC連接硬件(或接入點)使用主從，內(nèi)存映射配置。NoC上最基本的連接由一個主連接組成到使用單個分組交換機的單個從機。使用這種方法，主機獲得AXI信息并將其打包，以便通過分組交換機在NoC上傳輸?shù)綇臋C的slave將數(shù)據(jù)包分解為傳遞給連接后的AXI信息。為了實現(xiàn)這一點，一個NoC接入點管理所有的時鐘域交叉、交換和AXI和NoC端之間的數(shù)據(jù)緩沖，反之亦然；

R.支持內(nèi)存映射事務的糾錯碼(ECC)，不支持流；

NoC功能模塊如下：

A.NoC Master Unit (NMU)：用于連接主控節(jié)點和NoC；

B.NoC Slave Unit (NSU)：用于連接從設備到NoC；

C.NoC分組交換機(NPS)：用于沿NoC和執(zhí)行傳輸和分組交換設置和使用虛擬通道NMU和NSU組件通過標準從可編程邏輯端訪問；

NoC的AXI4使用以下基本的AXI特性：

A.支持AXI4和AXI4- stream；

B.可配置AXI接口寬度:32、64、128、256或512位接口；

C.64位尋址；

D.AXI排他訪問的處理；

在AMD Versal系列器件中將NoC整合到了專用的硬化DDR/HBM控制器中，可以更為方便的對存儲器數(shù)據(jù)流進行分配。其中HBM NoC結(jié)構(gòu)可以參見下圖：

三、AMD Versal NoC IP功能介紹

AMD Versal NoC IP主要包括AXI/DDR Memory Controller/HBM Memory Controller/AXI Stream幾種基礎模式，可以根據(jù)速率/帶寬的需求進行自由組合和選擇。本文主要基于AXI接口的NoC IP進行簡要介紹，基本界面如下圖所示：

對界面上幾個主要選項做如下說明：

AXI接口：

A. AXI Slave接口數(shù)量：NMU (NoCingress)接口的數(shù)； B. AXI Master Interface數(shù)量：NSU (NoC出口)端口數(shù)量； C. AXI時鐘的數(shù)量：這是將被跨使用的獨立AXI時鐘的數(shù)量，NMU和NSU端口的集合，基于接口輸入相關時鐘的工具將推斷每個接口的時鐘關聯(lián)；

Inter-NoC接口：

A. Inter-NoC SlaveInterface的數(shù)量：表示Inter-NoC Interface ingress (INI)的數(shù)量；

B. Inter-NoC MasterInterf ace數(shù)量：Inter-NoC Interface出接口數(shù)量(INI)端口；

內(nèi)存控制器-DDR4/LPDDR4：

A. 內(nèi)存控制器數(shù)量：已連接的集成內(nèi)存控制器數(shù)量這個axi_noc實例,必須為0、1、2或4，2或4表示內(nèi)存控制器交錯；

B. Memory ControllerPorts數(shù)量：內(nèi)存控制器中可連接的MC端口數(shù)量連接選項卡，必須是0-4，這對應于已啟用的NSU連接數(shù)；

C.交錯大?。寒攦?nèi)存控制器交錯時，設置每個字節(jié)的數(shù)量交錯，必須是{128,256,512,1024,2048,4096}中的一個；

D. DDR地址區(qū)域0/1：將DDRMC地址與統(tǒng)一的系統(tǒng)地址進行映射通用設備的地圖，有關更多信息，請參閱系統(tǒng)地址映射；

對于input和output頁面的功能主要是配置NoC的互聯(lián)信息，整體界面如下圖所示：

A. AXI輸入：設置該實例的AXI輸入的數(shù)量，并配置每個輸入的配置選項有如下連接對象:

? AIE：來自AI引擎陣列；

? PS非相干：來自PS的非相干接口之一；

? PS PMC：來自PS的平臺管理控制器；

? PS LPD：來自低功耗域；

? PL：來自可編程邏輯結(jié)構(gòu)；

? PS Cache Coherent：從PS的一個Cache Coherent接口；

? PS PCIe：從PS的PCIe接口；

B. 奇偶校驗：啟用從AXI主機到NMU的連接的奇偶校驗，可用的奇偶校驗選項有:

? None：不校驗；

? 地址：AXI地址奇偶校驗啟用；

? 數(shù)據(jù)：AXI數(shù)據(jù)奇偶校驗啟用；

? 地址和數(shù)據(jù)：啟用了AXI地址和數(shù)據(jù)檢查；

奇偶校驗位的對應關系如下表所示：

注意：奇偶校驗只對連接到PL的輸入有效，從PS或AI引擎不支持奇偶校驗。

C. Inter-NoC輸入：使用Inter-NoC接口指定來自其他axi_noc實例的輸入(INI)；

您可以選擇設置INI連接策略如下:

? 自動：IP集成商決定正確的策略。這是默認設置；

? 單驅(qū)動：只有一個驅(qū)動，可能有多個負載；

? 單負載：有一個負載和可能的多個驅(qū)動程序；

D. AXI輸出：設置該實例的AXI輸出數(shù)量并配置每個輸出，配置選項有：

? 連接對象；

? PL：到可編程邏輯結(jié)構(gòu)；

? AIE：連接到AI引擎陣列；

? PS Cache CoherentVirtual：到PS的一個Cache Coherent接口，路由到此NSU端主機使用固定目的地地址路由所有從NMU到NSU的事務，此設置適用于使用功能在SMMU-400和/或CCI-500；

? PS Cache CoherentPhysical：到PS的Cache Coherent接口之一，All PL路由到該NSU端口的主機使用地址解碼尋址來路由事務，此設置適用于以PS中的端點從機為目標的端點主機并不適用于使用CCI-500中的特性的端點主機；

? PS Non-CoherentVirtual：指向PS上的一個非相干接口路由到此NSU端口的主機使用固定目的地地址路由所有從NMU到NSU的事務；

? PS Non-CoherentPhysical：到PS的一個非相干接口路由到該NSU端口的主機使用地址解碼尋址來路由事務，此設置適用于以PS中的端點從服務器為目標的端點主服務器；

? PS PCIe：連接到PS的PCIe接口；

? PS PMC：到PS的平臺管理控制器；

? 奇偶校驗：啟用從NSU到AXI slave的連接的奇偶校驗使用奇偶校驗，奇偶校驗選項與輸入選項卡中描述的選項相同；

奇偶校驗位的映射說明如下表所示：

注意：奇偶校驗只對連接到PL的輸出有效，對于PS或AI引擎無效；

E. Inter-NoC輸出：使用Inter-NoC接口指定輸出到其他axi_noc實例(INI)；

您可以選擇設置INI連接策略如下：

? 自動：允許IP集成商確定正確的策略；

? 單驅(qū)動(NMU)：負載(NSU/MC)擁有PR路徑并具有QoS；

? 單負載(NSU/MC)：NMU (Driver)擁有PR路徑和QoS；

對于Connectivity頁面來說主要是用于配置AXI接口的Slave和Master的連接關系，就不再詳述了，頁面布局如下圖所示：

對于QoS頁面來說主要是配置NoC的QoS特性，分為基礎QOS和高級QOS配置兩種，整體界面如下圖所示：

A. QoS選項卡的第一列顯示了定義的連接的樹形結(jié)構(gòu)連接選項卡；每個樹的頂部(左對齊的端口名稱)是NoC入口端口；每個入口端口下面顯示的是相關行對于每個連接的出口端口。

B. 第二列定義讀流量的分類:取值為LOW_LATENCY和BEST_EFFORT(默認)，流量類適用于所有連接源自給定的入口端口；

C. 第三列定義寫流量類別，取值包括ISOCHRONOUS和BEST_EFFORT，寫流量不支持LOW_LATENCY，寫流量類適用于從給定入口端口發(fā)起的所有連接；

D. 第四列表示該NoC實例是否擁有給定路徑的QoS設置：NoC路徑可以使用INI遍歷多個NoC實例，QoS設置取自擁有QoS和路徑的NoC實例，當NoC實例不擁有QoS時，QoS將被忽略的路徑，所有權(quán)正處于從NMU或strategy=Driver者到NSU, MC，或strategy=Load，如果值為“pending”，則表示在此期間將計算所有權(quán)驗證，或單擊上面的Run NoC drc按鈕，對于值“error”，請驗證或單擊單擊上面的Run NoC drc按鈕，在Tcl控制臺和消息窗口中查看錯誤詳細信息；

E. 第五列為讀帶寬，單位為MB/s，允許取值范圍為0 (不接受讀流量)到NoC物理通道的最大數(shù)據(jù)帶寬；

F. 第六列為寫帶寬，單位為MB/s，允許的值范圍從0(不接受寫流量)到NoC物理通道的最大數(shù)據(jù)帶寬；

擁有QoS和路徑：

NoC路徑可以使用INI遍歷多個NoC實例，QoS設置取自擁有QoS和Path的NoC實例，當NoC不擁有QoS時，將忽略QoS路徑；所有權(quán)處于從NMU或strategy=Driver程序到NSU， MC或的過渡階段strategy=Load，值“pending”意味著所有權(quán)將在驗證期間計算，或者通過單擊運行上面的NoC DRCs按鈕，若值為“error”，請驗證或單擊“Run NoC drc”按鈕在Tcl控制臺和消息窗口中查看錯誤詳細信息。

注意：如果“擁有QoS”和“路徑”為“否”，則所有設置BW和流量分類將被忽略。

運行NoC drc：

在整個設計中運行NoC drc，錯誤會在Tcl控制臺和消息窗口中列出，通過計算所有權(quán)來更新'Owns QoS'列中的'pending'條目設計，NoC路徑可以使用INI遍歷多個NoC實例，采取QoS設置從擁有QoS和Path的NoC實例獲取，當NoC沒有忽略QoS時，QoS將被忽略擁有這條路徑；所有權(quán)正處于從NMU或strategy=Driver者到NSU, MC，或strategy=Load。

對于Address Remap頁面來說主要是配置輸入輸出的地址映射關系，有一些地址規(guī)則會詳細說明，Address Remap頁面如下圖所示：

A. IncomingSlave Interface：從下拉菜單中選擇從端口(NMU)存在需要重新映射的傳入地址；

B. 出主接口：從下拉菜單中選擇主接口(NSU)輸出重新映射的地址；

C. 入站地址：從站發(fā)送的起始地址，需要重新映射；

D. 發(fā)送地址：發(fā)送地址為映射后的地址，這是第一個地址在重新映射開始的地方；

E. 范圍：要訪問的地址空間的總范圍；

F. 重新映射規(guī)則：

? 范圍必須最小為64K，必須為2的整數(shù)次方；

? 范圍內(nèi)的入地址位必須為零：incoming_address& (range-1)== 0；

? 示例：對于由主控機尋址的32位4G范圍；

? 輸出地址范圍內(nèi)的位必須為零：output_address& (range-1) == 0；

四、DDR4/LPDDR4 NoC IP實戰(zhàn)

在 Versal新一代ACAP器件上，除了延續(xù)之前Ultrascale/Ultrascale+系列器件上已有的DDR4IP之外，還配置了最新的DDR4/LPDDR4 硬核控制器(NoC IP)。它的性能更高，并且不額外占用其他的可編程邏輯資源(PL)，使用它的時候，在硬件設計方面和設計流程上，和之前的軟核控制器(DDR4 IP)也有著很大的不同。今天我們來介紹一下I/O planning方面的設計考慮和實現(xiàn)流程。

我們首先要新建一個工程并添加CISP IP core，這樣我們才能順利的開始block design的設計工作。

新建如圖基于VMK180的vivado工程'edt_versal_noc'：

新建一個BlockDesign，這里我們添加CISP ip core （系統(tǒng)默認為versal_cips_0），并且run design automation讓vivado對ip核做自動初始化。這里我們使用CISP IP的默認配置，不進行更改。

自動化后雙擊versal_cips_0框圖，進入Re-customize IP向?qū)В瑢oard Interface設置成Custom, 如圖所示：

雙擊CIPS打開配置向?qū)д业絇S PMC配置NoC頁, 啟動PS Master Interfaces如圖所示：

最后點擊Finish更新CIPS的配置。

接著添加另外一個IP核 AXI NoC，RunBlock Automation, 配置如下：

在block design中添加NoC IP。

在IP wizard中，根據(jù)memory 容量，位寬，帶寬等要求完成相關配置。

總體上來講，DDR4/LPDDR4的管腳有2種分配模式—Flipped和Non-flipped，模式的選擇可以通過使能或者關閉NoC IP中 “Flipped pinout”的選項來實現(xiàn)。

Versal器件上每個NoC IP對應3個IO bank的管腳，它們都位于同一個triplet之中。一個NoC IP對應的所有DDR4/LPDDR4接口管腳都必須放置在這3個IO bank之中。在對block design進行綜合之后，打開synthesized design，在I/O ports窗口中點擊 “Open advanced I/O planner” ，按照bank或者nibble為單位指定所有管腳的位置。

在此之后，地址、控制和時鐘管腳的位置就被固定了下來。數(shù)據(jù)管腳在Byte以內(nèi)和Byte之間可以進行微調(diào)，這樣一個NoC的block design實例工程就搭建完成了。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

FPGA

FPGA

+關注

關注
1625

文章
21620

瀏覽量
601232
amd

amd

+關注

關注
25

文章
5420

瀏覽量
133806
計算機

計算機

+關注

關注
19

文章
7360

瀏覽量
87632
NoC

NoC

+關注

關注
0

文章
38

瀏覽量
11714
Versal

Versal

+關注

關注
1

文章
151

瀏覽量
7624

AMD Versal系列CIPS IP核建立示例工程

接著上一篇“AMD Versal系列CIPS IP核介紹”文章來進一步講解如何來建立CIPS IP核示例工程。

發(fā)表于 12-05 13:34 ?616次閱讀

<b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b><b class='flag-5'>系列</b>CIPS IP核建立示例工程

AMD Versal AI Edge自適應計算加速平臺之Versal介紹（2）

Versal 包含了 Cortex-A72 處理器和 Cortex-R5 處理器，PL 端可編程邏輯部分，PMC 平臺管理控制器，AI Engine 等模塊，與以往的 ZYNQ 7000 和 MPSoC 不同，Versal 內(nèi)部是通過

發(fā)表于 03-06 18:12 ?1363次閱讀

【ALINX 技術分享】AMD Versal AI Edge 自適應計算加速平臺之 Versal 介紹（2）

【ALINX 技術分享】AMD Versal AI Edge 自適應計算加速平臺之 Versal 介紹，以及Versal 芯片開發(fā)流程的簡介

發(fā)表于 03-07 16:03 ?938次閱讀

AMD Versal AI Edge自適應計算加速平臺之PL通過NoC讀寫DDR4實驗(4)

Versal的DDR4是通過NoC訪問，因此需要添加NoC IP進行配置。

發(fā)表于 03-22 17:18 ?2036次閱讀

技術文章：如何利用NoC來進行FPGA內(nèi)部邏輯的互連

運行的高速公路網(wǎng)絡一樣，為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了超高帶寬（~27Tbps）。圖1Speedster 7t FPGA結(jié)構(gòu)圖NoC使用一系列高速的行和列網(wǎng)絡通

發(fā)表于 05-12 08:00

怎么構(gòu)建一種基于FPGA的NoC驗證平臺？

本文提出了一種基于FPGA的NoC驗證平臺。詳細討論了該驗證平臺中FPGA硬件平臺和NoC軟件的基本功能，并闡述了TG／R，MPU，MPI以及NoC

發(fā)表于 05-06 07:20

基于FPGA的NoC多核處理器的設計

為了能夠靈活地驗證和實現(xiàn)自主設計的基于NoC的多核處理器，縮短NoC多核處理器的設計周期，提出了設計集成4片Virtex-6—550T FPGA的NoC多核處理器原型芯片設計／驗證平臺

發(fā)表于 11-22 09:15 ?4637次閱讀

采用FPGA的NoC驗證平臺實現(xiàn)方案

本文提出的基于FPGA的NoC驗證平臺在仿真速度方面是一般基于HDL的軟件仿真的16 000倍，而基于PC機編寫的NoC軟件更增強了該平臺的靈活性和實用性。

發(fā)表于 04-13 11:33 ?2278次閱讀

Versal系列芯片三個產(chǎn)品的基礎知識

三種引擎集成于其中。這三種引擎是：標量引擎（Scalar Engine，ARM核）、可適應引擎（AdaptableEngine，傳統(tǒng)FPGA資源+NOC）和智能引擎（IntelligentEngine

發(fā)表于 02-11 11:27 ?3291次閱讀

在Versal中通過NoC從PS-APU對AXI BRAM執(zhí)行基本讀寫操作

本篇博文旨在演示如何通過 NoC 從 Versal 應用處理單元 (APU) 訪問 AXI BRAM。

發(fā)表于 11-09 10:24 ?608次閱讀

如何通過NoC 從 Versal應用處理單元訪問AXI BRAM

Versal 架構(gòu)將“Scalar Engine”（標量引擎）、“Adaptable Engine”（自適應引擎）和“Intelligent Engine”（智能引擎）這三種不同類型的引擎與豐富的連接和通信功能以及片上網(wǎng)絡 (NoC) 有機結(jié)合，從而支持實現(xiàn)覆蓋整個器件的

發(fā)表于 11-11 09:09 ?614次閱讀

AMD Versal系列FPGA NoC介紹及實戰(zhàn)

NoC是相對于SoC的新一代片上互連技術，從計算機發(fā)展的歷史可以看到NoC 必將是SoC 之后的下一代主流技術

發(fā)表于 07-13 15:56 ?874次閱讀

AMD率先推出符合DisplayPort? 2.1 8K視頻標準的FPGA和自適應SoC

AMD UltraScale+ FPGA 和 AMD Versal 自適應 SoC 產(chǎn)品系列已率先成為業(yè)界符合 VESA DisplayPo

發(fā)表于 01-24 09:18 ?422次閱讀

ALINX VERSAL SOM產(chǎn)品介紹

近日，2024 AMD Adaptive Computing Summit（AMD ACS）在深圳舉行，芯驛電子應邀出席作主題分享：《ALINX 基于 Versal 系列硬件解決方案》

發(fā)表于 08-05 10:33 ?568次閱讀

AMD Versal自適應SoC CPM5 QDMA的Tandem PCIe啟動流程介紹

本文將從硬件設計和驅(qū)動使用兩個方面介紹基于 CPM5 QDMA 的 AMD Versal 自適應 SoC 的 Tandem 設計和啟動流程。

發(fā)表于 09-18 10:07 ?366次閱讀