0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于FPGA設計的sysGen算法系統(tǒng)設計

電子設計 ? 來源:CSDN 博主 ? 作者: 沒落騎士 ? 2020-12-30 12:59 ? 次閱讀

一、前言

利用FPGA設計算法一直以來都是熱點,同樣也是難點。將復雜的數(shù)學公式 模型通過硬件系統(tǒng)來搭建,在低延時 高并行性等優(yōu)勢背后極大提高了設計難度和開發(fā)周期。Xilinx公司的sysGen(system generator)工具擴展了MATLABsimulink,提供很多IP Catalog中沒有的基礎模塊和針對DSP應用的硬件模型。工程師利用豐富的模塊和MATLAB強大的數(shù)據(jù)處理及可視化能力能夠更快速完成設計與仿真驗證工作。

二、sysGen算法系統(tǒng)設計

本文以個最簡單的例子講述利用sysGen搭建算法IP核,并集成到IP Integrator中作為ZYNQ PS端CPU的“定制外設”。僅用于測試目的。設計需求:在sysGen中搭建系統(tǒng),將輸入定點整數(shù)數(shù)據(jù)*2后輸出,輸入位寬為8bit。

pIYBAF9uKDmAGlS-AACLMgeqkdk369.png

在System Generator token中設定仿真步長為1sec。點擊需要觀測的信號連線,右擊選擇Xilinx add to viewer。啟動仿真并啟動Xilinx waveform viewer:

本質(zhì)上就是調(diào)用Vivado的XSim工具進行行為仿真。仿真結果可見完成預期目標,現(xiàn)雙擊System Generator token ,選擇Compiliation類型為IP Catalog并勾選Create testbench,按下Generate生成IP核。

三、仿真測試

根據(jù)User Guide介紹sysGen是“周期和比特精準的”,我們還是在Vivado環(huán)境下再次驗證下。netlist文件夾內(nèi)子文件夾ip_catalog中為IP核示例工程,由于自動生成了testbench,打開后直接進行行為仿真。sysGen在創(chuàng)建testbench時會將經(jīng)過gatein和gateout的數(shù)據(jù)儲存到文件中,testbench進行的工作為:將gatein數(shù)據(jù)作為測試激勵送入到相應設計輸入端口,之后把設計輸出得到結果與gateout文件數(shù)據(jù)進行逐一比較從而驗證設計是否與sysGen環(huán)境下仿真結果一致。

發(fā)現(xiàn)個比較有意思的現(xiàn)象,自動生成的testbench中clock生成并約束的50MHz,而是認為進行了拓展。

仿真波形如圖:

將clock處改動為50MHz后,經(jīng)過測試發(fā)現(xiàn)如果系統(tǒng)一開始就輸入數(shù)據(jù),前幾個數(shù)據(jù)沒有被真正處理,輸出錯誤??赡苁擒浖﨎UG吧,不過這種情況也非常少見,實際系統(tǒng)中輸入數(shù)據(jù)大多情況會啟動一段時間后才輸入。這里等待100ns后再啟動clock翻轉(zhuǎn):

改動后仿真波形:

四、AXI-Stream總線形式IP

到此算法IP的設計與驗證結束。如果想將這個IP核導入到IP Integrator中作為CPU的外設,其接口必須滿足AXI總線標準,因此回到sysGen中更改端口名稱和位寬。端口要符合AXI-Stream標準信號名稱,位寬為8bit整數(shù)倍。

o4YBAF9uKEiAVeSPAARNJArcqqo731.png

生成IP核后,打開新的工程,導入該IP核到repository。

五、Block Design系統(tǒng)搭建

系統(tǒng)結構與上一篇該系列博文類似,均是以AXI DMA為核心的Loop系統(tǒng),只是將AXI-Stream Data FIFO改成了自定義IP核。由于IP核slave和master接口只包含tdata和tvalid信號,因此需要添加接口銜接的一些簡單邏輯。tready信號和tkeep信號直接連接constant使用常數(shù)驅(qū)動,DMA的s_axis_s2mm接口的tlast由wrapper內(nèi)計數(shù)器邏輯驅(qū)動,將system中FCLK_CLK0 peripheral_aresetn m_axis_tvalid和s_axis_s2mm_tlast信號引出到wrapper中。

有一點比較坑:自定義IP通過AXI總線與DMA互聯(lián)時,總線下相應的接口不一定會正確對應,所以需要分別將兩端的每個接口相連??梢酝ㄟ^打開綜合后的設計來確認連線無誤。

自動生成wrapper后改動添加代碼如下:
`timescale 1 ps / 1 ps

module user_wrapper
(DC,
DDR_addr,
DDR_ba,
DDR_cas_n,
DDR_ck_n,
DDR_ck_p,
DDR_cke,
DDR_cs_n,
DDR_dm,
DDR_dq,
DDR_dqs_n,
DDR_dqs_p,
DDR_odt,
DDR_ras_n,
DDR_reset_n,
DDR_we_n,
//FCLK_CLK0,
FIXED_IO_ddr_vrn,
FIXED_IO_ddr_vrp,
FIXED_IO_mio,
FIXED_IO_ps_clk,
FIXED_IO_ps_porb,
FIXED_IO_ps_srstb,
RES,
SCLK,
SDIN,
VBAT,
VDD
//m_axis_tvalid,
//peripheral_aresetn,
//s_axis_s2mm_tlast
);
output DC;
inout [14:0]DDR_addr;
inout [2:0]DDR_ba;
inout DDR_cas_n;
inout DDR_ck_n;
inout DDR_ck_p;
inout DDR_cke;
inout DDR_cs_n;
inout [3:0]DDR_dm;
inout [31:0]DDR_dq;
inout [3:0]DDR_dqs_n;
inout [3:0]DDR_dqs_p;
inout DDR_odt;
inout DDR_ras_n;
inout DDR_reset_n;
inout DDR_we_n;
//output FCLK_CLK0;
inout FIXED_IO_ddr_vrn;
inout FIXED_IO_ddr_vrp;
inout [53:0]FIXED_IO_mio;
inout FIXED_IO_ps_clk;
inout FIXED_IO_ps_porb;
inout FIXED_IO_ps_srstb;
output RES;
output SCLK;
output SDIN;
output VBAT;
output VDD;
//output [0:0]m_axis_tvalid;
//output [0:0]peripheral_aresetn;
//input s_axis_s2mm_tlast;

localparam DATA_NUM = 256;

wire DC;
wire [14:0]DDR_addr;
wire [2:0]DDR_ba;
wire DDR_cas_n;
wire DDR_ck_n;
wire DDR_ck_p;
wire DDR_cke;
wire DDR_cs_n;
wire [3:0]DDR_dm;
wire [31:0]DDR_dq;
wire [3:0]DDR_dqs_n;
wire [3:0]DDR_dqs_p;
wire DDR_odt;
wire DDR_ras_n;
wire DDR_reset_n;
wire DDR_we_n;
wire FCLK_CLK0;
wire FIXED_IO_ddr_vrn;
wire FIXED_IO_ddr_vrp;
wire [53:0]FIXED_IO_mio;
wire FIXED_IO_ps_clk;
wire FIXED_IO_ps_porb;
wire FIXED_IO_ps_srstb;
wire RES;
wire SCLK;
wire SDIN;
wire VBAT;
wire VDD;
wire [0:0]m_axis_tvalid;
wire [0:0]peripheral_aresetn;
wire s_axis_s2mm_tlast;

reg [8-1:0] cnt;
wire add_cnt;
wire end_cnt;

system system_i
(.DC(DC),
.DDR_addr(DDR_addr),
.DDR_ba(DDR_ba),
.DDR_cas_n(DDR_cas_n),
.DDR_ck_n(DDR_ck_n),
.DDR_ck_p(DDR_ck_p),
.DDR_cke(DDR_cke),
.DDR_cs_n(DDR_cs_n),
.DDR_dm(DDR_dm),
.DDR_dq(DDR_dq),
.DDR_dqs_n(DDR_dqs_n),
.DDR_dqs_p(DDR_dqs_p),
.DDR_odt(DDR_odt),
.DDR_ras_n(DDR_ras_n),
.DDR_reset_n(DDR_reset_n),
.DDR_we_n(DDR_we_n),
.FCLK_CLK0(FCLK_CLK0),
.FIXED_IO_ddr_vrn(FIXED_IO_ddr_vrn),
.FIXED_IO_ddr_vrp(FIXED_IO_ddr_vrp),
.FIXED_IO_mio(FIXED_IO_mio),
.FIXED_IO_ps_clk(FIXED_IO_ps_clk),
.FIXED_IO_ps_porb(FIXED_IO_ps_porb),
.FIXED_IO_ps_srstb(FIXED_IO_ps_srstb),
.RES(RES),
.SCLK(SCLK),
.SDIN(SDIN),
.VBAT(VBAT),
.VDD(VDD),
.m_axis_tvalid(m_axis_tvalid),
.peripheral_aresetn(peripheral_aresetn),
.s_axis_s2mm_tlast(s_axis_s2mm_tlast));

always @(posedge FCLK_CLK0)begin
if(!peripheral_aresetn)begin
cnt end
else if(add_cnt)begin
if(end_cnt)
cnt else
cnt end
end

assign add_cnt = m_axis_tvalid;
assign end_cnt = add_cnt && cnt== DATA_NUM-1;

assign s_axis_s2mm_tlast = end_cnt;

endmodule

user_wrapper

當自定義IP核輸出256個數(shù)據(jù)時,拉高tlast信號結束傳輸。打開綜合后的設計,添加調(diào)試探針,抓取DMA與自定義IP之間的接口信號,set up debug后完成接下來的流程。

六、軟硬件聯(lián)調(diào)

在硬件系統(tǒng)中定義數(shù)據(jù)幀長度為256個,數(shù)據(jù)位寬為16bit,因此C代碼中DMA啟動傳輸函數(shù)中數(shù)據(jù)長度參數(shù)為512byte。測試數(shù)據(jù)生成與檢測代碼非常簡單:

我們直接查看ILA抓取AXI S總線波形:


看到CPU產(chǎn)生數(shù)據(jù)從1到4重復遞增,IP核輸出結果從2到8重復遞增,輸出為輸入的2倍。

傳輸完成后進入DMA發(fā)送和接收中斷,軟件檢測結果正確。在Memory窗口能夠直接查看內(nèi)存絕對地址里的數(shù)據(jù),選定DDR接收緩存區(qū)起始地址,其中的數(shù)據(jù)與AXI總線傳回數(shù)據(jù)一致,證明系統(tǒng)聯(lián)調(diào)成功。之后任意算法模塊均可采用本文方式進行設計和集成,可以說一勞永逸!

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    為什么FPGA屬于硬件,還需要搞算法?

    交流學習,共同進步。 交流問題(一) Q:為什么FPGA屬于硬件,還需要搞算法? 剛?cè)腴T準備學fpga但一開始學的是語法,感覺像是電路用軟件語言描述出來,fpga
    發(fā)表于 09-09 16:54

    基于 FPGA 的會議系統(tǒng)設計

    比較好的魯棒性。Adaboost 是一種 迭代算法,其核心思想是針對同一個訓練集訓練不同的弱分類器,然后把這些弱 分類器集合起來,構成一個更強的最終分類器。Adaboost 算法系統(tǒng)具有較高的 檢測
    發(fā)表于 08-01 18:40

    FPGA能實現(xiàn)什么樣的算法

    FPGA功能如此強大,請問用FPGA能實現(xiàn)或者比較適合實現(xiàn)什么樣的算法?
    發(fā)表于 05-26 20:18

    基于FPGA的實時邊緣檢測系統(tǒng)設計,Sobel圖像邊緣檢測,FPGA圖像處理

    摘要 :本文設計了一種 基于 FPGA 的實時邊緣檢測系統(tǒng) ,使用OV5640 攝像頭模塊獲取實時的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設計和 并行運算加速
    發(fā)表于 05-24 07:45

    算法系列:彩色轉(zhuǎn)灰度

    今天和大俠簡單聊一聊彩色轉(zhuǎn)灰度的算法,話不多說,上貨。 一、基礎  對于彩色轉(zhuǎn)灰度,有一個很著名的心理學公式: Gray = R*0.299 + G*0.587 + B*0.114 二
    發(fā)表于 05-22 19:02

    基于FPGA的常見的圖像算法模塊總結

    意在給大家補充一下基于FPGA的圖像算法基礎,于是講解了一下常見的圖像算法模塊,經(jīng)過個人的總結,將知識點分布如下所示。
    的頭像 發(fā)表于 04-28 11:45 ?415次閱讀
    基于<b class='flag-5'>FPGA</b>的常見的圖像<b class='flag-5'>算法</b>模塊總結

    基于 FPGA 的光纖混沌加密系統(tǒng)

    。FPGA 設計加密算法具有安全性高,加密速度快,開發(fā)周期短,開發(fā)成本較低,可重配,可靠性高以及移植性好等優(yōu)點。 3.2 混沌序列密鑰設計 混沌序列的產(chǎn)生主要有兩類:一類是利用微分方程表示的混沌系統(tǒng)
    發(fā)表于 04-26 17:18

    算法系列:基于 FPGA 的圖像邊緣檢測系統(tǒng)設計(sobel算法

    今天給大俠帶來基于 FPGA 的圖像邊緣檢測設計,話不多說,上貨。 設計流程如下:mif文件的制作→ 調(diào)用 ip 核生成rom以及仿真注意問題→ 灰度處理→ 均值濾波:重點是3*3 像素陣列
    發(fā)表于 03-26 16:40

    怎么用FPGA算法 如何在FPGA上實現(xiàn)最大公約數(shù)算法

    FPGA算法的優(yōu)點在于它們可以提供高度的定制化和靈活性,使得算法可以根據(jù)實際需求進行優(yōu)化和調(diào)整。此外,FPGA還可以實現(xiàn)硬件加速,提供比傳統(tǒng)處理器更高的計算性能和吞吐量。因此,
    的頭像 發(fā)表于 01-15 16:03 ?1515次閱讀

    FPGA圖像處理之CLAHE算法

    FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發(fā)表于 01-04 12:23 ?2103次閱讀
    <b class='flag-5'>FPGA</b>圖像處理之CLAHE<b class='flag-5'>算法</b>

    浮點LMS算法FPGA實現(xiàn)

    運算的運算步驟遠比定點運算繁瑣,運算速度慢且所需硬件資源大大增加,因此基于浮點運算的LMS算法的硬件實現(xiàn)一直以來是學者們研究的難點和熱點。 本文正是基于這種高效結構的多輸入FPA,在FPGA上成功實現(xiàn)了基于浮點運算的LMS算法。
    的頭像 發(fā)表于 12-21 16:40 ?591次閱讀

    fpga布局布線算法加速

    現(xiàn)代電子設備中,針對復雜的數(shù)字電路,FPGA(Field-Programmable Gate Array)是一種非常優(yōu)秀的可編程邏輯器件。在FPGA的設計過程中,布局布線算法是關鍵步驟之一,其主要
    的頭像 發(fā)表于 12-20 09:55 ?593次閱讀

    基于FPGA的窄帶干擾抑制算法的實現(xiàn)方案

    電子發(fā)燒友網(wǎng)站提供《基于FPGA的窄帶干擾抑制算法的實現(xiàn)方案.pdf》資料免費下載
    發(fā)表于 11-07 09:29 ?0次下載
    基于<b class='flag-5'>FPGA</b>的窄帶干擾抑制<b class='flag-5'>算法</b>的實現(xiàn)方案

    自動兵力生成算法系統(tǒng)有哪些

    智慧華盛恒輝自動兵力生成算法通常涉及到人工智能和機器學習的技術,用于在游戲中自動生成具有智能和行為的虛擬兵力。以下是一些常見的自動兵力生成算法: 第一名華盛恒輝科技有限公司上榜理由:華盛恒輝是一家
    的頭像 發(fā)表于 10-31 15:57 ?301次閱讀

    智慧礦山ai算法系列解析 堵料檢測算法功能優(yōu)勢

    智慧礦山AI算法系列中的堵料檢測算法的功能優(yōu)勢,了解其重要性和帶來的價值
    的頭像 發(fā)表于 09-28 18:48 ?568次閱讀
    智慧礦山ai<b class='flag-5'>算法系</b>列解析 堵料檢測<b class='flag-5'>算法</b>功能優(yōu)勢