0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

重點介紹hls軟件的使用方法和優(yōu)化方法

FPGA之家 ? 來源:數(shù)字積木 ? 作者:鞏文紅 ? 2021-06-17 10:20 ? 次閱讀

【引言】

本系列教程演示如何使用xilinx的HLS工具進行算法硬件加速。分為三個部分,分別為HLS端IP設(shè)計,vivado硬件環(huán)境搭建,SDK端軟件控制。 在HLS端,要將進行硬件加速的軟件算法轉(zhuǎn)換為RTL級電路,生成便于嵌入式使用的axi控制端口,進行數(shù)據(jù)的傳輸和模塊的控制。

【HLS介紹】

HLS可以將算法直接映射為RTL電路,實現(xiàn)了高層次綜合。vivado-HLS可以實現(xiàn)直接使用 C,C++ 以及 System C 語言對Xilinx的FPGA器件進行編程。用戶無需手動創(chuàng)建 RTL,通過高層次綜合生成HDL級的IP核,從而加速IP創(chuàng)建。 HLS的官方參考文檔主要為:ug871( ug871-vivado-high-level-synthesis-tutorial.pdf )和ug902(ug902-vivado-high-level-synthesis.pdf)。 對于Vivado Hls來說,輸入包括Tesbench,C/C++源代碼和Directives,相應(yīng)的輸出為IP Catalog,DSP和SysGen,特別的,一個工程只能有一個頂層函數(shù)用于綜和,這個頂層函數(shù)下面的子函數(shù)也是可以被綜合的,會生成相應(yīng)的VHDL和Verilog代碼,所以,C綜合后的RTL代碼結(jié)構(gòu)通常是跟原始C描述的結(jié)構(gòu)是一致的,除非是子函數(shù)功能很簡單,所需要的邏輯量很小。并不是所有的C/C++都可以被綜合,動態(tài)內(nèi)存分配和涉及到操作系統(tǒng)層面的操作不可以被綜合。 Vivado HLS 的設(shè)計流程如下:

pYYBAGDKsvaADvghAABy19gBEPo235.jpg

在整個流程中,用戶先創(chuàng)建一個設(shè)計 C、C++ 或 SystemC 源代碼,以及一個C的測試平臺。通過 Vivado HLS Synthesis 運行設(shè)計,生成 RTL 設(shè)計,代碼可以是 Verilog,也可以是 VHDL。有了 RTL 后,隨即可以執(zhí)行設(shè)計的 Verilog 或 VHDL 仿真,或使用工具的C封裝器技術(shù)創(chuàng)建 SystemC 版本。然后可以進行System C架構(gòu)級仿真,進一步根據(jù)之前創(chuàng)建的 C 測試平臺,驗證設(shè)計的架構(gòu)行為和功能。設(shè)計固化后,就可以通過 Vivado 設(shè)計套件的物理實現(xiàn)流程來運行設(shè)計,將設(shè)計編程到器件上,在硬件中運行和/或使用 IP 封裝器將設(shè)計轉(zhuǎn)為可重用的 IP。

Step 1: 新建一個工程

1,Creat New Project新建文檔,輸入工程名稱和工程路徑。完成后點擊Next。

2,添加設(shè)計文件,并制定頂層函數(shù)。完成后點擊Next。

3,添加C語言仿真文件。完成后點擊Next。

4,:配置Solution Name,一般默認即可。配置Clock Period,單位是ns。配置Uncertainty,默認為空。選擇產(chǎn)品型號。完成后點擊Finish。

5,工程新建成功后進入的開發(fā)界面,HLS是典型的Eclipse界面,和SDK的界面十分相似。

導入的文件的代碼如下: 1,源文件。axi_interfaces.c

#include"axi_interfaces.h"void axi_interfaces (dout_t d_o[N], din_t d_i[N]) {inti,rem;// Store accumulated datastaticdacc_tacc[CHANNELS];axi_interfaces_label0:for (i=0;i

#ifndef AXI_INTERFACES_H_ #defineAXI_INTERFACES_H_ #include typedef int din_t; typedef int dout_t; typedefintdacc_t; #define CHANNELS 8 #define SAMPLES 4 #defineNCHANNELS*SAMPLES voidaxi_interfaces(dout_td_o[N],din_td_i[N]); #endif 3,測試文件。axi_interfaces_test.c

#include "axi_interfaces.h" int main () { // Create input data din_t d_i[N] = {10, 20, 30, 40, 50, 60, 70, 80, 11, 21, 31, 41, 51, 61, 71, 81, 12, 22, 32, 42, 52, 62, 72, 82, 13, 23, 33, 43, 53, 63, 73, 83}; dout_t d_o[N]; int i, retval=0; FILE*fp; // Call the function to operate on the data axi_interfaces(d_o,d_i); // Save the results to a file fp=fopen("result.dat","w"); fprintf(fp, "Din Dout "); for(i=0;i

Din Dout 10 10 20 20 30 30 40 40 50 50 60 60 70 70 80 80 11 21 21 41 31 61 41 81 51 101 61 121 71 141 81 161 12 33 22 63 32 93 42 123 52 153 62 183 72 213 82 243 13 46 23 86 33 126 43 166 53 206 63 246 73 286 83 326
Step 2: C源代碼驗證

本步驟是對功能代碼的邏輯驗證,相當于功能前仿。

1,測試程序的代碼入下圖。該程序先調(diào)用綜合的函數(shù),得到計算結(jié)果,再和預(yù)先的數(shù)據(jù)集進行比較,最后返回計較的結(jié)果。計算結(jié)果和預(yù)先的數(shù)據(jù)集一致時,測試通過,不一致時,測試失敗。需要查看代碼,尋找錯誤。

2,點擊紅框中的按鈕,開始C源代碼驗證。

pYYBAGDKsu2ADloIAACtBnQ33mc233.jpg

3,驗證的結(jié)果顯示在控制欄中。如圖顯示,測試通過。

poYBAGDKsuWAVYNaAADwTfPh_wI718.jpg

4,在頭文件中,重定義了數(shù)據(jù)類型,參數(shù),并進行了函數(shù)聲明。

Step 3: 高層次綜合

本步驟是把功能代碼的綜合成RTL邏輯。 1,點擊紅框中的按鈕,將C代碼綜合成RTL。綜合完成后,查看結(jié)果。

poYBAGDKst2AZCWvAADzLQvlifo703.jpg

2,綜合完成后,查看綜合報告。包括時序,延時,資源占用,端口信息等。

3,端口分析。(1)控制端口用于控制和顯示該模塊的工作狀態(tài)。各個端口的功功能如下,默認情況下會生成下面四個控制端口。 lap_start(in):為高時,該模塊開始處理數(shù)據(jù)。 lap_done(out):為高時,表示模塊處理數(shù)據(jù)完成。 lap_idle(out):表明模塊是否處于空閑態(tài)。高電平有效。為高時,該處于空閑態(tài)。 lap_ready(out):為高時,表示模塊可以接受新的數(shù)據(jù)。(2)數(shù)據(jù)端口用于傳遞模塊的輸入輸出參數(shù)。 參數(shù)d_o,d_i 為數(shù)組類型,故默認狀態(tài)下回生成內(nèi)存接口。內(nèi)存接口 (數(shù)組類型參數(shù))數(shù)據(jù)來自外部的memory,通過地址信號讀取相應(yīng)的數(shù)據(jù),輸入到該模塊中。輸入數(shù)組從外部內(nèi)存中讀源數(shù)據(jù),輸出數(shù)組從向外部內(nèi)存寫入結(jié)果數(shù)據(jù)。各個端口的定義如下。 laddress:地址信號 lce0:片選信號 lwe0:寫使能信號 ld0 :數(shù)據(jù)信號 4,綜合結(jié)果分析。 在分析界面,可以看到模塊的運行情況。包括數(shù)據(jù)依賴關(guān)系和各個周期執(zhí)行的操作,IO口的讀寫,內(nèi)存端口的訪問等等。

Step4: 綜合優(yōu)化

在使用高層次綜合,創(chuàng)造高質(zhì)量的RTL設(shè)計時,一個重要部分就是對C代碼進行優(yōu)化。 Vivado HLS擁有自動優(yōu)化的功能,試圖最小化loop(循環(huán))和function(函數(shù))的latency。除了自動優(yōu)化,我們可以手動進行程序優(yōu)化,即用在不同的solution中添加不同的directive(優(yōu)化指令)的方法,進行優(yōu)化和性能對比。其中,對同一個工程,可以建立多個不同的solution(解決方案),為不同的solution添加directive可以達到如下目的。 優(yōu)化的類型可分為如下類別: l端口優(yōu)化。指定不同類型的模塊端口。 l函數(shù)優(yōu)化。加快函數(shù)的執(zhí)行速度,減小執(zhí)行周期。 l循壞優(yōu)化。利用展開和流水線形式,減小循環(huán)的執(zhí)行周期。
1,點擊下面紅框的圖標,新建solution。

pYYBAGDKstaAdraXAAC_fIjBGxs394.jpg

2,不同solution位于不同的文件夾中。

3,選中綜合文件。可以在direct框中看可進行優(yōu)化的標簽。

4,雙擊選擇d_o,選擇interface,s_axilite。點擊ok。將d_o的端口類型設(shè)置為s_axilite類型。

5,參考d_o,將d_i的接口類型也設(shè)置為s_axilite。將d_i的端口類型設(shè)置為s_axilite類型。

6,雙擊選擇函數(shù)名稱axi_interface,選擇interface,s_axilite。點擊ok。將控制端口的端口類型設(shè)置為s_axilite類型。

7,雙擊循環(huán)標簽,選擇流水線優(yōu)化(pipeline),點擊ok。

8,雙擊循環(huán)標簽,選擇循環(huán)展開優(yōu)化(unroll),點擊ok。

9,同上,也將標簽為for_loop的循環(huán)進行流水線和展開優(yōu)化。
10,最終的優(yōu)化情況總結(jié)如下。

11,重新進行函數(shù)綜合,查看綜合報告如下。

pYYBAGDKssuAEunDAADmmdA20fU769.jpg

12,分析。 同未優(yōu)化相比,優(yōu)化過后的函數(shù)綜合后生成的模塊的運行時鐘大大減小。端口的接口類型也變?yōu)榱薬xi_lite端口。但資源占用率有所增加,也體現(xiàn)了用資源換速度的設(shè)計理念。

Step5: 綜合結(jié)果文件

綜合完成后,在各個solution的syn文件夾中可以看到綜合器生成的RTL代碼。包括systemc,VHDL,Verilog。

Step6:導出IP

在菜單里Solution>Export TL,設(shè)置如下,點擊ok。

pYYBAGDKssOAJUGKAACpu83LYA4549.jpg

IP封裝完成后,會在impl文件夾中輸出ip文件夾,其中包含了RTL代碼(hdl),模塊驅(qū)動(drivers),文檔(doc)等信息,其中包含一個壓縮包文件,是用于建立vivado工程所用的IP壓縮包。

Step7:總結(jié)

本文重點講解了hls軟件的使用方法和優(yōu)化方法,在C語言模塊設(shè)計上沒有重點講解。在掌握了hls軟件的基本用法和優(yōu)化方法后,接下來就可以設(shè)計更加復(fù)雜的C語言模塊,進行rtl綜合,加快設(shè)計開發(fā)的速度。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • HLS
    HLS
    +關(guān)注

    關(guān)注

    1

    文章

    128

    瀏覽量

    23916

原文標題:Vivado-hls使用實例

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DC/DC模擬的基本使用方法和特性確認方法

    本篇介紹了DC/DC模擬的基本使用方法及確認基本特性的方法
    的頭像 發(fā)表于 08-20 17:08 ?329次閱讀
    DC/DC模擬的基本<b class='flag-5'>使用方法</b>和特性確認<b class='flag-5'>方法</b>

    優(yōu)化 FPGA HLS 設(shè)計

    優(yōu)化 FPGA HLS 設(shè)計 用工具用 C 生成 RTL 的代碼基本不可讀。以下是如何在不更改任何 RTL 的情況下提高設(shè)計性能。 介紹 高級設(shè)計能夠以簡潔的方式捕獲設(shè)計,從而
    發(fā)表于 08-16 19:56

    DC/DC模擬器的特征和使用方法

    本篇介紹了特瑞仕在官網(wǎng)提供的DC/DC模擬器的特征和使用方法
    的頭像 發(fā)表于 07-18 16:17 ?417次閱讀
    DC/DC模擬器的特征和<b class='flag-5'>使用方法</b>

    淺談錫膏的儲存及使用方法

    錫膏(焊錫膏)是電子組裝過程中常用的材料,它的儲存和使用方法對保證焊接質(zhì)量和性能至關(guān)重要。以下是詳細的儲存及使用方法
    的頭像 發(fā)表于 06-27 10:02 ?481次閱讀

    可編程電源使用方法

    可編程電源使用方法 可編程電源使用方法 摘要:本文詳細介紹了可編程電源的使用方法,包括其基本概念、主要功能、選擇原則、操作步驟、注意事項以及實際應(yīng)用案例,旨在幫助讀者全面了解可編程電源
    的頭像 發(fā)表于 06-10 15:29 ?569次閱讀

    手柄控制代碼及使用方法

    手柄控制代碼及使用方法
    的頭像 發(fā)表于 05-15 10:19 ?925次閱讀

    RA MCU中的CRC模塊和使用方法

    瑞薩RA單片機硬件CRC計算單元采用固定的多項式發(fā)生器來計算8位或者32位數(shù)據(jù)的CRC校驗值,對數(shù)據(jù)傳輸或數(shù)據(jù)存儲的一致性、完整性進行驗證。這篇文章重點介紹RA MCU中的CRC模塊和使用方法。
    發(fā)表于 02-26 11:45 ?646次閱讀
    RA MCU中的CRC模塊和<b class='flag-5'>使用方法</b>

    磁場探頭和電場探頭的使用方法與技巧

    磁場探頭和電場探頭的使用方法與技巧? 磁場探頭和電場探頭是用于測量磁場和電場的儀器。它們在科學實驗、工程設(shè)計和實際應(yīng)用中都起著重要的作用。本文將詳細介紹磁場探頭和電場探頭的使用方法和技巧。 一、磁場
    的頭像 發(fā)表于 01-05 14:31 ?635次閱讀

    SUMIF函數(shù)的使用方法

    SUMIF函數(shù)是Excel中常用的求和函數(shù)之一,它可以根據(jù)指定的條件對范圍內(nèi)的數(shù)值進行求和。本文將詳細介紹SUMIF函數(shù)的使用方法,并通過實例演示其具體操作。 SUMIF函數(shù)的語法如下: SUMIF
    的頭像 發(fā)表于 11-30 16:34 ?4488次閱讀

    C語言循環(huán)結(jié)構(gòu)的使用方法

    詳細介紹了C語言while循環(huán)結(jié)構(gòu)、do-while循環(huán)結(jié)構(gòu)、for循環(huán)結(jié)構(gòu)、循環(huán)退出語句的語法和使用方法。
    發(fā)表于 11-02 11:26 ?1141次閱讀
    C語言循環(huán)結(jié)構(gòu)的<b class='flag-5'>使用方法</b>

    AT32 MCU Printf的功能使用方法

    AT32 MCU Printf的功能使用方法
    的頭像 發(fā)表于 10-27 09:27 ?835次閱讀
    AT32 MCU Printf的功能<b class='flag-5'>使用方法</b>

    AT32F435/437系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序

    AT32F435/437 Security Library Application Note主要在闡述AT32F435/437系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序。
    發(fā)表于 10-25 07:22

    AT32F403A/407系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序

    AT32F403A/407 Security Library Application Note主要在闡述AT32F403A/407系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序。
    發(fā)表于 10-24 07:29

    AT32F415系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序

    AT32F415 Security Library Application Note主要在闡述AT32F415系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序。
    發(fā)表于 10-24 07:08

    AT32F421系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序

    AT32F421 Security Library Application Note主要在闡述AT32F421系列安全庫區(qū)的應(yīng)用原理、軟件使用方法及范例程序。
    發(fā)表于 10-24 07:00