0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何合理優(yōu)化FPGA架構(gòu)設(shè)計(jì)及配方法

e9Zb_gh_8734352 ? 來(lái)源:未知 ? 作者:龔婷 ? 2018-03-20 11:18 ? 次閱讀

如果符合一些簡(jiǎn)單的設(shè)計(jì)原則,采用最新的Xilinx7系列FPGA架構(gòu)上實(shí)現(xiàn)無(wú)線(xiàn)通信。Xilinx公司已經(jīng)創(chuàng)建了典型無(wú)線(xiàn)數(shù)據(jù)路徑的設(shè)計(jì)范例,表明中速級(jí)(-2)器件上使用的幾乎100%的 slice資源都支持500 MHz以上的時(shí)鐘頻率。如何真正時(shí)序高速設(shè)計(jì),需要注意一下幾點(diǎn)

影響時(shí)鐘頻率的基本規(guī)則

01

DSP48 slice數(shù)與時(shí)鐘速率成反比

一般來(lái)說(shuō)DSP48 slice數(shù)與時(shí)鐘速率成反比。Block RAM資源也按照階躍函數(shù)隨時(shí)鐘速率降低。這在無(wú)線(xiàn)電信號(hào)處理設(shè)計(jì)中較常見(jiàn),其中Block RAM基本上用來(lái)按照相對(duì)高的采樣率存儲(chǔ)大量函數(shù)運(yùn)算的系數(shù)集合,例如,DDS(直接數(shù)字合成器)的正弦/余弦值,峰值抵消脈沖產(chǎn)生器中的CFR (波峰因數(shù)衰減)系數(shù),或DPD (數(shù)字預(yù)失真)模型中的非線(xiàn)性函數(shù)抽樣。

所以,提供時(shí)鐘頻率能夠降低Slice和BlockRAM的資源利用,當(dāng)時(shí)鐘頻率從368.64轉(zhuǎn)換至491.52 MHz(1.33時(shí)鐘比) ,按照比例LUT和FF的數(shù)據(jù)量分別減少了1.34和1.44倍。將時(shí)鐘速率從245.76放大一倍至491.52 MHz,這些數(shù)據(jù)減少了1.8倍和1.7倍。這種非線(xiàn)性行為基本上是為執(zhí)行信號(hào)處理控制邏輯,不需要按照時(shí)鐘頻率進(jìn)行線(xiàn)性放大。

02

信號(hào)采樣率也影響資源利用率

采樣速率為25 Msamples/sec的濾波器帶寬在250 MHz運(yùn)行時(shí)與帶寬在500 MHz運(yùn)行時(shí)相比所需的邏輯資源略降低兩倍。采樣速率為500 Msamples/sec的多相實(shí)現(xiàn)帶寬在250 MHz運(yùn)行時(shí)與帶寬在500 MHz時(shí)相比,所需的邏輯資源增加兩倍。對(duì)邏輯資源使用的一階估計(jì)是時(shí)鐘頻率增加x倍相當(dāng)于邏輯利用率減少0.85至1.1倍

高速設(shè)計(jì)其他注意事項(xiàng)

01

流水線(xiàn)設(shè)計(jì)

適當(dāng)?shù)牧魉€(xiàn)程序當(dāng)然是設(shè)計(jì)高速程序的關(guān)鍵因素,所有的高速設(shè)計(jì)都推崇流水線(xiàn)設(shè)計(jì),在此不做詳細(xì)描述

02

合理使用BlockRAM

需要構(gòu)建一個(gè)以上Block RAM的存儲(chǔ)時(shí),可通過(guò)選擇最大限度地減少數(shù)據(jù)復(fù)用和資源利用的配置優(yōu)化速度。舉例來(lái)說(shuō), 存儲(chǔ)16位數(shù)據(jù)的16K存儲(chǔ)器最好使用16K × 1位的Block RAM進(jìn)行構(gòu)建,而不是1K × 16位的Block RAM.

03

正確使用DSP Slice

DSP slice邏輯本質(zhì)上可支持較高的時(shí)鐘速率。邏輯電平與數(shù)據(jù)路由路徑的數(shù)量限制了速度,因此在構(gòu)建高速設(shè)計(jì)時(shí)應(yīng)在每一個(gè)或兩個(gè)LUT電平上插入一個(gè)寄存器

04

合理的層次結(jié)構(gòu)

定義合理的層次結(jié)構(gòu),按照邏輯分區(qū)將設(shè)計(jì)劃分成相應(yīng)的功能模塊。這種層次結(jié)構(gòu)提供便于在層次邊界寄存輸出的方法,從而限制特定模塊的關(guān)鍵路徑。這樣分析和修復(fù)在單一模塊中定位的時(shí)序路徑就很容易。實(shí)際上,定位超高時(shí)鐘速度時(shí),應(yīng)在層次結(jié)構(gòu)的一些層級(jí)使用多個(gè)寄存器級(jí),以?xún)?yōu)化時(shí)序并為后端工具留下更多設(shè)計(jì)空間。好的設(shè)計(jì)層次結(jié)構(gòu)應(yīng)該將相關(guān)的邏輯集成在一起,使得區(qū)域分組和邏輯壓縮更為有效;

建立適當(dāng)?shù)膶哟谓Y(jié)構(gòu)可在多個(gè)模塊時(shí)獲取可重復(fù)結(jié)果

在模塊級(jí)應(yīng)用實(shí)現(xiàn)屬性,可令代碼簡(jiǎn)單并具可擴(kuò)展性,該屬性可傳播該模塊中聲明的所有信號(hào)

05

良好的時(shí)鐘管理和時(shí)鐘分配方法

盡可能減少獨(dú)立主時(shí)鐘數(shù)量

將時(shí)鐘元件放在設(shè)計(jì)層次結(jié)構(gòu)的頂層,以便在多個(gè)模塊共享時(shí)鐘,這將減少所需的時(shí)鐘資源,提高時(shí)序性能,并降低資源和功率利用率

在不相關(guān)時(shí)鐘域之間使用適當(dāng)?shù)脑偻郊夹g(shù)

限制時(shí)鐘“使能”的使用。實(shí)際上這條規(guī)則難以實(shí)現(xiàn),原因是在多周期實(shí)現(xiàn)中時(shí)鐘“使能”通常需要評(píng)估數(shù)據(jù)樣本或操作符輸出。實(shí)現(xiàn)有效的降低功耗技術(shù)很有效。在任何情況下,必須適當(dāng)寄存時(shí)鐘使能信號(hào)以刪除高扇出 nets

06

復(fù)位策略

最小化復(fù)位網(wǎng)絡(luò)的大小

避免全局復(fù)位。

優(yōu)選同步復(fù)位,實(shí)際上對(duì)DSP48邏輯片和Block RAM是強(qiáng)制的。

總結(jié)

高速設(shè)計(jì)時(shí)FPGA設(shè)計(jì)的未來(lái),隨著信號(hào)處理能力的增強(qiáng),F(xiàn)PGA高速設(shè)計(jì)必不可少。如何合理優(yōu)化FPGA架構(gòu)設(shè)計(jì)是我們必須要考慮的問(wèn)題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1625

    文章

    21623

    瀏覽量

    601242
  • 時(shí)鐘
    +關(guān)注

    關(guān)注

    10

    文章

    1714

    瀏覽量

    131277
  • 無(wú)線(xiàn)電信號(hào)

    關(guān)注

    1

    文章

    50

    瀏覽量

    12785

原文標(biāo)題:高速FPGA系統(tǒng)設(shè)計(jì)幾條軍規(guī)

文章出處:【微信號(hào):gh_873435264fd4,微信公眾號(hào):FPGA技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深入理解 Llama 3 的架構(gòu)設(shè)計(jì)

    在人工智能領(lǐng)域,對(duì)話(huà)系統(tǒng)的發(fā)展一直是研究的熱點(diǎn)之一。隨著技術(shù)的進(jìn)步,我們見(jiàn)證了從簡(jiǎn)單的基于規(guī)則的系統(tǒng)到復(fù)雜的基于機(jī)器學(xué)習(xí)的模型的轉(zhuǎn)變。Llama 3,作為一個(gè)假設(shè)的先進(jìn)對(duì)話(huà)系統(tǒng),其架構(gòu)設(shè)計(jì)融合了
    的頭像 發(fā)表于 10-27 14:41 ?463次閱讀

    如何優(yōu)化FPGA設(shè)計(jì)的性能

    優(yōu)化FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)設(shè)計(jì)的性能是一個(gè)復(fù)雜而多維的任務(wù),涉及多個(gè)方面和步驟。以下是一些關(guān)鍵的優(yōu)化策略: 一、明確性能指標(biāo) 確定需求 :首先,需要明確FPGA設(shè)計(jì)的性能指標(biāo),包
    的頭像 發(fā)表于 10-25 09:23 ?132次閱讀

    邊緣計(jì)算架構(gòu)設(shè)計(jì)最佳實(shí)踐

    邊緣計(jì)算架構(gòu)設(shè)計(jì)最佳實(shí)踐涉及多個(gè)方面,以下是一些關(guān)鍵要素和最佳實(shí)踐建議: 一、核心組件與架構(gòu)設(shè)計(jì) 邊緣設(shè)備與網(wǎng)關(guān) 邊緣設(shè)備 :包括各種嵌入式設(shè)備、傳感器、智能手機(jī)、智能攝像頭等,負(fù)責(zé)采集原始數(shù)據(jù)
    的頭像 發(fā)表于 10-24 14:17 ?308次閱讀

    FPGA芯片架構(gòu)和資源有深入的理解,精通Verilog HDL、VHDL

    崗位職責(zé) 1.負(fù)責(zé)FPGA架構(gòu)設(shè)計(jì)、代碼編寫(xiě)、仿真等; 2.協(xié)同軟、硬件工程師完成系統(tǒng)聯(lián)調(diào)和測(cè)試; 3.負(fù)責(zé)項(xiàng)目中FPGA設(shè)計(jì)的相關(guān)文檔編寫(xiě)及維護(hù); 任職要求 1.碩士及以上學(xué)歷,電子、通信
    發(fā)表于 09-15 15:23

    優(yōu)化 FPGA HLS 設(shè)計(jì)

    對(duì) RTL 源代碼進(jìn)行任何更改即可實(shí)現(xiàn)的。 更高水平的性能 要達(dá)到更高的性能水平,需要在所有方面進(jìn)行優(yōu)化——架構(gòu)設(shè)計(jì)、代碼和工具。工具設(shè)置探索可以克服更高級(jí)別設(shè)計(jì)的性能權(quán)衡,而不會(huì)失去它首先帶來(lái)的生產(chǎn)力優(yōu)勢(shì)。這對(duì)于高級(jí)設(shè)計(jì)師來(lái)說(shuō)是雙贏。
    發(fā)表于 08-16 19:56

    交換芯片架構(gòu)設(shè)計(jì)

    交換芯片的架構(gòu)設(shè)計(jì)是網(wǎng)絡(luò)設(shè)備性能和功能的關(guān)鍵。一個(gè)高效的交換芯片架構(gòu)能夠處理大量的數(shù)據(jù)流量,支持高速數(shù)據(jù)傳輸,并提供先進(jìn)的網(wǎng)絡(luò)功能。
    的頭像 發(fā)表于 03-21 16:28 ?481次閱讀

    交換芯片架構(gòu)設(shè)計(jì)

    交換芯片架構(gòu)設(shè)計(jì)是網(wǎng)絡(luò)通信中的關(guān)鍵環(huán)節(jié),它決定了交換機(jī)的性能、功能和擴(kuò)展性。
    的頭像 發(fā)表于 03-18 14:12 ?613次閱讀

    fpga芯片架構(gòu)介紹

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)芯片架構(gòu)是一種高度靈活和可編程的集成電路架構(gòu),它以其獨(dú)特的結(jié)構(gòu)和功能,在現(xiàn)代電子系統(tǒng)中扮演著至關(guān)重要的角色。FPGA芯片
    的頭像 發(fā)表于 03-15 14:56 ?669次閱讀

    fpga是什么架構(gòu)

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)的架構(gòu)主要由可配置邏輯模塊(CLB)、輸入/輸出模塊(IOB)以及可編程互連資源組成。
    的頭像 發(fā)表于 03-14 17:05 ?788次閱讀

    華為企業(yè)架構(gòu)設(shè)計(jì)方法及實(shí)例

    企業(yè)架構(gòu)是一項(xiàng)非常復(fù)雜的系統(tǒng)性工程。公司在充分繼承原有架構(gòu)方法基礎(chǔ)上,博采眾家之長(zhǎng),融合基于職能的業(yè)務(wù)能力分析與基于價(jià)值的端到端流程分析,將”傳統(tǒng)架構(gòu)設(shè)計(jì)(TOGAF)”與“領(lǐng)域驅(qū)動(dòng)(
    發(fā)表于 01-30 09:40 ?818次閱讀
    華為企業(yè)<b class='flag-5'>架構(gòu)設(shè)</b>計(jì)<b class='flag-5'>方法</b>及實(shí)例

    智能座艙主流音頻架構(gòu)設(shè)計(jì)方案

    蔚來(lái)汽車(chē)NT1/NT2平臺(tái)座艙音頻系統(tǒng)的軟件架構(gòu)設(shè)計(jì)和研發(fā)工作都由我負(fù)責(zé),涉及到Android、QNX、Hypervisor等系統(tǒng)的音頻設(shè)計(jì)。今
    發(fā)表于 12-28 16:54 ?1149次閱讀
    智能座艙主流音頻<b class='flag-5'>架構(gòu)設(shè)</b>計(jì)方案

    揭秘GPU: 高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

    在計(jì)算領(lǐng)域,GPU(圖形處理單元)一直是性能飛躍的代表。眾所周知,高端GPU的設(shè)計(jì)充滿(mǎn)了挑戰(zhàn)。GPU的架構(gòu)創(chuàng)新,為軟件承接大模型訓(xùn)練和推理場(chǎng)景的人工智能計(jì)算提供了持續(xù)提升的硬件基礎(chǔ)。GPU架構(gòu)設(shè)
    的頭像 發(fā)表于 12-21 08:28 ?832次閱讀
    揭秘GPU: 高端GPU<b class='flag-5'>架構(gòu)設(shè)</b>計(jì)的挑戰(zhàn)

    TVM編譯器的整體架構(gòu)和基本方法

    。但是這其中也去思考了一下基于FPGA加速器的編譯器架構(gòu)。在FPGA深度學(xué)習(xí)加速器中,編譯器除了需要自動(dòng)化生成指令外,還要優(yōu)化指令的結(jié)構(gòu),來(lái)最大化加速器性能。TVM是一個(gè)支持GPU、C
    的頭像 發(fā)表于 11-30 09:36 ?2237次閱讀
    TVM編譯器的整體<b class='flag-5'>架構(gòu)</b>和基本<b class='flag-5'>方法</b>

    虹科方案 |?汽車(chē)電子電氣架構(gòu)設(shè)計(jì)仿真解決方案

    本文將介紹面向服務(wù)(SOA)的汽車(chē)TSN網(wǎng)絡(luò)架構(gòu),并探討RTaW-Pegase仿真與設(shè)計(jì)軟件在TSN網(wǎng)絡(luò)設(shè)計(jì)中的應(yīng)用。通過(guò)RTaW將設(shè)計(jì)問(wèn)題分解,我們可以更好地理解汽車(chē)電子電氣架構(gòu)設(shè)計(jì)的過(guò)程。
    的頭像 發(fā)表于 11-20 10:59 ?609次閱讀
    虹科方案 |?汽車(chē)電子電氣<b class='flag-5'>架構(gòu)設(shè)</b>計(jì)仿真解決方案

    汽車(chē)電子電氣架構(gòu)設(shè)計(jì)仿真解決方案

    本文將介紹面向服務(wù)(SOA)的汽車(chē)TSN網(wǎng)絡(luò)架構(gòu),并探討RTaW-Pegase仿真與設(shè)計(jì)軟件在TSN網(wǎng)絡(luò)設(shè)計(jì)中的應(yīng)用。通過(guò)RTaW將設(shè)計(jì)問(wèn)題分解,我們可以更好地理解汽車(chē)電子電氣架構(gòu)設(shè)計(jì)的過(guò)程。
    的頭像 發(fā)表于 11-13 15:08 ?1190次閱讀
    汽車(chē)電子電氣<b class='flag-5'>架構(gòu)設(shè)</b>計(jì)仿真解決方案