0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用FPGA實現(xiàn)FFT算法?

FPGA設(shè)計論壇 ? 來源:未知 ? 2023-10-09 14:30 ? 次閱讀

點擊上方藍字關(guān)注我們

引言
DFT(Discrete Fourier Transformation)是數(shù)字信號分析與處理如圖形、語音及圖像等領(lǐng)域的重要變換工具,直接計算DFT的計算量與變換區(qū)間長度N的平方成正比。當(dāng)N較大時,因計算量太大,直接用DFT算法進行譜分析和信號的實時處理是不切實際的??焖俑盗⑷~變換(Fast Fourier Transformation,簡稱FFT)使DFT運算效率提高1~2個數(shù)量級。其原因是當(dāng)N較大時,對DFT進行了基4和基2分解運算。FFT算法除了必需的數(shù)據(jù)存儲器ram和旋轉(zhuǎn)因子rom外,仍需較復(fù)雜的運算和控制電路單元,即使現(xiàn)在,實現(xiàn)長點數(shù)的FFT仍然是很困難。本文提出的FFT實現(xiàn)算法是基于FPGA之上的,算法完成對一個序列的FFT計算,完全由脈沖觸發(fā),外部只輸入一脈沖頭和輸入數(shù)據(jù),便可以得到該脈沖頭作為起始標(biāo)志的N點FFT輸出結(jié)果。由于使用了雙ram,該算法是流型(Pipelined)的,可以連續(xù)計算N點復(fù)數(shù)輸入FFT,即輸入可以是分段N點連續(xù)復(fù)數(shù)數(shù)據(jù)流。采用DIF(Decimation In Frequency)-FFT和DIT(Decimation In Time)-FFT對于算法本身來說是無關(guān)緊要的,因為兩種情況下只是存儲器的讀寫地址有所變動而已,不影響算法的結(jié)構(gòu)和流程,也不會對算法復(fù)雜度有何影響。算法實現(xiàn)的可以是基2/4混合基FFT,也可以是純基4FFT和純基2FFT運算。
傅立葉變換和逆變換
對于變換長度為N的序列x(n)其傅立葉變換可以表示如下:
[td]N
[td]nk
[/tr]
X(k)=DFT[x(n)]=[td]Σ[td]x(n)W[/tr]
[td]n=0[td][/tr]
式(1)
其中,W=exp(-2π/N)。
當(dāng)點數(shù)N較大時,必須對式(1)進行基4/基2分解,以短點數(shù)實現(xiàn)長點數(shù)的變換。而IDFT的實現(xiàn)在DFT的基礎(chǔ)上就顯得較為簡單了:
式(2)
由式(2)可以看出,在FFT運算模塊的基礎(chǔ)上,只需將輸入序列進行取共軛后再進行FFT運算,輸出結(jié)果再取一次共軛便實現(xiàn)了對輸入序列的IDFT運算,因子1/N對于不同的數(shù)據(jù)表示格式具體實現(xiàn)時的處理方式是不一樣的。IDFT在FFT的基礎(chǔ)上輸入和輸出均有一次共軛操作,但它們共用一個內(nèi)核,仍然是十分方便的。
基4和基2
基4和基2運算流圖及信號之間的運算關(guān)系如圖1所示:

(a)基4蝶形算法
(b)基2蝶形算法
以基4為例,令A(yù)=r0+j×i0;B=r1+j×i1;C=r2+j×i2;D=r3+j×i3;Wk0=c0+j×s0:Wk1=c1+j×s1;Wk2=c2+j×s2;Wk3=c3+j×s3。分別代入圖1中的基4運算的四個等式中有:
A‘=[r0+(r1×c1-i1×s1)+(r2×c2-i2×s2)+(r3×c3-i3×s3)]+j[i0+(i1×c1+r1×s1)+(i2×c2+r2×s2)+(i3×c3+r3×s3)] 式(3)
B’=[r0+(i1×c1+r1×s1)-(r2×c2-i2×s2)-(i3×c3+r3×s3)]+j[i0-(r1×c1-i1×s1)-(i2×c2+r2×s2)+(r3×c3-i3×s3)] 式(4)
C‘=[r0-(r1×c1-i1×s1)+(r2×c2-i2×s2)-(r3×c3-i3×s3)]+j[i0-(i1×c1+r1×s1)+(i2×c2+r2×s2)-(i3×c3+r3×s3)] 式(5)
D’=[r0-(i1×c1+r1×s1)-(r2×c2-i2×s2)+(i3×c3+r3×s3)]+j[i0+(r1×c1-i1×s1)-(i2×c2+r2×s2)-(r3×c3-i3×s3)] 式(6)
可以看出,式(3)至式(6)有多個公共項和類似項,這一點得到充分利用之后可以大大縮減基4和基2運算模塊中的乘法器的個數(shù),如上面A‘至D’的四個等式中的這三對類似項:(r1×c1-i1×s1)與(i1×c1+r1×s1)、(r2×c2-i2×s2)與(i2×c2+r2×s2)、(r3×c3-i3×s3)與(i3×c3+r3×s3)以高于輸入數(shù)據(jù)率的時鐘進行時分復(fù)用,最終可以做到只需要3個甚至1個復(fù)數(shù)乘法器便可以實現(xiàn)?;?運算之所以采用圖1-(b)中的形式進行基2運算,是為了將基本模塊做成基4/2復(fù)用模塊,它對于N有著更大的適用性和可借鑒性。在基4、基2和基4/2模塊的基礎(chǔ)上,構(gòu)建基16、基8和基16/8模塊有著非常大的意義。
算法實現(xiàn)
傅立葉變換實現(xiàn)時首先進行基2、基4分解,一般來說,如果算法使用基4實現(xiàn),雖然使用的資源多了一些,但速度上的好處足以彌補。如果資源充足,使用基16、基8或基16/8復(fù)用模塊,速度可以大大提高。一般FFT實現(xiàn)簡單框圖如圖2所示。

在圖2中,運算模塊即為基2/4/8/16模塊或它們的復(fù)用模塊,Rom表中存儲的是N點旋轉(zhuǎn)因子表??刂颇K產(chǎn)生所有的控制信號,存儲器1和2的讀寫地址、寫使能、運算模塊的啟動信號及因子表的讀地址等信號。當(dāng)然對于運算模塊為基16/8復(fù)用模塊時,控制模塊就需要產(chǎn)生模式選擇信號,如對于運算模塊是基4/2模塊時,該信號就決定了內(nèi)部運算模塊是進行基4運算還是基2運算。存儲器1作為當(dāng)前輸入標(biāo)志對應(yīng)輸入N點數(shù)據(jù)的緩沖器,存儲器2作為中間結(jié)果存儲器,用于存儲運算模塊計算出的各Pass的結(jié)果。在圖中的各種地址、使能和數(shù)據(jù)的緊密配合下,經(jīng)過一定延時后輸出計算結(jié)果及其對應(yīng)指示標(biāo)志。圖2只是一定點或浮點的FFT實現(xiàn)模塊,如果是塊浮點運算,則必須加入一個數(shù)據(jù)因子控制器,控制每遍運算過程中的數(shù)據(jù)大小,并根據(jù)各個Pass的乘性因子之和的大小,對最終輸出進行大小控制,以保證每段FFT運算輸出增益一致。
外部輸入為N點數(shù)據(jù)段流和啟動信號(N點之間如無間隔,則每N數(shù)據(jù)點輸入一脈沖信號),一方面,外部數(shù)據(jù)存入存儲器1中,同時通過控制模塊的控制,讀出存儲器1中的前段N點數(shù)據(jù)和Rom表中的因子及相關(guān)控制信號送入運算核心模塊進行各個Pass的運算,每個Pass的輸出都存入存儲器2中,最后一個Pass的計算結(jié)果存入存儲器2中,并在下一個啟動頭到來后,輸出計算結(jié)果。對圖2的實現(xiàn),除去運算模塊,關(guān)鍵是各個Pass數(shù)據(jù)因子讀寫地址及控制信號的配合。
速度、資源和精度
假定輸入數(shù)據(jù)的速率為fin,則每數(shù)據(jù)的持續(xù)時間T=1/fin,運算模塊的計算時鐘頻率為fa,對于N(N=2p,p即為Pass數(shù)目)點FFT計算時延與Pass數(shù)目直接相關(guān)。如果使用基2運算不考慮控制開銷,純粹的計算時延為td=p×N×T×fin/fa。顯然在fa》p× fin時,在N點內(nèi)可完成FFT運算。否則不能完成,即不能實現(xiàn)流型的變換。這在N很大且輸入數(shù)據(jù)速率較高時以FPGA實現(xiàn)幾乎是不可能的,而且內(nèi)部計算時鐘過高容易導(dǎo)致電路的工作不穩(wěn)定。設(shè)基2時的最小可流型工作運算頻率為fa0,則使用基4實現(xiàn)流型的變換,計算時鐘fa= fa0就可以。而使用基8時計算時鐘fa= fa0便可完成,基16時為fa0的1/4。上面所討論的是純基運算,當(dāng)N不為4的冪次方時(如N=2048=16×16×8,運算模塊為基16/8復(fù)用模塊),而又希望使用較低倍的時鐘完成運算時,圖2中的運算模塊必然包括基4/2復(fù)用模塊(即基16/8復(fù)用模塊),這也就是前面提到復(fù)用模塊的主要用意。由上面的分析可以得出結(jié)論,如果計算使用的基越大,完成速度越快。
但是,使用基16/8模塊所使用的邏輯資源要比基4/2模塊多將近一倍,這是因為基16/8復(fù)用模塊是以基4模塊和基4/2復(fù)用模塊構(gòu)建而成。當(dāng)然,可以直接實現(xiàn)基16/8復(fù)用模塊,但用FPGA很難解決復(fù)雜度和成本問題。另外,如果流型運算間隔比N點數(shù)據(jù)長度長一倍以上,可以考慮在較低的計算時鐘下使用基2運算模塊實現(xiàn)流型FFT。
運算結(jié)果的精度直接與計算過程中數(shù)據(jù)和因子位數(shù)(浮點算法)相關(guān),如果中間計算的位數(shù)、存儲數(shù)據(jù)位數(shù)和Rom表中的位數(shù)越大,輸出精度就越大。當(dāng)然,位數(shù)增大后邏輯運算資源和存儲資源都會直線上升。
浮點、塊浮點和定點FFT
根據(jù)運算過程中對數(shù)據(jù)位數(shù)取位和表示形式的不同,可以將FFT分為浮點FFT、塊浮點FFT和定點FFT。它們在實現(xiàn)時對于系統(tǒng)資源的要求是不同的,而且有著不同的適用范圍。
浮點FFT是基于數(shù)據(jù)表示為浮點的基礎(chǔ)之上的,即數(shù)據(jù)是由一純小數(shù)和一因子組成,輸入要轉(zhuǎn)成純小數(shù)和因子的浮點表示形式,所有計算過程中保存應(yīng)得計算結(jié)果大小,而輸出要變成所需大小的定點表示形式。只要因子位數(shù)足夠大,浮點FFT計算是不會溢出的。而定點則是所有計算過程中都是定點運算,如果各個Pass的截位規(guī)則不適當(dāng),很容易出現(xiàn)溢出,必須要有溢出控制。塊浮點是介于它們之間的一種運算機制,它是根據(jù)本Pass的輸入數(shù)據(jù)的大小,在計算之前進行控制(數(shù)據(jù)上移一比特或下移一比特或乘以一特定因子),可以保證不溢出,但一般也需要溢出控制。
浮點運算沒有溢出,信號平均信噪比高,但由于因子的運算必然導(dǎo)致電路復(fù)雜,實現(xiàn)困難。定點運算實現(xiàn)簡單,難以保證不溢出,需要統(tǒng)計得出合適的截位規(guī)則,否則溢出嚴重導(dǎo)致輸出結(jié)果錯誤。塊浮點由于每個Pass(包括最后輸出前)結(jié)束后有一統(tǒng)計控制過程,延時較大,但是可以保證不溢出而且電路又相對浮點來說簡單得多。
應(yīng)根據(jù)具體應(yīng)用的具體要求,選擇合適的FFT。如果要求精度,并且要解決頻域很高的單頻干擾,就必須使用浮點的FFT,使用數(shù)據(jù)位數(shù)很大的定點和塊浮點也能解決這個問題,但位數(shù)的確定十分困難。如果不要求高精度,邏輯資源和Rom比較緊張,可考慮定點運算。如果輸入在頻域集中于幾個點上或者對精度要求一般,可以慢速處理,可以采用塊浮點運算,就能夠保證這幾點的信噪比,而忽略其他點處的信噪比。



有你想看的精彩



至芯科技FPGA就業(yè)培訓(xùn)班——助你步入成功之路、9月23號北京中心開課、歡迎咨詢!
FPGA芯片編程器燒錄器里的應(yīng)用
FPGA是什么(超級詳細)






掃碼加微信邀請您加入FPGA學(xué)習(xí)交流群




歡迎加入至芯科技FPGA微信學(xué)習(xí)交流群,這里有一群優(yōu)秀的FPGA工程師、學(xué)生、老師、這里FPGA技術(shù)交流學(xué)習(xí)氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧!

點個在看你最好看




原文標(biāo)題:如何用FPGA實現(xiàn)FFT算法?

文章出處:【微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1625

    文章

    21620

    瀏覽量

    601232

原文標(biāo)題:如何用FPGA實現(xiàn)FFT算法?

文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放

    電子發(fā)燒友網(wǎng)站提供《使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放.pdf》資料免費下載
    發(fā)表于 09-19 11:27 ?0次下載
    使用DSPLIB <b class='flag-5'>FFT</b><b class='flag-5'>實現(xiàn)實現(xiàn)</b>實際輸入,無需數(shù)據(jù)縮放

    何用 S7-200 實現(xiàn) Modbus 通信?

    電子發(fā)燒友網(wǎng)站提供《如何用 S7-200 實現(xiàn) Modbus 通信?.pdf》資料免費下載
    發(fā)表于 09-14 10:22 ?1次下載

    為什么FPGA屬于硬件,還需要搞算法

    嗎?單純搞算 法就行了嗎?一臉懵求解答。 A:FPGA 屬于硬件,但其功能的實現(xiàn)離不開算法。 FPGA 雖然是硬件,但它具有可編程性,要
    發(fā)表于 09-09 16:54

    AD采集FPGAfft處理信號的問題

    頻率分辨率得是0.1才能將這些信號區(qū)分出來,這樣的話fft點數(shù)得是20K*2/0.1 ,達到了40萬以上(不知道我這樣算對不對),那么fpga是不是沒辦法做了呢,我看7系fpgafft
    發(fā)表于 08-29 09:22

    FPGA實現(xiàn)什么樣的算法?

    FPGA功能如此強大,請問用FPGA實現(xiàn)或者比較適合實現(xiàn)什么樣的算法?
    發(fā)表于 05-26 20:18

    示波器的 FFT 功能怎么調(diào)?

    示波器fft功能-示波器中的快速傅立葉變換 FFT功能非常有用。是德科技與您分享keysight示波器fft調(diào)出來的方法。Keysight示波器FFT調(diào)出來的方法
    的頭像 發(fā)表于 03-19 18:04 ?2773次閱讀
    示波器的 <b class='flag-5'>FFT</b> 功能怎么調(diào)?

    什么是實時頻譜分析儀呢?傅里葉變換(FFT)如何實現(xiàn)頻譜測量?

    分析儀廣泛應(yīng)用于無線通信、音頻處理、聲學(xué)研究等領(lǐng)域。 傅里葉變換(FFT)是實現(xiàn)頻譜測量的重要數(shù)學(xué)工具。FFT算法可以將時域信號轉(zhuǎn)換為頻域信號,并以圖形形式呈現(xiàn)出來。它是一種離散傅里葉
    的頭像 發(fā)表于 01-19 15:50 ?2822次閱讀

    實時頻譜分析儀FFT功能如何采集信號?

    實時頻譜分析儀FFT功能如何采集信號? 實時頻譜分析儀是一種用于分析信號頻譜特征的儀器,它可以實時監(jiān)測和顯示信號的頻譜分布情況。實時頻譜分析儀的FFT功能是實現(xiàn)頻譜分析的核心功能之一。在介紹實時頻譜
    的頭像 發(fā)表于 01-19 15:01 ?976次閱讀

    怎么用FPGA算法 如何在FPGA實現(xiàn)最大公約數(shù)算法

    FPGA算法的優(yōu)點在于它們可以提供高度的定制化和靈活性,使得算法可以根據(jù)實際需求進行優(yōu)化和調(diào)整。此外,FPGA還可以實現(xiàn)硬件加速,提供比傳統(tǒng)
    的頭像 發(fā)表于 01-15 16:03 ?1897次閱讀

    FPGA圖像處理之CLAHE算法

    FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發(fā)表于 01-04 12:23 ?2330次閱讀
    <b class='flag-5'>FPGA</b>圖像處理之CLAHE<b class='flag-5'>算法</b>

    浮點LMS算法FPGA實現(xiàn)

    運算的運算步驟遠比定點運算繁瑣,運算速度慢且所需硬件資源大大增加,因此基于浮點運算的LMS算法的硬件實現(xiàn)一直以來是學(xué)者們研究的難點和熱點。 本文正是基于這種高效結(jié)構(gòu)的多輸入FPA,在FPGA上成功
    的頭像 發(fā)表于 12-21 16:40 ?699次閱讀

    fpga布局布線算法加速

    任務(wù)是將邏輯元件與連接線路進行合理的布局和布線,以實現(xiàn)性能優(yōu)化和電路連接的可靠性。然而,FPGA布局布線的過程通常是一項繁瑣且耗時的任務(wù),因此加速布局布線算法的研究具有重要意義。本文將詳盡探討
    的頭像 發(fā)表于 12-20 09:55 ?742次閱讀

    何用BUCK電路簡單實現(xiàn)一個可靠的負電源?

    何用BUCK電路簡單實現(xiàn)一個可靠的負電源?
    的頭像 發(fā)表于 12-05 15:12 ?749次閱讀
    如<b class='flag-5'>何用</b>BUCK電路簡單<b class='flag-5'>實現(xiàn)</b>一個可靠的負電源?

    何用Verilog分模塊編寫1A2B猜數(shù)字游戲并且在野火FPGA開發(fā)板上實現(xiàn)效果?

    何用Verilog分模塊編寫1A2B猜數(shù)字游戲并且在野火FPGA開發(fā)板上實現(xiàn)效果?
    發(fā)表于 12-01 12:59

    何用AD526實現(xiàn)放大倍數(shù)自動調(diào)節(jié)

    電子發(fā)燒友網(wǎng)站提供《如何用AD526實現(xiàn)放大倍數(shù)自動調(diào)節(jié).pdf》資料免費下載
    發(fā)表于 11-20 11:27 ?2次下載
    如<b class='flag-5'>何用</b>AD526<b class='flag-5'>實現(xiàn)</b>放大倍數(shù)自動調(diào)節(jié)