基于IP核的數(shù)選式浮點(diǎn)矩陣相乘改進(jìn) - 全文

　　在科學(xué)計(jì)算中，需要大量的矩陣運(yùn)算，而矩陣運(yùn)算中乘法運(yùn)算是其他運(yùn)算的基礎(chǔ)，如能提高嵌入式系統(tǒng)中浮點(diǎn)矩陣乘法運(yùn)算的速度，則可加快其他類型的矩陣運(yùn)算速度。

　　目前實(shí)現(xiàn)浮點(diǎn)矩陣運(yùn)算的方法，有直接使用VHDL語言編寫的浮點(diǎn)矩陣相乘處理單元[1]，關(guān)鍵技術(shù)是乘累加單元的設(shè)計(jì)，通常依據(jù)設(shè)計(jì)者的編程水平?jīng)Q定硬件性能。同樣，FPGA 廠商也推出了一定規(guī)模的浮點(diǎn)矩陣運(yùn)算IP核[2]，其應(yīng)用針對本廠家器件，且經(jīng)過專業(yè)調(diào)試和硬件實(shí)測，性能穩(wěn)定且優(yōu)于手寫代碼，但還有一些可改進(jìn)的地方。

　　本文基于Altera的算法IP核，采用數(shù)選方式對矩陣運(yùn)算中的單精度浮點(diǎn)矩陣相乘進(jìn)行改進(jìn)，可推廣到階數(shù)更高的矩陣運(yùn)算和雙精度浮點(diǎn)、復(fù)數(shù)單精度浮點(diǎn)運(yùn)算中。

　　1 浮點(diǎn)矩陣相乘的IP核原理

　　Altera公司推出的浮點(diǎn)矩陣相乘IP核ALTFP_MATRIX_MULT，適用于Quartus10.1版本以上的軟件環(huán)境，能夠進(jìn)行一定規(guī)模的浮點(diǎn)矩陣計(jì)算，原理圖如圖1所示。

　　圖1的矩陣相乘結(jié)合流水線方式控制數(shù)據(jù)流動，關(guān)鍵部分為核心PE(Processing Element)單元實(shí)現(xiàn)兩浮點(diǎn)數(shù)的相乘。輸入數(shù)據(jù)在控制器的引導(dǎo)下分為AA矩陣和BB矩陣，分別存于M144K或M9K存儲器中，在計(jì)算指令的控制下做浮點(diǎn)相乘運(yùn)算，接著并行地浮點(diǎn)相加完成輸出。分析整個(gè)計(jì)算結(jié)構(gòu)，要達(dá)到較好的性能就需要耗費(fèi)多個(gè)存儲器和多個(gè)浮點(diǎn)相乘單元。列出矩陣相乘的基本時(shí)序圖如圖2所示。

　　從時(shí)序圖可見，整個(gè)IP核有7個(gè)輸入、4個(gè)輸出，分為數(shù)據(jù)加載、數(shù)據(jù)處理、數(shù)據(jù)輸出三個(gè)階段。在系統(tǒng)同步時(shí)鐘sysclk的驅(qū)動下，loadaa、loadbb對數(shù)據(jù)loaddata進(jìn)行乘數(shù)矩陣、被乘數(shù)矩陣使能，將數(shù)據(jù)加載到存儲器中。當(dāng)calcimatrix上升沿到來時(shí)，進(jìn)行矩陣乘法運(yùn)算并輸出數(shù)據(jù)outdata，且在outvalid為高電平時(shí)有效。在整個(gè)數(shù)據(jù)輸出有效階段，完成信號done處于低電平，其余階段為高電平。

　　浮點(diǎn)矩陣運(yùn)算IP核的運(yùn)算方式分為單精度、雙精度、復(fù)數(shù)單精度三種方式，矩陣運(yùn)算階數(shù)有8、16、32、64、96、128階6種，并不能實(shí)現(xiàn)任意階矩陣的相乘，隨著矩陣階數(shù)的增大，最高時(shí)鐘頻率在下降，同時(shí)占用器件資源在增加，耗用最多的是存儲器資源，呈幾何倍數(shù)增長。

　　2 數(shù)選實(shí)矩陣相乘設(shè)計(jì)

　　在矩陣相乘運(yùn)算中最基礎(chǔ)的是2階矩陣的相乘，核心部分為乘累加器[3]，通過適當(dāng)數(shù)選控制，可使整個(gè)矩陣運(yùn)算具有高時(shí)鐘頻率。如圖3為2階矩陣相乘電路。

　　整個(gè)矩陣相乘模塊的設(shè)計(jì)，結(jié)合數(shù)據(jù)選擇的控制方式，分為流水線數(shù)據(jù)輸入、數(shù)據(jù)相乘、數(shù)據(jù)輸出三部分。在流水線數(shù)據(jù)輸入模塊，采用流水線的方式輸入乘矩陣數(shù)據(jù)KA、KB，被乘數(shù)矩陣數(shù)據(jù)A、B，以同步系統(tǒng)時(shí)鐘啟動兩個(gè)數(shù)據(jù)選擇器，由cntr0控制兩個(gè)數(shù)選器選擇數(shù)據(jù)輸出到乘法器兩端;將乘法器的輸入數(shù)據(jù)相乘并存于寄存器中;最后在數(shù)據(jù)輸出部分cntr1模塊的控制下，累加輸出矩陣數(shù)據(jù)X、Y，完成矩陣運(yùn)算。以Altera器件EP2C35F672C6為映射器件，其時(shí)鐘頻率為250 MHz。在Quartus7.2軟件編程下，運(yùn)行此2階乘法器，可獲得248.69 MHz的最高時(shí)鐘頻率。占用資源為172個(gè)邏輯單元、152個(gè)寄存器、2個(gè)9位乘法器，且在輸入數(shù)據(jù)之后2個(gè)時(shí)鐘輸出運(yùn)算結(jié)果，如圖4所示。設(shè)計(jì)具有較高的計(jì)算性能，關(guān)鍵點(diǎn)在于數(shù)據(jù)選擇器在電路運(yùn)算過程中的作用，取代了存儲器單一存儲的目的，可進(jìn)行乒乓式實(shí)時(shí)數(shù)據(jù)流動，提高系統(tǒng)運(yùn)算效率，節(jié)省了一半存儲器。

　　圖4中乘矩陣[KA KB]在Matlab中的表示為[5 3;2 4]，被乘矩陣[A B]表示為[2 2;3 4]，得到的輸出結(jié)果為[16 27;12 22]，可見FPGA運(yùn)算結(jié)果與Matlab結(jié)果一致。

　　3 浮點(diǎn)矩陣相乘運(yùn)算的改進(jìn)

　　本文以16×16階浮點(diǎn)矩陣相乘為例，采用單精度浮點(diǎn)計(jì)算方式，結(jié)合2階高速矩陣運(yùn)算電路對16階矩陣運(yùn)算進(jìn)行改進(jìn)，其他高階矩陣運(yùn)算可采用類推的方式完成。

　　3.1 高階矩陣運(yùn)算分解

　　高階矩陣分解運(yùn)算是通過分解大規(guī)模矩陣為許多子矩陣進(jìn)行計(jì)算的方式，所以可將16×16階矩陣劃分為4個(gè)8×8階矩陣，實(shí)現(xiàn)2階矩陣相乘。16×16階矩陣相乘運(yùn)算，可表達(dá)為式(1)：

　　從式(1)的16階矩陣相乘運(yùn)算，可知其需要8次8階浮點(diǎn)矩陣相乘和4次8階浮點(diǎn)矩陣相加運(yùn)算。分析可得，在數(shù)據(jù)并行輸入輸出的情況下，相比較于16階矩陣IP核的運(yùn)行方式，此種分解方式性能要高。主要由于IP核運(yùn)行方式跨度長，在數(shù)據(jù)輸入時(shí)，需要經(jīng)過16×16級存儲器，而本文設(shè)計(jì)的方式只需要8×8級存儲和4次并行的浮點(diǎn)相加運(yùn)算，同時(shí)相比較于16階IP耗用存儲資源和浮點(diǎn)乘法單元數(shù)較少。

　　3.2 矩陣相乘硬件實(shí)現(xiàn)

　　采用Quartus10.1軟件設(shè)計(jì)16階單精度浮點(diǎn)矩陣相乘電路，使用VHDL語言[4]編寫，模塊由流水線數(shù)據(jù)輸入、矩陣相乘、鎖存器、浮點(diǎn)加法數(shù)選模塊4部分組成，設(shè)計(jì)框圖如圖5所示。

　　在流水線數(shù)據(jù)輸入部分，對數(shù)據(jù)data進(jìn)行分割，當(dāng)信號load為高電平時(shí)使能，同時(shí)進(jìn)行數(shù)據(jù)的緩存和生成控制位，輸出的三位控制位(calcimatrix、loadaa、loadbb)控制著下一步矩陣相乘的運(yùn)算，在loadaa與loadbb高電平交互之間的數(shù)據(jù)值取0，具有數(shù)據(jù)緩存和分割的作用。最后一個(gè)模塊需要進(jìn)行8×8階矩陣的32位浮點(diǎn)加法運(yùn)算，同時(shí)輸出數(shù)據(jù)有效電平，使用Altera altfp_add_sub IP 核實(shí)現(xiàn)單精度浮點(diǎn)加法器，可根據(jù)用戶的定制完成。對圖5的模塊加入幾個(gè)輸出結(jié)果，使用modelsim6.5進(jìn)行仿真，可得16階矩陣運(yùn)算仿真結(jié)果如圖6所示。

　　從圖6可見loadaa、loadbb、calcimatrix三者的時(shí)序滿足浮點(diǎn)矩陣運(yùn)算的時(shí)序圖，在前兩者數(shù)據(jù)加載后，即可獲得calcimatrix上升沿，進(jìn)行矩陣相乘。輸出結(jié)果分為4個(gè)大組，各大組有8小組，每一小組由8個(gè)數(shù)據(jù)組成，具有較好的計(jì)算結(jié)果。

　　4 性能比較分析

　　4.1 性能比較

　　將第3節(jié)設(shè)計(jì)的16階矩陣相乘電路與Altera自身提供的IP核進(jìn)行比較。同時(shí)以8階矩陣相乘為基，以第2節(jié)的方式設(shè)計(jì)4×4階數(shù)選實(shí)矩陣電路，套用于32×32階矩陣運(yùn)算中，與Altera的IP核比較。IP核使用最高性能運(yùn)行，同時(shí)以資源消耗、浮點(diǎn)操作數(shù)[5]、最高時(shí)鐘頻率、吞吐量作為比較準(zhǔn)則，其中浮點(diǎn)操作數(shù)的計(jì)算表達(dá)式為：

　　依據(jù)以上浮點(diǎn)操作數(shù)計(jì)算方式，使用Quartus10.1軟件進(jìn)行編程，映射到Stratix III系列的器件中，可獲得相應(yīng)的對比表如表1所示。

　　從表1結(jié)果可見改進(jìn)的浮點(diǎn)運(yùn)算電路在ALM的資源占用減少了許多。原因?yàn)樵诰仃囈?guī)模增大時(shí)，只使用了8階浮點(diǎn)矩陣運(yùn)算，浮點(diǎn)IP核中的乘加核數(shù)量不變，所以消耗的浮點(diǎn)相乘單元不變，同樣增添的浮點(diǎn)加法器也只消耗了不多的ALM資源。而對于改進(jìn)的兩類矩陣相乘都只使用8階矩陣乘法，所以在乘法器和M9K存儲器這兩類邏輯單元的消耗不變。為了達(dá)到較好的性能，需要少量外圍存儲器處理數(shù)據(jù)的流動和浮點(diǎn)相加運(yùn)算，但整體存儲器消耗降低。觀察吞吐量可知，套用的數(shù)選式矩陣相乘模塊，當(dāng)階數(shù)增大時(shí)吞吐量降低，幅度明顯，而選擇2階數(shù)選矩陣具有乒乓結(jié)構(gòu)，性能有所提升。同理適用于浮點(diǎn)操作數(shù)的情況。最后整個(gè)運(yùn)算電路的最高時(shí)鐘頻率始終是提升的。與Altera公司的IP核比較，改進(jìn)的16階浮點(diǎn)矩陣運(yùn)算電路性能較好，而32階運(yùn)算電路性能卻未達(dá)到要求。

　　對高階矩陣進(jìn)一步分析，在32階運(yùn)算電路的設(shè)計(jì)中，使用16階浮點(diǎn)矩陣為乘法運(yùn)算部分，以2×2實(shí)矩陣運(yùn)算電路為核心，能夠提升32階電路的運(yùn)算性能。

　　4.2 精度分析

　　以16階矩陣的運(yùn)算進(jìn)行精度分析，取乘矩陣與被乘矩陣各16個(gè)數(shù)據(jù)進(jìn)行計(jì)算分析，列出表2數(shù)據(jù)，其中B矩陣為現(xiàn)有數(shù)據(jù)的轉(zhuǎn)置，以Matlab和FPGA運(yùn)算結(jié)果進(jìn)行對比。

　　從Matlab與FPGA計(jì)算結(jié)果可見，計(jì)算輸出近乎完全相同，相差的數(shù)據(jù)值也是由于Matlab在計(jì)算中需要先轉(zhuǎn)化為雙精度運(yùn)算后才轉(zhuǎn)化為單精度數(shù)，從而得出FPGA計(jì)算具有較高的精度。

　　本設(shè)計(jì)降低存儲器和計(jì)算資源消耗，提升了系統(tǒng)吞吐量、浮點(diǎn)運(yùn)算性能和運(yùn)行最高時(shí)鐘頻率。這種改進(jìn)的浮點(diǎn)矩陣乘法器對降低資源消耗、提升系統(tǒng)性能具有重大意義。同時(shí)，利用VHDL語言編寫，具有模塊化設(shè)計(jì)思想，使得本設(shè)計(jì)可移植性強(qiáng)、通用性好，只需要在現(xiàn)有IP核的基礎(chǔ)上進(jìn)行小規(guī)模改進(jìn)，即可擁有較高性能，具有一定的工程實(shí)際意義和應(yīng)用前景。

閱讀全文

上一頁 1 2 3全文

本文導(dǎo)航

矩陣(34223) 矩陣(34223)
IP核(49014) IP核(49014)

IP交換矩陣的關(guān)鍵參數(shù) IP交換矩陣測試原理概述

IP交換矩陣是由一級或多級交換設(shè)備及其控制器組成的單體矩陣，包含媒體業(yè)務(wù)信號、控制指令信號、同步時(shí)鐘信號三個(gè)平面。

2023-12-04 14:13:45

816

4×4 矩陣式鍵盤電路的改進(jìn)

4×4 矩陣式鍵盤電路的改進(jìn)

2012-08-20 16:06:14

IP核加法器

2019-08-14 14:24:38

IP核生成文件：XilinxAltera

IP核生成文件：XilinxAlteraIP 核生成文件：（Xilinx/Altera同） IP 核生成器生成ip 后有兩個(gè)文件對我們比較有用，假設(shè)生成了一個(gè) asyn_fifo 的核，則

2012-08-12 12:21:36

IP核簡介

本帖最后由 eehome 于 2013-1-5 09:59 編輯 IP核簡介IP核是指：將一些在數(shù)字電路中常用但比較復(fù)雜的功能塊,如FIR濾波器、SDRAM控制器、PCI接口等等設(shè)計(jì)成可修改

2011-07-06 14:15:52

IP核簡介

IP核簡介IP核是指：將一些在數(shù)字電路中常用但比較復(fù)雜的功能塊,如FIR濾波器、SDRAM控制器、PCI接口等等設(shè)計(jì)成可修改參數(shù)的模塊,讓其它用戶可以直接調(diào)用這些模塊,以避免重復(fù)勞動。隨著CPLD

2011-07-15 14:46:14

ip核

我想問一下，在quartus上直接調(diào)用IP核和在qsys中用IP核有什么區(qū)別？自個(gè)有點(diǎn)迷糊了

2017-08-07 10:09:03

ip核使用問題

我調(diào)用了一個(gè)ip核在下載到芯片中有一個(gè)time-limited的問題在完成ip核破解之后還是無法解決但是我在Google上的找到一個(gè)解決方法就是把ip核生成的v文件加到主項(xiàng)目文件中就是上面

2016-05-17 10:28:47

浮點(diǎn)數(shù)相乘IP (ALTFP_MULT)，結(jié)果一直為0

fpga），現(xiàn)在需要完成一個(gè)cpu/fpga協(xié)同工作的任務(wù)，使用pcie總線通信。具體任務(wù)很簡單：cpu通過pcie傳兩個(gè)32位浮點(diǎn)數(shù)給fpga，fpga相乘然后把結(jié)果返回。乘法模塊使用quartus提供

2014-12-21 21:32:14

ADC IP核的選購

公司現(xiàn)需12bit sar adc的IP核，國內(nèi)有哪些公司提供相關(guān)方面的服務(wù)了？

2015-11-06 08:37:44

Aletra IP核

用Quartus II 調(diào)用IP核時(shí)，在哪可以查看IP核的例程

2014-07-27 20:28:04

Altera浮點(diǎn)矩陣相乘IP核怎么提高運(yùn)算速度？

語言編寫的浮點(diǎn)矩陣相乘處理單元[1]，其關(guān)鍵技術(shù)是乘累加單元的設(shè)計(jì)，這樣設(shè)計(jì)的硬件，其性能依賴于設(shè)計(jì)者的編程水平。此外，F(xiàn)PGA廠商也推出了一定規(guī)模的浮點(diǎn)矩陣運(yùn)算IP核[2]，雖然此IP核應(yīng)用了本廠家的器件，并經(jīng)過專業(yè)調(diào)試和硬件實(shí)測，性能穩(wěn)定且優(yōu)于手寫代碼，但仍可對其進(jìn)行改進(jìn)，以進(jìn)一步提高運(yùn)算速度。

2019-08-22 06:41:38

Altera_IP核

Altera_IP核,僅供參考

2016-08-24 16:57:15

Anlogic Float IP用戶手冊

Anlogic Float IP 基于 IEEE754 浮點(diǎn)數(shù)標(biāo)準(zhǔn)，實(shí)現(xiàn)了浮點(diǎn)數(shù)下的四則運(yùn)算，IP 特色如下：IP 支持 Anlogic 所有器件 浮點(diǎn)數(shù)類型：半精度、單精度、雙精度 浮點(diǎn)數(shù)計(jì)算

2023-08-09 07:53:03

DDR2 ip核創(chuàng)建時(shí)，器件選型的問題

在quartus2中創(chuàng)建了一個(gè)DDR2 控制器的ip核，但是在選擇 DDR型號的時(shí)候，找不到我要用的DDR芯片信號怎么辦？選擇了一個(gè)DDR芯片將它的行列bits數(shù)改了之后發(fā)現(xiàn) 內(nèi)存大小又不對。求解答

2017-09-19 14:50:23

FPGA IP核的相關(guān)問題

初始化時(shí)存入數(shù)據(jù)。那在IP核rom中存放大量數(shù)據(jù)對FPGA有什么影響,比如我想存65536個(gè)16位的數(shù)，然后在64M或者128M的時(shí)鐘下讀出來。會不會導(dǎo)致FPGA速度過慢？

2013-01-10 17:19:11

FPGA浮點(diǎn)IP內(nèi)核有哪些優(yōu)勢？

最近出現(xiàn)的 FPGA設(shè)計(jì)工具和 IP有效減少了計(jì)算占用的資源，大大簡化了浮點(diǎn)數(shù)據(jù)通路的實(shí)現(xiàn)。而且，與數(shù)字信號處理器不同， FPGA能夠支持浮點(diǎn)和定點(diǎn)混合工作的 DSP數(shù)據(jù)通路，實(shí)現(xiàn)的性能超過

2019-08-13 06:42:48

FPGA嵌入8051單片機(jī) IP核編程

FPGA嵌入8051單片機(jī) IP核編程，編寫的c語言矩陣鍵盤程序可以在stc89c54單片機(jī)上正常工作，但是下載到FPGA中8051單片機(jī)ip核的rom中，不能正常工作，求指教

2013-07-25 21:27:44

LCD的通用驅(qū)動電路IP核設(shè)計(jì)

本帖最后由 gk320830 于 2015-3-8 09:29 編輯 LCD的通用驅(qū)動電路IP核設(shè)計(jì) 摘　　要：本文介紹了一種新型的LCD驅(qū)動電路IP核的總體設(shè)計(jì)，采用自頂向下的設(shè)計(jì)方法將其

2012-08-12 12:28:42

NioslI中如何設(shè)計(jì)SOPC的LCD顯示驅(qū)動IP核

通用的IP核，使得用戶可輕松集成屬于自己的專用功能；但對于一些特定的外設(shè)，沒有現(xiàn)成可用的IP核，如液晶模塊CBGl28064等。用戶可通過自定義邏輯的方法在SOPC設(shè)計(jì)中添加自定義IP核。在實(shí)際應(yīng)用中

2019-08-06 08:29:14

QUARTUS 13.1在生成FFT IP核時(shí)仿真文件生成不了？

最近在做FFT IP核，，走了好多彎路，LISENCE激活過了0034的IP核，通過修改LISENCE.DAT的方法。后來生成FFT的時(shí)候卡住，又嘗試了關(guān)閉quartus_map進(jìn)程和重裝jre

2019-04-03 16:16:21

Q格式相乘問題怎么解決

);v.BaseRpm為Q0格式v.Speed為Q15格式，他兩個(gè)相乘為什么得到Q0格式的v.SpeedRpm。Q格式相乘不應(yīng)該Q后面系數(shù)相加嗎。

2020-05-19 10:34:07

RS IP核 full license 求助

本人使用RS IP核進(jìn)行編碼時(shí)出現(xiàn)IP核后面帶有美元符號，不能正常使用。求大神給予破解幫助。

2019-08-20 11:34:00

TensorFlow矩陣基本操作及其實(shí)現(xiàn)

。具體做法開始一個(gè)交互式會話，以便得到計(jì)算結(jié)果：一些其他有用的矩陣操作，如按元素相乘、乘以一個(gè)標(biāo)量、按元素相除、按元素余數(shù)相除等，可以執(zhí)行如下語句：tf.div 返回的張量的類型與第一個(gè)參數(shù)類型一致

2020-07-22 21:25:24

VIP系列IP核使用

大家好，有沒有誰比較熟悉ALTERA公司的VIP系列ip核，我們用該系列IP核中的某些模塊（主要是scaler和interlacer）來實(shí)現(xiàn)高清圖像轉(zhuǎn)標(biāo)清圖像（具體就是1080p50轉(zhuǎn)576i30

2015-04-13 14:12:18

Vivado生成IP核

在vivado生成ip核后缺少一大片文件，之前是可以用的，中途卸載過Modelsim，用vivado打開過ISE工程，因?yàn)楣こ讨泻芏?b class="flag-6" style="color: red">IP核不能用所以在重新生成過程中發(fā)現(xiàn)了這個(gè)問題，還請大神告知是怎么回事？

2023-04-24 23:42:21

altera公司IP核使用手冊

altera公司IP核使用手冊，分享給想學(xué)習(xí)altera公司FPGA的IP核使用的親們~~

2013-02-16 22:40:19

fpga關(guān)于IP核

求用sopc builder定制IP核的步驟，是9.0的軟件，假設(shè)硬件代碼已有

2013-09-14 18:35:40

ise中的iP核

請問哪位高手有ise軟件中的各個(gè)ip核的功能介紹

2013-10-08 16:41:25

labview怎樣實(shí)現(xiàn)矩陣相乘

labview怎樣實(shí)現(xiàn)矩陣相乘A是nxm矩陣，B是mxp矩陣,如何實(shí)現(xiàn)C=AB；

2012-12-12 21:02:32

matlab矩陣特例

±B 　其中Cij=Aij±Bij。2.2.2.2 乘　數(shù)量k與矩陣A相乘, 將A的每個(gè)元素都乘以k。MATLAB表達(dá)式形式：k*A　兩矩陣A,B相乘，要求兩個(gè)矩陣的相鄰階數(shù)相等，一般情況下

2009-09-22 15:34:40

pci ip核求助

有哪位大神用過pci ip核，為什么輸入lm_req32請求，pci側(cè)沒有reqn請求輸出呢？

2016-06-27 17:56:59

quartus IP核仿真求指導(dǎo)或者出現(xiàn)這種問題的討論一下

quartus 11.0 IP核的simulation如果勾選就生成不出IP核出錯，但是不選的話就沒辦法RTL仿真求大神問題原因或者解決方法

2016-11-25 20:39:45

quartus ip核破解

本帖最后由 ys_1*****8201 于 2016-5-19 14:16 編輯 Quartus IP核破解在完成quartus軟件安裝之后，一般都要進(jìn)行一個(gè)軟件破解。對于一般的需求來說

2016-05-19 14:13:09

quartus ii的IP核中的 sincos核怎么使用？

2.5MHz 振幅0-5V 的正弦信號，請問 data 端口應(yīng)該輸入怎樣的信號？如果有Altera IP核相關(guān)的詳解資料推薦下更好。多謝了。

2014-10-28 12:34:41

quartus2 ip 核

ip 核應(yīng)用

2012-05-26 15:26:27

quartusII FFT ip核

在quartusII中，應(yīng)用fft ip核時(shí)，variable streaming 模式下的bit-reverse（位翻轉(zhuǎn)）是什么意思？煩勞詳細(xì)幫助新手解釋一下，不甚感激

2017-01-09 10:55:59

vivado 調(diào)用IP核詳細(xì)介紹

數(shù)學(xué)運(yùn)算（乘法器、除法器、浮點(diǎn)運(yùn)算器等）、信號處理（FFT、DFT、DDS等）。IP核類似編程中的函數(shù)庫（例如C語言中的printf()函數(shù)），可以直接調(diào)用，非常方便，大大加快了開發(fā)速度。使用Verilog調(diào)用IP

2018-05-15 12:05:13

vivado有哪幾種常用IP核？如何去調(diào)用它們

vivado三種常用IP核的調(diào)用當(dāng)前使用版本為vivado 2018.3vivado的IP核，IP核（IP Core）：Vivado中有很多IP核可以直接使用，例如數(shù)學(xué)運(yùn)算（乘法器、除法器、浮點(diǎn)

2021-07-29 06:07:16

xilinx FPGA的FFT IP核的調(diào)用

有沒有大神可以提供xilinx FPGA的FFT IP核的調(diào)用的verilog 的參考程序，最近在學(xué)習(xí)FFT的IP核的使用，但是仿真結(jié)果有問題，所以想找些參考設(shè)計(jì)，謝謝

2016-12-25 17:05:38

兩單精度浮點(diǎn)數(shù)相乘怎么用C語言編寫

兩單精度浮點(diǎn)數(shù)相乘是先轉(zhuǎn)換成二進(jìn)制再相乘還是直接相乘，求教思路或程序

2016-10-23 23:36:36

乘數(shù)IP核的不良行為

大家好，我在乘法模式下使用浮點(diǎn)7.0核心，即使對于小輸入值，大多數(shù)時(shí)候核心輸出也會非常高，核心配置： 1.在非阻塞模式下，單精度浮點(diǎn) 2.輸入“a”是常量（32位） 3.輸入“b”是以108Mhz

2020-03-25 09:07:58

關(guān)于IP核

剛剛接觸IP核做FFT，現(xiàn)在用的是FFTV9.0，已經(jīng)建立了一個(gè)IP核，但是如何仿真呢？是用quartus自帶軟件，還是要用MATLAB？抑或其他？我用的自帶軟件，但是什么也沒有出來。正確的辦法應(yīng)該怎樣呢，謝謝指點(diǎn)。

2011-04-21 10:22:31

關(guān)于altera系列芯片F(xiàn)IR IP核在使用過程中的問題

最近在做一個(gè)FIR低通濾波器，利用Matlab 產(chǎn)生濾波系數(shù)，導(dǎo)入到Quartus中，再利用其中的FIR IP核進(jìn)行濾波器設(shè)計(jì)，在采用分布式全并行結(jié)構(gòu)時(shí)，Modelsim 仿真有輸出；如果改為分布式

2018-07-05 08:33:02

關(guān)于fpga的IP核

quartus ii9.0創(chuàng)建的ip核，生成的一些文件，（.qip、 add_sub_bb.v、add_sub.v）這些文件都有用嗎，想在其他工程里調(diào)用這些IP核，這幾個(gè)文件全部要添加嗎？

2013-07-02 17:20:01

在做FFT IP核的仿真時(shí)遇到問題，居然不能生成FFT的仿真文件，求解答

在quartus II13.0版本上調(diào)用FFT IP核并進(jìn)行modelsim-altera仿真，在生成IP核時(shí)，step2中勾選generate simulation model、generate

2016-10-07 22:23:33

基于IP核的FPGA設(shè)計(jì)方法是什么？

核的分類和特點(diǎn)是什么？基于IP核的FPGA設(shè)計(jì)方法是什么？

2021-05-08 07:07:01

基于IP核的SoC接口技術(shù)

引言隨著半導(dǎo)體技術(shù)的發(fā)展,深亞微米工藝加工技術(shù)允許開發(fā)上百萬門級的單芯片，已能夠?qū)⑾到y(tǒng)級設(shè)計(jì)集成到單個(gè)芯片中即實(shí)現(xiàn)片上系統(tǒng)SoC。IP核的復(fù)用是SoC設(shè)計(jì)的關(guān)鍵，但困難在于缺乏IP核與系統(tǒng)的接口標(biāo)準(zhǔn)

2019-06-11 05:00:07

基于FPGA的IP核的DDS信號發(fā)生器如何用IP核

我畢業(yè)設(shè)計(jì)要做一個(gè)基于FPGA的IP核的DDS信號發(fā)生器，但是我不會用DDS的IP核，有沒有好人能發(fā)我一份資料如何用IP核的呀。我的瀏覽器下載不了網(wǎng)站上的資料，所以只能發(fā)帖求幫忙了。

2015-03-10 11:46:40

基于FPGA的FFT和IFFT IP核應(yīng)用實(shí)例

基于FPGA的FFT和IFFT IP核應(yīng)用實(shí)例AT7_Xilinx開發(fā)板（USB3.0+LVDS）資料共享騰訊鏈接：https://share.weiyun.com/5GQyKKc百度網(wǎng)盤鏈接

2019-08-10 14:30:03

如何使用arm內(nèi)核庫的矩陣計(jì)算函數(shù)

我們在嵌入式上跑矩陣運(yùn)算時(shí)候，會遇到這樣一個(gè)問題。假設(shè)將矩陣設(shè)置成N*N維的二維數(shù)組后，我們想求兩個(gè)矩陣相乘，那就需要按照矩陣計(jì)算規(guī)則編寫矩陣相乘函數(shù)，而且4*4矩陣得編一個(gè)，5*5矩陣又得編一個(gè)

2021-07-16 06:56:52

如何在SOPC的NiosII中設(shè)計(jì)LCD顯示驅(qū)動IP核？

2019-08-05 07:56:59

如何將IP軟核與硬核整合到芯片上，兩者有什么對比區(qū)別？具體怎么選

是擁有完整的IP核產(chǎn)品線。如果你選擇軟核，應(yīng)該確認(rèn)該公司提供的是考慮了未來產(chǎn)品改進(jìn)的完整軟核產(chǎn)品線。如果你選擇硬核，應(yīng)確認(rèn)它可提供所有你將使用的工藝技術(shù)，他們是否計(jì)劃擴(kuò)展其提供的軟核產(chǎn)品？他們?nèi)绾斡?jì)劃將

2021-07-03 08:30:00

將四字節(jié)16進(jìn)制數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù)

將四字節(jié)16進(jìn)制數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù)近期機(jī)緣湊巧幫了朋友一個(gè)忙，在Modbus協(xié)議下，將采集到的十六進(jìn)數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù)，有幾種解決方法，分享給需要的朋友，令其少走一些彎路。眾所周知，Modbus通信協(xié)議

2018-12-01 06:13:07

嵌入式HLS 案例開發(fā)步驟分享——基于Zynq-7010/20工業(yè)開發(fā)板（3）

核測試前的準(zhǔn)備工作。 HLS 工程生成的 IP 核為 HLS_accel_0。圖 64 4.4.1 PL 端 IP 核測試 Vivado 工程說明浮點(diǎn)矩陣乘法運(yùn)算加速器 IP 核通過 AXI DMA

2023-08-24 14:52:17

嵌入式HLS 案例開發(fā)步驟分享——基于Zynq-7010/20工業(yè)開發(fā)板（3）

的 IP 核為 HLS_accel_0。圖 644.4.1 PL 端 IP 核測試 Vivado 工程說明浮點(diǎn)矩陣乘法運(yùn)算加速器 IP 核通過 AXI DMA IP 核連接到 PS 端 ACP 接口，從而

2023-01-01 23:50:04

急求助！??！用verilog編寫一個(gè)浮點(diǎn)矩陣乘法器

求助，有沒有大神用verilog寫過浮點(diǎn)矩陣乘法器的，我寫出浮點(diǎn)乘法器和加法器之后就進(jìn)行不下去了，急求助?。?！只有一個(gè)積分~~~

2017-09-18 09:22:03

新手求助：Quartus的加法器IP核仿真無結(jié)果

求助：用的Quartus13.0，選的modelsim仿真，Run Functional Simulation加法器IP核是Arithmetic下的ALTFP_ADD_SUB，設(shè)置是double

2015-06-25 16:05:50

求一種復(fù)數(shù)浮點(diǎn)協(xié)方差矩陣的實(shí)現(xiàn)方案

本文介紹了一種基于FPGA的復(fù)數(shù)浮點(diǎn)協(xié)方差矩陣實(shí)現(xiàn)方案。

2021-04-29 06:01:31

特權(quán)老師F“”PGA數(shù)字圖像采集與處理“一書中色彩濾波矩陣IP核程序有不明白的問題

@特權(quán)老師：特權(quán)老師，您好！最近買了您寫的“PGA數(shù)字圖像采集與處理”一書，書中第5章色彩濾波矩陣IP核 Demosaic 中的一段程序代碼不明白！請問o_rgb_image_rst這個(gè)輸出圖像復(fù)位信號為1時(shí)的兩個(gè)條件：dly>=12'd3200 &&dly

2021-04-01 08:41:05

詳細(xì)操作 vivado 調(diào)用IP核（附圖）

2018-05-16 11:42:55

請教兩個(gè)vivado仿真錯誤的解決方法

`錯誤提示截圖放在二樓，用vivado14.4寫了個(gè)1×8和8×8矩陣相乘的程序，調(diào)用了64個(gè)ip核乘法器，IO口用的有些多。綜合和實(shí)現(xiàn)網(wǎng)表都能成功，就是仿真總是提示這兩個(gè)錯誤，仔細(xì)檢查了幾遍程序

2020-04-26 19:21:25

請教使用IP核的latency問題

本人FPGA小白一枚，最近使用到FPGA的IP核遇到一個(gè)問題。比如說：某個(gè)IP，用于計(jì)算sin函數(shù)，使用了流水線機(jī)制，所有從輸入到輸出需要20個(gè)時(shí)鐘周期的延時(shí)。另外，還有一個(gè)IP，從輸入到輸出需要1

2021-06-19 11:06:07

請問Altera RAM IP核怎么使用？

2022-01-18 06:59:33

請問不同Q格式的用這個(gè)相乘怎么理解？？

是Q21格式的，后面是Q15格式，看IQMath文檔_IQmpy是兩個(gè)Q格式相同的數(shù)相乘的，請問不同Q格式的用這個(gè)相乘怎么理解？？

2018-11-22 09:59:34

請問在dspLib里只有矩陣轉(zhuǎn)至和相乘的算法，還有沒其他庫有更多矩陣算法呢？

在dspLib里只有矩陣轉(zhuǎn)至和相乘的算法，還有沒其他庫有更多矩陣算法呢？

2018-07-27 10:01:18

改進(jìn)的基于差別矩陣的屬性約簡算法

指出現(xiàn)有差別矩陣屬性約簡算法的不足，對原有差別矩陣和屬性重要性度量方法進(jìn)行改進(jìn)，運(yùn)用差別矩陣元素項(xiàng)的重要性質(zhì)，提出一種新的啟發(fā)式約簡完備算法，有效地降低差別矩

2009-03-28 09:34:22

矩陣相乘算法優(yōu)化的研究

本文對經(jīng)典矩陣相乘A*B 算法提出多種優(yōu)化方法：根據(jù)局部性原理，提出對矩陣B進(jìn)行轉(zhuǎn)置；根據(jù)計(jì)算機(jī)緩存的大小與矩陣A 與矩陣B 的規(guī)模進(jìn)行嵌套循環(huán)分塊，通過對分塊大小的調(diào)

2010-01-27 13:37:55

#硬聲創(chuàng)作季 9.8.1 基于Vivado的IP核設(shè)計(jì)過程

fpgaIP核Vivado數(shù)電基礎(chǔ)

Mr_haohao發(fā)布于 2022-09-02 06:36:40

#硬聲創(chuàng)作季 9.8.2 基于IP核的簡易數(shù)字鐘電路設(shè)計(jì)與實(shí)現(xiàn)

fpgaIP核數(shù)字鐘數(shù)電基礎(chǔ)

Mr_haohao發(fā)布于 2022-09-02 06:37:18

行劃分矩陣相乘并行改進(jìn)及其DSP實(shí)現(xiàn)

在陣列信號處理中需要大量的矩陣運(yùn)算,而其中最基本的就是矩陣相乘運(yùn)算。本文就矩陣相乘的行劃分并行實(shí)現(xiàn)進(jìn)行了改進(jìn),將A矩陣的一行和整個(gè)B矩陣傳輸?shù)矫總€(gè)工作進(jìn)程,其中第一個(gè)

2010-07-27 16:30:27

#FPGA點(diǎn)撥生成FIFO的IP核

fpgaIP核

電子技術(shù)那些事兒發(fā)布于 2022-10-12 21:52:56

#FPGA點(diǎn)撥如何驗(yàn)證帶有IP核的代碼

fpgaIP核代碼

電子技術(shù)那些事兒發(fā)布于 2022-10-12 21:53:35

DSP實(shí)現(xiàn)矩陣相乘的并行計(jì)算

矩陣相乘的速度在陣列信號處理中具有重要意義，并行處理是提高系統(tǒng)運(yùn)算能力最有效的方法。本文根據(jù)矩陣相乘的特點(diǎn)，提凡了矩陣相乘的并行算法。同時(shí)經(jīng)分析攜姆出了矩陣相乘的

2011-10-12 16:27:41

基于Altera浮點(diǎn)IP核的浮點(diǎn)矩陣相乘運(yùn)算的實(shí)現(xiàn)和改進(jìn)設(shè)計(jì)

嵌入式計(jì)算作為新一代計(jì)算系統(tǒng)的高效運(yùn)行方式，應(yīng)用于多個(gè)高性能領(lǐng)域，如陣列信號處理、核武器模擬、計(jì)算流體動力學(xué)等。在這些科學(xué)計(jì)算中，需要大量的浮點(diǎn)矩陣運(yùn)算。而目前已

2012-10-15 16:57:40

3824

快速高效的實(shí)現(xiàn)浮點(diǎn)復(fù)數(shù)矩陣分解

浮點(diǎn)具有更大的數(shù)據(jù)動態(tài)范圍，從而在很多算法中只需要一種數(shù)據(jù)類型的優(yōu)勢。本文介紹如何使用Vivado HLS實(shí)現(xiàn)浮點(diǎn)復(fù)數(shù)矩陣分解。使用HLS可以快速，高效地實(shí)現(xiàn)各種矩陣分解算法，極大地提高生產(chǎn)效率，降低開發(fā)者的算法FPGA實(shí)現(xiàn)難度。

2017-11-18 12:00:11

852

卷積神經(jīng)網(wǎng)絡(luò)中的矩陣乘法

一致，均為3x3方陣。激活區(qū)域與濾波器對應(yīng)系數(shù)相乘并相加即獲得對應(yīng)的輸出（這里是矩陣元素對應(yīng)相乘相加，不是矩陣乘法）。緊接著，滑窗右移一格，得到新的激活區(qū)域，再次與濾波器對應(yīng)元素相乘相加獲得第2個(gè)輸出。這里滑窗的步進(jìn)為1。當(dāng)滑窗右側(cè)邊緣與

2021-03-03 14:49:47

5049

人工智能或可助力矩陣乘法運(yùn)算原理解析

矩陣乘法是所有數(shù)學(xué)中最基本和最普遍的運(yùn)算之一。要將一對 n×n 矩陣相乘，每個(gè)矩陣都有 n^2 個(gè)元素，你可以將這些元素以特定組合相乘并相加以生成乘積，即第三個(gè) n×n 矩陣。將兩個(gè) n×n 矩陣相乘的標(biāo)準(zhǔn)方法需要 n^3 次乘法運(yùn)算，因此，例如，一個(gè) 2×2 矩陣需要八次乘法。

2022-12-02 16:35:11

368

已全部加載完成

搜索歷史

基于IP核的數(shù)選式浮點(diǎn)矩陣相乘改進(jìn) - 全文

本文導(dǎo)航

評論