電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>可編程邏輯>1024bit以上大位寬可重構(gòu)包處理器可編程CRC算法的設(shè)計(jì)與實(shí)現(xiàn)

1024bit以上大位寬可重構(gòu)包處理器可編程CRC算法的設(shè)計(jì)與實(shí)現(xiàn)

2021-02-05 | pdf | 1.32MB | 次下載 | 2積分

資料介紹

作者:劉歡,來源:網(wǎng)絡(luò)交換FPGA 微信公眾號(hào)

前段時(shí)間,本公眾號(hào)發(fā)布了《FPGA是網(wǎng)絡(luò)交換領(lǐng)域的不二選擇》的文章,文章引用了叢京生老師在2020年ASP-DAC會(huì)議上對(duì)于FPGA的一段有關(guān)硬件可定制計(jì)算具有巨大優(yōu)勢的論述,而FPGA作為一種能夠?qū)崿F(xiàn)可定制計(jì)算且靈活可編程的載體,具有無與倫比的天然優(yōu)勢,對(duì)此,小編也深以為然。但是,換個(gè)角度來思考問題,F(xiàn)PGA是唯一實(shí)現(xiàn)可定制計(jì)算的載體嗎?當(dāng)然不是。相對(duì)而言,F(xiàn)PGA作為一種所謂的萬能芯片,其靈活性已經(jīng)足夠好,但對(duì)于某個(gè)具體的領(lǐng)域而言,為支持其靈活性而采用可編程SRAM硬件單元的方式就顯得顆粒度過于細(xì)小了,細(xì)小到已經(jīng)嚴(yán)重影響定制硬件實(shí)現(xiàn)的PPA的程度。當(dāng)然,對(duì)于大規(guī)模的應(yīng)用場景,F(xiàn)PGA當(dāng)然還是要轉(zhuǎn)為ASIC實(shí)現(xiàn)從而獲得足夠好的性價(jià)比,但ASIC天然的不靈活性也給算法或協(xié)議的升級(jí)帶來了障礙。那么,是否存在一種介于FPGA和ASIC之間,具有ASIC足夠的性能保障,同時(shí)又具有FPGA足夠好的可編程靈活性的可重構(gòu)ASIC呢?這就是本文所關(guān)注的可重構(gòu)計(jì)算領(lǐng)域。

可重構(gòu)計(jì)算領(lǐng)域國內(nèi)做的最好的團(tuán)隊(duì)是清華大學(xué)魏少軍教授團(tuán)隊(duì),魏老師團(tuán)隊(duì)曾開發(fā)過可重構(gòu)的CPU芯片、可重構(gòu)的密碼算法芯片以及可重構(gòu)的深度學(xué)習(xí)芯片等。這些芯片都以同時(shí)具備ASIC的高性能和FPGA的靈活性作為最重要的優(yōu)勢,當(dāng)然,你也可以認(rèn)為這些芯片都是相關(guān)領(lǐng)域可編程顆粒度較大的特殊的FPGA芯片。那么,除了上面的幾個(gè)領(lǐng)域之外,網(wǎng)絡(luò)交換領(lǐng)域是否存在類似的特殊的FPGA芯片呢?答案是肯定的。從2013年開始,斯坦福大學(xué)的Nick McKeown 教授為了充分解放數(shù)據(jù)平面的編程能力于2014 年首次設(shè)計(jì)并提出了數(shù)據(jù)平面特定領(lǐng)域編程語言P4,經(jīng)提出就得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注和認(rèn)可。工業(yè)界紛紛跟進(jìn)并著手研制了一系列高性能的可編程硬件,其中主要包含Barefoot Tofino,Cavium XPliant以及Netronome NICs等。其中Barefoot Tofino 是目前業(yè)界數(shù)據(jù)分組轉(zhuǎn)發(fā)速度最快的可編程硬件,最高可以達(dá)到6.5Tbit/s 的線速數(shù)據(jù)分組轉(zhuǎn)發(fā)速率,性能遠(yuǎn)超傳統(tǒng)交換機(jī)。一方面基于可編程設(shè)備的可定制化特性能夠快速實(shí)現(xiàn)和驗(yàn)證一些新型的網(wǎng)絡(luò)架構(gòu)、功能和協(xié)議,極大加速了網(wǎng)絡(luò)演進(jìn)和創(chuàng)新;另一方面基于可編程設(shè)備的高性能特性,傳統(tǒng)上由靈活但低性能的中間件實(shí)現(xiàn)的一些比如防火墻,負(fù)載均衡等較為簡單的網(wǎng)絡(luò)功能可以卸載到可編程數(shù)據(jù)平面上實(shí)現(xiàn)來獲取可觀的性能提升。數(shù)據(jù)平面特定領(lǐng)域編程語言P4 具有如下3 點(diǎn)語言特性。1) 可重配置性:P4 支持轉(zhuǎn)發(fā)邏輯代碼經(jīng)過編譯部署到具體平臺(tái)上之后動(dòng)態(tài)修改報(bào)文的處理方式。這樣的話,運(yùn)營商就可以在不更換硬件的前提下靈活定義數(shù)據(jù)平面的處理行為,極大降低了更換設(shè)備的資金成本和等待新設(shè)備開發(fā)的時(shí)間成本。2) 協(xié)議無關(guān)性:P4 并不綁定于某個(gè)特定的網(wǎng)絡(luò)協(xié)議。開發(fā)人員只需根據(jù)P4 語言定義的語法語義要素結(jié)合平臺(tái)的相關(guān)特性就可以自定義新協(xié)議,同時(shí)也能夠去除冗余的協(xié)議,按需使用協(xié)議,降低了額外開銷,提高了設(shè)備的資源利用率。3) 平臺(tái)無關(guān)性:開發(fā)人員可以獨(dú)立于特定的底層運(yùn)行平臺(tái)來編寫數(shù)據(jù)報(bào)文處理邏輯。代碼能夠通過設(shè)備相關(guān)的后端編譯器快速地在硬件交換機(jī)、FPGA、SmartNIC、軟件交換機(jī)等不同平臺(tái)之間移植,減輕了開發(fā)人員的負(fù)擔(dān),提高了開發(fā)效率。

好了,說了那么多,都是本文以下內(nèi)容的鋪墊。本文介紹的主要內(nèi)容是為了配合硬件實(shí)現(xiàn)可編程的PISA的包處理器,特別實(shí)現(xiàn)了一種在硬件實(shí)現(xiàn)時(shí)為支持不同數(shù)據(jù)位寬下靈活可編程的CRC架構(gòu)。通俗點(diǎn)說,就是在實(shí)現(xiàn)可重構(gòu)包處理器時(shí),數(shù)據(jù)通路的CRC計(jì)算為了支持不同位寬時(shí)的一種低成本解決方案。本文作者是團(tuán)隊(duì)博士生劉歡,相關(guān)研究已撰寫論文發(fā)表在TCASII雜志2021年1月的第一期雜志上(題目:Low-Cost and Programmable CRC Implementation Based on FPGA),源代碼已在GitHub開源(https://github.com/FPGA-Networking/Low-Cost-and-Programmable-CRC)。以下是文章的部分中文譯文。

另外,F(xiàn)PGA LUT可編程的內(nèi)容也可以參考本公眾號(hào)之前的文章《【重磅干貨】手把手教你動(dòng)態(tài)編輯Xilinx FPGA內(nèi)LUT內(nèi)容》。

循環(huán)冗余碼校驗(yàn)(CRC)是一種眾所周知的錯(cuò)誤檢測代碼,已廣泛用于以太網(wǎng),PCIe和其他傳輸協(xié)議中?,F(xiàn)有的基于FPGA的實(shí)現(xiàn)解決方案在高性能場景中會(huì)遇到資源過度利用的問題。填充零問題和可編程性的引入進(jìn)一步加劇了這個(gè)問題。在本文中,提出了stride-by-5算法,以實(shí)現(xiàn)FPGA資源的最佳利用。提出了pipelining go back算法來解決填充零問題。提出了使用HWICAP進(jìn)行重編程的方法,以實(shí)現(xiàn)資源占用少且恒定的可編程性。實(shí)驗(yàn)結(jié)果表明,所提出的非分段架構(gòu)的資源利用率與兩種基于FPGA的最新CRC實(shí)現(xiàn)相比,降低80.7%-87.5%和25.1%-46.2%,并且所提出的分段架構(gòu)具有比兩種最新狀態(tài)更低的資源利用率,分別降低了81.7%-85.9%和2.9%-20.8%藝術(shù)建筑。此外,保證了吞吐量和可編程性。源代碼已在GitHub開源。

1. 引言
“在硬件加速計(jì)算時(shí)代,識(shí)別并卸載通用的抽象和原語,而不是單獨(dú)的算法和協(xié)議?!?/p>

隨著網(wǎng)絡(luò)吞吐量的不斷增加,越來越多的數(shù)據(jù)包處理任務(wù)被轉(zhuǎn)移到基于現(xiàn)場可編程門陣列的智能網(wǎng)卡上,包括循環(huán)冗余校驗(yàn)的生成和驗(yàn)證。400G等技術(shù)和即將到來的多太比特以太網(wǎng)要求更快的CRC計(jì)算[5],而基于FPGAs的高性能CRC計(jì)算的實(shí)現(xiàn)必須滿足三個(gè)要求:1)降低并行化成本。Dennard縮放[2]的結(jié)束導(dǎo)致了提高集成電路頻率的瓶頸,更高的吞吐量意味著芯片中更寬的總線。4切片和8切片算法是在[3]中提出的并行處理算法,適用于CPU,但不適用于FPGAs [4]。2)解決補(bǔ)零問題。并行化意味著事務(wù)的最后一個(gè)字由有效字節(jié)和填充零組成。填充零的數(shù)量是不確定的,并且使用完整的最終字的循環(huán)冗余校驗(yàn)計(jì)算將導(dǎo)致錯(cuò)誤的結(jié)果,這被稱為填充零問題。[5]說明解決這個(gè)問題的最新方案。最后一個(gè)字對(duì)應(yīng)的表是以流水線的方式組織的,每個(gè)流水線步驟對(duì)應(yīng)于一個(gè)二叉查找樹層。介紹了一種O(n)資源利用方式。3)保持可編程性。循環(huán)冗余校驗(yàn)算法的可編程實(shí)現(xiàn)可以實(shí)現(xiàn)更好的可重用性;因此,無需修改電路即可支持廣泛的應(yīng)用。需求可以在iSCSI [6]和P4 [7]找到。使用特定的電路架構(gòu)來保證可編程性[8],但不適用于FPGAs。[4]是適用于FPGAs的最先進(jìn)的方案,但它需要復(fù)雜的配置電路,導(dǎo)致資源利用率隨著總線寬度的增加而大幅提高。

上述三個(gè)要求導(dǎo)致了可觀的資源利用率。盡管slicing[3] [4]、aggressive strides、多個(gè)流的同時(shí)處理[5]以及支持循環(huán)冗余校驗(yàn)加速的許多其他原則是眾所周知的,但它們不能同時(shí)實(shí)現(xiàn)低成本、高性能和可編程性。采用英特爾循環(huán)冗余校驗(yàn)指令[9]的多核多插槽系統(tǒng)可以實(shí)現(xiàn)高吞吐量,但在數(shù)據(jù)包處理應(yīng)用中會(huì)面臨高延遲和高功耗的問題。簡單地說,提出了兩種算法和一種對(duì)應(yīng)于這三種要求的方法,以在保證吞吐量和可編程性的情況下降低資源利用率。首先,提出了stride-by-5算法,與slicing-by-4和slicing-by-8算法相比,該算法的資源利用率降低了79.69%-79.98%。其次,提出了pipelining go back算法來解決填充零問題,這將引入一個(gè)O (log2 n)資源利用率。最后,硬件內(nèi)部配置訪問端口(HWICAP)用于實(shí)現(xiàn)動(dòng)態(tài)可編程性,無論總線寬度如何,它都可以實(shí)現(xiàn)小而恒定的資源利用率。

本文的其余部分組織如下。第二節(jié)介紹了一些基礎(chǔ)知識(shí)。第三節(jié)討論了系統(tǒng)架構(gòu)和三個(gè)創(chuàng)新。第四節(jié)顯示了綜合結(jié)果。第五節(jié)是本文的結(jié)尾。

2. 基礎(chǔ)知識(shí)

2.1 并行循環(huán)冗余校驗(yàn)算法
并行循環(huán)冗余校驗(yàn)算法可以同時(shí)處理多個(gè)數(shù)據(jù)輸入位[10]。并行處理的位數(shù)設(shè)為,這也是本文剩余部分中內(nèi)部總線的寬度。并行輸入數(shù)據(jù)為

。在Bn進(jìn)入之前,循環(huán)冗余校驗(yàn)寄存器的值為Ck。Cn+k和Ck的關(guān)系是:


3. 設(shè)計(jì)思路

3.1 非分段系統(tǒng)架構(gòu)
所提出的非分段系統(tǒng)架構(gòu)如圖1所示。在非分段系統(tǒng)架構(gòu)中,單個(gè)字中應(yīng)該有一個(gè)幀,分段系統(tǒng)架構(gòu)可以同時(shí)處理多個(gè)幀[13]。區(qū)域1和2對(duì)應(yīng)于(1)中WlnBn的計(jì)算。區(qū)域1消耗大部分查找表,消耗的查找表數(shù)量線性地取決于Wln的大小。在第二節(jié)中討論的stride-by-5算法是為了減少區(qū)域1的LUT消耗而提出的。區(qū)域2通過異或樹而不是一級(jí)異或函數(shù)來實(shí)現(xiàn),以獲得更高的性能。區(qū)域3完成了公式(1)的計(jì)算。區(qū)域4解決了填充零問題,并在第五節(jié)中提出和討論了導(dǎo)致O(log2n)資源利用率的pipelining go back算法。區(qū)域5是一個(gè)HWICAP控制器,可以動(dòng)態(tài)修改查找表的內(nèi)容。操作程序在第四節(jié)中討論。分段系統(tǒng)架構(gòu)在第五節(jié)中提出。上述建議的實(shí)施細(xì)節(jié)可訪問[1]。

3.2 stride-by-5算法

在這一部分中,建立了資源利用模型,證明了對(duì)于不同的總線寬度,5步是最佳的步幅(stride),stride-by-5算法在算法1中描述。顧名思義,Stride是指單個(gè)邏輯表處理的位數(shù)。邏輯表可以用FPGA LUTs實(shí)現(xiàn),可以加載一個(gè)函數(shù)的真值表。例如,八輸入函數(shù)定義為:

步幅為8和4的等式(3)和(4)可以分別如圖2(a)和圖2(b)所示實(shí)現(xiàn)。較小的步長意味著較小的邏輯表可以通過單個(gè)LUT或級(jí)聯(lián)查找表來實(shí)現(xiàn)。步長等于1可以認(rèn)為是FPGA實(shí)現(xiàn)的最佳步距嗎?我們將建立資源利用模型并確定答案。


stride-by-5算法對(duì)于FPGAs中的5輸入查找表是最佳的。與slicing-by-4和slicing-by-8算法中使用的stride-by-8相比,stride-by-5將資源利用率降低了79.69%-79.98%。對(duì)于具有非5輸入查找表的FPGAs(Xilinx Virtex-5或Altera Stratix II之前),應(yīng)使用由LUT輸入數(shù)定義的步長,并應(yīng)利用LUT共享機(jī)制。stride-by-5算法在算法1中描述;它在這里處理區(qū)域1中的計(jì)算,但是該算法也可以在區(qū)域3和4中使用。

3.3 Pipelining Go Back算法

在這一部分中,提出了一種資源利用率為O(log2n)的pipelining go back算法,并給出了算法的推導(dǎo)和描述。

q可以表示為:


3.4 通過HWICAP進(jìn)行重編程

圖1中的區(qū)域5代表一個(gè)HWICAP IP核,它可以動(dòng)態(tài)修改查找表的內(nèi)容。對(duì)于任何總線寬度,它消耗186個(gè)查找表。相比之下,邏輯資源實(shí)現(xiàn)的配置邏輯導(dǎo)致n ≥ 1024 [4]時(shí)消耗幾千個(gè)lut,資源利用率隨著總線寬度的增加而增加。使用HWICAP IP核重新編程的操作程序如下所述:

1. 完成初始設(shè)計(jì),使用Vivado生成比特流,并將比特流下載到FPGA

2. 提取所用查找表的位置;

3. 當(dāng)需要重新編程時(shí),使用(1)和(12)計(jì)算查找表的新內(nèi)容;

4. 將查找表的內(nèi)容映射到查找表的初始值;

5. 使用HWICAP IP核的AXI Lite 接口將初始值寫入查找表。

重編程方法在工程上是有用的。我們的貢獻(xiàn)如下:

1. 我們驗(yàn)證了使用HWICAP IP核對(duì)循環(huán)冗余校驗(yàn)算法的現(xiàn)場可編程門陣列實(shí)現(xiàn)進(jìn)行重新編程的可行性。不考慮總線寬度,導(dǎo)致資源利用率小且恒定;

2. 該方法可以直接改變循環(huán)冗余校驗(yàn)多項(xiàng)式,無需重新編碼和合成;

3. 上述程序的代碼可作為整個(gè)項(xiàng)目的一部分在[1]中訪問。據(jù)我們所知,這是第一個(gè)涵蓋上述整個(gè)過程的開源代碼。

3.5 分段系統(tǒng)架構(gòu)

非分段系統(tǒng)架構(gòu)無法在一個(gè)字(時(shí)鐘)中處理多個(gè)幀,這降低了短幀或未對(duì)齊幀的吞吐量。這就是總線效率問題。針對(duì)這一問題,提出了一種分段的系統(tǒng)架構(gòu)。總線格式與[5]中的相同,[5]中的塊(block)是[13]中段(segment)的另一個(gè)名稱。比如一條4096位總線可以同時(shí)處理8個(gè)完整的幀;因此,總線可以分為八個(gè)區(qū)域[5]。區(qū)域的數(shù)量僅取決于總線寬度。不同的段寬度是可行的,如果選擇64位的段寬度,一個(gè)區(qū)域可以分成八個(gè)段(塊)。圖3示出了所提出的分段系統(tǒng)架構(gòu)。與建議的非分段系統(tǒng)架構(gòu)相比,建議的分段系統(tǒng)架構(gòu)具有稍微更復(fù)雜的區(qū)域1和區(qū)域2以及區(qū)域3和區(qū)域4的多個(gè)副本。重復(fù)的數(shù)量只是單個(gè)字中處理的最大幀數(shù)。

在圖4中可以找到所提出的分段系統(tǒng)架構(gòu)和所提出的非分段系統(tǒng)架構(gòu)之間的比較。紅色長方體代表非分段系統(tǒng)架構(gòu)。藍(lán)色長方體表示建議的分段系統(tǒng)架構(gòu)和建議的非分段系統(tǒng)架構(gòu)之間的增量。黃色切片(總線寬度= 1024,段寬度=512) 表示兩種體系結(jié)構(gòu)之間的減量。圖4a示出了資源利用率的增加主要取決于總線寬度而不是段寬度。這是因?yàn)橘Y源利用率的增加主要取決于區(qū)域3和4的副本數(shù)量,而區(qū)域3和4的副本數(shù)量僅取決于總線寬度。圖4b顯示,在大多數(shù)情況下,65字節(jié)幀吞吐量的增加是明顯的。當(dāng)總線寬度為1024位,段寬度為512位時(shí),吞吐量只會(huì)下降,其中兩種架構(gòu)對(duì)于65字節(jié)幀吞吐量具有相同的總線效率,而非分段架構(gòu)的頻率略高。因此,在本文的其余部分,選擇64位作為段寬。分段和非分段架構(gòu)之間的詳細(xì)比較可以在本簡報(bào)的擴(kuò)展版本中找到[11]。

4. 實(shí)驗(yàn)結(jié)果

有三個(gè)最先進(jìn)的研究[5][4][14]。[4][14]中的體系結(jié)構(gòu)可以重新編程,而[5]中的體系結(jié)構(gòu)不能重新編程。提出的兩種架構(gòu)分別用Virtex-7 XC7VX690T實(shí)現(xiàn),[5][4][14]使用Virtex-7 XCVH870T、Virtex-6 XC6VLX550T和Stratix-V 5SGSED6N1F45I2。在本節(jié)中,從資源利用率和最大吞吐量的角度將兩種建議的體系結(jié)構(gòu)與這些工作進(jìn)行了比較。就各種幀長度的吞吐量而言,將所提出的分段架構(gòu)與[5]進(jìn)行了比較。還報(bào)告了兩種建議架構(gòu)的功耗。在下文中,我們使用SA來指代分段架構(gòu)。

綜合結(jié)果如圖5所示。圖5a示出了建議的非SA的資源利用率較分別比[4]和[5]中的體系結(jié)構(gòu)低80.7%-87.5%和25.1%-46.2%,SA的分別為81.7%-85.9%和2.9%-20.8%。資源利用率較低是由于實(shí)施了第三節(jié)中描述的算法和方法,這也可以保證高性能和可編程性。[14]中的體系結(jié)構(gòu)的資源利用率比非SA體系結(jié)構(gòu)低74.4%-81.3%。[14]資源利用率較低的原因如下:1)。[14]只需要處理半滿和全滿的數(shù)據(jù)包。換句話說,補(bǔ)零問題得到了部分解決。相比之下,兩個(gè)建議的架構(gòu)和[5][4]可以完全解決填充零問題。2)。Nios II IP核的成本在[14]中沒有考慮。相比之下,兩種建議的體系結(jié)構(gòu)都考慮了HWICAP的成本。此外,很難將[14]的總線寬度擴(kuò)展到1024位。

圖5b顯示,所提出的非SA的最大吞吐量分別比[4][5][14]中的架構(gòu)高24.2%-37.9%、37.4%-75.0%和259.4%-284.5%。提出的SA的最大吞吐量分別比[4][5]中的架構(gòu)高28.7%-30.2%和32.2%-80.2%。更高的頻率導(dǎo)致更高的吞吐量,并且兩個(gè)建議的架構(gòu)可以為區(qū)域1、2和4中排列良好的流水線實(shí)現(xiàn)更高的頻率。

幀長度從64字節(jié)到256字節(jié)的吞吐量可以在圖5c中找到。只有[5]和提議的SA被比較,因?yàn)樗鼈冊(cè)谝粋€(gè)字中處理多個(gè)幀的能力。這兩種架構(gòu)使用4096位總線寬度和64位段寬度;因此,它們具有相同的總線效率。提議的SA的頻率和吞吐量比[5]高80.2%。當(dāng)幀長度為65字節(jié)時(shí),最低吞吐量為1933.9 Gbps。

兩種提出架構(gòu)的功耗如圖5d所示。它們以500Mhz運(yùn)行。數(shù)據(jù)集來自vivado生成的實(shí)施后功耗報(bào)告。功耗由靜態(tài)功耗和動(dòng)態(tài)功耗組成。靜態(tài)功耗從0.32 W到0.48 W不等,動(dòng)態(tài)功耗隨著總線寬度的增加而線性增加。提議的SA的功耗比提議的非SA的功耗增長更快。這是因?yàn)樘嶙h的SA的資源消耗比提議的非SA的資源消耗增加得更快。

板級(jí)實(shí)現(xiàn)和與其他作品的比較可以在本文的擴(kuò)展版本中找到[11]。

5. 結(jié)論和未來工作
本文提出了兩種算法和一種方法來實(shí)現(xiàn)低成本、高性能和可編程的循環(huán)冗余校驗(yàn)計(jì)算。這些算法和所提出的方法可用于分段或非分段架構(gòu)。綜合結(jié)果表明,與現(xiàn)有的兩種體系結(jié)構(gòu)相比,所提出的體系結(jié)構(gòu)可以實(shí)現(xiàn)更低的資源利用率和更高的吞吐量。源代碼可以在[1]中訪問。我們未來的工作將集中在使硬件重配置方法(HWICAP)技術(shù)獨(dú)立。

參考文獻(xiàn)

[1] S.C. of Low-Cost and Programmable CRC Implementation.Accessed: Apr. 24, 2020. [Online]. Available: https://github.com/FPGA-Networking/Low-Cost-and-Programmable-CRC.

[2] R. H. Dennard, F. H. Gaensslen, V. L. Rideout, E. Bassous, and A. R.LeBlanc, “Design of ion-implanted MOSFET’s with very small physicaldimensions,”IEEE J. Solid-State Circuits, vol. 9, no. 5, pp. 256–268,Oct. 1974.

[3] M. E. Kounavis and F. L. Berry, “Novel Table Lookup-Based Algorithmsfor High-Performance CRC Generation,”IEEE Trans. Comput., vol. 57,no. 11, pp. 1550–1560, Nov. 2008.

[4] A. Akagic and H. Amano, “High-speed fully-adaptable CRC accelera-tors,” IEICE Trans. Inf.& Syst., vol. 96, no. 6, pp. 1299–1308, 2013.

[5] L. Kekely, J. Cabal, and J. Koˇrenek, “Effective FPGA Architecturefor General CRC,” in International Conference on Architecture ofComputing Systems. Springer, 2019, pp. 211–223.

[6] C. Toal, K. McLaughlin, S. Sezer, and X. Yang, “Design and Implemen-tation of a Field Programmable CRC Circuit Architecture,” IEEE Trans.Very Large Scale Integr. (VLSI) Syst., vol. 17, no. 8, pp. 1142–1147,2009.

[7] The P4 Language Consortium. (Nov. 2018). The P4 Language Spec-ification, Version 1.0.5. [Online]. Available: https://p4.org/p4-spec/p4-14/v1.0.5/tex/p4.pdf.

[8] M. Grymel and S. B. Furber, “A Novel Programmable Parallel CRC Circuit,”IEEE Trans. Very Large Scale Integr. (VLSI) Syst., vol. 19,no. 10, pp. 1898–1902, Oct. 2011.

[9] S. Gueron, “Speeding up CRC32C computations with Intel CRC32instruction,” Information Processing Letters,vol. 112, no. 5, pp. 179–185, 2012.

[10] G. Campobello, G. Patane, and M. Russo, “Parallel CRC realization,”IEEE Trans. Comput., vol. 52, no. 10, pp. 1312–1319, Oct. 2003.

[11] H. Liu, Z. Qiu, W. Pan, J. Li, L. Zheng, and Y. Gao, “Low-Cost and Programmable CRC Implementation based on FPGA,” 42020. [Online]. Available: https://www.techrxiv.org/articles/Low-Costand Programmable CRCImplementation based on FPGA/12181494

[12] K. Vipin and S. A. Fahmy, “FPGA Dynamic and Partial Reconfiguration:A Survey of Architectures Methods and Applications,”ACM Comput.Surv., vol. 51, no. 4, pp. 1–39, 2018.

[13] P. Orosz, T. T′ othfalusi, and P. Varga, “FPGA-Assisted DPI Systems:100 Gbit/s and Beyond,”IEEE Commun. Surveys Tuts., vol. 21, no. 2,pp. 2015–2040, 2019.

[14] M. Jubin and T. Nayak, “Reconfigurable very high throughput lowlatency VLSI (FPGA) design architecture of CRC 32,” Integration,vol. 56, pp. 1–14, 2017.

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費(fèi)下載
  2. 0.00 MB  |  1491次下載  |  免費(fèi)
  3. 2單片機(jī)典型實(shí)例介紹
  4. 18.19 MB  |  95次下載  |  1 積分
  5. 3S7-200PLC編程實(shí)例詳細(xì)資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識(shí)別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關(guān)電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費(fèi)
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
  14. 0.23 MB  |  4次下載  |  免費(fèi)
  15. 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
  16. 0.11 MB  |  4次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費(fèi)
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費(fèi)
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費(fèi)
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費(fèi)
  9. 5555集成電路應(yīng)用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費(fèi)
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費(fèi)
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費(fèi)
  15. 8開關(guān)電源設(shè)計(jì)實(shí)例指南
  16. 未知  |  21539次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537793次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191183次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138039次下載  |  免費(fèi)