快点吧啊下面都日出水了,特级做A爰片毛片A片免费

本文轉(zhuǎn)載自：網(wǎng)絡(luò)交換FPGA微信公眾號(hào)

近年來(lái)，隨著集成電路工藝的不斷進(jìn)步，大數(shù)據(jù)與人工智能的興起，數(shù)據(jù)中心的網(wǎng)絡(luò)負(fù)載愈來(lái)愈高，然而由于摩爾定律和Dennard縮放定律的失效，通用處理器依靠加深流水線(xiàn)深度和增加多核并行都受到功耗墻和存儲(chǔ)器墻的限制。星球級(jí)算力需求的增加促使定制化硬件逐漸興起（見(jiàn)公眾號(hào)文章：未來(lái)已來(lái)：ASIC云和行星級(jí)應(yīng)用程序的數(shù)據(jù)中心），從RDMA到RoCE V2到TOE設(shè)備，數(shù)據(jù)中心網(wǎng)絡(luò)從10Gbps發(fā)展到40Gbps，目前100Gbps和400Gbps的接口正在成為主流。本文設(shè)計(jì)的100Gbps網(wǎng)卡基于一款開(kāi)源100Gbps NIC剛玉（見(jiàn)公眾號(hào)文章：業(yè)界第一個(gè)真正意義上開(kāi)源100 Gbps NIC Corundum介紹），在理解消化代碼的基礎(chǔ)上，基于其架構(gòu)將部分核心代碼進(jìn)行修改，使其更適合于硬件實(shí)現(xiàn)，并為后續(xù)擴(kuò)展功能進(jìn)行了前期預(yù)研和準(zhǔn)備。

公眾號(hào)文章《業(yè)界第一個(gè)真正意義上開(kāi)源100 Gbps NIC Corundum介紹》發(fā)出后，得到了很多粉絲的關(guān)注，大家紛紛留言討論。因此，本文也是對(duì)眾多問(wèn)題的簡(jiǎn)單回應(yīng)。另外，特別感謝Xilinx提供免費(fèi)試用的Alveo U50網(wǎng)卡，我們把原本搭載在VCU118板卡上的剛玉工程移植到了Alveo U50板卡上，與VCU118板卡一起實(shí)現(xiàn)了兩臺(tái)普通電腦的100Gbps光纖連接，并進(jìn)行了非優(yōu)化加速情況下普通應(yīng)用的測(cè)試。

隨著云計(jì)算的興起，越來(lái)越多的計(jì)算被部署到云端來(lái)執(zhí)行，數(shù)據(jù)中心的運(yùn)營(yíng)模式逐漸云化，從接入模式來(lái)看，當(dāng)前部署的云計(jì)算主要分為公有云、私有云和混合云。私有云主要是單位或者個(gè)人使用的云計(jì)算資源，不對(duì)外提供，因此可以不兼容傳統(tǒng)以太網(wǎng)，在諸如高性能的分布式計(jì)算應(yīng)用場(chǎng)景下有較好的應(yīng)用前景。公有云通過(guò)Internet為用戶(hù)提供服務(wù)，因此需要兼容以太網(wǎng)。再加上需要定制加速的應(yīng)用越來(lái)越多，可編程的Smart NIC逐漸的走上了舞臺(tái)中央。

高性能數(shù)據(jù)中心的網(wǎng)絡(luò)演進(jìn)趨勢(shì)

軟硬件協(xié)同優(yōu)化方法

在1Gbps時(shí)代，由操作系統(tǒng)網(wǎng)絡(luò)、協(xié)議棧和進(jìn)程調(diào)度引起的開(kāi)銷(xiāo)是可以接受的，但是隨著定制化硬件的性能越來(lái)越高，網(wǎng)絡(luò)協(xié)議棧和進(jìn)程上下文切換引起的開(kāi)銷(xiāo)變得不可接受。針對(duì)協(xié)議棧的開(kāi)銷(xiāo)，人們提出了分段卸載功能，將數(shù)據(jù)面卸載到可編程網(wǎng)卡設(shè)備而在處理器上僅對(duì)控制面進(jìn)行處理；在用戶(hù)側(cè)，應(yīng)用程序通過(guò)BSD Socket接口和協(xié)議棧通信，然而協(xié)議棧進(jìn)程和網(wǎng)卡驅(qū)動(dòng)程序位于內(nèi)核態(tài)，頻繁發(fā)生的用戶(hù)態(tài)和內(nèi)核態(tài)上下文切換和數(shù)據(jù)緩沖區(qū)的拷貝帶來(lái)了極大的CPU開(kāi)銷(xiāo)。為了解決這個(gè)問(wèn)題，提出了諸如英特爾的DPDK的用戶(hù)態(tài)協(xié)議棧，這些協(xié)議棧大多涉及或支持無(wú)鎖的Ring操作，更換了用戶(hù)Socket API，采用內(nèi)存重映射等技術(shù)實(shí)現(xiàn)DMA零拷貝技術(shù)。可見(jiàn)，采用軟硬件協(xié)同設(shè)計(jì)方法是優(yōu)化網(wǎng)絡(luò)中心的最佳方案。

RDMA技術(shù)

RDMA（RemoteDirect Memory Access）技術(shù)全稱(chēng)遠(yuǎn)程直接內(nèi)存訪問(wèn)，就是為了解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的。RDMA有以下三個(gè)特性：

Remote：無(wú)CPU參與，數(shù)據(jù)通過(guò)網(wǎng)絡(luò)與遠(yuǎn)程機(jī)器間進(jìn)行數(shù)據(jù)傳輸。

Direct：沒(méi)有內(nèi)核態(tài)的切換，有關(guān)發(fā)送傳輸?shù)乃袃?nèi)容都卸載到網(wǎng)卡上。

Memory：在用戶(hù)空間虛擬內(nèi)存與RNIC網(wǎng)卡直接進(jìn)行數(shù)據(jù)傳輸不涉及到系統(tǒng)內(nèi)核，沒(méi)有額外的數(shù)據(jù)移動(dòng)和復(fù)制。

值得注意的是，RDMA沒(méi)有使用標(biāo)準(zhǔn)的TCP/IP協(xié)議，而是提出了自己的一套傳輸協(xié)議，因此不支持廣域網(wǎng)的傳輸，為了支持公有云的設(shè)計(jì)，RDMA在承載網(wǎng)絡(luò)上設(shè)計(jì)了三套標(biāo)準(zhǔn)。

1）實(shí)現(xiàn)在InfiniBand網(wǎng)絡(luò)。InfiniBand是專(zhuān)為RDMA設(shè)計(jì)的一套網(wǎng)絡(luò)，在硬件級(jí)別保證數(shù)據(jù)可靠傳輸。需要專(zhuān)用的IB交換機(jī)和IB網(wǎng)卡，不支持Internet連接，主要適用于私有云和分布式計(jì)算。

2）RoCE（RDMAover Converged Ethernet），分為V1版本和V2版本。RoCEV1將RDMA協(xié)議運(yùn)行在以太網(wǎng)協(xié)議上，而RoCEV2將RDMA協(xié)議運(yùn)行在UDP協(xié)議上。構(gòu)建RoCE網(wǎng)絡(luò)需要專(zhuān)用網(wǎng)卡，但是交換機(jī)可以兼容標(biāo)準(zhǔn)以太網(wǎng)交換機(jī)，因此可以用于構(gòu)建公有云和數(shù)據(jù)中心。

3）iWarp（internetWide Area RDMA Protocol），iWarp將RDMA協(xié)議運(yùn)行在TCP協(xié)議上，與RoCE具有類(lèi)似特性。

目前，RoCE由于支持Internet并且較iWarp協(xié)議更加簡(jiǎn)單，擁有較大的市場(chǎng)和更好的前景。

另外，針對(duì)Smart NIC的研究現(xiàn)在也被推上高潮，由于采用了嵌入式的CPU，智能網(wǎng)卡可以進(jìn)一步降低對(duì)Host主機(jī)的依賴(lài)，因此正在被數(shù)據(jù)中心廣泛采用。

開(kāi)源100Gbps NIC（Corundum）架構(gòu)簡(jiǎn)介

高性能NIC采用基于隊(duì)列和描述符的機(jī)制完成數(shù)據(jù)發(fā)送和接收的調(diào)制解調(diào)。描述符即指向內(nèi)存中數(shù)據(jù)物理地址的一組地址描述邏輯，隊(duì)列被實(shí)現(xiàn)為內(nèi)存中連續(xù)的、可以存放多個(gè)描述符的環(huán)形緩沖區(qū)。網(wǎng)卡的驅(qū)動(dòng)程序發(fā)出內(nèi)存屏障，生成數(shù)據(jù)和對(duì)應(yīng)的描述符后通過(guò)門(mén)鈴操作告知板卡，板卡獲取描述符后解析，并產(chǎn)生對(duì)數(shù)據(jù)的處理操作。

從系統(tǒng)結(jié)構(gòu)上來(lái)看，NIC的頂層包含PCIe IP和DMA接口、100Gbps MAC IP和PHY及相應(yīng)的以太網(wǎng)接口，頂層還需要包含一個(gè)或者多個(gè)Interface接口，一個(gè)Interface接口被實(shí)現(xiàn)為Host下的一個(gè)NIC，即操作系統(tǒng)級(jí)別的網(wǎng)絡(luò)接口。網(wǎng)絡(luò)接口內(nèi)部主要用于戶(hù)邏輯的實(shí)現(xiàn)，包括用于維護(hù)NIC隊(duì)列的隊(duì)列管理邏輯，描述符獲取和操作完成報(bào)文寫(xiě)邏輯、發(fā)送和接收引擎以及發(fā)送調(diào)度程序，用于中間暫存數(shù)據(jù)的分段存儲(chǔ)器。

在發(fā)送方向上，由驅(qū)動(dòng)更新生產(chǎn)者指針并通過(guò)PCIe的下行鏈路通知到板卡寄存器，發(fā)送隊(duì)列管理邏輯通過(guò)Doorbell操作告知發(fā)送調(diào)度程序。發(fā)送調(diào)度采用RR調(diào)度算法從已啟用的隊(duì)列進(jìn)行調(diào)度，而后發(fā)送調(diào)度向發(fā)送引擎發(fā)起req請(qǐng)求。發(fā)送引擎收到傳輸請(qǐng)求后，向?qū)?yīng)隊(duì)列發(fā)送描述符獲取請(qǐng)求，最終，描述符獲取請(qǐng)求由描述符獲取模塊路由到發(fā)送隊(duì)列管理模塊，發(fā)送隊(duì)列管理模塊將對(duì)應(yīng)的狀態(tài)響應(yīng)到描述符獲取模塊，描述符獲取模塊使用DMA接口上的控制接口將描述符從隊(duì)列取出后放到中間段RAM，而后將描述符獲取狀態(tài)返回到發(fā)送引擎。發(fā)送引擎根據(jù)描述符獲取狀態(tài)到中間段RAM取得描述符，而后使用DMA的數(shù)據(jù)接口將數(shù)據(jù)從Host搬移到分段存儲(chǔ)器RAM，然后又DMA客戶(hù)端將數(shù)據(jù)從分段存儲(chǔ)器發(fā)送到MAC控制器。上述數(shù)據(jù)操作流程相當(dāng)復(fù)雜，如果采用狀態(tài)機(jī)控制，將會(huì)浪費(fèi)部分?jǐn)?shù)據(jù)通路的帶寬，這樣數(shù)據(jù)很難達(dá)到高性能。高性能NIC往往采用流水線(xiàn)設(shè)計(jì)，而剛玉NIC中基于操作表和操作指針的設(shè)計(jì)非常適合網(wǎng)絡(luò)流水線(xiàn)的處理，因此我們沿用了這個(gè)設(shè)計(jì)思路并將其擴(kuò)展到部分?jǐn)?shù)據(jù)控制通路上去，后續(xù)小節(jié)將會(huì)詳細(xì)介紹采用操作表和操作指針的流水線(xiàn)設(shè)計(jì)思路。

在接收方向上，傳入的數(shù)據(jù)包通過(guò)流哈希模塊確定目標(biāo)接收隊(duì)列，并為接收引擎生成命令，該命令協(xié)調(diào)對(duì)接收數(shù)據(jù)路徑的操作。由于同一接口模塊中的所有端口共享同一組接收隊(duì)列，因此不同端口上的傳入流將合并到同一組隊(duì)列中。接收方向的數(shù)據(jù)的流程不在贅述。

基于流水線(xiàn)的隊(duì)列管理

實(shí)際上，NIC中為了提高數(shù)據(jù)帶寬利用率，幾乎所有的模塊都采用了流水線(xiàn)處理方式來(lái)促進(jìn)高并發(fā)。本節(jié)以隊(duì)列管理模塊來(lái)介紹基于操作表和操作指針的流水線(xiàn)設(shè)計(jì)思路。

Corundum NIC的隊(duì)列管理邏輯必須能夠有效地存儲(chǔ)和管理數(shù)千個(gè)隊(duì)列的狀態(tài)。為了支持高吞吐量，NIC必須能夠并行處理多個(gè)描述符。因此，隊(duì)列管理邏輯必須跟蹤多個(gè)正在進(jìn)行的操作，并在操作完成時(shí)向驅(qū)動(dòng)程序報(bào)告更新的隊(duì)列指針。NIC的操作表項(xiàng)包含激活和提交標(biāo)志、所屬隊(duì)列號(hào)、和影子指針，操作指針包括操作表開(kāi)始指針和操作表提交指針，通過(guò)不同的指針對(duì)操作表不同字段的索引就可以跟蹤當(dāng)前進(jìn)行中的不同操作項(xiàng)目進(jìn)展到哪一個(gè)步驟，從而可以觸發(fā)流水操作。更詳細(xì)的來(lái)說(shuō)，當(dāng)隊(duì)列管理接收到出隊(duì)請(qǐng)求時(shí)將命令放置到Pipeline同時(shí)觸發(fā)隊(duì)列消息，當(dāng)命令到達(dá)處理周期時(shí)，對(duì)應(yīng)隊(duì)列的信息已經(jīng)被索引到，此時(shí)可以進(jìn)行處理，如果出隊(duì)被允許，必要的信息會(huì)被記錄到操作表，處理邏輯只需要不斷寫(xiě)入操作表并更新操作指針，可以認(rèn)為出隊(duì)邏輯在處理操作表的表頭，操作被提交時(shí)會(huì)觸發(fā)提交邏輯，提交邏輯處理操作表末并合理的釋放操作表。需要注意的是，操作表只跟蹤正在進(jìn)行中的處理進(jìn)程，因此不需要設(shè)置太大。它和隊(duì)列管理的信息RAM構(gòu)成了一個(gè)雙向鏈表，即隊(duì)列信息中需要存入為該隊(duì)列服務(wù)的最新的操作表項(xiàng)索引，用于維護(hù)正確的影子指針。

分段存儲(chǔ)器

為了實(shí)現(xiàn)高性能，Corundum在內(nèi)部使用了自定義分段存儲(chǔ)器接口，該思想與CPU中的剩余緩存技術(shù)設(shè)計(jì)思路類(lèi)似但又不完全一致。該接口被分成最大128位的段，并且整體寬度是PCIe硬IP內(nèi)核的AXI流接口的兩倍。例如，將PCIe Gen 3 x16與PCIe硬核中的512位AXI流接口一起使用的設(shè)計(jì)將使用1024位分段接口，該接口分成8個(gè)段，每個(gè)128位。與使用單個(gè)AXI接口相比，該接口提供了改進(jìn)的“阻抗匹配”，通過(guò)消除背壓和對(duì)準(zhǔn)問(wèn)題來(lái)提高PCIe鏈路利用率。通過(guò)設(shè)置基地址和偏移量，分段存儲(chǔ)器可以在每次訪問(wèn)時(shí)保證100%的數(shù)據(jù)帶寬。

基于Xilinx Alevo U50和VCU118 板卡的測(cè)試

Xilinx Alevo U50卡采用賽靈思 UltraScale+? 架構(gòu)，率先使用半高半長(zhǎng)的外形尺寸和低于75 瓦的低包絡(luò)功耗。該卡支持高帶寬存儲(chǔ)器（HBM2），每秒 100G 網(wǎng)絡(luò)連接，面向任意類(lèi)型的服務(wù)器部署。而VCU118則包含了兩個(gè)100Gbps光模塊，支持PCIe Gen3 X16，最大128Gbps帶寬，兩塊板卡均可以滿(mǎn)足我們的測(cè)試需求。

我們?cè)跍y(cè)試過(guò)程中選用了兩臺(tái)主流性能機(jī)器，它們采用分別Intel 8700K和4770K，配置單如下：

兩臺(tái)機(jī)器使用光纖連接，U50直接插在主機(jī)的PCIe插槽上，VCU118通過(guò)擴(kuò)展的PCIe延長(zhǎng)線(xiàn)插到主機(jī)的PCIe插槽上，實(shí)物圖如下：

Alveo U50由于采用半高設(shè)計(jì)，可以直接插入到服務(wù)器或者普通主機(jī)機(jī)箱內(nèi)，VCU118則需要PCIe電纜進(jìn)行連接。

板卡安裝就緒后，燒寫(xiě)B(tài)it文件，并重新啟動(dòng)系統(tǒng)，裝載Linux驅(qū)動(dòng)，此時(shí)可以使用Linux系統(tǒng)的網(wǎng)絡(luò)工具進(jìn)行查看，在本次測(cè)試中，設(shè)置U50板卡的IP地址為192.168.0.128，VCU118板卡的IP為192.168.0.129。而后進(jìn)行網(wǎng)絡(luò)測(cè)試，發(fā)現(xiàn)可以正常Ping通，網(wǎng)絡(luò)延時(shí)在2ms左右。（視頻請(qǐng)點(diǎn)擊公眾號(hào)查看）

為了測(cè)試TCP連接，我們安裝了FTP傳輸工具用于在兩臺(tái)機(jī)器之間傳輸文件。受限于FTP軟件是雙線(xiàn)程，并且我們使用的機(jī)器采用機(jī)械硬盤(pán)，傳輸?shù)乃俾什⒉焕硐?，但是可以證明TCP鏈接是沒(méi)有問(wèn)題的。（視頻請(qǐng)點(diǎn)擊公眾號(hào)查看）

為了測(cè)試到高性能NIC的極限性能，我們使用C語(yǔ)言創(chuàng)建UDPSocket鏈接，并不斷發(fā)送1400字節(jié)幀長(zhǎng)數(shù)據(jù)。

UDP Socket極限發(fā)包速率

在單線(xiàn)程下，使用BSD Socket可以達(dá)到將近10Gbps的速率，在多線(xiàn)程使用時(shí)受限于CPU瓶頸，我們的最高測(cè)試速率達(dá)到了35Gbps，此時(shí)可以發(fā)現(xiàn)CPU性能已經(jīng)接近滿(mǎn)負(fù)載，即使增加更多的線(xiàn)程，網(wǎng)絡(luò)處理速率也不會(huì)增大，非常遺憾的是更高的性能需要在服務(wù)器級(jí)別的主機(jī)上才能進(jìn)一步測(cè)試。（視頻請(qǐng)點(diǎn)擊公眾號(hào)查看）

也有網(wǎng)友在服務(wù)器上實(shí)現(xiàn)并分享了自己的測(cè)試結(jié)果：

用戶(hù)態(tài)協(xié)議棧和用戶(hù)套接字簡(jiǎn)介

用戶(hù)態(tài)協(xié)議棧旨在替換Linux內(nèi)核自帶的協(xié)議棧，并提供零拷貝DMA技術(shù)。網(wǎng)絡(luò)協(xié)議棧一般作為操作系統(tǒng)的組件，運(yùn)行在內(nèi)核態(tài)中，用戶(hù)調(diào)用套接字來(lái)調(diào)用協(xié)議棧進(jìn)程，此時(shí)會(huì)涉及用戶(hù)態(tài)和內(nèi)核態(tài)的上下文切換。Linux協(xié)議棧為了通用性考慮，本身性能并不高。

從概念上講：Linux協(xié)議棧分為三層，VFS層為應(yīng)用程序提供套接字API；傳統(tǒng)的TCP/IP層提供I/O復(fù)用、擁塞控制、丟包恢復(fù)、路由和服務(wù)質(zhì)量保證；網(wǎng)卡層與網(wǎng)卡硬件完成數(shù)據(jù)收發(fā)。VFS層貢獻(xiàn)了網(wǎng)絡(luò)協(xié)議中極大一部分開(kāi)銷(xiāo)。內(nèi)核穿越和套接字描述符鎖為每次操作帶來(lái)了開(kāi)銷(xiāo)，傳輸協(xié)議在TCP/IP處理上消耗CPU，其他諸如中斷、進(jìn)程切換、I/O復(fù)用也在消耗CPU；此外，BSD Socket中的send和recv語(yǔ)義會(huì)導(dǎo)致協(xié)議棧和應(yīng)用之前的數(shù)據(jù)復(fù)制。

為了解決上述問(wèn)題，目前有多款開(kāi)源的用戶(hù)態(tài)協(xié)議棧被提出。其中包括Intel針對(duì)高速大并發(fā)網(wǎng)絡(luò)提出的數(shù)據(jù)平面開(kāi)發(fā)套件DPDK。Intel-DPDK提供了一套可從linux用戶(hù)態(tài)空間使用的API來(lái)替代傳統(tǒng)的LINUX系統(tǒng)調(diào)用，數(shù)據(jù)將不再跨越Linux內(nèi)核，而是直接通過(guò)Intel-DPDK路徑。注意到，DPDK本身并不具備協(xié)議棧功能，而是為用戶(hù)提供一套開(kāi)發(fā)套件。目前，已經(jīng)存在諸如MTCP等基于DPDK的開(kāi)源用戶(hù)協(xié)議棧。

DPDK存在以下優(yōu)勢(shì)：

1）輪詢(xún)：在包處理時(shí)避免中斷上下文切換的開(kāi)銷(xiāo)，對(duì)于高速大突發(fā)數(shù)據(jù)量的網(wǎng)絡(luò)中心，隨時(shí)都有數(shù)據(jù)到達(dá)。

2）用戶(hù)態(tài)驅(qū)動(dòng)：通過(guò)UIO技術(shù)將報(bào)文拷貝到應(yīng)用空間處理，規(guī)避不必要的內(nèi)存拷貝和系統(tǒng)調(diào)用，便于快速迭代優(yōu)化。

3）親和性與獨(dú)占：傳統(tǒng)內(nèi)核運(yùn)行時(shí)，調(diào)度器采用負(fù)載均衡機(jī)制，一個(gè)進(jìn)程會(huì)在多個(gè)CPU核心上切換，造成額外開(kāi)銷(xiāo)，而DPDK特定任務(wù)可以被指定只在某個(gè)核上工作，避免線(xiàn)程在不同核間頻繁切換，保證更多的cache命中。

4）降低訪存開(kāi)銷(xiāo)：Linux默認(rèn)采用4KB分頁(yè)管理機(jī)制，然而在大量使用內(nèi)存時(shí)，將嚴(yán)重制約程序的運(yùn)行性能。Linux2.6后開(kāi)始支持HUGEPAGE，利用內(nèi)存大頁(yè)HUGEPAGE可以降低TLB miss，利用內(nèi)存多通道交錯(cuò)訪問(wèn)提高內(nèi)存訪問(wèn)有效帶寬。

5）軟件調(diào)優(yōu)：cache行對(duì)齊，預(yù)取數(shù)據(jù)，多元數(shù)據(jù)批量操作。

6）無(wú)鎖隊(duì)列：DPDK 提供了一種低開(kāi)銷(xiāo)的無(wú)鎖隊(duì)列機(jī)制 Ring，Ring 既支持單生產(chǎn)者單消費(fèi)者，也支持多生產(chǎn)者多消費(fèi)者。內(nèi)部實(shí)現(xiàn)沒(méi)有使用鎖，大大節(jié)省了使用開(kāi)銷(xiāo)。

7）使用rte_mbuf結(jié)構(gòu)體來(lái)代替?zhèn)鹘y(tǒng)的sk_buff結(jié)構(gòu)體，可以節(jié)省一次內(nèi)存開(kāi)銷(xiāo)。

后續(xù)的工作和發(fā)展方向

通過(guò)測(cè)試表明，高性能NIC依然存在一些問(wèn)題，如在接收方向上沒(méi)有進(jìn)行描述符預(yù)讀取機(jī)制，這將會(huì)大大提高接收延遲；沒(méi)有加入對(duì)虛擬化的支持，由于網(wǎng)絡(luò)中心主要面向多用戶(hù)服務(wù)，因此大多云都需要加入對(duì)SRIO-V等虛擬化功能的支持；沒(méi)有采用大容量DDR或者更高性能的HBM緩存，這將導(dǎo)致其防抖動(dòng)性能較差；沒(méi)有軟件協(xié)議棧與其配合工作，軟硬件協(xié)同設(shè)計(jì)優(yōu)化趨勢(shì)是大勢(shì)所趨，在網(wǎng)絡(luò)中心上也是如此，高性能NIC需要采用用戶(hù)態(tài)協(xié)議棧來(lái)進(jìn)行優(yōu)化才能更好的發(fā)揮其性能；另外，硬件協(xié)議棧分段卸載也是未來(lái)發(fā)展的方向，未來(lái)的高性能NIC勢(shì)必也要具備這個(gè)功能。

后記

業(yè)界和學(xué)術(shù)界也在為提高Smart NIC性能在不懈的努力。如最近斯坦福大學(xué)著名的Nick教授團(tuán)隊(duì)提出的NanoPU（文章題目：The nanoPU： Redesigning the CPU-Network Interface to Minimize RPC Tail Latency，2020年），100G光口經(jīng)過(guò)協(xié)議無(wú)關(guān)Match-Aciton多級(jí)流表等內(nèi)部處理邏輯再到內(nèi)部嵌入式RISC-V處理器的回環(huán)時(shí)延僅有65ns。

另外，在100G開(kāi)源 Corundum 可編程N(yùn)IC的基礎(chǔ)上的對(duì)該開(kāi)源IP核進(jìn)行改進(jìn)的文章也已經(jīng)出來(lái)了，而且，最可貴的是這篇改進(jìn)的文章PANIC也是開(kāi)源的（OSDI 2020：https://www.usenix.org/conference/osdi20/presentation/lin）。文章針對(duì)目前所有的SmartNIC都不擅長(zhǎng)同時(shí)運(yùn)行多個(gè)租戶(hù)的卸載問(wèn)題進(jìn)行了研究并提出了切實(shí)可行的解決方案。相關(guān)研究工作后續(xù)本公眾號(hào)會(huì)持續(xù)跟進(jìn)。

審核編輯：何安

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

網(wǎng)絡(luò)

網(wǎng)絡(luò)

+關(guān)注

關(guān)注
14

文章
7489

瀏覽量
88555

評(píng)論

相關(guān)推薦

當(dāng)今數(shù)據(jù)中心新技術(shù)趨勢(shì)

當(dāng)今數(shù)據(jù)中心的新技術(shù)趨勢(shì)正以前所未有的速度推動(dòng)著行業(yè)的變革與創(chuàng)新。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展，數(shù)據(jù)中心作為信息技術(shù)的核心基礎(chǔ)設(shè)施，正面臨著前所未有的機(jī)遇與挑戰(zhàn)。一、

發(fā)表于 10-24 15:15 ?288次閱讀

數(shù)據(jù)中心對(duì)MOS管性能的要求

數(shù)據(jù)中心作為現(xiàn)代信息技術(shù)的核心基礎(chǔ)設(shè)施，承載著數(shù)據(jù)存儲(chǔ)、處理和傳輸?shù)闹匾蝿?wù)。在這些任務(wù)中，MOS管（金屬氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管）作為關(guān)鍵的電子元件，其性能對(duì)數(shù)據(jù)中心的整體效率和穩(wěn)定性起著至關(guān)重要的作用。本文將詳細(xì)探討

發(fā)表于 10-11 11:22 ?200次閱讀

SK海力士推出高性能數(shù)據(jù)中心SSD PEB110

SK海力士近日宣布成功開(kāi)發(fā)出專(zhuān)為數(shù)據(jù)中心設(shè)計(jì)的高性能固態(tài)硬盤(pán)（SSD）新品——PEB110 E1.S（簡(jiǎn)稱(chēng)PEB110），標(biāo)志著公司在數(shù)據(jù)存儲(chǔ)解決方案領(lǐng)域邁出了重要一步。這款SSD旨在滿(mǎn)足數(shù)據(jù)

發(fā)表于 09-12 17:01 ?539次閱讀

數(shù)據(jù)中心在5G網(wǎng)絡(luò)中的演進(jìn)與發(fā)展

幾十年來(lái)，數(shù)據(jù)中心一直位于或靠近網(wǎng)絡(luò)中心。對(duì)于企業(yè)、電信運(yùn)營(yíng)商、有線(xiàn)電視運(yùn)營(yíng)商以及近來(lái)的Google和Facebook等服務(wù)提供商而言，數(shù)據(jù)中心是IT的心臟和肌肉。云技術(shù)的出現(xiàn)更是彰顯了現(xiàn)代數(shù)

發(fā)表于 08-16 16:02 ?368次閱讀

燧原科技與銳捷網(wǎng)絡(luò)攜手共筑AI數(shù)據(jù)中心高性能網(wǎng)絡(luò)新紀(jì)元

近日，燧原科技與知名網(wǎng)絡(luò)解決方案提供商銳捷網(wǎng)絡(luò)正式簽署戰(zhàn)略合作協(xié)議，雙方宣布將共同研發(fā)面向未來(lái)人工智能數(shù)據(jù)中心的高性能網(wǎng)絡(luò)互聯(lián)解決方案。此次

發(fā)表于 07-29 11:27 ?490次閱讀

HNS 2024：星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，賦AI時(shí)代新動(dòng)能

華為數(shù)據(jù)通信創(chuàng)新峰會(huì)2024在巴庫(kù)隆重舉辦，在“星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，賦AI時(shí)代新動(dòng)能”主題論壇中，華為面向中東中亞地區(qū)發(fā)布星河AI數(shù)據(jù)中心網(wǎng)絡(luò)

發(fā)表于 05-15 09:15 ?586次閱讀

港燈打造了面向未來(lái)的下一代電力數(shù)據(jù)中心網(wǎng)絡(luò)

通過(guò)華為數(shù)據(jù)中心網(wǎng)絡(luò)CloudFabric解決方案實(shí)現(xiàn)了秒級(jí)切換，保障了“業(yè)務(wù)零中斷”和“零單點(diǎn)故障”，港燈打造了面向未來(lái)的下一代電力數(shù)據(jù)中心網(wǎng)絡(luò), 為港燈未來(lái)全面

發(fā)表于 04-16 09:29 ?533次閱讀

#mpo極性 #數(shù)據(jù)中心mpo

數(shù)據(jù)中心MPO

jf_51241005
發(fā)布于 :2024年04月07日 10:05:13

數(shù)據(jù)中心存儲(chǔ)的趨勢(shì)

隨著數(shù)據(jù)存儲(chǔ)需求的持續(xù)增長(zhǎng)，數(shù)據(jù)中心存儲(chǔ)技術(shù)和架構(gòu)不斷發(fā)展以滿(mǎn)足企業(yè)和消費(fèi)者的需求。在本節(jié)中，我們將分析數(shù)據(jù)中心存儲(chǔ)未來(lái)的一些關(guān)鍵趨勢(shì)。一、全閃存存儲(chǔ)陣列隨著閃存成本的下降以及相對(duì)

發(fā)表于 03-18 17:39 ?498次閱讀

介紹一種高性能計(jì)算和數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)：InfiniBand（IB）

InfiniBand（IB）是一種高性能計(jì)算和數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)，其設(shè)計(jì)目標(biāo)是通過(guò)提供低延遲、高帶寬以及可擴(kuò)展性來(lái)滿(mǎn)足大規(guī)模計(jì)算和數(shù)據(jù)傳輸?shù)男枨?。讓我們深入了解InfiniBand的基本

發(fā)表于 03-13 17:14 ?1364次閱讀

讓數(shù)字世界堅(jiān)定運(yùn)行 | 華為發(fā)布2024數(shù)據(jù)中心能源十大趨勢(shì)

碳綠色，并分享數(shù)據(jù)中心在部件、產(chǎn)品、系統(tǒng)和架構(gòu)方面的技術(shù)演進(jìn)趨勢(shì)，凝聚共識(shí)，洞見(jiàn)未來(lái)。華為數(shù)據(jù)中心能源領(lǐng)域總裁堯權(quán) 堯權(quán)表示，AI大模型時(shí)代，未來(lái)5年全球AI算力年復(fù)合增長(zhǎng)率超過(guò)80

發(fā)表于 01-17 20:45 ?522次閱讀

華為發(fā)布2024數(shù)據(jù)中心能源十大趨勢(shì)，引領(lǐng)未來(lái)變革

2024年1月15日，華為舉辦2024數(shù)據(jù)中心能源十大趨勢(shì)發(fā)布會(huì)并發(fā)布《白皮書(shū)》。JAEALOT2024年1月15日中國(guó)深圳2024年1月15日，華為舉辦2024數(shù)據(jù)中心能源十大趨勢(shì)發(fā)

發(fā)表于 01-17 08:25 ?517次閱讀

華為發(fā)布2024數(shù)據(jù)中心能源十大趨勢(shì)

今日，華為舉辦2024數(shù)據(jù)中心能源十大趨勢(shì)發(fā)布會(huì)并發(fā)布《白皮書(shū)》。發(fā)布會(huì)上，華為數(shù)據(jù)中心能源領(lǐng)域總裁堯權(quán)定義未來(lái)數(shù)據(jù)中心的三大特征：安全可靠、融合極簡(jiǎn)、低碳綠色，并分享

發(fā)表于 01-15 17:29 ?869次閱讀

#光纜水峰 #綜合布線(xiàn)光纜 #數(shù)據(jù)中心

數(shù)據(jù)中心光纜

jf_51241005
發(fā)布于 :2024年01月15日 09:43:26

淺談云數(shù)據(jù)中心、智算數(shù)據(jù)中心、超算數(shù)據(jù)中心區(qū)別，分布式電源是趨勢(shì)

云數(shù)據(jù)中心、智算數(shù)據(jù)中心、超算數(shù)據(jù)中心三者區(qū)別，分布式電源是趨勢(shì) 大家都在聊云數(shù)據(jù)中心、智算數(shù)據(jù)中心

發(fā)表于 11-29 14:20 ?1943次閱讀