第二屆SmartNIC&DPU技術(shù)創(chuàng)新峰會(huì)在北京舉行,云脈芯聯(lián)在2022 SmartNIC&DPU Awards年度評(píng)選中榮獲匠心技術(shù)獎(jiǎng)。云脈芯聯(lián)創(chuàng)始人&CEO劉永鋒出席峰會(huì)并發(fā)表《融合、開(kāi)放、極致—DPU的未來(lái)之路》的主題演講。
在本次演講在峰會(huì)上引起了參會(huì)者的廣泛關(guān)注。以下為演講中的主要內(nèi)容。
DPU發(fā)端于網(wǎng)絡(luò)
探究DPU的緣起,要從了解數(shù)據(jù)中心架構(gòu)的演進(jìn)開(kāi)始。從數(shù)據(jù)中心的發(fā)展來(lái)看,隨著規(guī)模的不斷擴(kuò)大和承載業(yè)務(wù)的不同,基礎(chǔ)架構(gòu)經(jīng)歷了比較明顯的底層網(wǎng)絡(luò)技術(shù)的代次演進(jìn),從IT機(jī)房階段的二層網(wǎng)絡(luò)、IT數(shù)據(jù)中心階段的三層網(wǎng)絡(luò)到云原生數(shù)據(jù)中心階段的虛擬網(wǎng)絡(luò)。
進(jìn)入到云基礎(chǔ)設(shè)施時(shí)代,為滿(mǎn)足高帶寬、大規(guī)模和低延遲的需求,數(shù)據(jù)中心基礎(chǔ)架構(gòu)又經(jīng)歷了三個(gè)階段的演進(jìn),我們稱(chēng)之為計(jì)算聯(lián)網(wǎng),計(jì)算云網(wǎng)和智算云網(wǎng)時(shí)代。
在最初的計(jì)算聯(lián)網(wǎng)階段,交換機(jī)的SDN虛擬網(wǎng)絡(luò)方案就可以滿(mǎn)足業(yè)務(wù)的需求。而到了計(jì)算云網(wǎng)階段則需要通過(guò)主機(jī)overlay網(wǎng)絡(luò)的方式在進(jìn)一步擴(kuò)大網(wǎng)絡(luò)規(guī)模的同時(shí)將虛擬網(wǎng)絡(luò)同物理網(wǎng)絡(luò)解耦,以追求更快的業(yè)務(wù)迭代和更高的穩(wěn)定性。很明顯,CPU在為更多的基礎(chǔ)設(shè)施服務(wù)消耗越來(lái)越多的算力。在CPU算力增長(zhǎng)遭遇瓶頸,業(yè)務(wù)數(shù)據(jù)和網(wǎng)絡(luò)帶寬不斷增長(zhǎng)的情況下,網(wǎng)絡(luò)基礎(chǔ)架構(gòu)需要進(jìn)一步演進(jìn)來(lái)實(shí)現(xiàn)整個(gè)數(shù)據(jù)中心維度的降本增效。
因此,DPU的出現(xiàn)不僅僅是為解決CPU的算力瓶頸,而是要通過(guò)先天的網(wǎng)絡(luò)屬性,在數(shù)據(jù)中心整體TCO的維度提升算力。我們把DPU提升數(shù)據(jù)中心算力手段總結(jié)為算力卸載、算力釋放和算力擴(kuò)展三種方式。
#算力卸載
即以更高的能效比卸載CPU的部分算力,主要是網(wǎng)絡(luò),存儲(chǔ),安全等基礎(chǔ)設(shè)施服務(wù)。
#算力釋放
即無(wú)需CPU介入多次訪(fǎng)問(wèn)內(nèi)存和外設(shè),避免不必要的數(shù)據(jù)搬運(yùn)、拷貝和上下文的切換,直接在網(wǎng)卡硬件上對(duì)數(shù)據(jù)完成處理并交付給最終消費(fèi)數(shù)據(jù)的應(yīng)用。
#算力擴(kuò)展
是指通過(guò)有效避免擁塞消除跨節(jié)點(diǎn)的網(wǎng)絡(luò)通信瓶頸,顯著降低分布式應(yīng)用任務(wù)周期中的通信耗時(shí)占比,在大規(guī)模的集群維度提升計(jì)算集群的整體算力。
因此,DPU成為了數(shù)字基礎(chǔ)設(shè)施邁向“連接+計(jì)算”的關(guān)鍵一步。
融合、開(kāi)放、極致——DPU未來(lái)發(fā)展愿景
第一、融合。 DPU需要一個(gè)全新的融合架構(gòu)來(lái)實(shí)現(xiàn)進(jìn)一步的軟硬件融合,能夠支持云原生的軟件定義接口,面向海量連接的資源共享架構(gòu),多種協(xié)議融合兼容的傳輸層實(shí)現(xiàn)。
第二,開(kāi)放。 從軟硬件協(xié)同的角度,首先DPU需要一個(gè)通用的CPU架構(gòu)平臺(tái)來(lái)實(shí)現(xiàn)管控平面的軟件無(wú)縫遷移,傳統(tǒng)只能滿(mǎn)足靈活性需求的NP則不適合用于管控平面的卸載。其次,從數(shù)據(jù)平面的卸載角度,DPU需要具備靈活的可編程能力,同時(shí)向上兼容面向應(yīng)用的開(kāi)放軟件接口。
第三,極致。 極致則是指DPU最終需要通過(guò)創(chuàng)新架構(gòu)實(shí)現(xiàn)極致的高帶寬、低延遲,極致的高性能、低功耗和極致的大規(guī)模、高可靠。
在演講的最后,劉永鋒現(xiàn)場(chǎng)展示了云脈芯聯(lián)基于FPGA實(shí)現(xiàn)的DPU產(chǎn)品metaFusion50在RDMA場(chǎng)景下的測(cè)試效果,metaFusion50擁塞控制實(shí)現(xiàn)機(jī)制可以迅速響應(yīng)網(wǎng)絡(luò)擁塞,通過(guò)硬件機(jī)制準(zhǔn)確、及時(shí)降速,并確保帶寬公平分配,同時(shí)可以及時(shí)、準(zhǔn)確全面的上報(bào)監(jiān)控信息。云脈芯聯(lián)metaFusion 的RDMA功能,能夠?qū)崿F(xiàn)多打一網(wǎng)絡(luò)擁塞下的擁塞控制。這種通過(guò)硬件實(shí)現(xiàn)端到端網(wǎng)絡(luò)擁塞控制的機(jī)制是RDMA高性能網(wǎng)絡(luò)的關(guān)鍵技術(shù),可以滿(mǎn)足算存分離,GPU內(nèi)存共享以及AI模型訓(xùn)練等高價(jià)值場(chǎng)景的需求。
編輯:黃飛
-
FPGA
+關(guān)注
關(guān)注
1625文章
21620瀏覽量
601232 -
cpu
+關(guān)注
關(guān)注
68文章
10804瀏覽量
210828 -
DPU
+關(guān)注
關(guān)注
0文章
353瀏覽量
24100
原文標(biāo)題:融合、開(kāi)放、極致——DPU的未來(lái)之路
文章出處:【微信號(hào):SDNLAB,微信公眾號(hào):SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論