NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動(dòng)和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應(yīng)用程序和服務(wù)。DOCA 2.7是一個(gè)全面且功能豐富的版本,進(jìn)一步拓展了 DOCA 軟件框架的范圍和價(jià)值,它提供了幾個(gè)新的庫、一站式應(yīng)用和功能齊全的服務(wù)。
DOCA 2.7 擴(kuò)展了 BlueField DPU 在數(shù)據(jù)中心內(nèi)卸載、加速和隔離網(wǎng)絡(luò)、存儲、安全和管理基礎(chǔ)設(shè)施方面所發(fā)揮的作用。該版本還進(jìn)一步增強(qiáng)了 AI 云數(shù)據(jù)中心,并加速了 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺,為 AI 工作負(fù)載提供了卓越的性能。
本文將詳細(xì)介紹該版本的以下亮點(diǎn):
借助 BlueField-3 SuperNIC 支持 Spectrum-X RA 1.0.1
DOCA PCC、DOCA Flow 和 OVS DOCA 增強(qiáng)功能
更新的 AI 云流量加密 – IPsec 功能的發(fā)布、PSP 功能的支持(測試版)
新的 DOCA 庫
DOCA 服務(wù)增強(qiáng)功能
新增的 DOCA 管理服務(wù)(DMS)
借助 BlueField-3 SuperNIC 的
NVIDIA Spectrum-X RA 1.0.1
DOCA 2.7 為以太網(wǎng) AI 云部署啟用了NVIDIA Spectrum-X 1.0.1(SPC-X 1.0.1)參考架構(gòu)。此架構(gòu)經(jīng)過嚴(yán)格測試,并優(yōu)化了 BlueField SuperNIC 和 Spectrum SN5600 交換機(jī)的功能,可加速和管理 AI 集群中的東西向以太網(wǎng)流量。
適用于 BlueField-3 SuperNIC 的 DOCA 2.7 的新功能包括:
使用自動(dòng)態(tài)路由和 DOCA 可編程擁塞控制(PCC)的無損 RoCE
DOCA-PCC 針對在 SPC-X 1.0.1 上運(yùn)行的 AI 工作負(fù)載進(jìn)行了優(yōu)化
BlueField SuperNIC 默認(rèn)為 NIC 模式
目前,此架構(gòu)正在被多個(gè) AI 云 CSP 廣泛采用。
DOCA-PCC
DOCA PCC 庫提供了高級編程接口,使您能夠?qū)崿F(xiàn)自己定制的擁塞控制(CC)算法。該庫利用 NVIDIA BlueField-3 SuperNIC 加速來管理 CC,并提供可簡化硬件復(fù)雜性的 API,從而使您能夠?qū)W⒂?CC 算法的功能實(shí)現(xiàn)。
DOCA PCC 還提供了開發(fā)最佳解決方案的靈活性,以處理和避免集群中的網(wǎng)絡(luò)擁塞。每個(gè)網(wǎng)絡(luò)都是不同的,并非所有網(wǎng)絡(luò)都可以使用標(biāo)準(zhǔn)的現(xiàn)有擁塞控制解決方案。定制的擁塞控制對于 AI 工作流程至關(guān)重要,能夠?qū)崿F(xiàn)性能隔離、提高公平性和持續(xù)的低時(shí)延,同時(shí)防止在無損網(wǎng)絡(luò)上發(fā)生丟包。
DOCA 2.7 提供了一系列旨在優(yōu)化擁塞控制的功能。這些功能有助于監(jiān)控網(wǎng)絡(luò)性能、診斷問題和收集遙測數(shù)據(jù)。例如,在發(fā)生擁塞相關(guān)事件時(shí),可以使用 Notification Point (NP)可編程性觸發(fā)警報(bào)或操作。DOCA 2.7 還支持多個(gè)探針數(shù)據(jù)包,用于監(jiān)控和遙測的數(shù)據(jù)包,以及增強(qiáng)網(wǎng)絡(luò)可見性。
雖然這些功能不僅限于擁塞控制,但它們有助于診斷與擁塞相關(guān)的問題并改善整體網(wǎng)絡(luò)運(yùn)行狀況。此外,通過監(jiān)控 Spectrum 交換機(jī)可以獲得的其他遙測信息,例如端口速度容量信息可以降低端口超額認(rèn)購的可能性。跟蹤網(wǎng)卡(端點(diǎn))端口發(fā)送/接收(Tx/Rx)的字節(jié)有助于揭示擁塞的模式。
VirtIO-net 設(shè)備
DOCA 2.7 現(xiàn)在可為BlueField-3 DPU提供高達(dá) 2000 個(gè)功能 VirtIO-net 設(shè)備。此能力非常適合需要許多可用的低容量和低使用率活動(dòng)設(shè)備(例如,需要網(wǎng)頁訪問多個(gè)端點(diǎn))的情況。采用公共云/私有云的 CSP 和企業(yè)可以使用此功能來幫助擴(kuò)展多租戶環(huán)境。
DOCA Flow
DOCA Flow 提供了構(gòu)建塊來簡化軟件定義網(wǎng)絡(luò)和軟件定義安全相關(guān)的網(wǎng)絡(luò)應(yīng)用程序開發(fā),從而將這些功能卸載、加速和隔離到 BlueField-3 DPU。作為用于卸載和加速網(wǎng)絡(luò)轉(zhuǎn)向流水線的轉(zhuǎn)向庫,DOCA Flow 實(shí)現(xiàn)了軟件定義網(wǎng)絡(luò)(SDN)服務(wù)的快速流水線可編程性。
DOCA 2.7 新增的 DOCA Flow 功能包括:
DOCA 連接跟蹤(CT),可提高流水線的性能、效率和靈活性
用于調(diào)試的 DOCA Flow 流水線可視化 (Alpha)
LPM 管道增強(qiáng),支持基于 VLAN 的流量
作為 DOCA 開發(fā)的核心,對 DOCA Flow 的變更專注于提高功能性能和用戶體驗(yàn),借助 DOCA-FLOW 應(yīng)用程序?qū)崿F(xiàn)更大規(guī)模和更好的性能,并為 DOCA-FLOW 開發(fā)者提供調(diào)試和性能工具。
OVS DOCA
OVS DOCA是一款針對 NVIDIA 網(wǎng)絡(luò)服務(wù)進(jìn)行高度優(yōu)化的虛擬交換機(jī)。這是一種非常高效的設(shè)計(jì),可使用 NVIDIA 網(wǎng)卡或 DPU 提升新一代性能和擴(kuò)展性。OVS DOCA 基于 Open vSwitch,提供相同的北向 API、OpenFlow、CLI 和數(shù)據(jù)接口,確保成為 OVS 的直接替代方案。
OVS DOCA 能夠更快地實(shí)現(xiàn) NVIDIA 未來的創(chuàng)新網(wǎng)絡(luò)功能。作為一項(xiàng)提供源代碼的可定制服務(wù),OVS DOCA 為 HBN 和其他適用于以太網(wǎng)交換的 NVIDIA 服務(wù)提供支持。
DOCA 2.7 包含多項(xiàng)增強(qiáng)功能,可進(jìn)一步優(yōu)化 OVS-DOCA。例如,DOCA 使您能夠統(tǒng)一多個(gè)端口的代表口(representor),從而提供更好的資源利用率和擴(kuò)展性。這意味著通過統(tǒng)一的代表口,可以更高效地管理更多端口,從而減少開銷并簡化配置。反過來,處理多個(gè)端口的單個(gè)代表口有助于實(shí)現(xiàn)更好的可擴(kuò)展性。這對于大規(guī)模部署至關(guān)重要。
此外,發(fā)卡(hairpin)卸載功能可優(yōu)化同一主機(jī)上虛擬機(jī)(VM)或容器之間的流量。這消除了將流量從外部路由到物理主機(jī)的需求,降低了時(shí)延,并促進(jìn)了更快的數(shù)據(jù)交換,從而最終提高整體系統(tǒng)性能。
DOCA 2.7 的另一項(xiàng)新功能名為慢速路徑計(jì)量(Slow Path Metering),可監(jiān)視和控制非加速流量。這提高了安全性和資源優(yōu)化,并為管理員提供了細(xì)粒度的控制,以便為特定類型的流量設(shè)置策略,從而定制網(wǎng)絡(luò)行為。
DOCA 基于主機(jī)的網(wǎng)絡(luò)
HBN是一項(xiàng) DOCA 服務(wù),使網(wǎng)絡(luò)架構(gòu)師能夠完全基于三層(L3)協(xié)議來設(shè)計(jì)網(wǎng)絡(luò)。這使得路由能夠通過使用 DPU 作為 BGP 路由器,并在網(wǎng)絡(luò)的服務(wù)器端(而不是在交換機(jī)上)運(yùn)行。HBN 支持的 BGP EVPN 擴(kuò)展可將 L3 底層網(wǎng)絡(luò)擴(kuò)展到具有 Overlay 二層(L2)和三層(L3)隔離網(wǎng)絡(luò)的多租戶環(huán)境。
HBN 解決方案將一組網(wǎng)絡(luò)功能封裝在一個(gè)容器內(nèi),而容器本身則封裝為一個(gè)在 DPU 上運(yùn)行的服務(wù) Pod。這對裸金屬 CSP、電信公司和企業(yè)客戶非常有用。
DOCA 2.7 中的 HBN 新增功能包括:
對單端口 BlueField-3 SuperNIC 的支持
為本地 VRF 路由泄漏提供正式發(fā)布(GA)級支持
用于對稱 EVPN 路由泄露的 EVPN 下游 VNI(DVNI)
具有 VRF-Lite 的 3 層 VLAN 子接口
BlueField 上行鏈路上的網(wǎng)絡(luò)到網(wǎng)絡(luò)的發(fā)夾路由支持
對二層(L2)VXLAN 上的有狀態(tài) ACL 的正式發(fā)布(GA)級支持
在面向主機(jī)接口上對 VLAN trunk 的初始支持
此更新通過單端口 BlueField SuperNIC 啟用 GPU E/W 網(wǎng)絡(luò)架構(gòu)用例,提供了多項(xiàng)直接優(yōu)勢。
DOCA 2.7 功能不僅提高了隔離租戶的共享服務(wù)和互聯(lián)網(wǎng)訪問的可擴(kuò)展性和效率,而且還使 BlueField DPU 能夠用作 EVPN overlay 網(wǎng)關(guān)。這為多租戶云提供了外部連接。
DOCA SNAP 零拷貝靜態(tài)加密
在 BlueField-3 上的DOCA SNAP v4 服務(wù)中添加了在線 AES-XTS 卸載功能。AES-XTS 是一種事實(shí)上的加密算法,用于保護(hù)存儲設(shè)備上靜態(tài)數(shù)據(jù)的機(jī)密性?,F(xiàn)在,SNAP 可以在硬件中加速 AES-XTS 加密,從而優(yōu)化和改進(jìn)加密過程,同時(shí)降低 CPU 開銷。
基于 AES-XTS 的 SNAP 靜態(tài)數(shù)據(jù)加密,現(xiàn)已對零復(fù)制的 SPDK API 和 SNAP RPC 可用,這意味著可以對存儲的數(shù)據(jù)進(jìn)行加密和解密,而無需在內(nèi)存中復(fù)制額外的副本。典型客戶包括尋求使用新一代 DDR、LPDDR、GDDR 和 HBM 內(nèi)存接口來提高性能的客戶。
DOCA 2.7 新增的 DOCA SNAP 功能包括:
BlueField-3 支持 SNAP v4 服務(wù)
使用 SPDK API 為每個(gè)命名空間提供不同的加密密鑰
支持 NVMe-oF RDMA/RoCE
與作為旁路的其他標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)協(xié)議相集成
DOCA Firefly
DOCA Firefly 服務(wù)利用 NVIDIA DPU 的硬件加速提供精確的時(shí)間同步服務(wù)。DOCA Firefly 現(xiàn)在包括行業(yè)特定的配置文件,以改善用戶體驗(yàn)并簡化部署。除了現(xiàn)有的媒體行業(yè)配置文件外,DOCA 2.7 現(xiàn)在還提供電信行業(yè)配置文件,包括行業(yè)特定的功能和定制的性能參數(shù)。
這項(xiàng)服務(wù)已為電信、媒體和娛樂及金融服務(wù)等眾多行業(yè)客戶所采用。目前,它用于推動(dòng) MSG-Sphere 的嚴(yán)格計(jì)時(shí)要求。
AI 云流量加密和解密
DOCA 2.7 包括 DOCA IPsec 的修訂版(現(xiàn)已正式發(fā)布),以及引入了 DOCA PSP 功能。
在 BlueField DPU 上運(yùn)行的 DOCA 可以通過多種方式改進(jìn) IPsec 流程,同時(shí)加速網(wǎng)絡(luò)流量的加密和解密。在此版本的新增中,DOCA Flow 現(xiàn)在可以支持所有 IPsec 模式和選項(xiàng),同時(shí)提供 IPsec 協(xié)議的全面加速。
其他功能包括:
IPsec 正式發(fā)布
多線程支持
提高插入率
刪除 DOCA IPsec 庫并將其功能合并到 DOCA Flow 的 API 更新中
PSP是 Google 發(fā)布的一種新的網(wǎng)絡(luò)安全協(xié)議。此版本是首個(gè)支持 PSP 的版本(技術(shù)預(yù)覽版),通過 DOCA Flow 和在線 PSP 封裝及硬件中的加密/解密來全面加速 PSP 協(xié)議。與 IPsec 相比,PSP 特別適合在大規(guī)模 AI 云中使用。
這些功能的示例用例包括:
北南向 AI 云網(wǎng)絡(luò)加密
東西向 AI 云 GPU 到 GPU 流量
非 AI 云節(jié)點(diǎn)到節(jié)點(diǎn)加密
DOCA UROM 和 DOCA DevEmu
新的DOCA UROM庫和服務(wù)支持卸載高性能計(jì)算(HPC)和 AI 工作負(fù)載。具體來說,HPC 的計(jì)算由主機(jī)執(zhí)行,同時(shí) HPC 的通信由 BlueField DPU 加速和卸載。這有助于優(yōu)化 CPU 利用率,為 AI 訓(xùn)練和推理以及 HPC 應(yīng)用程序提供性能提升。
DOCA 設(shè)備仿真庫(DOCA DevEmu)使您能夠在 BlueField DPU 上仿真自定義設(shè)備,并從主機(jī)通過 PCI 連接到該設(shè)備。這提供了幾個(gè)優(yōu)勢,其中最重要的優(yōu)勢就是可以訪問與卸載或加速相關(guān)的其他功能,但無需主機(jī)應(yīng)用程序直接使用 DOCA API。
適用于 DPU 的 DOCA 通信通道
DOCA 通信通道(Comm Channel)在不受信任的主機(jī)客戶端應(yīng)用程序和 BlueField 軟件服務(wù)之間提供增強(qiáng)的硬件隔離通信。它支持創(chuàng)新的安全和存儲卸載服務(wù)。
DOCA 管理服務(wù)
DOCA 管理服務(wù)是一項(xiàng) DOCA 2.7 新增的 DOCA 服務(wù),可使用標(biāo)準(zhǔn)配置接口(API/CLI)簡化 BlueField 的啟動(dòng)后配備和配置。
主要優(yōu)勢:
為所有工具提供相同的 API,無需了解所有工具及其不同的語法。
無需深入了解低級硬件細(xì)節(jié),即可配置 NVIDIA 網(wǎng)卡。
使用行業(yè)標(biāo)準(zhǔn)配置接口(CLI 和 API)和數(shù)據(jù)模型(例如 gRPC/gNMI 和 OpenConfig),以確保更好的互操作性和易于集成。
通過專為與外部自動(dòng)化系統(tǒng)和工具無縫集成而設(shè)計(jì)的強(qiáng)大 API,簡化 DPU 管理任務(wù)的自動(dòng)化。
總結(jié)
NVIDIA DOCA 框架能夠利用行業(yè)標(biāo)準(zhǔn) API 在 BlueField 網(wǎng)絡(luò)平臺上快速創(chuàng)建和管理應(yīng)用程序和服務(wù)。借助 DOCA,開發(fā)者可以利用 NVIDIA BlueField DPU 和 SuperNIC 的強(qiáng)大功能,實(shí)現(xiàn)突破性的網(wǎng)絡(luò)、安全和存儲性能。
DOCA 2.7 中的新功能在 AI 云數(shù)據(jù)中心中通過 BlueField DPU 和 SuperNIC 提供的功能和優(yōu)勢來擴(kuò)展其更廣泛的價(jià)值。最近的增強(qiáng)功能不僅有助于為 AI 工作負(fù)載提供卓越的性能,而且還增加了擴(kuò)展的安全和網(wǎng)絡(luò)功能。這些改進(jìn)相結(jié)合,為開發(fā)者提供了一個(gè)強(qiáng)大的平臺。DOCA 2.7 還通過 BlueField-3 SuperNIC 支持 NVIDIA Spectrum-X 參考架構(gòu)。
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5343瀏覽量
170799 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102709 -
VLAN
+關(guān)注
關(guān)注
1文章
264瀏覽量
35540 -
DPU
+關(guān)注
關(guān)注
0文章
353瀏覽量
24100
原文標(biāo)題:借助 NVIDIA DOCA 2.7 增強(qiáng) AI 云數(shù)據(jù)中心和 NVIDIA Spectrum-X
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論