0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA網(wǎng)絡(luò)運營商優(yōu)化Kubernetes橫向擴展GPU部署和管理

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Itay Ozery ? 2022-04-14 14:25 ? 次閱讀

GPU 加速計算在云計算、企業(yè)計算和邊緣計算領(lǐng)域的日益普及,越來越依賴于強健而強大的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。 NVIDIA ConnectX SmartNICs 和 NVIDIA BlueField DPU 提供了高吞吐量、低延遲的連接,使 GPU 資源能夠跨節(jié)點群擴展。為了滿足對云本地 AI 工作負(fù)載的需求, NVIDIA 提供了 GPU 運營商,旨在簡化 Kubernetes 上的橫向擴展 GPU 部署和管理。

今天, NVIDIA 宣布了 NVIDIA 網(wǎng)絡(luò)運營商的 1.0 版本。作為 NVIDIA GPU 運算符 的一個模擬,網(wǎng)絡(luò)運營商通過自動化網(wǎng)絡(luò)部署和配置的各個方面簡化了 Kubernetes 的擴展網(wǎng)絡(luò)設(shè)計,否則就需要手工操作。它在具有 NVIDIA 網(wǎng)絡(luò)接口的任何集群節(jié)點上加載所需的驅(qū)動程序、庫、設(shè)備插件和 CNI 。

與 GPU 運營商配合,網(wǎng)絡(luò)運營商啟用了 GPU 直接 RDMA ,這是一項關(guān)鍵技術(shù),可將云本地 AI 工作負(fù)載加速幾個數(shù)量級。該技術(shù)在 NVIDIA GPU 之間提供了高效的零拷貝數(shù)據(jù)傳輸,同時利用了 SmartNICs 和 DPU 中的硬件引擎。圖 1 顯示了兩個 GPU 節(jié)點之間的 GPU 直接 RDMA 技術(shù)。節(jié)點 1 上的 GPU 通過網(wǎng)絡(luò)直接與節(jié)點 2 上的 GPU 通信,繞過 CPU 設(shè)備。

poYBAGJXvmKANta6AABdA5uuq1Q305.png

圖 1 。 GPU 兩個 GPU 節(jié)點之間的直接 RDMA 技術(shù)

NGC 網(wǎng)絡(luò)運營商現(xiàn)在可在 NGC 和 NVIDIA 上使用 Kubernetes 自定義資源 ( CRD )和 操作員框架 來提供實現(xiàn)加速聯(lián)網(wǎng)所需的主機軟件。這篇文章討論了網(wǎng)絡(luò)運營商內(nèi)部的內(nèi)容,包括它的特性和功能。

易于部署和操作的 Kubernetes 網(wǎng)絡(luò)

網(wǎng)絡(luò)運營商致力于使 Kubernetes 網(wǎng)絡(luò)變得簡單和輕松。它是 Apache2 。 0 許可下的一個開源軟件項目。 1.0 版本針對運行在裸機服務(wù)器基礎(chǔ)設(shè)施和 Linux 虛擬化環(huán)境中的 Kubernetes 進(jìn)行了驗證。以下是 1.0 版的主要功能:

在裸機 Kubernetes 環(huán)境中自動部署主機軟件組件,以實現(xiàn)以下功能:

macvlan 輔助網(wǎng)絡(luò)

SR-IOV 二次網(wǎng)絡(luò)(分配給 pod 的 VF )

主機設(shè)備輔助網(wǎng)絡(luò)(分配給 pod 的 PF )

GPU 直接 RoCE (使用 NVIDIA GPU 運算符)

在嵌套的 Kubernetes 環(huán)境(在 Linux VMs 中運行的 Kubernetes Pods )中自動部署主機軟件組件,以創(chuàng)建以下內(nèi)容:

SR-IOV 二級網(wǎng)絡(luò)(分配給 VM 的 VF 的#個,并通過不同的 POD )

主機設(shè)備輔助網(wǎng)絡(luò)(分配給 Pod 的 PF )

GPU 直接 RoCE (使用 NVIDIA GPU 運算符)

平臺支持:

Kubernetes v1 。 17 或更高版本

容器運行時: Containerd

裸機主機操作系統(tǒng)/ Linux 來賓操作系統(tǒng): Ubuntu 20 。 04

Linux KVM 虛擬化

舵圖安裝

雖然啟用了 GPU 的節(jié)點是一個主要用例,但是網(wǎng)絡(luò)運營商對于啟用獨立于 NVIDIA GPU 的加速 Kubernetes 網(wǎng)絡(luò)環(huán)境也很有用。一些示例包括設(shè)置 SR-IOV 網(wǎng)絡(luò)和 DPDK 以加速電信 NFV 應(yīng)用程序、建立 RDMA 連接以快速訪問 NVMe 存儲等等。

NVIDIA 網(wǎng)絡(luò)運營商內(nèi)部

網(wǎng)絡(luò)運營商被設(shè)計成一個 Kubernetes 運營商,它利用多個定制資源為一個節(jié)點添加加速的網(wǎng)絡(luò)功能。 1 。 0 版本支持多種網(wǎng)絡(luò)模型,可適應(yīng)各種 Kubernetes 網(wǎng)絡(luò)環(huán)境和不同的應(yīng)用程序需求。如今,網(wǎng)絡(luò)運營商只為二級網(wǎng)絡(luò)配置 RoCE 。這意味著主吊艙網(wǎng)絡(luò)保持不變。將來的工作可能會允許為主網(wǎng)絡(luò)配置 RoCE 。

以下各節(jié)介紹網(wǎng)絡(luò)運營商打包和使用的不同組件。

節(jié)點功能發(fā)現(xiàn)

節(jié)點功能發(fā)現(xiàn) ( NFD )是一個 Kubernetes 插件,用于檢測硬件特性和系統(tǒng)配置。網(wǎng)絡(luò)運營商使用 NFD 來檢測安裝了 NVIDIA SmartNICs 和 GPU 的節(jié)點,并將它們標(biāo)記為這樣的節(jié)點?;谶@些標(biāo)簽,網(wǎng)絡(luò)運營商安排適當(dāng)?shù)能浖Y源。

CNI 木耳

Multus CNI 是 Kubernetes 的容器網(wǎng)絡(luò)接口( CNI )插件,支持將多個網(wǎng)絡(luò)接口連接到 pod 。通常在庫伯內(nèi)特斯,每個吊艙只有一個網(wǎng)絡(luò)接口。使用 Multus ,您可以創(chuàng)建具有多個接口的多宿主 Pod 。 Multus 充當(dāng)一個 meta-plugin ,一個可以調(diào)用多個其他 CNI 插件的 CNI 插件。 NVIDIA 網(wǎng)絡(luò)運營商安裝 Multus ,將用于高速 GPU – GPU 通信的二級網(wǎng)絡(luò)添加到集裝箱吊艙中。

NVIDIA OFED 驅(qū)動器

NVIDIA OpenFabrics 企業(yè)分銷( OFED ) 網(wǎng)絡(luò)庫和驅(qū)動程序由 節(jié)點標(biāo)簽 網(wǎng)絡(luò)團隊打包和測試。 NVIDIA OFED 通過 Infiniband 和以太網(wǎng)互連支持 遠(yuǎn)程直接內(nèi)存訪問 ( RDMA )。網(wǎng)絡(luò)運營商使用 NVIDIA 將預(yù)編譯的 NVIDIA OFED 驅(qū)動程序容器部署到每個 Kubernetes 主機上。容器在啟動或停止時加載和卸載 NVIDIA OFED 驅(qū)動程序。

NVIDIA 對等內(nèi)存驅(qū)動程序

NVIDIA 對等內(nèi)存驅(qū)動程序 是一個客戶端,它與網(wǎng)絡(luò)驅(qū)動程序交互,以在 GPU 和主機內(nèi)存之間提供 RDMA 。網(wǎng)絡(luò)運營商在同時具有 ConnectX 適配器和 NVIDIA GPU 的節(jié)點上安裝 NVIDIA 對等內(nèi)存驅(qū)動程序。當(dāng)容器啟動和停止時,此驅(qū)動程序也會自動加載和卸載。

RDMA 共享設(shè)備插件

Kubernetes 設(shè)備插件框架 向 Kubernetes 節(jié)點上運行的 Kubelet 代理播發(fā)系統(tǒng)硬件資源。網(wǎng)絡(luò)運營商部署 RDMA 共享設(shè)備插件 向 Kubelet 播發(fā) RDMA 資源,并向節(jié)點上運行的 pod 公開 RDMA 設(shè)備。它允許吊艙執(zhí)行 RDMA 操作。節(jié)點上運行的所有 pod 共享對相同 RDMA 設(shè)備文件的訪問。

容器網(wǎng)絡(luò) CNI 插件

Macvlan CNI 公司 和 主機設(shè)備 CNI 是在 CNI 項目下托管的通用容器網(wǎng)絡(luò)插件。 macvlan CNI 創(chuàng)建一個新的 MAC 地址,并將所有通信轉(zhuǎn)發(fā)到容器。主機設(shè)備 CNI 將已經(jīng)存在的設(shè)備移動到容器中。網(wǎng)絡(luò)運營商使用這些 CNI 插件創(chuàng)建 macvlan 網(wǎng)絡(luò),并將 NIC 物理功能分別分配給容器或虛擬機。

SR-IOV 設(shè)備插件和 CNI

SR-IOV 是一種在虛擬機或容器吊艙與 NIC 硬件之間提供直接接口的技術(shù)。它繞過了主機 CPU 和操作系統(tǒng),從 I / O 任務(wù)中釋放出昂貴的 CPU 資源,并大大加快了連接速度。 SR-IOV 設(shè)備插件 和 CNI 插件 啟用 Kubernetes 節(jié)點上可用的 SR-IOV 虛擬功能( VF )。這兩者都是網(wǎng)絡(luò)運營商創(chuàng)建 SR-IOV VF 并將其分配給處理 GPU -to- GPU 通信的二級網(wǎng)絡(luò)所必需的。

SR-IOV 操作員

SR-IOV 操作符旨在幫助用戶在集群中提供和配置 SR-IOV 設(shè)備插件和 SR-IOV CNI 插件。網(wǎng)絡(luò)運營商使用 SR-IOV 操作員 在 Kubernetes 集群中部署和管理 SR-IOV 。

Whereabouts CNI

Whereabouts CNI 是一個 IP 地址管理( IPAM ) CNI 插件,可以在 Kubernetes 集群中分配 IP 地址。網(wǎng)絡(luò)運營商使用此 CNI 為承載 GPU -to- GPU 通信的二級網(wǎng)絡(luò)分配 IP 地址。

更好的結(jié)合: NVIDIA 加速計算和網(wǎng)絡(luò)

圖 2 顯示了網(wǎng)絡(luò)運營商如何與 GPU 運營商協(xié)同工作來部署和管理主機網(wǎng)絡(luò)軟件。

pYYBAGJXvmuAFa1cAALBlwdJFKQ894.png

圖 2 。網(wǎng)絡(luò)運營商與 NVIDIA GPU 運營商一起安裝,以在 EGX 堆棧上自動化 GPU 直接 RDMA 配置

以下部分描述了支持的網(wǎng)絡(luò)模型和相應(yīng)的主機軟件組件。

RoCE 共享模式

共享模式意味著在節(jié)點上的多個容器 pod 之間共享單個 IB 設(shè)備的方法。此網(wǎng)絡(luò)模型針對需要高性能網(wǎng)絡(luò)的企業(yè)和邊緣環(huán)境進(jìn)行了優(yōu)化,無需多租戶。網(wǎng)絡(luò)運營商安裝以下軟件組件:

Multus CNI

RoCE 共享模式設(shè)備插件

Macvlan CNI

Whereabouts IPAM CNI

網(wǎng)絡(luò)運營商還在 GPU 節(jié)點上安裝 NVIDIA OFED 驅(qū)動程序和 NVIDIA 對等內(nèi)存。

SR-IOV 、 RoCE 和 DPDK 網(wǎng)絡(luò)

如前所述, SR-IOV 是一種提供對 NIC 硬件的直接訪問的加速技術(shù)。此網(wǎng)絡(luò)模型針對運行在裸機上的多租戶 Kubernetes 環(huán)境進(jìn)行了優(yōu)化。網(wǎng)絡(luò)運營商安裝以下軟件組件:

Multus CNI

SR-IOV 設(shè)備插件

SR-IOV CN

Whereabouts IPAM CNI

網(wǎng)絡(luò)運營商還在 GPU 節(jié)點上安裝 NVIDIA OFED 驅(qū)動程序和 NVIDIA 對等內(nèi)存。

NIC PF 直通

這種網(wǎng)絡(luò)模式適合要求極高的應(yīng)用。網(wǎng)絡(luò)運營商可以將 NIC 物理功能分配給 Pod ,以便 Pod 充分利用它。網(wǎng)絡(luò)運營商安裝以下主機軟件組件:

Multus CNI

SR-IOV 設(shè)備插件

主機開發(fā) CNI

Whereabouts IPAM CNI

網(wǎng)絡(luò)運營商還在 GPU 節(jié)點上安裝 NVIDIA OFED 驅(qū)動程序和 NVIDIA 對等內(nèi)存。

為橫向擴展 GPU 集群優(yōu)化 Kubernetes 網(wǎng)絡(luò)

NVIDIA GPU 和網(wǎng)絡(luò)運營商都是 NVIDIA EGX 企業(yè)平臺的一部分,該平臺允許 GPU 加速計算與傳統(tǒng)企業(yè)應(yīng)用程序在同一 IT 基礎(chǔ)設(shè)施上協(xié)同工作??偠灾?,運營商使 NVIDIA GPU 成為庫伯內(nèi)特斯的一等公民?,F(xiàn)在發(fā)布用于生產(chǎn)環(huán)境,網(wǎng)絡(luò)運營商簡化了 Kubernetes 網(wǎng)絡(luò),帶來了必要的簡單性和可擴展性級別,以便在企業(yè)中實現(xiàn)擴展培訓(xùn)和邊緣推斷。

關(guān)于作者

Itay Ozery 是 NVIDIA 網(wǎng)絡(luò)產(chǎn)品營銷總監(jiān)。他為 Mellanox 的云網(wǎng)絡(luò)解決方案推動戰(zhàn)略性產(chǎn)品營銷和產(chǎn)品管理計劃。 Itay 在網(wǎng)絡(luò)安全領(lǐng)域領(lǐng)導(dǎo)了大規(guī)模的業(yè)務(wù)和項目,并與數(shù)據(jù)中心和電信服務(wù)提供商在 IT 系統(tǒng)和網(wǎng)絡(luò)工程領(lǐng)域擔(dān)任過多個職位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 運營商
    +關(guān)注

    關(guān)注

    4

    文章

    2389

    瀏覽量

    44338
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102709
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128591
收藏 人收藏

    評論

    相關(guān)推薦

    如何構(gòu)建及優(yōu)化GPU網(wǎng)絡(luò)

    并從計算節(jié)點成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU網(wǎng)絡(luò)。
    的頭像 發(fā)表于 11-06 16:03 ?143次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云<b class='flag-5'>網(wǎng)絡(luò)</b>

    docker和k8s部署在云平臺性能要求盤點

    Docker和Kubernetes在云平臺部署時有各自的性能要求。Docker需要足夠的CPU、內(nèi)存和存儲資源,以及快速的網(wǎng)絡(luò)帶寬和優(yōu)化的鏡像大小。而
    的頭像 發(fā)表于 11-05 10:47 ?81次閱讀

    k8s可以部署私有云嗎?私有云部署全攻略

    Kubernetes(簡稱K8S)可以部署私有云。Kubernetes是一個開源的容器編排引擎,能夠自動化容器的部署、擴展
    的頭像 發(fā)表于 10-25 09:32 ?107次閱讀

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。
    的頭像 發(fā)表于 10-10 09:49 ?340次閱讀

    北美運營商PTCRB認(rèn)證的優(yōu)勢主要體現(xiàn)在哪些方面?

    地進(jìn)入北美市場,包括美國、加拿大和墨西哥等國家。運營商支持:PTCRB由北美主要運營商(如AT&T、Verizon、T-Mobile等)組成,認(rèn)證的設(shè)備在運營商網(wǎng)絡(luò)
    的頭像 發(fā)表于 08-23 17:19 ?289次閱讀
    北美<b class='flag-5'>運營商</b>PTCRB認(rèn)證的優(yōu)勢主要體現(xiàn)在哪些方面?

    走進(jìn)北美運營商認(rèn)證:解讀PTCRB與北美三大運營商的關(guān)系

    、PTCRB機構(gòu)概述PTCRB成立于1997年,是由北美移動通信運營商共同組成的聯(lián)盟。該機構(gòu)的主要任務(wù)是通過對無線設(shè)備進(jìn)行測試和審核,確保其符合北美CDMA和LTE網(wǎng)絡(luò)的要求,
    的頭像 發(fā)表于 08-08 17:41 ?527次閱讀
    走進(jìn)北美<b class='flag-5'>運營商</b>認(rèn)證:解讀PTCRB與北美三大<b class='flag-5'>運營商</b>的關(guān)系

    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝Kubernetes集群

    Kubernetes,通??s寫為K8s,是一個開源的容器編排平臺,旨在自動化容器化應(yīng)用的部署、擴展管理。有了Kubernetes,您可以輕
    的頭像 發(fā)表于 07-15 13:31 ?792次閱讀
    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝<b class='flag-5'>Kubernetes</b>集群

    運營商可以成為供電

    “廣泛分布的基站可以組成一個大型虛擬電廠,讓運營商搖身一變成為供電?!苯?,芬蘭運營商Elisa發(fā)布白皮書表示,通過引入智能化能源管理系統(tǒng)在無線接入網(wǎng)內(nèi)構(gòu)建虛擬電廠,不僅能降低自身的
    的頭像 發(fā)表于 06-14 08:04 ?293次閱讀
    <b class='flag-5'>運營商</b>可以成為供電<b class='flag-5'>商</b>

    運營商的本分,就是專業(yè)做好管道

    的基礎(chǔ)。也就是說,運營商作為“管道工”,手里攥著的卻是APP的命門,憑什么就不能從管道服務(wù)中多掙錢呢?運營商部署5G進(jìn)行了巨額的投資,個人用戶的套餐資費又難以大幅
    的頭像 發(fā)表于 04-24 08:04 ?442次閱讀
    <b class='flag-5'>運營商</b>的本分,就是專業(yè)做好管道

    美國主流運營商指南:美國運營商認(rèn)證如何選擇?

    不管在中國還是在美國,無線通信市場的競爭都相當(dāng)激烈。中國主流主要是電信、移動、聯(lián)通三大運營商,而在美國市場也由幾家知名的主要運營商主導(dǎo)。如果您的產(chǎn)品有出口美國市場銷售的需求,且產(chǎn)品本身帶有通信功能
    的頭像 發(fā)表于 04-23 17:07 ?786次閱讀
    美國主流<b class='flag-5'>運營商</b>指南:美國<b class='flag-5'>運營商</b>認(rèn)證如何選擇?

    網(wǎng)絡(luò)自動化助力運營商實現(xiàn)成本削減高達(dá)81%

    部署網(wǎng)絡(luò)自動化后,運營商預(yù)計能夠節(jié)省高達(dá)81%的成本。這一顯著降低成本主要得益于自動化在多個領(lǐng)域的優(yōu)勢,包括網(wǎng)絡(luò)和服務(wù)生命周期管理。
    發(fā)表于 02-20 15:10 ?338次閱讀

    第四大運營商,攻擊前三大運營商

    1&1稱其委托Aetha Consulting開展的研究發(fā)現(xiàn)德國前三大移動運營商相比歐洲其他有四家移動運營商的國家的排名前三的運營商的頻譜持有量,平均多出38 MHz的低頻段頻率,總計多出了幾乎120 MHz。
    的頭像 發(fā)表于 01-30 16:00 ?771次閱讀

    最受網(wǎng)絡(luò)運營商歡迎的設(shè)備:愛立信第一 三星第二

    元月23日消息,據(jù)Recon Analytics的調(diào)研,在最受網(wǎng)絡(luò)運營商歡迎的設(shè)備方面,諾基亞被三星替代,諾基亞排名第三,而三星排名第二。
    的頭像 發(fā)表于 01-29 15:05 ?634次閱讀

    瑞士第一大移動網(wǎng)絡(luò)運營商Sunrise將裁員6.14%

    瑞士第一大移動網(wǎng)絡(luò)運營商Sunrise將裁員6.14% 瑞士第一大移動網(wǎng)絡(luò)運營商Sunrise目前全職員工總數(shù)有2703名;Sunrise計劃2024年3月底裁員166 人;約占6.1
    發(fā)表于 01-17 18:51 ?927次閱讀

    使用Jenkins和單個模板部署多個Kubernetes組件

    在持續(xù)集成和部署中,我們通常需要部署多個實例或組件到Kubernetes集群中。通過Jenkins的管道腳本,我們可以自動化這個過程。在本文中,我將演示如何使用Jenkins Pipeline及單個
    的頭像 發(fā)表于 01-02 11:40 ?676次閱讀
    使用Jenkins和單個模板<b class='flag-5'>部署</b>多個<b class='flag-5'>Kubernetes</b>組件