Kubernetes 是一個開源的容器編排系統(tǒng),用于自動化計算機(jī)應(yīng)用程序部署、擴(kuò)展和管理。它是一個非常流行的工具,可以用于自動展開和回滾、水平擴(kuò)展、存儲編排等。對于許多組織來說, Kubernetes 是其基礎(chǔ)架構(gòu)的關(guān)鍵組件。
安裝和擴(kuò)展 Kubernetes 的一個關(guān)鍵步驟是確保它正確利用基礎(chǔ)設(shè)施的其他組件。 NVIDIA 運(yùn)營商優(yōu)化 Kubernetes 上的 GPU 和 NIC 的安裝和管理,使軟件堆棧能夠在云中運(yùn)行最需要資源的工作負(fù)載,如 AI 、 ML 、 DL 和 HPC ,數(shù)據(jù)中心和邊緣。 NVIDIA 運(yùn)營商由 GPU 運(yùn)營商和網(wǎng)絡(luò)運(yùn)營商組成,是開源的,基于運(yùn)營商框架。
NVIDIA GPU 運(yùn)算符
NVIDIA GPU 操作符被打包為一個 Helm 圖表,并安裝和管理軟件組件的生命周期,以便 GPU 加速的應(yīng)用程序可以在 Kubernetes 上運(yùn)行。這些組件包括 GPU 功能發(fā)現(xiàn)、 NVIDIA 驅(qū)動程序、 Kubernetes 設(shè)備插件、 NVIDIA 容器工具包和 DCGM 監(jiān)控。
GPU 操作符使基礎(chǔ)結(jié)構(gòu)團(tuán)隊能夠在集群級別與 Kubernetes 一起使用時管理 GPU 的生命周期,因此無需單獨(dú)管理每個節(jié)點(diǎn)。以前,基礎(chǔ)架構(gòu)團(tuán)隊必須管理兩個操作系統(tǒng)映像,一個用于 GPU 節(jié)點(diǎn),另一個用于 CPU 節(jié)點(diǎn)。當(dāng)使用 GPU 操作符時,基礎(chǔ)設(shè)施團(tuán)隊也可以將 CPU 映像與 GPU 工作節(jié)點(diǎn)一起使用。
NVIDIA 網(wǎng)絡(luò)運(yùn)營商
網(wǎng)絡(luò)運(yùn)營商負(fù)責(zé)自動化 Kubernetes 集群中主機(jī)網(wǎng)絡(luò)組件的部署和管理。它包括 Kubernetes 設(shè)備插件、 NVIDIA 驅(qū)動程序、 NVIDIA 對等內(nèi)存驅(qū)動程序和 Multus 、 macvlan CNIs 。這些組件以前是手動安裝的,但通過網(wǎng)絡(luò)運(yùn)營商實(shí)現(xiàn)了自動化,簡化了部署過程,并通過增強(qiáng)的客戶體驗實(shí)現(xiàn)了加速計算。
單獨(dú)或一起使用, NVIDIA 操作符簡化了 Kubernetes 上的 GPU 和 SmartNIC 配置,并與合作伙伴云平臺兼容。要了解有關(guān)這些組件的更多信息,以及 NVIDIA 操作員如何解決運(yùn)行 AI 、 ML 、 DL 和 HPC 工作負(fù)載的關(guān)鍵挑戰(zhàn),并簡化初始設(shè)置和第 2 天操作,請查看按需網(wǎng)絡(luò)研討會“ 用 NVIDIA Operators 加速 Kubernetes ”。
關(guān)于作者
Troy Estes 是 NVIDIA Edge 和企業(yè)計算解決方案的產(chǎn)品營銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事營銷活動和支持產(chǎn)品 GTM 。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4862瀏覽量
102722 -
gpu
+關(guān)注
關(guān)注
28文章
4678瀏覽量
128612 -
計算機(jī)
+關(guān)注
關(guān)注
19文章
7383瀏覽量
87641
發(fā)布評論請先 登錄
相關(guān)推薦
評論