日韩专区+中文字幕,国内自拍视频在线

在本文中，我們將介紹 GPU Operator release 1.8 中添加的新功能，進(jìn)一步簡(jiǎn)化 GPU 對(duì)各種部署場(chǎng)景的管理，包括：

增加了對(duì) GPU 操作員升級(jí)的支持

支持 NVX 交換機(jī)系統(tǒng)，包括 DGX A100 和 NVIDIA HGX A100 服務(wù)器

支持收集 GPU 操作員狀態(tài)指標(biāo)

GPU 運(yùn)營(yíng)商和網(wǎng)絡(luò)運(yùn)營(yíng)商改進(jìn)多節(jié)點(diǎn)培訓(xùn)

支持 Red Hat OpenShift 4.8

NVIDIA 軟件生命周期管理

GPU Operator 的 1.8 版為組織提供了更新機(jī)制，以更新其 GPU Operator 版本，而不會(huì)中斷運(yùn)行 GPU Operator 的群集的工作流。 GPU Operator 的早期版本要求用戶(hù)在安裝新版本之前卸載以前的版本，這意味著在升級(jí)過(guò)程中群集中沒(méi)有可用的 GPU 。

從 1.8 開(kāi)始，升級(jí)版本不會(huì)中斷工作流程。該機(jī)制以滾動(dòng)方式一次更新一個(gè)節(jié)點(diǎn)，因此其他節(jié)點(diǎn)可以繼續(xù)使用。只有在安裝完成且上一個(gè)節(jié)點(diǎn)重新聯(lián)機(jī)時(shí)，下一個(gè)節(jié)點(diǎn)才會(huì)更新。用戶(hù)可以確信，在更新 GPU 操作員時(shí)，他們的工作流程將得到更好的管理。

現(xiàn)在支持 NVS 交換機(jī)系統(tǒng)

對(duì)于 1.8 ， GPU 操作員自動(dòng)在 NVIDIA 上部署初始化結(jié)構(gòu)所需的軟件 NVSwitch 系統(tǒng)，包括 NVIDIA HGX A100 和 DGX A100 。一旦初始化，所有 GPU 都可以在全 NVLink 帶寬下相互通信，以創(chuàng)建一個(gè)可擴(kuò)展的終端計(jì)算平臺(tái)。

GPU 操作員還經(jīng)過(guò)認(rèn)證，可在 DGX A100 系統(tǒng)上與 Red Hat OpenShift 4 一起使用。

支持收集 GPU 操作員狀態(tài)指標(biāo)

在 1.8 版本中， GPU 運(yùn)營(yíng)商現(xiàn)在報(bào)告各種指標(biāo)，供用戶(hù)監(jiān)控 GPU 運(yùn)營(yíng)商和 GPU – 運(yùn)營(yíng)商資源命名空間下的運(yùn)營(yíng)商部署資源的總體運(yùn)行狀況。 SRE 團(tuán)隊(duì)和集群管理員現(xiàn)在可以配置必要的 Prometheus 用于收集指標(biāo)以及在某些故障情況下觸發(fā)警報(bào)的資源。

對(duì)于 OpenShift 容器平臺(tái)，這些資源將在此版本中自動(dòng)創(chuàng)建。監(jiān)控解決方案，如 Grafana 可用于構(gòu)建儀表板和可視化 GPU 操作員和節(jié)點(diǎn)組件的操作狀態(tài)。

更好地結(jié)合： NVIDIA 加速計(jì)算和聯(lián)網(wǎng)

最近， NVIDIA 發(fā)布了 NVIDIA Network Operator 。模擬 NVIDIA GPU Operator ，網(wǎng)絡(luò)運(yùn)營(yíng)商通過(guò)自動(dòng)化網(wǎng)絡(luò)部署和配置的各個(gè)方面簡(jiǎn)化了 Kubernetes 的擴(kuò)展網(wǎng)絡(luò)設(shè)計(jì)，否則需要手動(dòng)操作。它在具有 NVIDIA 網(wǎng)絡(luò)接口的任何群集節(jié)點(diǎn)上加載所需的驅(qū)動(dòng)程序、庫(kù)、設(shè)備插件和 CNI 。

當(dāng)它們一起部署時(shí)， NVIDIA GPU 和網(wǎng)絡(luò)運(yùn)營(yíng)商啟用 GPU 直接 RDMA ，即不同節(jié)點(diǎn)上 NVIDIA GPU 之間的快速數(shù)據(jù)路徑。這是數(shù)據(jù)密集型工作負(fù)載（如 AI 多節(jié)點(diǎn)培訓(xùn)）的關(guān)鍵技術(shù)促成因素。

了解有關(guān)最新版本的更多信息 NVIDIA 網(wǎng)絡(luò)運(yùn)營(yíng)商發(fā)布。

增加了對(duì) Red Hat OpenShift 的支持

我們繼續(xù)支持紅帽 OpenShift 。

GPU Operator 1.8 和 1.7 支持 Red Hat OpenShift 4.8 和 4 . 7

GPU 運(yùn)算符 1.6 支持 Red Hat OpenShift 4. 7

GPU 運(yùn)算符 1. 5 支持 Red Hat OpenShift 4 . 6

GPU Operator 1. 4 和1 .3 分別支持 Red Hat OpenShift 4.5 和 4.4

概括

以下資源可用于使用 NVIDIA GPU 運(yùn)算符：

GPU 操作員 1.8 發(fā)行說(shuō)明

入門(mén)指南

GPU NGC 上的操作員舵圖

GitHub 上的 GPU 運(yùn)算符

NVIDIA GPU 運(yùn)算符是許多應(yīng)用程序的關(guān)鍵組件邊緣計(jì)算解決。

關(guān)于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計(jì)算解決方案的產(chǎn)品營(yíng)銷(xiāo)經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門(mén)之前，特洛伊曾在自主汽車(chē)業(yè)務(wù)部門(mén)和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事?tīng)I(yíng)銷(xiāo)活動(dòng)和支持產(chǎn)品 GTM 。

Erik Bohnhorst 是 NVIDIA 的高級(jí)產(chǎn)品經(jīng)理，專(zhuān)注于云本地技術(shù)，為 edge 和數(shù)據(jù)中心構(gòu)建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ，以解決方案架構(gòu)師的身份幫助客戶(hù)構(gòu)建世界一流的虛擬化遠(yuǎn)程工作站。埃里克領(lǐng)導(dǎo)技術(shù)營(yíng)銷(xiāo)團(tuán)隊(duì)，直到他加入了 EGX 團(tuán)隊(duì)。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4862

瀏覽量
102723
數(shù)據(jù)中心

數(shù)據(jù)中心

+關(guān)注

關(guān)注
16

文章
4644

瀏覽量
71906

評(píng)論

相關(guān)推薦

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

本篇閱讀學(xué)習(xí)第七、八章，了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算發(fā)展 ●從三角形開(kāi)始的幾何階段在現(xiàn)代圖形渲染中，三角形是最常用

發(fā)表于 11-03 12:55

談?wù)?b class='flag-5'>GPU的使用壽命

上文結(jié)合論文談一談，三年壽命的GPU [上]說(shuō)到，電路腐蝕導(dǎo)致橡樹(shù)嶺實(shí)驗(yàn)室的GPU壽命只有3年，更換了11,000塊GPU。

發(fā)表于 11-01 10:27 ?100次閱讀

【一文看懂】大白話解釋“GPU與GPU算力”

隨著大模型的興起，“GPU算力”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場(chǎng)景中，什么是GPU，它與CPU的區(qū)別是什么？以及到底什么是GPU算力？本篇文章主要從以下5個(gè)角度，讓您

發(fā)表于 10-29 08:05 ?188次閱讀

【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

常見(jiàn)GPU問(wèn)題及解決方法

GPU（圖形處理單元）是計(jì)算機(jī)硬件的重要組成部分，負(fù)責(zé)處理圖形和視頻渲染任務(wù)。隨著技術(shù)的發(fā)展，GPU在深度學(xué)習(xí)、游戲、視頻編輯等領(lǐng)域扮演著越來(lái)越重要的角色。然而，在使用GPU的過(guò)程中，我們可能會(huì)遇到

發(fā)表于 10-27 14:12 ?489次閱讀

GPU深度學(xué)習(xí)應(yīng)用案例

GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要，以下是一些GPU深度學(xué)習(xí)應(yīng)用案例：一、圖像識(shí)別圖像識(shí)別是深度學(xué)習(xí)的核心應(yīng)用領(lǐng)域之一，GPU在加速圖像識(shí)別模型訓(xùn)練方面發(fā)揮著關(guān)鍵作用。通過(guò)利用GPU

發(fā)表于 10-27 11:13 ?297次閱讀

GPU超頻設(shè)置技巧

超頻GPU（圖形處理單元）可以提高顯卡的性能，但同時(shí)也可能增加熱量和功耗，甚至可能縮短硬件的壽命。在進(jìn)行GPU超頻之前，確保你了解可能的風(fēng)險(xiǎn)，并且愿意承擔(dān)這些風(fēng)險(xiǎn)。以下是一些基本的GPU超頻設(shè)置

發(fā)表于 10-27 11:09 ?227次閱讀

如何選擇適合的GPU

。因此，選擇一個(gè)適合自己需求的GPU是一個(gè)需要綜合考慮多個(gè)因素的過(guò)程。 1. 確定用途首先，你需要明確你的GPU將用于什么目的。不同的應(yīng)用場(chǎng)景對(duì)GPU的需求差異很大。例如，如果你主要

發(fā)表于 10-27 11:07 ?170次閱讀

GPU算力租用平臺(tái)是什么

GPU算力租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式，它允許用戶(hù)通過(guò)互聯(lián)網(wǎng)按需租用高性能GPU資源，而無(wú)需自行購(gòu)買(mǎi)、部署和維護(hù)這些硬件。

發(fā)表于 10-16 10:15 ?151次閱讀

暴漲預(yù)警！NVIDIA GPU供應(yīng)大跳水

gpu

jf_02331860
發(fā)布于 :2024年07月26日 09:41:42

CPU渲染和GPU渲染優(yōu)劣分析

使用計(jì)算機(jī)進(jìn)行渲染時(shí)，有兩種流行的系統(tǒng)：基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計(jì)算機(jī)的CPU來(lái)執(zhí)行場(chǎng)景并將其渲染到接近完美。這也是執(zhí)行渲染的更傳統(tǒng)方式。然而，隨著

發(fā)表于 05-23 08:27 ?511次閱讀

為什么GPU對(duì)AI如此重要？

GPU在人工智能中相當(dāng)于稀土金屬，甚至黃金，它們?cè)诋?dāng)今生成式人工智能時(shí)代中的作用不可或缺。那么，為什么GPU在人工智能發(fā)展中如此重要呢？什么是GPU圖形處理器（GPU）是一種通常用于進(jìn)

發(fā)表于 05-17 08:27 ?630次閱讀

NVLink技術(shù)之GPU與GPU的通信

在多 GPU 系統(tǒng)內(nèi)部，GPU 間通信的帶寬通常在數(shù)百GB/s以上，PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸，且PCIe鏈路接口的串并轉(zhuǎn)換會(huì)產(chǎn)生較大延時(shí)，影響GPU并行計(jì)算的效率和性能。

發(fā)表于 03-27 09:40 ?3497次閱讀