NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強大功能帶入虛擬桌面、應(yīng)用程序和工作站,加速圖形和計算,使在家辦公或在任何地方工作的創(chuàng)意和技術(shù)專業(yè)人員能夠訪問虛擬化工作空間。
完整的 NVIDIA vGPU 方案包含 GPU 硬件與 vGPU 軟件,將 GPU 硬件與 vGPU 軟件解耦,能夠使用戶定期從軟件的更新功能中受益,同時也為 IT 部門提供靈活性,以滿足不同環(huán)境中用戶的特定需求。
那么,如何選擇能滿足用戶工作負載要求的 NVIDIA GPU 和虛擬化軟件的組合方案呢?
今天我們從 vGPU 的許可類型、軟件版本、支持的虛擬化平臺、物理 GPU、虛擬機 vGPU Profile 等方面來介紹 NVIDIA vGPU 的軟硬件選型指南,以幫助您選擇適合不同工作負載的虛擬化軟件和 GPU。
vGPU 許可類型的選擇
NVIDIA vGPU 目前包含三種許可類型,NVIDIA Virtual Applications (vApp)、NVIDIA Virtual PC (vPC)、NVIDIA RTX Virtual Workstation (vWS),原來的 NVIDIA Virtual Compute Server (vCS) 已合并至 NVIDIA AI Enterprise (NVAIE) 軟件套件中,本篇不做闡述。那么,在日常的虛擬化應(yīng)用場景中,如何選擇合適的 vGPU 許可類型呢?
1
vApp
vApp 即 NVIDIA Virtual Applications(NVIDIA 虛擬應(yīng)用程序)軟件,專為應(yīng)用程序流和遠程桌面共享主機 (RDSH) 工作負載而設(shè)計。
2
vPC
vPC 即 NVIDIA Virtual PC(NVIDIA 虛擬 PC)軟件,專為知識工作者 VDI 工作負載而設(shè)計,可加速以下軟件和應(yīng)用設(shè)備:
辦公生產(chǎn)力應(yīng)用程序,如 Office 軟件
流媒體視頻
Windows OS
多顯示器
高分辨率顯示器
3
vWS
vWS 即 NVIDIA RTX Virtual Workstation(NVIDIA RTX 虛擬工作站)軟件,專為專業(yè)圖形工作負載而設(shè)計,主要優(yōu)勢有:
RTX Enterprise 平臺驅(qū)動程序和 ISV 認證
支持 NVIDIA CUDA 工具包和 OpenCL
更高分辨率的顯示器
具有大量幀緩沖區(qū)的 vGPU 配置文件
NVIDIA RTX vWS 可加速專業(yè)設(shè)計和可視化應(yīng)用程序,例如:
Autodesk Revit
Dassault Systèmes CATIA
Esri ArcGIS Pro
Maya
Petrel
SolidWorks
…
NVIDIA vGPU 軟件版本及虛擬化平臺的推薦
歷經(jīng)十多個版本的迭代更新,NVIDIA vGPU 軟件已經(jīng)更新到最新的 vGPU 16 版本,目前仍在支持的 NVIDIA vGPU 軟件版本有 NVIDIA vGPU software 13、NVIDIA vGPU software 15 和 NVIDIA vGPU software 16,其各自的 EOL 日期如下:
考慮到使用日期和售后支持等方面,推薦使用 vGPU 16 版本。
以 vGPU 16.2 版本為例,其支持的系統(tǒng)和虛擬化產(chǎn)品如下,用戶可以根據(jù)現(xiàn)有的虛擬化平臺進行選擇。
1
Citrix Hypervisor
2
Microsoft Azure Stack HCI
3
Microsoft Windows Server
4
Red Hat Enterprise Linux with KVM
5
Ubuntu with KVM
6
VMware vSphere ESXi
7
Nutanix AHV
該版本的 NVIDIA vGPU 軟件支持 Nutanix AHV,基于 Linux 的 KVM 虛擬機管理程序。
未在列表中的、基于 Linux KVM 開發(fā)的其他虛擬化平臺,需要和廠家確認是否兼容適配 vGPU 軟件,建議實際測試,確定是否可以正常安裝部署。
物理 GPU 的選擇
NVIDIA vGPU 軟件需要在具備 NVIDIA GPU 的平臺上運行。vGPU 通過 time-sliced(時間切分)的方式共享 GPU 引擎,包括圖形 (3D)、視頻編解碼引擎等,不同的 GPU 具備不同的規(guī)格,用戶可以根據(jù)性能、成本和顯存大小等因素選擇合適的 GPU。針對目前仍在支持的虛擬 GPU 軟件版本,支持的 GPU 有:
虛擬機 vGPU Profile 的設(shè)定
可用 vGPU Profile 配置文件,在虛擬化教程 (2) 和虛擬化教程 (3)(點擊藍字跳轉(zhuǎn)鏈接)中介紹許可類型功能特性時有提到,包括 vWS 的 1Q/2Q/../48Q,vPC 的 1B/2B,vApp 的 1A/2A/.../48A,可以將其認為是給虛擬機分配的顯存大小。
經(jīng)常有用戶會問:如何去設(shè)定 vGPU Profile,才能滿足當下的應(yīng)用場景和業(yè)務(wù)需求?
大致可以從以下三個方向去考慮:
首先,反推法,先確定當下使用的物理 GPU 型號,以及支持應(yīng)用程序或業(yè)務(wù)工作負載所需的顯存大小,再反推應(yīng)該怎么去劃分。
其次,可以根據(jù)具體的應(yīng)用程序官方推薦的 GPU 和顯存大小等硬件需求,來進行具體的 vGPU 文件的配置和顯存劃分。
最后,正向測試方法,比如設(shè)計類用戶,考慮到運行模型大小以及復(fù)雜程度的不同,可以通過一些工具或?qū)で蠊?yīng)商來評估,獲取 POC 支持和優(yōu)化的方案。這里推薦兩個工具:
1
GPU Profiler
GPU Profiler(GitHub 上可下載)是一個常用的工具,可以實時記錄資源在虛擬機上執(zhí)行工作負載時的利用率。該工具通常在 POC 階段幫助調(diào)整虛擬環(huán)境大小,以確??山邮艿男阅?。GPU Profiler 可以在具有各種 vGPU 配置文件的單個 VM 上運行??梢垣@取以下指標:
幀緩沖區(qū)
GPU 利用率
vCPU
內(nèi)存
視頻編碼
視頻解碼
2
NVIDIA System Management Interface
(nvidia-smi)
NVIDIA vGPU Manager 提供監(jiān)控功能,讓 IT 人員能夠了解更好地利用 NVIDIA vGPU 的各種引擎的使用情況,包括幀緩沖區(qū)、編解碼器等都可以通過命令行界面工具 nvidia-smi 進行監(jiān)控和記錄,并可以在 Hypervisor 或者虛擬機內(nèi)進行訪問。
適用于虛擬化工作負載的
NVIDIA vGPU解決方案推薦
NVIDIA 虛擬化解決方案與基于當下 NVIDIA Ada Lovelace 和 Ampere 架構(gòu)的 GPU 配合使用時,可提供巨大的靈活性和性能,從而滿足當今企業(yè)不斷變化的工作負載和組織需求。
▲ 推薦 vGPU 軟硬件方案
如上圖所示,如果追求最大限度地提高虛擬化工作負載的性能,可以考慮性能優(yōu)化的 GPU,如果考慮到成本因素,則可以選擇高性價比的 GPU。
當然,除了 NVIDIA 數(shù)據(jù)中心 GPU 之外,還有很多其他 GPU 支持虛擬化,包括 NVIDIA RTX 專業(yè)圖形卡系列:NVIDIA RTX 5880 Ada Generation、NVIDIA RTX 5000 Ada Generation、NVIDIA RTX A5000 等。用戶可根據(jù)具體需求,選擇合適的 GPU 和軟件。
*與NVIDIA產(chǎn)品相關(guān)的圖片或視頻(完整或部分)的版權(quán)均歸NVIDIA Corporation所有。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102711 -
gpu
+關(guān)注
關(guān)注
28文章
4673瀏覽量
128593 -
虛擬機
+關(guān)注
關(guān)注
1文章
904瀏覽量
28018 -
OpenCL
+關(guān)注
關(guān)注
2文章
48瀏覽量
33255 -
多顯示器
+關(guān)注
關(guān)注
0文章
2瀏覽量
1142
原文標題:虛擬化教程 (4) : NVIDIA vGPU 軟硬件選型指南
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論