NVIDIA 發(fā)布了世界上最小、最先進(jìn)的用于自主機(jī)器人和邊緣計算設(shè)備的嵌入式 AI超級計算機(jī) Jetson Xavier NX 。 Jetson Xavier NX 能夠在緊湊的 70x45mm 外形中部署服務(wù)器級性能,在 15W 的功率下可提供多達(dá) 21 臺計算機(jī), MLPerf Inference 0.5 是基于 NVIDIA’s Xavier 引腳的 Jetson Nano 的最新計算結(jié)果,部署工作負(fù)載可能會受到限制,比如基于成本和性能的限制。
圖 2 : Jetson Xavier NX 處理器引擎的框圖,包括高速 I / O 和內(nèi)存結(jié)構(gòu)。
如圖 2 所示, Jetson Xavier NX 包括集成的 384 核 NVIDIA Volta GPU , 48 個張量核, 6 核 NVIDIA Carmel ARMv8 。 2 64 位 CPU , 8GB 128 位 LPDDR4x ,雙 NVIDIA 深度學(xué)習(xí)加速器( NVDLA )引擎, 4K 視頻編碼器和解碼器,專用攝像機(jī)攝取,最多 6 個同時高分辨率傳感器流, PCIe Gen 3 擴(kuò)展、雙顯示端口/ HDMI 4K 顯示器、 USB 3 。 1 和 GPIO ,包括 SPI 、 I2C 、 I2S 、 CAN 總線和 UART 。有關(guān)特性列表,請參閱下表 1 ,有關(guān)完整規(guī)格,請參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。共享內(nèi)存結(jié)構(gòu)允許處理器自由地共享內(nèi)存,而不會產(chǎn)生額外的內(nèi)存拷貝(稱為零拷貝),這有效地提高了系統(tǒng)的帶寬利用率和吞吐量。
表 1 : Jetson Xavier NX 計算模塊特性和功能
* CPU 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最大工作頻率為 1900MHz
?最大并發(fā)流數(shù),達(dá)到總吞吐量。支持的視頻編解碼器: H 。 265 、 H 。 264 、 VP9
有關(guān)具體的編解碼器和配置文件規(guī)范,請參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。
???每通道 2 英鎊/ MIP ,總計 2 英鎊。
? PCIe 1 × 1 僅支持根端口, 1 × 1 / 2 / 4 支持根端口或端點(diǎn)模式
^工作溫度范圍, Xavier SoC 結(jié)溫( Tj )
Jetson Xavier NX 由 NVIDIA 完整的 CUDA -X 軟件棧和 JetPack SDK 開發(fā)包 為 AI 開發(fā)提供支持,除了實時計算機(jī)視覺外,還可以在多個高分辨率傳感器流上同時運(yùn)行流行的機(jī)器學(xué)習(xí)框架和復(fù)雜的 DNN ,在全桌面 Linux 環(huán)境中加速圖形和豐富的多媒體應(yīng)用程序。 Jetson 與 NVIDIA 的 AI 加速計算平臺的兼容性使得開發(fā)更加容易,云和 edge 之間的 MIG 無縫匹配。
設(shè)計抵押品 Jetson Xavier NX 設(shè)計指南 NX 模塊將于 2020 年 3 月面市,售價 399 美元,嵌入式設(shè)計師可以參考可供下載的 Jetson ,包括 Xavier ,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設(shè)備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設(shè)計和直接的技術(shù)插入升級到 Jetson Xavier NX 。除了提供現(xiàn)成的載體、傳感器和配件外, Jetson 生態(tài)系統(tǒng) 的硬件設(shè)計合作伙伴還能夠提供定制設(shè)計服務(wù)和系統(tǒng)集成。
軟件開發(fā)人員現(xiàn)在可以開始為 Jetson Xavier NX 構(gòu)建人工智能應(yīng)用程序,方法是使用 Jetson AGX Xavier 開發(fā)工具包,并將 設(shè)備配置修補(bǔ)程序 應(yīng)用到 JetPack 上,使設(shè)備的行為類似于 Jetson Xavier NX 。通過軟件,它將改變可用的 CPU 和 GPU 核心的數(shù)量,此外還可以設(shè)置整個系統(tǒng)的核心時鐘頻率和電壓。該補(bǔ)丁是完全可逆的,可用于在硬件可用之前近似于 Jetson Xavier NX 的性能。
Jetson Xavier NX 定義了 10 和 15W 的默認(rèn)電源模式,根據(jù)活動模式,可實現(xiàn) 14 到 21 個峰值性能。用于管理電源配置文件的 nvpmodel 工具可調(diào)整 CPU 、 GPU 、內(nèi)存控制器和其他 SoC 時鐘的最大時鐘頻率,以及在線 CPU 集群的數(shù)量 – 這些設(shè)置如表 2 所示,適用于 Jetson Xavier NX 的預(yù)定義 10W 和 15W 模式。 CPU 分為三組,每組 2 個核, 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最高工作頻率為 1900MHz ,對于可能需要更高單線程性能和多線程性能的應(yīng)用而言,最高工作頻率為 1900MHz 。
NVIDIA Jetson Xavier NX – Power Modes
表 2 : Jetson Xavier NX 10W 和 15W 電源模式的最大工作頻率和核心配置。
*使用 NVDLA 時, GPU 最大工作頻率為 600MHz ( 10W 模式)和 1000MHz ( 15W 模式)
根據(jù)工作負(fù)載,動態(tài)電壓和頻率縮放( DVFS )調(diào)控器在運(yùn)行時將頻率調(diào)整到活動 nvpmodel 所定義的最大限制,因此在空閑時根據(jù)處理器利用率降低功耗。 nvpmodel 工具還可以根據(jù)應(yīng)用需求和 TDP 輕松創(chuàng)建和定制新的電源模式??梢跃庉嬰娫磁渲梦募⑵涮砑拥? etc / NVP 模式。 conf 配置文件和一個 GUI 小部件被添加到 Ubuntu 狀態(tài)欄中,以便在運(yùn)行時方便地管理和切換電源模式。
深度學(xué)習(xí)推斷基準(zhǔn)
今天 NVIDIA 還宣布,它在 MLPerf 推斷 0 。 5 基準(zhǔn)測試中占據(jù)了 5 個類別中的 4 個類別的榜首,其中 Jetson AGX Xavier 是邊緣計算 SoC 的領(lǐng)導(dǎo)者,包括所有基于視覺的任務(wù):使用 Mobilenet 和 ResNet-50 進(jìn)行圖像分類,以及使用 SSD Mobilenet 和 SSD ResNet 進(jìn)行目標(biāo)檢測。 NVIDIA GPUs 是十個競爭芯片架構(gòu)中唯一一個在 MLPerf 定義的所有五個推斷測試中提交結(jié)果的。
為了參考 Jetson 家族成員之間的可伸縮性,我們還測量了 Jetson Nano 、 Jetson TX2 、 Jetson Xavier NX 和 Jetson AGX Xavier 對圖像分類、目標(biāo)檢測、位姿估計、分割等常用 DNN 模型的推理性能。這些結(jié)果,如下面的圖 3 所示,是用 JetPack 和 NVIDIA 的 TensorRT 推斷加速器庫運(yùn)行的,該庫優(yōu)化了網(wǎng)絡(luò)的實時性能,該庫是在流行的 ML 框架(如 TensorFlow 、 PyTorch 、 Caffe 、 MXNet 等)中訓(xùn)練出來的。
圖 3 。用 TensorRT 來推斷 Jetson 家族中各種基于視覺的 DNN 模型的性能。
Jetson Xavier NX 的性能比 Jetson TX2 高 10 倍,功耗相同,占地面積小 25% 。在這些基準(zhǔn)測試期間,每個平臺都以最高性能運(yùn)行( MAX-N 模式用于 Jetson AGX Xavier , Xavier NX 和 TX2 為 15W , Nano 為 10W )。最大吞吐量是在批處理大小不超過 16ms 的延遲閾值的情況下獲得的,否則,對于平臺超過該延遲閾值的網(wǎng)絡(luò),批處理大小為 1 。這種方法在實時應(yīng)用程序的確定性低延遲需求和多流用例場景的最大性能之間提供了平衡。
在 Xavier Jetson NX 和 Jetson AGX Xavier 上, NVDLA 引擎和 GPU 同時以 INT8 精度運(yùn)行,而在 Jetson Nano 和 Jetson TX2 上 GPU 以 FP16 精度運(yùn)行, Jetson Xavier NX 中具有張量核心的 Volta 架構(gòu) GPU 可以達(dá)到 12 。 3 個計算頂層,而該模塊的 DLA 引擎每臺最多可產(chǎn)生 4 。 5 臺。
除了用 TensorRT 運(yùn)行神經(jīng)網(wǎng)絡(luò)外, ML 框架還可以通過 cuDNN 和 CUDA 加速在 Jetson 上安裝,包括 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 MXNet 、 Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎外, Jetson 動物園 還包括這些預(yù)構(gòu)建的安裝程序和構(gòu)建說明。
開發(fā)突破性的人工智能產(chǎn)品
Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設(shè)備開辟了新的機(jī)遇,這些設(shè)備需要在較小、低功耗的空間內(nèi)實現(xiàn)高性能人工智能和復(fù)雜的 DNN ,比如移動機(jī)器人、無人機(jī)、智能相機(jī)、便攜式醫(yī)療設(shè)備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。 NVIDIA 支持 CUDA -X 的 JetPack SDK 提供了開發(fā)尖端 AI 解決方案的完整工具,并以世界領(lǐng)先的性能在云端和邊緣之間擴(kuò)展應(yīng)。
關(guān)于作者
Dustin Franklin 是 NVIDIA 的 Jetson 團(tuán)隊的開發(fā)人員布道者。 Dustin 擁有機(jī)器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5060文章
18975瀏覽量
302113 -
機(jī)器人
+關(guān)注
關(guān)注
210文章
28109瀏覽量
205863 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4856瀏覽量
102715 -
嵌入式AI
+關(guān)注
關(guān)注
0文章
33瀏覽量
803
發(fā)布評論請先 登錄
相關(guān)推薦
評論