0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

世界最小嵌入式AI超級計算機Jetson Xavier NX

星星科技指導員 ? 來源:NVIDIA ? 作者:Dustin ? 2022-04-18 10:09 ? 次閱讀

NVIDIA 發(fā)布了Jetson Xavier NX,這是世界上最小、最先進的嵌入式 AI 超級計算機,用于自主機器人和邊緣計算設備。Jetson Xavier NX 能夠在緊湊的 70x45mm 外形尺寸中部署服務器級性能,在 15W 功率下提供高達 21 TOPS 的計算,或在 10W 下提供高達 14 TOPS 的計算。Jetson Xavier NX 模塊(圖 1)與 Jetson Nano 引腳兼容,并基于 NVIDIA 的 Xavier SoC 的低功耗版本,該版本在邊緣 SoC 中領先于最近的MLPerf Inference 0.5結果,為部署要求苛刻的基于 AI 的邊緣的工作負載可能會受到尺寸、重量、功率和成本等因素的限制。

pYYBAGJcyEaAO14YAAE37EgmMPI570.png

圖 2:Jetson Xavier NX 處理器引擎的框圖,包括高速 I/O 和內(nèi)存結構。

如圖 2 所示,Jetson Xavier NX 包括一個集成的 384 核 NVIDIA Volta GPU,具有 48 個 Tensor 核心、6 核 NVIDIA Carmel ARMv8.2 64 位 CPU、8GB 128 位 LPDDR4x、雙 NVIDIA 深度學習加速器 (NVDLA)引擎、4K 視頻編碼器和解碼器、用于多達 6 個同步高分辨率傳感器流的專用攝像頭攝取、PCIe Gen 3 擴展、雙 DisplayPort/HDMI 4K 顯示器、USB 3.1 和 GPIO,包括 SPI、I2C、I2S、CAN 總線和UART。請參閱下表 1,了解功能列表和Jetson Xavier NX 模塊數(shù)據(jù)表,了解完整規(guī)格。共享內(nèi)存結構允許處理器自由共享內(nèi)存,而不會產(chǎn)生額外的內(nèi)存副本(稱為 ZeroCopy),從而有效地提高了系統(tǒng)的帶寬利用率和吞吐量。

pYYBAGJcyGeAd4WAAAChc7VjUeE693.png

表 1:Jetson Xavier NX 計算模塊特性和功能

* CPU 最大工作頻率在 4/6 核模式下為 1400MHz,或在雙核模式下為 1900MHz

? 最大并發(fā)流數(shù)達到總吞吐量。支持的視頻編解碼器:H.265、H.264、VP9有關特定編解碼器和配置文件規(guī)范,

請參閱Jetson Xavier NX 模塊數(shù)據(jù)表。

?? MIPI CSI-2,D-PHY V1.2(每通道 2.5Gb/s,總計高達 30Gbps)。

? PCIe 1×1 僅支持根端口,1×1/2/4 支持根端口或端點模式

^ 工作溫度范圍,Xavier SoC 結溫 (Tj)

Jetson Xavier NX 得到 NVIDIA 完整的 CUDA-X 軟件堆棧和用于 AI 開發(fā)的JetPack SDK的支持,除了實時計算機視覺、加速圖形和豐富的多媒體應用程序之外,還能在多個高分辨率傳感器流上同時運行流行的機器學習框架和復雜的 DNN在完整的桌面 Linux 環(huán)境中。Jetson 與 NVIDIA 的 AI 加速計算平臺的兼容性使得開發(fā)和云與邊緣之間的無縫遷移變得容易。

Jetson Xavier NX 模塊將于 2020 年 3 月以 399 美元的批量供貨,嵌入式設計人員可以參考可供下載設計資料,包括Jetson Xavier NX 設計指南,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設計和對 Jetson Xavier NX 的直接技術插入升級。Jetson 生態(tài)系統(tǒng)的硬件設計合作伙伴除了提供現(xiàn)成的載體、傳感器和配件外,還能夠提供定制設計服務和系統(tǒng)集成。

軟件開發(fā)人員現(xiàn)在可以開始為 Jetson Xavier NX 構建 AI 應用程序,方法是使用 Jetson AGX Xavier 開發(fā)工具包,并將設備配置補丁應用到 JetPack,使設備表現(xiàn)得像 Jetson Xavier NX。除了設置整個系統(tǒng)的核心時鐘頻率和電壓外,它還將通過軟件改變可用的 CPU 和 GPU 核心的數(shù)量。該補丁是完全可逆的,可用于在硬件可用之前估算 Jetson Xavier NX 的性能。

Jetson Xavier NX 定義了 10 和 15W 的默認功率模式,根據(jù)活動模式實現(xiàn) 14 到 21 TOPS 的峰值性能。用于管理電源配置文件的 nvpmodel 工具調(diào)整 CPU、GPU、內(nèi)存控制器和其他 SoC 時鐘的最大時鐘頻率,以及在線 CPU 集群的數(shù)量——這些設置顯示在表 2 中,用于預定義的 10W 和Jetson Xavier NX 的 15W 模式。CPU 布置在三個集群中,每個集群有 2 個內(nèi)核,在 4/6 核模式下的最高工作頻率為 1400MHz,在雙核模式下最高可達 1900MHz,適用于可能需要更多單線程與多線程的應用程序表現(xiàn)。

poYBAGJcyHKAZGpiAABMKO7O-zY213.png

表 2:Jetson Xavier NX 在 10W 和 15W 功率模式下的最大工作頻率和核心配置。

* 使用 NVDLA 時,GPU 最高工作頻率為 600MHz(10W 模式)和 1000MHz(15W 模式)

根據(jù)工作負載,動態(tài)電壓和頻率縮放 (DVFS) 調(diào)節(jié)器在運行時將頻率縮放到活動 nvpmodel 定義的最大限制,因此在空閑時降低功耗并取決于處理器利用率。nvpmodel 工具還可以根據(jù)應用要求和 TDP 輕松創(chuàng)建和自定義新的電源模式??梢跃庉嬰娫磁渲梦募⑵涮砑拥?/etc/nvpmodel.conf 配置文件中,并且在 Ubuntu 狀態(tài)欄中添加了一個 GUI 小部件,以便在運行時輕松管理和切換電源模式。

深度學習推理基準

NVIDIA 還宣布,它在MLPerf Inference 0.5基準測試的 5 個類別中的 4 個類別中奪冠,其中 Jetson AGX Xavier 是邊緣計算 SoC 的領導者,包括所有基于視覺的任務:使用 Mobilenet 進行圖像分類和ResNet-50,以及使用 SSD-Mobilenet 和 SSD-ResNet 進行對象檢測。在 MLPerf 定義的所有五項推理測試中,NVIDIA GPU 是十種競爭芯片架構中唯一提交結果的一種。

為了參考 Jetson 系列成員之間的可擴展性,我們還在流行的 DNN 模型上測量了 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 的推理性能,用于圖像分類、對象檢測、姿勢估計、分割等。這些結果(如下圖 3 所示)是使用 JetPack 和 NVIDIA 的 TensorRT 推理加速器庫運行的,該庫可優(yōu)化網(wǎng)絡以實現(xiàn)實時性能,這些網(wǎng)絡在 TensorFlow、PyTorch、Caffe、MXNet 等流行的機器學習框架中進行了訓練。

pYYBAGJcyEiAcUKjAADDhGorRsA431.png

圖 3. Jetson 系列中使用 TensorRT 的各種基于視覺的 DNN 模型的推理性能。

Jetson Xavier NX 的性能比 Jetson TX2 高出多達 10 倍,功率相同,占用空間減少 25%。在這些基準測試中,每個平臺都以最高性能運行(Jetson AGX Xavier 為 MAX-N 模式,Xavier NX 和 TX2 為 15W,Nano 為 10W)。最大吞吐量是在批處理大小不超過 16 毫秒延遲閾值的情況下獲得的,否則對于平臺超過此延遲閾值的網(wǎng)絡,批處理大小為 1。這種方法在實時應用程序的確定性低延遲要求和多流用例場景的最大性能之間提供了平衡。

在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVDLA 引擎和 GPU 以 INT8 精度同時運行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度運行。Jetson Xavier NX 中帶有 Tensor Cores 的 Volta 架構 GPU 能夠進行高達 12.3 TOPS 的計算,而該模塊的 DLA 引擎每個可產(chǎn)生高達 4.5 TOPS。

除了使用 TensorRT 運行神經(jīng)網(wǎng)絡之外,ML 框架還可以通過 CUDA 和 cuDNN 本地安裝在 Jetson 上,包括 TensorFlow、PyTorch、Caffe/Caffe2、MXNet、Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎之外, Jetson Zoo還包括預構建的安裝程序和構建說明。

開發(fā)突破性的人工智能產(chǎn)品

Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設備開辟了新的機會,這些設備需要高性能 AI 和復雜的 DNN 在小尺寸、低功耗的足跡中——想想移動機器人、無人機、智能相機、便攜式醫(yī)療設備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。支持 CUDA-X 的 NVIDIA JetPack SDK 提供了完整的工具來開發(fā)尖端的 AI 解決方案,并以世界領先的性能在云和邊緣之間擴展您的應用程序。

關于作者

Dustin 是 NVIDIA Jetson 團隊的一名開發(fā)人員推廣員。Dustin 擁有機器人技術和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    210

    文章

    27839

    瀏覽量

    204600
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266237
  • 無人機
    +關注

    關注

    226

    文章

    10199

    瀏覽量

    177527
  • 嵌入式AI
    +關注

    關注

    0

    文章

    33

    瀏覽量

    797
收藏 人收藏

    評論

    相關推薦

    ARMxy ARM嵌入式計算機支持Ubuntu OS快速部署AIoT解決方案

    隨著人工智能(AI)和物聯(lián)網(wǎng)(IoT)技術的融合,AIoT正成為推動工業(yè)自動化和智能制造的關鍵力量。在這一背景下,ARMxy ARM嵌入式計算機憑借其穩(wěn)定的性能和對Ubuntu操作系統(tǒng)的支持,成為
    的頭像 發(fā)表于 08-21 16:14 ?148次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式計算機</b>支持Ubuntu OS快速部署AIoT解決方案

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達一萬億次的浮點運算,這為復雜的圖像處理和深度學習任務提供了充足的計算資源。在產(chǎn)品缺陷檢測領域,ARMxy ARM嵌入式計算機具備的這一算
    的頭像 發(fā)表于 08-20 11:53 ?127次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式計算機</b>搭載 1 TOPS NPU支持深度學習

    如何選擇嵌入式主板或單板計算機

    規(guī)格并選擇工業(yè)主板或嵌入式單板計算機可能是一項耗時且艱巨的任務。本質(zhì)上,單板計算機和主板都是印刷電路板,承載嵌入式計算機的所有必要組件。傳統(tǒng)上,單板
    的頭像 發(fā)表于 05-21 16:31 ?655次閱讀
    如何選擇<b class='flag-5'>嵌入式</b>主板或單板<b class='flag-5'>計算機</b>

    富士通使用富岳超級計算機訓練LLM

    盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如
    的頭像 發(fā)表于 05-13 14:18 ?421次閱讀

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機這一消息屬實。
    的頭像 發(fā)表于 04-11 10:14 ?412次閱讀

    人形機器人主板:jetson orin nx核心模塊與SOM-7583核心模塊結合在一塊主板上

    ERUN_7583_ORIN_NX嵌入式人工智能計算機底板,專為滿足人形機器人的實際需求而設計,他具備jetson orin nx核心模塊與
    的頭像 發(fā)表于 03-26 11:17 ?576次閱讀
    人形機器人主板:<b class='flag-5'>jetson</b> orin <b class='flag-5'>nx</b>核心模塊與SOM-7583核心模塊結合在一塊主板上

    諾和諾德基金會將聯(lián)手英偉達打造丹麥AI超級計算機

    諾和諾德基金會攜手英偉達,共同宣布在丹麥打造一臺領先的AI超級計算機。這臺超級計算機將致力于推動醫(yī)療保健、生命科學以及綠色轉(zhuǎn)型等領域的科研與
    的頭像 發(fā)表于 03-21 13:43 ?440次閱讀

    NVIDIA Jetson嵌入式計算領域探索AI可能

    自動化業(yè)務流程、通過數(shù)據(jù)分析獲得洞察力、與客戶和員工互動……如今 AI 正在大幅提高生產(chǎn)力,推動競爭優(yōu)勢。NVIDIA Jetson 是適用于自主機器和其他嵌入式應用的先進平臺,具有出色的 A
    的頭像 發(fā)表于 01-25 17:03 ?440次閱讀
    NVIDIA <b class='flag-5'>Jetson</b>為<b class='flag-5'>嵌入式</b><b class='flag-5'>計算</b>領域探索<b class='flag-5'>AI</b>可能

    什么是嵌入式計算機?

    嵌入式計算機是一種專門設計用于特定功能的計算機系統(tǒng),通常被嵌入到其他設備中,以執(zhí)行特定的任務。這種計
    的頭像 發(fā)表于 01-15 15:10 ?1056次閱讀
    什么是<b class='flag-5'>嵌入式計算機</b>?

    最適合 AI 應用的計算機視覺類型是什么?

    著眼于使計算機能夠像人類一樣通過“看”來感知世界,從這一視角對人工智能 (AI) 進行了探討。我將簡要比較每一類計算機視覺,尤其關注在本地而不是依賴基于云的資源收集和處理數(shù)據(jù),并根據(jù)數(shù)
    的頭像 發(fā)表于 12-18 13:09 ?7093次閱讀
    最適合 <b class='flag-5'>AI</b> 應用的<b class='flag-5'>計算機</b>視覺類型是什么?

    NVIDIA Jetson嵌入式系統(tǒng)AI應用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個Arm內(nèi)核和NVIDIA Ampere
    發(fā)表于 12-11 17:37 ?423次閱讀

    利用 NVIDIA Jetson 實現(xiàn)生成 AI

    近日,NVIDIA 發(fā)布了 Jetson 生成 AI 實驗室(Jetson Generative AI Lab),使開發(fā)者能夠通過 NVI
    的頭像 發(fā)表于 11-07 21:25 ?775次閱讀
    利用 NVIDIA <b class='flag-5'>Jetson</b> 實現(xiàn)生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b>

    Banana Pi為何選擇rk3588開發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品

    。這篇文章將解釋我們選擇RK3588的原因以及如何實現(xiàn)與Jetson Nano引腳的兼容性。 Jetson Nano一直是嵌入式計算領域的領先產(chǎn)品,具有強大的性能和豐富的功能,廣受開發(fā)
    發(fā)表于 11-02 12:30

    基于ARM的嵌入式飛行控制計算機系統(tǒng)設計

    電子發(fā)燒友網(wǎng)站提供《基于ARM的嵌入式飛行控制計算機系統(tǒng)設計.pdf》資料免費下載
    發(fā)表于 10-27 10:35 ?1次下載
    基于ARM的<b class='flag-5'>嵌入式</b>飛行控制<b class='flag-5'>計算機</b>系統(tǒng)設計

    armsom:為何選擇rk3588開發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品

    的原因以及如何實現(xiàn)與Jetson Nano引腳的兼容性。Jetson Nano一直是嵌入式計算領域的領先產(chǎn)品,具有強大的性能和豐富的功能,廣受開發(fā)者和制造商的歡迎。然而,armsom認
    發(fā)表于 10-18 17:35