0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson Xavier NX世上最小嵌入式AI超級計算機(jī)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin Franklin ? 2022-04-18 14:58 ? 次閱讀

NVIDIA 發(fā)布了世界上最小、最先進(jìn)的用于自主機(jī)器人和邊緣計算設(shè)備的嵌入式 AI超級計算機(jī) Jetson Xavier NX 。 Jetson Xavier NX 能夠在緊湊的 70x45mm 外形中部署服務(wù)器級性能,在 15W 的功率下可提供多達(dá) 21 臺計算機(jī), MLPerf Inference 0.5 是基于 NVIDIA’s Xavier 引腳的 Jetson Nano 的最新計算結(jié)果,部署工作負(fù)載可能會受到限制,比如基于成本和性能的限制。

圖 2 : Jetson Xavier NX 處理器引擎的框圖,包括高速 I / O 和內(nèi)存結(jié)構(gòu)。

如圖 2 所示, Jetson Xavier NX 包括集成的 384 核 NVIDIA Volta GPU , 48 個張量核, 6 核 NVIDIA Carmel ARMv8 。 2 64 位 CPU , 8GB 128 位 LPDDR4x ,雙 NVIDIA 深度學(xué)習(xí)加速器( NVDLA )引擎, 4K 視頻編碼器和解碼器,專用攝像機(jī)攝取,最多 6 個同時高分辨率傳感器流, PCIe Gen 3 擴(kuò)展、雙顯示端口/ HDMI 4K 顯示器、 USB 3 。 1 和 GPIO ,包括 SPI 、 I2C 、 I2S 、 CAN 總線和 UART 。有關(guān)特性列表,請參閱下表 1 ,有關(guān)完整規(guī)格,請參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。共享內(nèi)存結(jié)構(gòu)允許處理器自由地共享內(nèi)存,而不會產(chǎn)生額外的內(nèi)存拷貝(稱為零拷貝),這有效地提高了系統(tǒng)的帶寬利用率和吞吐量。

表 1 : Jetson Xavier NX 計算模塊特性和功能

* CPU 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最大工作頻率為 1900MHz

?最大并發(fā)流數(shù),達(dá)到總吞吐量。支持的視頻編解碼器: H 。 265 、 H 。 264 、 VP9

有關(guān)具體的編解碼器和配置文件規(guī)范,請參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。

???每通道 2 英鎊/ MIP ,總計 2 英鎊。

? PCIe 1 × 1 僅支持根端口, 1 × 1 / 2 / 4 支持根端口或端點(diǎn)模式

^工作溫度范圍, Xavier SoC 結(jié)溫( Tj )

Jetson Xavier NX 由 NVIDIA 完整的 CUDA -X 軟件棧和 JetPack SDK 開發(fā)包 為 AI 開發(fā)提供支持,除了實時計算機(jī)視覺外,還可以在多個高分辨率傳感器流上同時運(yùn)行流行的機(jī)器學(xué)習(xí)框架和復(fù)雜的 DNN ,在全桌面 Linux 環(huán)境中加速圖形和豐富的多媒體應(yīng)用程序。 Jetson 與 NVIDIA 的 AI 加速計算平臺的兼容性使得開發(fā)更加容易,云和 edge 之間的 MIG 無縫匹配。

設(shè)計抵押品 Jetson Xavier NX 設(shè)計指南 NX 模塊將于 2020 年 3 月面市,售價 399 美元,嵌入式設(shè)計師可以參考可供下載的 Jetson ,包括 Xavier ,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設(shè)備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設(shè)計和直接的技術(shù)插入升級到 Jetson Xavier NX 。除了提供現(xiàn)成的載體、傳感器和配件外, Jetson 生態(tài)系統(tǒng) 的硬件設(shè)計合作伙伴還能夠提供定制設(shè)計服務(wù)和系統(tǒng)集成。

軟件開發(fā)人員現(xiàn)在可以開始為 Jetson Xavier NX 構(gòu)建人工智能應(yīng)用程序,方法是使用 Jetson AGX Xavier 開發(fā)工具包,并將 設(shè)備配置修補(bǔ)程序 應(yīng)用到 JetPack 上,使設(shè)備的行為類似于 Jetson Xavier NX 。通過軟件,它將改變可用的 CPU 和 GPU 核心的數(shù)量,此外還可以設(shè)置整個系統(tǒng)的核心時鐘頻率和電壓。該補(bǔ)丁是完全可逆的,可用于在硬件可用之前近似于 Jetson Xavier NX 的性能。

Jetson Xavier NX 定義了 10 和 15W 的默認(rèn)電源模式,根據(jù)活動模式,可實現(xiàn) 14 到 21 個峰值性能。用于管理電源配置文件的 nvpmodel 工具可調(diào)整 CPU 、 GPU 、內(nèi)存控制器和其他 SoC 時鐘的最大時鐘頻率,以及在線 CPU 集群的數(shù)量 – 這些設(shè)置如表 2 所示,適用于 Jetson Xavier NX 的預(yù)定義 10W 和 15W 模式。 CPU 分為三組,每組 2 個核, 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最高工作頻率為 1900MHz ,對于可能需要更高單線程性能和多線程性能的應(yīng)用而言,最高工作頻率為 1900MHz 。

NVIDIA Jetson Xavier NX – Power Modes

表 2 : Jetson Xavier NX 10W 和 15W 電源模式的最大工作頻率和核心配置。

*使用 NVDLA 時, GPU 最大工作頻率為 600MHz ( 10W 模式)和 1000MHz ( 15W 模式)

根據(jù)工作負(fù)載,動態(tài)電壓和頻率縮放( DVFS )調(diào)控器在運(yùn)行時將頻率調(diào)整到活動 nvpmodel 所定義的最大限制,因此在空閑時根據(jù)處理器利用率降低功耗。 nvpmodel 工具還可以根據(jù)應(yīng)用需求和 TDP 輕松創(chuàng)建和定制新的電源模式??梢跃庉嬰娫磁渲梦募⑵涮砑拥? etc / NVP 模式。 conf 配置文件和一個 GUI 小部件被添加到 Ubuntu 狀態(tài)欄中,以便在運(yùn)行時方便地管理和切換電源模式。

深度學(xué)習(xí)推斷基準(zhǔn)

今天 NVIDIA 還宣布,它在 MLPerf 推斷 0 。 5 基準(zhǔn)測試中占據(jù)了 5 個類別中的 4 個類別的榜首,其中 Jetson AGX Xavier 是邊緣計算 SoC 的領(lǐng)導(dǎo)者,包括所有基于視覺的任務(wù):使用 Mobilenet 和 ResNet-50 進(jìn)行圖像分類,以及使用 SSD Mobilenet 和 SSD ResNet 進(jìn)行目標(biāo)檢測。 NVIDIA GPUs 是十個競爭芯片架構(gòu)中唯一一個在 MLPerf 定義的所有五個推斷測試中提交結(jié)果的。

為了參考 Jetson 家族成員之間的可伸縮性,我們還測量了 Jetson Nano 、 Jetson TX2 、 Jetson Xavier NX 和 Jetson AGX Xavier 對圖像分類、目標(biāo)檢測、位姿估計、分割等常用 DNN 模型的推理性能。這些結(jié)果,如下面的圖 3 所示,是用 JetPack 和 NVIDIA 的 TensorRT 推斷加速器庫運(yùn)行的,該庫優(yōu)化了網(wǎng)絡(luò)的實時性能,該庫是在流行的 ML 框架(如 TensorFlow 、 PyTorch 、 Caffe 、 MXNet 等)中訓(xùn)練出來的。

圖 3 。用 TensorRT 來推斷 Jetson 家族中各種基于視覺的 DNN 模型的性能。

Jetson Xavier NX 的性能比 Jetson TX2 高 10 倍,功耗相同,占地面積小 25% 。在這些基準(zhǔn)測試期間,每個平臺都以最高性能運(yùn)行( MAX-N 模式用于 Jetson AGX Xavier , Xavier NX 和 TX2 為 15W , Nano 為 10W )。最大吞吐量是在批處理大小不超過 16ms 的延遲閾值的情況下獲得的,否則,對于平臺超過該延遲閾值的網(wǎng)絡(luò),批處理大小為 1 。這種方法在實時應(yīng)用程序的確定性低延遲需求和多流用例場景的最大性能之間提供了平衡。

在 Xavier Jetson NX 和 Jetson AGX Xavier 上, NVDLA 引擎和 GPU 同時以 INT8 精度運(yùn)行,而在 Jetson Nano 和 Jetson TX2 上 GPU 以 FP16 精度運(yùn)行, Jetson Xavier NX 中具有張量核心的 Volta 架構(gòu) GPU 可以達(dá)到 12 。 3 個計算頂層,而該模塊的 DLA 引擎每臺最多可產(chǎn)生 4 。 5 臺。

除了用 TensorRT 運(yùn)行神經(jīng)網(wǎng)絡(luò)外, ML 框架還可以通過 cuDNN 和 CUDA 加速在 Jetson 上安裝,包括 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 MXNet 、 Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎外, Jetson 動物園 還包括這些預(yù)構(gòu)建的安裝程序和構(gòu)建說明。

開發(fā)突破性的人工智能產(chǎn)品

Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設(shè)備開辟了新的機(jī)遇,這些設(shè)備需要在較小、低功耗的空間內(nèi)實現(xiàn)高性能人工智能和復(fù)雜的 DNN ,比如移動機(jī)器人、無人機(jī)、智能相機(jī)、便攜式醫(yī)療設(shè)備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。 NVIDIA 支持 CUDA -X 的 JetPack SDK 提供了開發(fā)尖端 AI 解決方案的完整工具,并以世界領(lǐng)先的性能在云端和邊緣之間擴(kuò)展應(yīng)。

關(guān)于作者

Dustin Franklin 是 NVIDIA 的 Jetson 團(tuán)隊的開發(fā)人員布道者。 Dustin 擁有機(jī)器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5060

    文章

    18975

    瀏覽量

    302113
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28109

    瀏覽量

    205863
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4856

    瀏覽量

    102715
  • 嵌入式AI
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    803
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA助力xAI打造全球最大AI超級計算機(jī)

    NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級計算機(jī)集群達(dá)到了 10 萬顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了
    的頭像 發(fā)表于 10-30 11:38 ?251次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機(jī)

    市的 Colossus 超級計算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺,該平臺
    發(fā)表于 10-30 09:33 ?102次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超級</b><b class='flag-5'>計算機(jī)</b>

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機(jī)

    這臺丹麥最大的超級計算機(jī)由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級
    的頭像 發(fā)表于 10-27 09:42 ?356次閱讀

    ARMxy ARM嵌入式計算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計算機(jī)BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達(dá)一萬億次的浮點(diǎn)運(yùn)算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計算資源。在產(chǎn)品缺陷檢測領(lǐng)域,ARMxy ARM嵌入式計算機(jī)具備的這一算
    的頭像 發(fā)表于 08-20 11:53 ?260次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式計算機(jī)</b>搭載 1 TOPS NPU支持深度學(xué)習(xí)

    借助NVIDIA超級計算機(jī)加速量子計算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機(jī),驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?475次閱讀

    計算機(jī)行業(yè)攜手 NVIDIA 為新工業(yè)革命打造 AI 工廠和數(shù)據(jù)中心

    領(lǐng)先的計算機(jī)制造商推出一系列 Blackwell 賦能的系統(tǒng),搭載 Grace CPU、NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施 豐富的產(chǎn)品組合覆蓋云、專用系統(tǒng)、嵌入式和邊緣 AI 系統(tǒng)等 產(chǎn)品配
    發(fā)表于 06-03 09:14 ?211次閱讀
    <b class='flag-5'>計算機(jī)</b>行業(yè)攜手 <b class='flag-5'>NVIDIA</b> 為新工業(yè)革命打造 <b class='flag-5'>AI</b> 工廠和數(shù)據(jù)中心

    如何選擇嵌入式主板或單板計算機(jī)

    規(guī)格并選擇工業(yè)主板或嵌入式單板計算機(jī)可能是一項耗時且艱巨的任務(wù)。本質(zhì)上,單板計算機(jī)和主板都是印刷電路板,承載嵌入式計算機(jī)的所有必要組件。傳統(tǒng)上,單板
    的頭像 發(fā)表于 05-21 16:31 ?805次閱讀
    如何選擇<b class='flag-5'>嵌入式</b>主板或單板<b class='flag-5'>計算機(jī)</b>

    NVIDIA和Recursion利用AI超級計算機(jī)加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅(qū)動,用于加速醫(yī)療領(lǐng)域科學(xué)家的工作。在全球超級計算機(jī) TOP500 榜單中,它的排名上升了 100 多位。
    的頭像 發(fā)表于 05-16 09:46 ?1213次閱讀
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超級</b><b class='flag-5'>計算機(jī)</b>加快新藥研發(fā)

    人形機(jī)器人主板:jetson orin nx核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上

    ERUN_7583_ORIN_NX嵌入式人工智能計算機(jī)底板,專為滿足人形機(jī)器人的實際需求而設(shè)計,他具備jetson orin nx核心模塊與
    的頭像 發(fā)表于 03-26 11:17 ?749次閱讀
    人形機(jī)器人主板:<b class='flag-5'>jetson</b> orin <b class='flag-5'>nx</b>核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成 AI 超級計算

    ——? NVIDIA 于今日發(fā)布新一代 AI 超級計算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell
    發(fā)表于 03-19 10:56 ?359次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級</b><b class='flag-5'>計算</b>

    Tesla 計劃斥資 5 億美元建造一臺由 NVIDIAAI GPU 提供支持的 Dojo 超級計算機(jī)

    ABSTRACT摘要Tesla計劃斥資5億美元建造一臺由NVIDIA的AIGPU提供支持的Dojo超級計算機(jī),因此該公司正在加大基于AI的開發(fā)力度。JAEALOT2024年1月27日T
    的頭像 發(fā)表于 02-19 12:45 ?528次閱讀
    Tesla 計劃斥資 5 億美元建造一臺由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超級</b><b class='flag-5'>計算機(jī)</b>

    NVIDIA Jetson嵌入式計算領(lǐng)域探索AI可能

    自動化業(yè)務(wù)流程、通過數(shù)據(jù)分析獲得洞察力、與客戶和員工互動……如今 AI 正在大幅提高生產(chǎn)力,推動競爭優(yōu)勢。NVIDIA Jetson 是適用于自主機(jī)器和其他嵌入式應(yīng)用的先進(jìn)平臺,具有出
    的頭像 發(fā)表于 01-25 17:03 ?495次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>為<b class='flag-5'>嵌入式</b><b class='flag-5'>計算</b>領(lǐng)域探索<b class='flag-5'>AI</b>可能

    什么是嵌入式計算機(jī)?

    嵌入式計算機(jī)是一種專門設(shè)計用于特定功能的計算機(jī)系統(tǒng),通常被嵌入到其他設(shè)備中,以執(zhí)行特定的任務(wù)。這種計
    的頭像 發(fā)表于 01-15 15:10 ?1283次閱讀
    什么是<b class='flag-5'>嵌入式計算機(jī)</b>?

    NVIDIA Jetson嵌入式系統(tǒng)AI應(yīng)用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6
    發(fā)表于 12-11 17:37 ?523次閱讀

    亞馬遜云科技與 NVIDIA 宣布開展戰(zhàn)略合作,為生成 AI 提供全新超級計算基礎(chǔ)架構(gòu)、軟件和服務(wù)

    亞馬遜云科技將提供首款搭載 NVIDIA Grace Hopper 超級芯片 和亞馬遜云科技可擴(kuò)展性 UltraCluster 的云? AI 超級
    的頭像 發(fā)表于 11-29 21:00 ?597次閱讀
    亞馬遜云科技與 <b class='flag-5'>NVIDIA</b> 宣布開展戰(zhàn)略合作,為生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超級</b><b class='flag-5'>計算</b>基礎(chǔ)架構(gòu)、軟件和服務(wù)