0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson Xavier NX開發(fā)者套件的應(yīng)用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-18 09:39 ? 次閱讀

NVIDIA 發(fā)布了基于Jetson Xavier NX模塊的NVIDIA Jetson Xavier NX 開發(fā)者套件。Jetson Xavier NX 以緊湊的外形尺寸提供高達 21 TOPS 的計算,功率低于 15W,為邊緣 AI 設(shè)備和自主機器帶來服務(wù)器級性能和云原生工作流。

借助 Jetson Xavier NX 開發(fā)人員套件,您可以創(chuàng)建令人驚嘆的人工智能應(yīng)用程序,并將深度神經(jīng)網(wǎng)絡(luò) (DNN) 模型和流行的機器學(xué)習(xí)框架快速部署到該領(lǐng)域。NVIDIA JetPack 4.4 Developer Preview的初始軟件支持包括 CUDA Toolkit 10.2 和 cuDNN 8.0、TensorRT 7.1 和 DeepStream 5.0 的預(yù)覽版,以及用于機器學(xué)習(xí)和預(yù)訓(xùn)練 DNN 模型的新 Docker 容器。

pYYBAGJcwZOAU-1HAABhLa102nw985.png

Jetson Xavier NX 基于 NVIDIA 開創(chuàng)性的 Xavier SoC,可以并行運行多個復(fù)雜模型和多個高清傳感器流。它包括以下功能:

具有 48 個張量核心的集成 NVIDIA Volta 384 核 Volta GPU

兩個 NVIDIA 深度學(xué)習(xí)加速器引擎

七向 VLIW 視覺加速器

六核 NVIDIA Carmel 64 位 ARMv8.2 CPU

8 GB 128 位 LPDDR4x

為了進一步簡化邊緣 AI 應(yīng)用程序在生產(chǎn)環(huán)境中的部署,NVIDIA 為 Jetson 帶來了云原生技術(shù),包括基于 Docker 的容器化以及硬件直通和 Kubernetes 等編排服務(wù),以及可從 NVIDIA NGC 注冊中心獲得的預(yù)訓(xùn)練模型和容器映像。

Jetson Xavier NX 開發(fā)者套件

Jetson Xavier NX 開發(fā)套件捆綁了一個開源參考載板和預(yù)組裝的散熱器/風(fēng)扇,如圖 2 所示,包括一個 19V 電源和基于 M.2 的 802.11 WLAN+BT 模塊。除了可啟動的 microSD 卡插槽外,載體底部還提供了一個 M.2 Key-M NVMe 插槽,用于擴展高速存儲。

由于 Xavier NX 模塊向后兼容 Jetson Nano (B01),它們的載板有一些共同點——還包括雙 MIPI CSI 攝像頭連接器,以及四個 USB 3.1 端口、HDMI、DisplayPort、千兆以太網(wǎng)和一個 40-引腳 GPIO 頭。

套件載板的主要特性和接口如下表 1 所示。有關(guān) Jetson Xavier NX 計算模塊的核心處理能力和規(guī)格的更多信息,請參閱介紹 Jetson Xavier NX,世界上最小的 AI 超級計算機帖子和Jetson Xavier NX 模塊數(shù)據(jù)表。

JetPack 4.4 開發(fā)者預(yù)覽版

NVIDIA JetPack SDK 包含用于在 Jetson 上構(gòu)建 AI 應(yīng)用程序的庫、工具和核心操作系統(tǒng)。JetPack 4.4 開發(fā)者預(yù)覽版增加了對 Jetson Xavier NX 的支持。除了表 2 中顯示的其他組件外,它還包括 CUDA Toolkit 10.2 以及 cuDNN 8.0、TensorRT 7.1、DeepStream 5.0 和用于部署云原生服務(wù)的 NVIDIA Container Runtime 的預(yù)覽版。用于流行機器的預(yù)構(gòu)建包安裝程序除了 NGC 上的 JetPack 新框架容器外,Jetson Zoo還提供 TensorFlow 和 PyTorch 等學(xué)習(xí)框架。

NVIDIA JetPack 4.4 開發(fā)者預(yù)覽版

Linux For Tegra R32.4.2Ubuntu 18.04 LTS aarch64

CUDA 工具包10.2cuDNN 8.0 DP

張量RT 7.1 DPGStreamer 1.14.5

VisionWorks 1.6OpenCV 4.1.1

DeepStream 5.0 DPVPI 0.2 DP

OpenGL 4.6 / GLES 3.2伏爾甘 1.2

L4T 多媒體 API R32.4.2L4T阿格斯相機 API 0.97

NVIDIA Nsight 系統(tǒng)2020.2NVIDIA Nsight 顯卡2020.1

NVIDIA SDK 管理器1.1.0NVIDIA 容器運行時1.0.1

表 2. NVIDIA JetPack 4.4 Developer Preview SDK 中可用的軟件組件。

下載 適用于 Jetson Xavier NX、Jetson AGX Xavier、Jetson TX1/TX2 和 Jetson Nano 的JetPack 4.4 開發(fā)者預(yù)覽版。收到新的 Jetson Xavier NX 開發(fā)工具包后,按照入門指南中的說明,用 JetPack 映像刷寫您的 microSD 卡。

此開發(fā)者預(yù)覽版可用于啟動和運行 Jetson Xavier NX 開發(fā)者套件并開始應(yīng)用程序開發(fā),而生產(chǎn)的 JetPack 4.4 SDK 計劃于今年夏天晚些時候發(fā)布。安裝 JetPack 后,您可以跟隨一些 AI 驅(qū)動的Jetson 社區(qū)項目。

深度學(xué)習(xí)推理基準(zhǔn)

Jetson 可用于將各種流行的 DNN 模型和 ML 框架部署到具有高性能推理的邊緣,用于實時分類和對象檢測、姿勢估計、語義分割和自然語言處理 (NLP) 等任務(wù)。

JetPack SDK 和 NVIDIA CUDA-X 支持 Jetson 和 NVIDIA 獨立 GPU 通用,這意味著您可以輕松地將性能和尺寸、重量和功耗 (SWaP) 消耗降至 5W,而無需重新編寫應(yīng)用程序。 圖 3 顯示了使用 JetPack 4.4 Developer Preview 和 TensorRT 7.1 在 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 上流行的視覺 DNN 的推理基準(zhǔn)。這些結(jié)果可以通過運行 GitHub 上的 open jetson_benchmarks項目來重現(xiàn)。

pYYBAGJcwVGAfHOLAADDhGorRsA608.png

圖 3. Jetson 系列中使用 TensorRT 的各種基于視覺的 DNN 模型的推理性能。

在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVIDIA 深度學(xué)習(xí)加速器 (NVDLA) 引擎和 GPU 以 INT8 精度同時運行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度運行。Jetson Xavier NX 的性能比 Jetson TX2 高出多達 10 倍,功率相同,占用空間減少 25%。

在這些基準(zhǔn)測試中,每個平臺都以最高性能運行(Jetson AGX Xavier 為 MAX-N 模式,Xavier NX 和 TX2 為 15W,Nano 為 10W)。這些基于視覺的任務(wù)的最大吞吐量是在批量大小不超過 15 毫秒的延遲閾值時獲得的?!?否則,對于平臺超過此延遲閾值的網(wǎng)絡(luò),批量大小為 1。這種方法在實時應(yīng)用程序的確定性低延遲要求和多流用例場景的最大性能之間提供了平衡。

我們還提供了BERT在問答方面的基準(zhǔn)測試結(jié)果。BERT 是一種多功能架構(gòu),因其在多個 NLP 任務(wù)中的成功應(yīng)用而越來越受歡迎,包括 QA、意圖分類、情感分析、翻譯、名稱/實體識別、釋義、推薦系統(tǒng)、自動完成等。

BERT 傳統(tǒng)上過于復(fù)雜,無法在本地部署板載邊緣設(shè)備,尤其是 BERT Large 變體。但是,由于 TensorRT 中包含針對 BERT 的 Tensor Core 優(yōu)化,BERT 可以輕松地在 Jetson Xavier NX 和 Jetson AGX Xavier 上運行。

將 BERT 部署到邊緣對于低延遲、智能人機交互 (HMI) 和對話式 AI 很有用,如本文后面的多容器演示的聊天機器人部分,它還在本地執(zhí)行自動語音識別 (ASR)并且不依賴于云連接。

poYBAGJcwVOASpPoAACiboECo6Q197.png

圖 4. BERT Base 和 BERT Large 在問答時的運行時性能,對 NLP 任務(wù)使用 50 毫秒的延遲閾值。

圖 4 顯示了 BERT Base 和 BERT Large 在問答方面的運行時性能,對 NLP 任務(wù)使用 50 毫秒的延遲閾值。這些結(jié)果以每秒的序列來衡量,其中每個文本序列都是 BERT 回答的查詢或問題。Jetson 上的 BERT 性能為用戶提供近乎即時的反饋,延遲低至 5.9 毫秒。這允許 BERT 處理與其他實時處理流(例如視頻)同時執(zhí)行。

將云原生方法帶到邊緣

到目前為止,嵌入式和邊緣設(shè)備的軟件一直被編寫為單片系統(tǒng)。升級單一軟件映像的復(fù)雜性增加了出現(xiàn)錯誤的風(fēng)險,并使更新的節(jié)奏難以加快。這對于具有 AI 的邊緣設(shè)備來說尤其成問題,因為它需要頻繁更新以維持快速的能力改進?,F(xiàn)代對敏捷能力和持續(xù)創(chuàng)新(零停機時間)的期望要求改變嵌入式和邊緣設(shè)備軟件的開發(fā)和部署方式。

在邊緣采用云原生范例,如微服務(wù)、容器化和容器編排是前進的方向。

微服務(wù)架構(gòu)、容器化和編排使云應(yīng)用程序能夠擺脫單一工作流的約束?,F(xiàn)在,Jetson 正在將云原生轉(zhuǎn)型理念帶入 AI 邊緣設(shè)備。

Jetson 是領(lǐng)先的 AI 邊緣計算平臺,擁有近 50 萬開發(fā)人員。它由 JetPack SDK 提供支持,具有與全球數(shù)據(jù)中心和工作站相同的 CUDA-X 加速計算堆棧和 NVIDIA Container Runtime。

借助 Jetson 的多個開發(fā)和部署容器、容器化框架和托管在NVIDIA NGC上的預(yù)訓(xùn)練 AI 模型,它可以作為 AI 應(yīng)用程序開發(fā)的構(gòu)建塊。最新的 Jetson Xavier NX 以盡可能小的外形尺寸實現(xiàn)功能齊全的多模式 AI 應(yīng)用程序。

我們歡迎云原生技術(shù),這些技術(shù)使客戶具有擴展業(yè)務(wù)所需的生命周期敏捷性??蓴U展的軟件開發(fā)加快了上市時間。為什么?因為當(dāng)您不必同時更新其他應(yīng)用程序組件時,更新產(chǎn)品生命周期變得不那么繁重。

多容器演示

Jetson Xavier NX的 NVIDIA多容器演示展示了使用云原生方法開發(fā)和部署服務(wù)機器人 AI 應(yīng)用程序的過程。服務(wù)機器人是自主機器人,通常與零售、酒店、醫(yī)療保健或倉庫中的人員進行交互。

視頻。Jetson Xavier NX 的云原生多容器演示,并行運行七個深度學(xué)習(xí)模型。

考慮一個服務(wù)機器人,其目的是通過與購物者互動來改善零售百貨商店的客戶服務(wù)。如果機器人能夠執(zhí)行許多計算任務(wù),包括人類識別、交互檢測、人體姿態(tài)檢測、語音檢測和自然語言處理,它只能為客戶查詢提供有用的答案。機器人必須運行支持這些功能所需的多個 AI 模型。

借助云原生方法,人工智能模型可以獨立開發(fā)、容器化并包含所有依賴項,并部署到任何 Jetson 設(shè)備上。

該演示在 Jetson Xavier NX 上同時運行四個容器,其中包含七個深度學(xué)習(xí)模型,包括姿勢估計、面部和凝視檢測、人數(shù)統(tǒng)計、語音識別和 BERT 問答。結(jié)果是,這些服務(wù)構(gòu)建塊容器可以輕松修改和重新部署而不會中斷,從而提供零停機時間和無縫更新體驗。

Jetson Xavier NX 的計算能力使您能夠一次運行所有這些容器,而不會犧牲跨多個傳感器數(shù)據(jù)流的實時性能。您可以使用托管在 NGC 上的容器從NVIDIA-AI-IOT/jetson-cloudnative-demo GitHub 存儲庫下載演示。

關(guān)于作者

Dustin 是 NVIDIA Jetson 團隊的一名開發(fā)人員推廣員。Dustin 擁有機器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項目。您可以在NVIDIA 開發(fā)者論壇或GitHub 上找到他。

Suhas Sheshadri 是 NVIDIA 的產(chǎn)品經(jīng)理,專注于 Jetson 軟件。他之前曾在 NVIDIA 的自動駕駛團隊工作,為 NVIDIA Drive 平臺優(yōu)化系統(tǒng)軟件。在空閑時間,Suhas 喜歡閱讀有關(guān)量子物理學(xué)和博弈論的書籍。

Sarah Todd 是一名產(chǎn)品營銷經(jīng)理,專注于 Metropolis 解決方案的 GTM 戰(zhàn)略,促進跨行業(yè)的應(yīng)用程序集成。此前,Sarah 曾在 Autonomous Machines 團隊擔(dān)任營銷傳播經(jīng)理,該團隊支持 Jetson、Isaac、DeepStream、TAO Toolkit 等 NVIDIA 產(chǎn)品。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27839

    瀏覽量

    204611
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102432
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

    NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該
    的頭像 發(fā)表于 09-06 14:45 ?251次閱讀

    借助OpenUSD和NVIDIA Omniverse開發(fā)數(shù)字孿生應(yīng)用

    接口、軟件開發(fā)套件和服務(wù)組成的,使開發(fā)者能夠開發(fā)基于 OpenUSD 的應(yīng)用 NVIDIA Omniverse開發(fā)了一款數(shù)字孿生應(yīng)用。
    的頭像 發(fā)表于 09-06 14:18 ?260次閱讀

    NVIDIA將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    來自 AI 生態(tài)系統(tǒng)各個領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),將企業(yè)級 AI 應(yīng)用的部署時間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計劃會員可免費使用 NIM 來進行研究、開發(fā)
    的頭像 發(fā)表于 06-03 18:21 ?901次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    來自 AI 生態(tài)系統(tǒng)各個領(lǐng)域的 150 余家合作伙伴嵌入了 NIM 推理微服務(wù),將企業(yè)級 AI 應(yīng)用的部署時間從數(shù)周縮短至幾分鐘 NVIDIA 開發(fā)者計劃會員可免費使用 NIM 來進行研究、開發(fā)
    發(fā)表于 06-03 09:12 ?181次閱讀
    <b class='flag-5'>NVIDIA</b> NIM 革命性地改變模型部署,將全球數(shù)百萬<b class='flag-5'>開發(fā)者</b>轉(zhuǎn)變?yōu)樯墒?AI <b class='flag-5'>開發(fā)者</b>

    NVIDIA與微軟擴展合作,幫助開發(fā)者更快構(gòu)建和部署AI應(yīng)用

    NVIDIA 在 Microsoft Build 開發(fā)者大會上展示了與 Microsoft Azure 和 Windows PC 的集成解決方案,簡化了 AI 模型部署并優(yōu)化了路徑規(guī)劃和應(yīng)用性能。
    的頭像 發(fā)表于 05-23 10:14 ?301次閱讀

    英特爾開發(fā)套件『哪吒』在Java環(huán)境實現(xiàn)ADAS道路識別演示 | 開發(fā)者實戰(zhàn)

    本文使用來自O(shè)penModelZoo的預(yù)訓(xùn)練的road-segmentation-adas-0001模型。ADAS代表高級駕駛輔助服務(wù)。該模型識別四個類別:背景、道路、路緣和標(biāo)記。硬件環(huán)境此文使用了英特爾開發(fā)套件家族里的『哪吒』(Nezha)開發(fā)板,其為研揚科技針對邊緣A
    的頭像 發(fā)表于 04-29 08:07 ?340次閱讀
    英特爾<b class='flag-5'>開發(fā)套件</b>『哪吒』在Java環(huán)境實現(xiàn)ADAS道路識別演示 | <b class='flag-5'>開發(fā)者</b>實戰(zhàn)

    【轉(zhuǎn)載】英特爾開發(fā)套件“哪吒”快速部署YoloV8 on Java | 開發(fā)者實戰(zhàn)

    部署到生產(chǎn)系統(tǒng)中。通過簡化的開發(fā)工作流程,OpenVINO可賦能開發(fā)者在現(xiàn)實世界中部署高性能應(yīng)用程序和算法。 今天我們將基于哪吒開發(fā)者套件平臺來快速部署OpenVI
    的頭像 發(fā)表于 03-23 08:05 ?278次閱讀
    【轉(zhuǎn)載】英特爾<b class='flag-5'>開發(fā)套件</b>“哪吒”快速部署YoloV8 on Java | <b class='flag-5'>開發(fā)者</b>實戰(zhàn)

    NVIDIA DOCA 2.5 長期支持版本發(fā)布

    開放的軟件開發(fā)套件和運行環(huán)境,同時驅(qū)動 NVIDIA DOCA 開發(fā)者社區(qū)和生態(tài)合作的長足發(fā)展。 此次發(fā)布,NVIDIA DOCA 2.5 新版本引入了全新功能和增強功能,強
    的頭像 發(fā)表于 12-26 18:25 ?317次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 2.5 長期支持版本發(fā)布

    有獎?wù)魑牡谝粡?| 攜手百萬開發(fā)者 共創(chuàng) AI 新未來

    攜手百萬開發(fā)者,共創(chuàng) AI 新未來 NVIDIA 百萬中國開發(fā)者故事有獎?wù)魑?活動已于 12 月 14 日拉開帷幕。 現(xiàn)正在火熱進行中! 超過 100 萬中國開發(fā)者注冊并使用
    的頭像 發(fā)表于 12-22 17:15 ?285次閱讀
    有獎?wù)魑牡谝粡?| 攜手百萬<b class='flag-5'>開發(fā)者</b> 共創(chuàng) AI 新未來

    有獎?wù)魑?| NVIDIA 攜手中國百萬開發(fā)者共創(chuàng) AI 美好未來

    同那些最活躍的“細(xì)胞”, 是激活和繁榮生態(tài)的關(guān)鍵因子。 今天,中國已有超過 100 萬開發(fā)者注冊并使用 NVIDIA 產(chǎn)品及解決方案,這距離 2016 年 NVIDIA 開發(fā)者社區(qū)官方
    的頭像 發(fā)表于 12-14 16:35 ?275次閱讀

    NVIDIA Jetson 的嵌入式系統(tǒng)AI應(yīng)用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個Arm內(nèi)核和
    發(fā)表于 12-11 17:37 ?423次閱讀

    利用 NVIDIA Jetson 實現(xiàn)生成式 AI

    近日,NVIDIA 發(fā)布了 Jetson 生成式 AI 實驗室(Jetson Generative AI Lab),使開發(fā)者能夠通過 NVIDIA
    的頭像 發(fā)表于 11-07 21:25 ?775次閱讀
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 實現(xiàn)生成式 AI

    Banana Pi為何選擇rk3588開發(fā)Jetson Nano引腳兼容的嵌入式產(chǎn)品

    引言: 當(dāng)Banana PI&armsom決定采用RK3588芯片開發(fā)一款與Jetson Nano引腳兼容的產(chǎn)品時,這意味著一次重要的技術(shù)決策,為開發(fā)者和制造商提供了更大的靈活性
    發(fā)表于 11-02 12:30

    armsom:為何選擇rk3588開發(fā)Jetson Nano引腳兼容的嵌入式產(chǎn)品

    引言: 當(dāng)armsom決定采用RK3588芯片開發(fā)一款與Jetson Nano引腳兼容的產(chǎn)品時,這意味著一次重要的技術(shù)決策,為開發(fā)者和制造商提供了更大的靈活性。這篇文章將解釋我們選擇RK3588
    發(fā)表于 10-18 17:35

    NVIDIA Jetson 計算平臺賦能森云智能推出 GMSL3 攝像頭開發(fā)套件

    的 GMSL3 攝像頭產(chǎn)品,能有效解決攝像頭高速率傳輸和無損無延時的需求。同時依托 NVIDIA Jetson 上的軟件驅(qū)動技術(shù),將 GMSL3 攝像頭與 Jetson 平臺進行深度集成,發(fā)布了全球首款 GMSL3 攝像頭的
    的頭像 發(fā)表于 09-26 18:35 ?633次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 計算平臺賦能森云智能推出 GMSL3 攝像頭<b class='flag-5'>開發(fā)套件</b>