0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀

工業(yè)物聯(lián)網(wǎng)架構(gòu)師花了數(shù)年時間才得出結(jié)論,邊緣需要數(shù)據(jù)中心級的性能,以實現(xiàn)高效分析、提高安全性和降低網(wǎng)絡(luò)成本。在人工智能機器學(xué)習(xí)領(lǐng)域,傳感器設(shè)備內(nèi)部或附近對高端處理能力的需求從一開始就很明顯。

考慮到即使是簡單的自主機器(我知道這是矛盾的說法)也需要大量的計算能力來運行神經(jīng)網(wǎng)絡(luò)來執(zhí)行障礙物檢測、識別和避免等功能。例如,京東和菜鳥等公司生產(chǎn)的自動送貨車需要大約每秒 30 兆次運算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動駕駛檢查無人機需要大約 20 兆次運算 (TOPS) 的處理性能。

當(dāng)然,這對嵌入式和工業(yè)工程師提出了一個經(jīng)典的設(shè)計挑戰(zhàn):平衡每瓦性能。性能太低,應(yīng)用程序失敗。功耗太大,自主機器必須連接到持續(xù)的電源

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務(wù)器級性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構(gòu)處理性能,適用于人工智能驅(qū)動的機器人應(yīng)用程序,包括:

512 核 Volta GPU,帶有 64 個 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學(xué)習(xí)加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達(dá) 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負(fù)載相關(guān)的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務(wù)器級性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺式風(fēng)扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報告稱每瓦性能 (PPW) 的最佳點在 15W 左右。即使在那個水平(大約相當(dāng)于藍(lán)光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項功能可實現(xiàn)這種類型的每瓦性能,從基礎(chǔ)芯片架構(gòu)開始。雖然 SoC 上的每個內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復(fù)制。雖然 AGX Xavier 模塊確實通過外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構(gòu)的異構(gòu)性也提高了效率,因為工作負(fù)載可以在最適合任務(wù)的架構(gòu)上執(zhí)行。這方面的一個例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復(fù)雜或用戶定義的任務(wù)。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 時,NVDLA 引擎可提供高達(dá) 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時,功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時,Carmel CPU 內(nèi)核可以保留用于通用計算任務(wù)。

JetPack 簡化了深度學(xué)習(xí)編程的復(fù)雜性

Jetson AGX 系列運行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對 GPU 和/或深度學(xué)習(xí)加速器進(jìn)行編程。幸運的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對 GPU 進(jìn)行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機 API

TensorRT 5.0 包中提供的 API 也簡化了對 DLA 進(jìn)行編程以執(zhí)行神經(jīng)網(wǎng)絡(luò)工作負(fù)載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡(luò)層或?qū)?,而?_allowGPUFallback() 這樣的命令可讓工作負(fù)載在 DLA 不支持的情況下恢復(fù)到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應(yīng)用程序的開發(fā)。

當(dāng)然,低級 CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100018
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102432
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128152
收藏 人收藏

    評論

    相關(guān)推薦

    fx3系列的硬件主要由什么組成

    FX3系列是索尼(Sony)推出的一款高性能計算平臺,它基于NVIDIA的Jetson AGX Xavier模塊,專為需要高性能計算、機器學(xué)習(xí)、計算機視覺和實時數(shù)據(jù)處理的嵌入式系統(tǒng)設(shè)計
    的頭像 發(fā)表于 09-18 11:14 ?104次閱讀

    AC/DC電源模塊:應(yīng)用于工業(yè)自動化領(lǐng)域

    BOSHIDA ? AC/DC電源模塊:應(yīng)用于工業(yè)自動化領(lǐng)域 AC/DC電源模塊是一種用來將交流電轉(zhuǎn)換為直流電的電源模塊。它在
    的頭像 發(fā)表于 05-31 13:45 ?250次閱讀
    AC/DC電源<b class='flag-5'>模塊</b>:應(yīng)<b class='flag-5'>用于</b><b class='flag-5'>工業(yè)</b>自動化領(lǐng)域

    除英偉達(dá)Jetson系列外,AI邊緣計算盒子還能搭載哪些算力芯片

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去幾年,隨著英偉達(dá)推出Jetson系列開始,搭載各種AI算力芯片的邊緣設(shè)備相繼問世。因為外觀形似盒子,具備算法推理能力,為區(qū)分一般傳統(tǒng)工控機,行業(yè)多稱之為邊緣盒子
    的頭像 發(fā)表于 05-06 09:21 ?3007次閱讀

    研華:AI視覺檢測+AMR精準(zhǔn)控制,激發(fā)智能制造新動力

    研華提供出色的AI+AOI服務(wù),可配合AIR-030 AGX OrinAI系統(tǒng)(用于推理)、AIR-520 4UAI工作站出色運行。
    的頭像 發(fā)表于 04-18 10:58 ?480次閱讀
    研華:<b class='flag-5'>AI</b>視覺檢測+AMR精準(zhǔn)控制,激發(fā)智能制造新動力

    人形機器人主板:jetson orin nx核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上

    ERUN_7583_ORIN_NX嵌入式人工智能計算機底板,專為滿足人形機器人的實際需求而設(shè)計,他具備jetson orin nx核心模塊與SOM-7583核心模塊,可以實現(xiàn)核心模塊
    的頭像 發(fā)表于 03-26 11:17 ?579次閱讀
    人形機器人主板:<b class='flag-5'>jetson</b> orin nx核心<b class='flag-5'>模塊</b>與SOM-7583核心<b class='flag-5'>模塊</b>結(jié)合在一塊主板上

    AIDI工業(yè)AI視覺檢測軟件介紹

    AIDI是一款基于深度學(xué)習(xí)的智能工業(yè)視覺平臺應(yīng)用于多種工業(yè)應(yīng)用場景,有效解決復(fù)雜缺陷的定位識別、分類定級及字符識別等問題,具有強大的兼容性。AIDI 內(nèi)置多種應(yīng)用模塊,無需編程,幫助用
    發(fā)表于 03-25 21:52

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    硬件設(shè)計則是為了確保設(shè)備在執(zhí)行這些任務(wù)時能夠保持低能耗,從而提高其續(xù)航能力。 2、應(yīng)用場景 NanoEdge AI 可以廣泛應(yīng)用于各種物聯(lián)網(wǎng)設(shè)備和傳感器,如智能家居、工業(yè)自動化、智能交通、醫(yī)療健康
    發(fā)表于 03-12 08:09

    NVIDIA Jetson為嵌入式計算領(lǐng)域探索AI可能

    自動化業(yè)務(wù)流程、通過數(shù)據(jù)分析獲得洞察力、與客戶和員工互動……如今 AI 正在大幅提高生產(chǎn)力,推動競爭優(yōu)勢。NVIDIA Jetson 是適用于自主機器和其他嵌入式應(yīng)用的先進(jìn)平臺,具有出色的 A
    的頭像 發(fā)表于 01-25 17:03 ?440次閱讀
    NVIDIA <b class='flag-5'>Jetson</b>為嵌入式計算領(lǐng)域探索<b class='flag-5'>AI</b>可能

    NVIDIA Jetson 的嵌入式系統(tǒng)AI應(yīng)用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個Arm內(nèi)核和NVIDIA Ampere級GPU,為攝像頭提供高效的計算能力。
    發(fā)表于 12-11 17:37 ?423次閱讀

    Neousys宸曜科技強固型Jetson AGX Orin邊緣計算平臺,賦能視覺邊緣計算AI推理應(yīng)用

    工業(yè)級強固型嵌入式平臺廠商Neousys宸曜科技發(fā)布了新的NVIDIA Jetson無風(fēng)扇嵌入式計算平臺NRU-220S系列。NRU-220S系列搭載了Jetson AGX Orin
    的頭像 發(fā)表于 12-05 11:12 ?467次閱讀

    NVIDIA再出手!加速開發(fā)邊緣AI應(yīng)用,迎接生成式AI新紀(jì)元

    NVIDIA 近日宣布,對適用于邊緣 AI 和機器人的 NVIDIA Jetson 平臺上的兩個框架進(jìn)行大規(guī)模擴(kuò)展。NVIDIA Isaac ROS 機器人框架已全面上市,NVIDIA Metropolis 在
    的頭像 發(fā)表于 11-23 17:31 ?923次閱讀
    NVIDIA再出手!加速開發(fā)邊緣<b class='flag-5'>AI</b>應(yīng)用,迎接生成式<b class='flag-5'>AI</b>新紀(jì)元

    利用 NVIDIA Jetson 實現(xiàn)生成式 AI

    交互速率運行的 Llama-2-70B 模型。 圖 1. 領(lǐng)先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速測試最新的模型和應(yīng)用,
    的頭像 發(fā)表于 11-07 21:25 ?775次閱讀
    利用 NVIDIA <b class='flag-5'>Jetson</b> 實現(xiàn)生成式 <b class='flag-5'>AI</b>

    Banana Pi為何選擇rk3588開發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品

    、HDMI輸出、DP輸出、以太網(wǎng)、PCIe、mipi csi等接口將使我們的產(chǎn)品非常靈活,適用于各種應(yīng)用領(lǐng)域。 AI支持: 集成的NPU將使我們的產(chǎn)品能夠輕松處理復(fù)雜的人工智能任務(wù)。 低功耗設(shè)計: 產(chǎn)品
    發(fā)表于 11-02 12:30

    使用 NVIDIA Jetson 優(yōu)化功率

    在使用 Jetson 模組等嵌入式系統(tǒng)時,必須根據(jù)功率分配和計算資源來優(yōu)化應(yīng)用。為避免性能以及熱節(jié)流問題,進(jìn)行監(jiān)控就顯得格外重要。 Jetson 模組自帶 GPU、CPU 和各種 AI 加速器,還
    的頭像 發(fā)表于 10-19 11:10 ?556次閱讀
    使用 NVIDIA <b class='flag-5'>Jetson</b> 優(yōu)化功率

    armsom:為何選擇rk3588開發(fā)與Jetson Nano引腳兼容的嵌入式產(chǎn)品

    應(yīng)用領(lǐng)域。 AI支持: 集成的NPU將使我們的產(chǎn)品能夠輕松處理復(fù)雜的人工智能任務(wù)。 低功耗設(shè)計: 產(chǎn)品將具有出色的能效,延長電池壽命,降低運營成本。 結(jié)論:采用RK3588芯片開發(fā)與Jetson
    發(fā)表于 10-18 17:35