0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson Nano開發(fā)套件具有實時計算機視覺和推理

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin Franklin ? 2022-04-18 15:08 ? 次閱讀

GPU 在 2019 年 NVIDIA NVIDIA 技術(shù)會議( GTC )上宣布推出了 Jetson Nano 開發(fā)者套件 ,這是一款售價 99 美元的計算機,目前可供嵌入式設(shè)計師、研究人員和 DIY 制造商使用,在一個緊湊、易于使用的平臺上實現(xiàn)了現(xiàn)代人工智能的強大功能,具有完全的軟件可編程性。 Jetson Nano 通過一個四核 64 位 ARMCPU 和一個 128 核集成的 NVIDIA GPU ,提供 472 GFLOPS 的計算性能。它還包括 4GB LPDDR4 內(nèi)存在一個高效的低功耗封裝中,具有 5W / 10W 電源模式和 5V 直流輸入。

最新發(fā)布的 JetPack 4 。 2 SDK 開發(fā)包 為基于 Ubuntu 18 。 04 的 Jetson Nano 提供了一個完整的桌面 Linux 環(huán)境,支持加速的圖形,支持 NVIDIA CUDA toolk10 。 0 ,以及 cuDNN 7 。 3 和 TensorRT 5 等庫。 SDK 還包括在本地安裝流行的開源機器學(xué)習(xí)( ML )框架,如 TensorFlow , PyTorch 、 Caffe 、 Keras 和 MXNet ,以及 OpenCV 和 ROS計算機視覺機器人開發(fā)框架。

與這些框架和 NVIDIA 領(lǐng)先的人工智能平臺完全兼容,使得將基于人工智能的推理工作負載部署到 Jetson 上比以往任何時候都容易。 Jetson Nano 為各種復(fù)雜的深層神經(jīng)網(wǎng)絡(luò)( DNN )模型帶來了實時計算機視覺和推理。這些功能使多傳感器自主機器人、具有智能邊緣分析的物聯(lián)網(wǎng)設(shè)備和先進的人工智能系統(tǒng)成為可能。甚至傳輸學(xué)習(xí)也可以使用 ML 框架在 Jetson Nano 上重新訓(xùn)練網(wǎng)絡(luò)。

Jetson Nano 開發(fā)套件的尺寸僅為 80×100 毫米,具有四個高速 USB 3 。 0 端口、 MIPI CSI-2 攝像頭接口、 HDMI 2 。 0 和 DisplayPort 1 。 3 、千兆以太網(wǎng)、 M 。 2 Key-E 模塊、 MicroSD 卡插槽和 40 針 GPIO 頭。端口和 GPIO 頭可以與各種流行的外圍設(shè)備、傳感器和現(xiàn)成的項目一起使用,例如 NVIDIA 在 GitHub 上開源的 3D 可打印深度學(xué)習(xí) 噴氣式飛機。 。

devkit 從一個可移動 MicroSD 卡啟動,該卡可以在任何帶有 SD 卡適配器的 PC 上格式化和成像。 devkit 可以方便地通過 Micro-USB 端口或 5V 直流桶形插孔適配器供電。攝像頭連接器與價格合理的 MIPI CSI 傳感器兼容,包括基于 8MP IMX219 的模塊,可從 Jetson 生態(tài)系統(tǒng)合作伙伴處獲得。同時支持的還有 Raspberry Pi 攝像頭模塊 v2 ,它包括 JetPack 中的驅(qū)動程序支持。主要規(guī)格見表 1 。

devkit 是圍繞一個 260 針 SODIMM 風(fēng)格的系統(tǒng) on Module ( SoM )構(gòu)建的,如圖 2 所示。 SoM 包含處理器、內(nèi)存和電源管理電路。 Jetson 納米計算模塊尺寸為 45x70mm ,將于 2019 年 6 月開始發(fā)貨,售價 129 美元( 1000 單位體積),供嵌入式設(shè)計師集成到生產(chǎn)系統(tǒng)中。生產(chǎn)計算模塊將包括 16GB eMMC 板載存儲和增強 I / O , PCIe Gen2 x4 / x2 / x1 、 MIPI DSI 、附加 GPIO 和 12 通道 MIPI CSI-2 在 x4 / x2 配置中,最多可連接三個 x4 攝像頭或四個攝像頭。 Jetson 的統(tǒng)一內(nèi)存子系統(tǒng)在 CPU 、 GPU 和多媒體引擎之間共享,提供了流線型的零拷貝傳感器攝取和高效的處理管道。

深度學(xué)習(xí)推理基準(zhǔn)

Jetson Nano 可以運行多種高級網(wǎng)絡(luò),包括流行 ML 框架的完整本機版本,如 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 Keras 、 MXNet 等。這些網(wǎng)絡(luò)可用于構(gòu)建自主機器和復(fù)雜的人工智能系統(tǒng),實現(xiàn)強大的功能,如圖像識別、目標(biāo)檢測和定位、姿勢估計、語義分割、視頻增強和智能分析。

圖 3 顯示了來自在線可用的流行模型的推理基準(zhǔn)測試的結(jié)果。有關(guān)在您的 Jetson Nano 上運行這些基準(zhǔn)測試的說明,請參見 在這里 。該推斷使用批次大小 1 和 FP16 精度,使用了 Jetpack4 。 2 中包含的 NVIDIA 的 TensorRT 加速器庫。 Jetson Nano 在許多場景下都能達到實時性能,并且能夠處理多個高清視頻流。

圖 3 。使用 Jetson Nano 和 TensorRT ,使用 FP16 精度和批量大小 1 的各種深度學(xué)習(xí)推理網(wǎng)絡(luò)的性能

表 2 提供了完整的結(jié)果,包括 Raspberry Pi3 、 Intel Neural Compute Stick 2 和 Google Edge TPU Coral Dev Board 等其他平臺的性能:

由于內(nèi)存容量有限、不受支持的網(wǎng)絡(luò)層或硬件/軟件限制,經(jīng)常出現(xiàn) DNR (未運行)結(jié)果。固定函數(shù)神經(jīng)網(wǎng)絡(luò)加速器通常支持相對狹窄的用例集,硬件支持專用層操作,網(wǎng)絡(luò)權(quán)重和激活需要適應(yīng)有限的片上緩存,以避免嚴(yán)重的數(shù)據(jù)傳輸損失。它們可以依靠主機 CPU 來運行硬件不支持的層,并且可能依賴于支持框架的簡化子集的模型編譯器(例如 TFLite )。

Jetson Nano 靈活的軟件和完整的框架支持、內(nèi)存容量和統(tǒng)一的內(nèi)存子系統(tǒng),使其能夠運行各種不同的網(wǎng)絡(luò),達到全高清分辨率,包括同時在多個傳感器流上運行可變的批量大小。這些基準(zhǔn)測試代表了流行網(wǎng)絡(luò)的一個樣本,但是用戶可以在 Jetson Nano 上部署各種模型和定制架構(gòu),從而提高性能。而且 Jetson Nano 不僅僅局限于 DNN 推斷。它的 CUDA 體系結(jié)構(gòu)可用于計算機視覺和數(shù)字信號處理( DSP ),使用包括 FFT 、 BLAS 和 LAPACK 運算在內(nèi)的算法,以及用戶定義的 CUDA 內(nèi)核。

多流視頻分析

Jetson Nano 可實時處理多達 8 個高清全動態(tài)視頻流,可作為網(wǎng)絡(luò)視頻錄像機( NVR )、智能攝像頭和物聯(lián)網(wǎng)網(wǎng)關(guān)的低功耗邊緣智能視頻分析平臺進行部署。 NVIDIA 的 DeepStream 軟件開發(fā)工具包 使用 ZeroCopy 和 TensorRT 優(yōu)化端到端推斷管道,以在邊緣和本地服務(wù)器上實現(xiàn)最終性能。下面的視頻顯示 Jetson Nano 在 8 個 1080p30 流上同時執(zhí)行目標(biāo)檢測,基于 ResNet 的模型以全分辨率運行,吞吐量為每秒 5 億像素( MP / s )。

基于 ResNet 在 Jetson Nano 上運行的 DeepStream 應(yīng)用程序

在八個獨立的 1080p30 視頻流上并發(fā)的目標(biāo)檢測器。

圖 4 中的框圖顯示了一個使用 Jetson Nano 的 NVR 架構(gòu)示例,該架構(gòu)使用深度學(xué)習(xí)分析技術(shù),通過千兆以太網(wǎng)接收和處理多達 8 個數(shù)字流。該系統(tǒng)可以解碼 500mp / s 的 H 。 264 / H 。 265 視頻和 250mp / s 的 H 。 264 / H 。 265 視頻。

圖 4 。具有 Jetson 納米和 8x 高清攝像頭輸入的參考 NVR 系統(tǒng)架構(gòu)

Jetson Nano 的 DeepStream SDK 支持計劃于 2019 年第 2 季度發(fā)布。請加入 DeepStream 開發(fā)者計劃 以接收有關(guān)即將發(fā)布的通知。

噴氣式飛機。

圖 5 中所示的 NVIDIA 噴氣式飛機。 是一個新的開源自主機器人工具包,它提供了所有的軟件和硬件計劃,以低于 250 美元的價格構(gòu)建一個人工智能驅(qū)動的深度學(xué)習(xí)機器人。硬件材料包括 Jetson Nano 、 IMX219 8MP 攝像頭、 3D 打印機箱、電池組、電機、 I2C 電機驅(qū)動器和配件。

該項目通過 Jupyter 筆記本為您提供了簡單易學(xué)的示例,介紹了如何編寫 Python 代碼來控制電機,如何訓(xùn)練 JetBot 來檢測障礙物,如何跟蹤人和家庭對象等對象,以及如何訓(xùn)練 JetBot 跟蹤地板周圍的路徑。通過擴展代碼和使用 AI 框架,可以為 JetBot 創(chuàng)建新的功能。

還有 ROS 節(jié)點 可用于 JetBot ,為那些希望集成基于 ROS 的應(yīng)用程序和功能(如 SLAM 和高級路徑規(guī)劃)的用戶提供 ROS Melodic 支持。包含 JetBot ROS 節(jié)點的 GitHub 存儲庫還包括 Gazebo 3D 機器人模擬器的模型,允許在虛擬環(huán)境中開發(fā)和測試新的 AI 行為,然后再部署到機器人上。 Gazebo 模擬器生成合成相機數(shù)據(jù),并在 Jetson 納米上運行。

你好,人工智能世界

你好,人工智能世界 為開始使用 TensorRT 和體驗人工智能的力量提供了一個很好的方法。只需幾個小時,您就可以在帶有 JetPack SDK 和 NVIDIA NVIDIA 的 Jetson Nano Developer Kit 上建立并運行一組用于實時圖像分類和對象檢測的深度學(xué)習(xí)推理演示。本教程側(cè)重于與計算機視覺相關(guān)的網(wǎng)絡(luò),并包括實時攝像機的使用。你還可以在 C ++中編寫自己易于理解的識別程序??捎玫?深度學(xué)習(xí) ROS 節(jié)點 將這些識別、檢測和分段推斷功能與 ROS 公司 集成,以集成到先進的機器人系統(tǒng)和平臺中。這些實時推斷節(jié)點可以很容易地放入現(xiàn)有的 ROS 應(yīng)用程序中。

想要嘗試訓(xùn)練自己模型的開發(fā)人員可以按照完整的“ 還有兩天就要演示了 ”教程進行,該教程涵蓋了圖像分類、對象檢測和語義分割模型的再培訓(xùn)和定制,并使用轉(zhuǎn)移學(xué)習(xí)。傳輸學(xué)習(xí)微調(diào)特定數(shù)據(jù)集的模型權(quán)重,避免了從頭訓(xùn)練模型。傳輸學(xué)習(xí)最有效地在帶有 NVIDIA 離散 GPU 的 PC 或云實例上執(zhí)行,因為培訓(xùn)需要比推斷更多的計算資源和時間。

然而,由于 Jetson Nano 可以運行完整的培訓(xùn)框架,如 TensorFlow 、 PyTorch 和 Caffe ,它還可以通過轉(zhuǎn)移學(xué)習(xí)為那些可能無法訪問另一臺專用培訓(xùn)機器并愿意等待更長時間等待結(jié)果的人進行再培訓(xùn)。表 3 列出了將兩天的學(xué)習(xí)轉(zhuǎn)移到演示教程中的一些初步結(jié)果,其中 PyTorch 使用 Jetson Nano 在 20 萬張圖像上訓(xùn)練 Alexnet 和 ResNet-18 , ImageNet 的 22 。 5GB 子集:

每個歷元的時間是完全通過 200K 圖像的訓(xùn)練數(shù)據(jù)集所需的時間。分類網(wǎng)絡(luò)可能只需要 2-5 個周期就可以得到可用的結(jié)果,生產(chǎn)模型應(yīng)該在離散 GPU 系統(tǒng)上為更多的時代進行訓(xùn)練,直到它們達到最大的精度。然而, Jetson Nano 可以讓你在一個低成本的平臺上進行深度學(xué)習(xí)和人工智能的實驗,讓網(wǎng)絡(luò)在一夜之間重新訓(xùn)練。并非所有的自定義數(shù)據(jù)集都可能像這里使用的 22 。 5GB 示例那樣大。因此,圖像/秒表示 Jetson Nano 的訓(xùn)練性能,每歷元時間隨數(shù)據(jù)集大小、訓(xùn)練批大小和網(wǎng)絡(luò)復(fù)雜性而變化。隨著訓(xùn)練時間的增加,其他模型也可以在 Jetson Nano 上重新訓(xùn)練。

所有人的 AI

Jetson Nano 的計算性能、緊湊的占地面積和靈活性為開發(fā)人員創(chuàng)造以人工智能為動力的設(shè)備和嵌入式系統(tǒng)帶來了無限的可能性。

關(guān)于作者

Dustin Franklin 是 NVIDIA 的 Jetson 團隊的開發(fā)人員布道者。 Dustin 擁有機器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5059

    文章

    18975

    瀏覽量

    302070
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102711
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46666

    瀏覽量

    237102
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計算機。
    的頭像 發(fā)表于 10-27 09:42 ?351次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?657次閱讀

    機器視覺計算機視覺有什么區(qū)別

    。機器視覺的研究目標(biāo)是讓機器具有類似人類的視覺能力,能夠自動、準(zhǔn)確地完成各種視覺任務(wù)。 計算機視覺
    的頭像 發(fā)表于 07-16 10:23 ?442次閱讀

    計算機視覺的工作原理和應(yīng)用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計算機和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?1500次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機器學(xué)習(xí)等多個領(lǐng)域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?484次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計算機視覺 計算機
    的頭像 發(fā)表于 07-09 09:22 ?384次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    計算機視覺和圖像處理是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計算機視覺 計算機視覺
    的頭像 發(fā)表于 07-09 09:16 ?1088次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1029次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?774次閱讀

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2無法使用操作系統(tǒng)內(nèi)置的網(wǎng)絡(luò)管理器管理Wi-Fi如何解決?

    我們使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,請參閱 Nvidia Jetson
    發(fā)表于 05-23 06:47

    【LicheeRV-Nano開發(fā)套件試用體驗】+智能平板開發(fā)

    首先感謝Sipeed矽速科技和電子發(fā)燒友給與的這次機會,得以試用LicheeRV-Nano開發(fā)套件,并與大家共同分享與學(xué)習(xí)。 鑒于試用報告格式調(diào)整,后面亦按要求展現(xiàn)。 申請理由: 個人多年嵌入式
    發(fā)表于 03-06 23:05

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計算巨頭的計算機視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?532次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領(lǐng)域也取得了長足的進步。本文將介紹計算機視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點。這些算法在圖像處理、目標(biāo)檢測、人臉識別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1177次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    什么是計算機視覺?計算機視覺的三種方法

    計算機視覺是指通過為計算機賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機器人等應(yīng)用。計算機缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-16 16:38 ?4414次閱讀
    什么是<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>?<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的三種方法

    最適合AI應(yīng)用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機器人等應(yīng)用。計算機缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-15 16:38 ?407次閱讀
    最適合AI應(yīng)用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?