GPU 在 2019 年 NVIDIA NVIDIA 技術(shù)會議( GTC )上宣布推出了 Jetson Nano 開發(fā)者套件 ,這是一款售價 99 美元的計算機,目前可供嵌入式設(shè)計師、研究人員和 DIY 制造商使用,在一個緊湊、易于使用的平臺上實現(xiàn)了現(xiàn)代人工智能的強大功能,具有完全的軟件可編程性。 Jetson Nano 通過一個四核 64 位 ARMCPU 和一個 128 核集成的 NVIDIA GPU ,提供 472 GFLOPS 的計算性能。它還包括 4GB LPDDR4 內(nèi)存在一個高效的低功耗封裝中,具有 5W / 10W 電源模式和 5V 直流輸入。
最新發(fā)布的 JetPack 4 。 2 SDK 開發(fā)包 為基于 Ubuntu 18 。 04 的 Jetson Nano 提供了一個完整的桌面 Linux 環(huán)境,支持加速的圖形,支持 NVIDIA CUDA toolk10 。 0 ,以及 cuDNN 7 。 3 和 TensorRT 5 等庫。 SDK 還包括在本地安裝流行的開源機器學(xué)習(xí)( ML )框架,如 TensorFlow , PyTorch 、 Caffe 、 Keras 和 MXNet ,以及 OpenCV 和 ROS 等計算機視覺和機器人開發(fā)框架。
與這些框架和 NVIDIA 領(lǐng)先的人工智能平臺完全兼容,使得將基于人工智能的推理工作負載部署到 Jetson 上比以往任何時候都容易。 Jetson Nano 為各種復(fù)雜的深層神經(jīng)網(wǎng)絡(luò)( DNN )模型帶來了實時計算機視覺和推理。這些功能使多傳感器自主機器人、具有智能邊緣分析的物聯(lián)網(wǎng)設(shè)備和先進的人工智能系統(tǒng)成為可能。甚至傳輸學(xué)習(xí)也可以使用 ML 框架在 Jetson Nano 上重新訓(xùn)練網(wǎng)絡(luò)。
Jetson Nano 開發(fā)套件的尺寸僅為 80×100 毫米,具有四個高速 USB 3 。 0 端口、 MIPI CSI-2 攝像頭接口、 HDMI 2 。 0 和 DisplayPort 1 。 3 、千兆以太網(wǎng)、 M 。 2 Key-E 模塊、 MicroSD 卡插槽和 40 針 GPIO 頭。端口和 GPIO 頭可以與各種流行的外圍設(shè)備、傳感器和現(xiàn)成的項目一起使用,例如 NVIDIA 在 GitHub 上開源的 3D 可打印深度學(xué)習(xí) 噴氣式飛機。 。
devkit 從一個可移動 MicroSD 卡啟動,該卡可以在任何帶有 SD 卡適配器的 PC 上格式化和成像。 devkit 可以方便地通過 Micro-USB 端口或 5V 直流桶形插孔適配器供電。攝像頭連接器與價格合理的 MIPI CSI 傳感器兼容,包括基于 8MP IMX219 的模塊,可從 Jetson 生態(tài)系統(tǒng)合作伙伴處獲得。同時支持的還有 Raspberry Pi 攝像頭模塊 v2 ,它包括 JetPack 中的驅(qū)動程序支持。主要規(guī)格見表 1 。
devkit 是圍繞一個 260 針 SODIMM 風(fēng)格的系統(tǒng) on Module ( SoM )構(gòu)建的,如圖 2 所示。 SoM 包含處理器、內(nèi)存和電源管理電路。 Jetson 納米計算模塊尺寸為 45x70mm ,將于 2019 年 6 月開始發(fā)貨,售價 129 美元( 1000 單位體積),供嵌入式設(shè)計師集成到生產(chǎn)系統(tǒng)中。生產(chǎn)計算模塊將包括 16GB eMMC 板載存儲和增強 I / O , PCIe Gen2 x4 / x2 / x1 、 MIPI DSI 、附加 GPIO 和 12 通道 MIPI CSI-2 在 x4 / x2 配置中,最多可連接三個 x4 攝像頭或四個攝像頭。 Jetson 的統(tǒng)一內(nèi)存子系統(tǒng)在 CPU 、 GPU 和多媒體引擎之間共享,提供了流線型的零拷貝傳感器攝取和高效的處理管道。
深度學(xué)習(xí)推理基準(zhǔn)
Jetson Nano 可以運行多種高級網(wǎng)絡(luò),包括流行 ML 框架的完整本機版本,如 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 Keras 、 MXNet 等。這些網(wǎng)絡(luò)可用于構(gòu)建自主機器和復(fù)雜的人工智能系統(tǒng),實現(xiàn)強大的功能,如圖像識別、目標(biāo)檢測和定位、姿勢估計、語義分割、視頻增強和智能分析。
圖 3 顯示了來自在線可用的流行模型的推理基準(zhǔn)測試的結(jié)果。有關(guān)在您的 Jetson Nano 上運行這些基準(zhǔn)測試的說明,請參見 在這里 。該推斷使用批次大小 1 和 FP16 精度,使用了 Jetpack4 。 2 中包含的 NVIDIA 的 TensorRT 加速器庫。 Jetson Nano 在許多場景下都能達到實時性能,并且能夠處理多個高清視頻流。
圖 3 。使用 Jetson Nano 和 TensorRT ,使用 FP16 精度和批量大小 1 的各種深度學(xué)習(xí)推理網(wǎng)絡(luò)的性能
表 2 提供了完整的結(jié)果,包括 Raspberry Pi3 、 Intel Neural Compute Stick 2 和 Google Edge TPU Coral Dev Board 等其他平臺的性能:
由于內(nèi)存容量有限、不受支持的網(wǎng)絡(luò)層或硬件/軟件限制,經(jīng)常出現(xiàn) DNR (未運行)結(jié)果。固定函數(shù)神經(jīng)網(wǎng)絡(luò)加速器通常支持相對狹窄的用例集,硬件支持專用層操作,網(wǎng)絡(luò)權(quán)重和激活需要適應(yīng)有限的片上緩存,以避免嚴(yán)重的數(shù)據(jù)傳輸損失。它們可以依靠主機 CPU 來運行硬件不支持的層,并且可能依賴于支持框架的簡化子集的模型編譯器(例如 TFLite )。
Jetson Nano 靈活的軟件和完整的框架支持、內(nèi)存容量和統(tǒng)一的內(nèi)存子系統(tǒng),使其能夠運行各種不同的網(wǎng)絡(luò),達到全高清分辨率,包括同時在多個傳感器流上運行可變的批量大小。這些基準(zhǔn)測試代表了流行網(wǎng)絡(luò)的一個樣本,但是用戶可以在 Jetson Nano 上部署各種模型和定制架構(gòu),從而提高性能。而且 Jetson Nano 不僅僅局限于 DNN 推斷。它的 CUDA 體系結(jié)構(gòu)可用于計算機視覺和數(shù)字信號處理( DSP ),使用包括 FFT 、 BLAS 和 LAPACK 運算在內(nèi)的算法,以及用戶定義的 CUDA 內(nèi)核。
多流視頻分析
Jetson Nano 可實時處理多達 8 個高清全動態(tài)視頻流,可作為網(wǎng)絡(luò)視頻錄像機( NVR )、智能攝像頭和物聯(lián)網(wǎng)網(wǎng)關(guān)的低功耗邊緣智能視頻分析平臺進行部署。 NVIDIA 的 DeepStream 軟件開發(fā)工具包 使用 ZeroCopy 和 TensorRT 優(yōu)化端到端推斷管道,以在邊緣和本地服務(wù)器上實現(xiàn)最終性能。下面的視頻顯示 Jetson Nano 在 8 個 1080p30 流上同時執(zhí)行目標(biāo)檢測,基于 ResNet 的模型以全分辨率運行,吞吐量為每秒 5 億像素( MP / s )。
基于 ResNet 在 Jetson Nano 上運行的 DeepStream 應(yīng)用程序
在八個獨立的 1080p30 視頻流上并發(fā)的目標(biāo)檢測器。
圖 4 中的框圖顯示了一個使用 Jetson Nano 的 NVR 架構(gòu)示例,該架構(gòu)使用深度學(xué)習(xí)分析技術(shù),通過千兆以太網(wǎng)接收和處理多達 8 個數(shù)字流。該系統(tǒng)可以解碼 500mp / s 的 H 。 264 / H 。 265 視頻和 250mp / s 的 H 。 264 / H 。 265 視頻。
圖 4 。具有 Jetson 納米和 8x 高清攝像頭輸入的參考 NVR 系統(tǒng)架構(gòu)
Jetson Nano 的 DeepStream SDK 支持計劃于 2019 年第 2 季度發(fā)布。請加入 DeepStream 開發(fā)者計劃 以接收有關(guān)即將發(fā)布的通知。
噴氣式飛機。
圖 5 中所示的 NVIDIA 噴氣式飛機。 是一個新的開源自主機器人工具包,它提供了所有的軟件和硬件計劃,以低于 250 美元的價格構(gòu)建一個人工智能驅(qū)動的深度學(xué)習(xí)機器人。硬件材料包括 Jetson Nano 、 IMX219 8MP 攝像頭、 3D 打印機箱、電池組、電機、 I2C 電機驅(qū)動器和配件。
該項目通過 Jupyter 筆記本為您提供了簡單易學(xué)的示例,介紹了如何編寫 Python 代碼來控制電機,如何訓(xùn)練 JetBot 來檢測障礙物,如何跟蹤人和家庭對象等對象,以及如何訓(xùn)練 JetBot 跟蹤地板周圍的路徑。通過擴展代碼和使用 AI 框架,可以為 JetBot 創(chuàng)建新的功能。
還有 ROS 節(jié)點 可用于 JetBot ,為那些希望集成基于 ROS 的應(yīng)用程序和功能(如 SLAM 和高級路徑規(guī)劃)的用戶提供 ROS Melodic 支持。包含 JetBot ROS 節(jié)點的 GitHub 存儲庫還包括 Gazebo 3D 機器人模擬器的模型,允許在虛擬環(huán)境中開發(fā)和測試新的 AI 行為,然后再部署到機器人上。 Gazebo 模擬器生成合成相機數(shù)據(jù),并在 Jetson 納米上運行。
你好,人工智能世界
你好,人工智能世界 為開始使用 TensorRT 和體驗人工智能的力量提供了一個很好的方法。只需幾個小時,您就可以在帶有 JetPack SDK 和 NVIDIA NVIDIA 的 Jetson Nano Developer Kit 上建立并運行一組用于實時圖像分類和對象檢測的深度學(xué)習(xí)推理演示。本教程側(cè)重于與計算機視覺相關(guān)的網(wǎng)絡(luò),并包括實時攝像機的使用。你還可以在 C ++中編寫自己易于理解的識別程序??捎玫?深度學(xué)習(xí) ROS 節(jié)點 將這些識別、檢測和分段推斷功能與 ROS 公司 集成,以集成到先進的機器人系統(tǒng)和平臺中。這些實時推斷節(jié)點可以很容易地放入現(xiàn)有的 ROS 應(yīng)用程序中。
想要嘗試訓(xùn)練自己模型的開發(fā)人員可以按照完整的“ 還有兩天就要演示了 ”教程進行,該教程涵蓋了圖像分類、對象檢測和語義分割模型的再培訓(xùn)和定制,并使用轉(zhuǎn)移學(xué)習(xí)。傳輸學(xué)習(xí)微調(diào)特定數(shù)據(jù)集的模型權(quán)重,避免了從頭訓(xùn)練模型。傳輸學(xué)習(xí)最有效地在帶有 NVIDIA 離散 GPU 的 PC 或云實例上執(zhí)行,因為培訓(xùn)需要比推斷更多的計算資源和時間。
然而,由于 Jetson Nano 可以運行完整的培訓(xùn)框架,如 TensorFlow 、 PyTorch 和 Caffe ,它還可以通過轉(zhuǎn)移學(xué)習(xí)為那些可能無法訪問另一臺專用培訓(xùn)機器并愿意等待更長時間等待結(jié)果的人進行再培訓(xùn)。表 3 列出了將兩天的學(xué)習(xí)轉(zhuǎn)移到演示教程中的一些初步結(jié)果,其中 PyTorch 使用 Jetson Nano 在 20 萬張圖像上訓(xùn)練 Alexnet 和 ResNet-18 , ImageNet 的 22 。 5GB 子集:
每個歷元的時間是完全通過 200K 圖像的訓(xùn)練數(shù)據(jù)集所需的時間。分類網(wǎng)絡(luò)可能只需要 2-5 個周期就可以得到可用的結(jié)果,生產(chǎn)模型應(yīng)該在離散 GPU 系統(tǒng)上為更多的時代進行訓(xùn)練,直到它們達到最大的精度。然而, Jetson Nano 可以讓你在一個低成本的平臺上進行深度學(xué)習(xí)和人工智能的實驗,讓網(wǎng)絡(luò)在一夜之間重新訓(xùn)練。并非所有的自定義數(shù)據(jù)集都可能像這里使用的 22 。 5GB 示例那樣大。因此,圖像/秒表示 Jetson Nano 的訓(xùn)練性能,每歷元時間隨數(shù)據(jù)集大小、訓(xùn)練批大小和網(wǎng)絡(luò)復(fù)雜性而變化。隨著訓(xùn)練時間的增加,其他模型也可以在 Jetson Nano 上重新訓(xùn)練。
所有人的 AI
Jetson Nano 的計算性能、緊湊的占地面積和靈活性為開發(fā)人員創(chuàng)造以人工智能為動力的設(shè)備和嵌入式系統(tǒng)帶來了無限的可能性。
關(guān)于作者
Dustin Franklin 是 NVIDIA 的 Jetson 團隊的開發(fā)人員布道者。 Dustin 擁有機器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5059文章
18975瀏覽量
302070 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102711 -
人工智能
+關(guān)注
關(guān)注
1789文章
46666瀏覽量
237102
發(fā)布評論請先 登錄
相關(guān)推薦
評論