0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Isaac Initiative應(yīng)用在領(lǐng)域訓(xùn)練和部署高級(jí)AI中

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Dustin ? 2022-04-18 10:32 ? 次閱讀

NVIDIA 發(fā)布了JetPack 3.1,這是用于 Jetson TX1 和 TX2 的生產(chǎn) Linux 軟件版本。隨著對(duì) TensorRT 2.1 和 cuDNN 6.0 的升級(jí),JetPack 3.1 為視覺(jué)引導(dǎo)導(dǎo)航和運(yùn)動(dòng)控制等實(shí)時(shí)應(yīng)用提供了高達(dá) 2 倍的深度學(xué)習(xí)推理性能提升,這些應(yīng)用受益于加速的批量大小 1。改進(jìn)的功能使 Jetson 能夠部署比以往任何時(shí)候都更強(qiáng)大的智能,實(shí)現(xiàn)一代自主機(jī)器,包括送貨機(jī)器人、遠(yuǎn)程呈現(xiàn)和視頻分析。為了進(jìn)一步推動(dòng)機(jī)器人技術(shù)的發(fā)展,NVIDIA 最近推出的 Isaac Initiative 是一個(gè)端到端平臺(tái),用于在該領(lǐng)域訓(xùn)練和部署高級(jí) AI。

邊緣的人工智能

今年春天早些時(shí)候,當(dāng) NVIDIA 推出Jetson TX2時(shí),事實(shí)上的邊緣計(jì)算平臺(tái)在功能上得到了顯著提升。如圖 1 中的 Wave Glider 平臺(tái)所示,位于網(wǎng)絡(luò)邊緣的遠(yuǎn)程物聯(lián)網(wǎng)IoT) 設(shè)備經(jīng)常會(huì)遇到網(wǎng)絡(luò)覆蓋、延遲和帶寬下降的情況。雖然物聯(lián)網(wǎng)設(shè)備通常用作將數(shù)據(jù)中繼到云的網(wǎng)關(guān),但邊緣計(jì)算通過(guò)訪問(wèn)安全的板載計(jì)算資源重新構(gòu)建了物聯(lián)網(wǎng)的可能性。NVIDIA 的 Jetson 嵌入式模塊在 Jetson TX1 上以 1 TFLOP/s 的速度提供服務(wù)器級(jí)性能,并在 10W 的功率下將 Jetson TX2 上的 AI 性能提高一倍。

噴氣背包 3.1

JetPack 3.1 with Linux For Tegra (L4T) R28.1 是 Jetson TX1 和 TX2 的生產(chǎn)軟件版本,具有長(zhǎng)期支持 (LTS)。TX1 和 TX2 的 L4T 板級(jí)支持包 (BSP) 適用于客戶產(chǎn)品化,其共享的 Linux 內(nèi)核 4.4 代碼庫(kù)提供了兩者之間的兼容性和無(wú)縫移植。從 JetPack 3.1 開(kāi)始,開(kāi)發(fā)人員可以在 TX1 和 TX2 上訪問(wèn)相同的庫(kù)、API 和工具版本。

除了從 cuDNN 5.1 升級(jí)到 6.0 以及對(duì) CUDA 8 的維護(hù)更新之外,JetPack 3.1 還包括用于構(gòu)建流應(yīng)用程序的最新視覺(jué)和多媒體 API。您可以將 JetPack 3.1 下載到您的主機(jī) PC,以使用最新的 BSP 和工具刷新 Jetson。

使用 TensorRT 2.1 進(jìn)行低延遲推理

JetPack 3.1 中包含最新版本的 TensorRT,因此您可以在 Jetson 上部署優(yōu)化的運(yùn)行時(shí)深度學(xué)習(xí)推理。TensorRT 通過(guò)網(wǎng)絡(luò)圖優(yōu)化、內(nèi)核融合和半精度 FP16 支持提高了推理性能。TensorRT 2.1 包括關(guān)鍵功能和增強(qiáng)功能,例如多權(quán)重批處理,可進(jìn)一步提高 Jetson TX1 和 TX2 的深度學(xué)習(xí)性能和效率并減少延遲。

批量大小 1 的性能已顯著提高,從而將 GoogLeNet 的延遲降低到 5 毫秒。對(duì)于延遲敏感的應(yīng)用程序,批量大小 1 提供最低延遲,因?yàn)槊總€(gè)幀一到達(dá)系統(tǒng)就會(huì)被處理(而不是等待批量處理多個(gè)幀)。如圖 2 所示,在 Jetson TX2 上,使用 TensorRT 2.1 在 GoogLeNet 和 ResNet 圖像識(shí)別推理方面的吞吐量是 TensorRT 1.0 的兩倍。

圖 2:使用 Jetson TX2 Max-Q 和 Max-P 功率曲線的 GoogLeNet 和 ResNet-50 的推理吞吐量。TensorRT 2.1 在 GoogleLeNet 和 ResNet 上提供兩倍的推理吞吐量。

表 2 中的延遲顯示隨著批量大小 1 的成比例減少。使用 TensorRT 2,Jetson TX2 在 Max-P 性能配置文件中實(shí)現(xiàn)了 5ms 的 GoogLeNet 延遲,在 Max-Q 效率配置文件中實(shí)現(xiàn)了 7ms 的延遲。ResNet-50 在 Max-P 中具有 12.2ms 的延遲,在 Max-Q 中具有 15.6ms 的延遲。ResNet 通常用于提高圖像分類(lèi)的準(zhǔn)確性,超越 GoogLeNet,使用 TensorRT 2.1 可將運(yùn)行時(shí)性能提高 2 倍以上。借助 Jetson TX2 的 8GB 內(nèi)存容量,即使在 ResNet 等復(fù)雜網(wǎng)絡(luò)上也可以實(shí)現(xiàn)高達(dá) 128 的大批量。

減少的延遲允許深度學(xué)習(xí)推理方法用于需要近實(shí)時(shí)響應(yīng)的應(yīng)用程序,例如高速無(wú)人機(jī)和水面車(chē)輛的防撞和自主導(dǎo)航。

自定義圖層

通過(guò)用戶插件 API 支持自定義網(wǎng)絡(luò)層,TensorRT 2.1 能夠運(yùn)行最新的網(wǎng)絡(luò)和擴(kuò)展支持的功能,包括殘差網(wǎng)絡(luò) (ResNet)、循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)、你只看一次 (YOLO) 和更快-RCNN(區(qū)域卷積神經(jīng)網(wǎng)絡(luò))。自定義層在用戶定義的 C++ 插件中實(shí)現(xiàn),這些插件實(shí)現(xiàn)IPlugin了如下代碼中的接口。

#include "NvInfer.h" 

使用 
   


    
      
                            
      
                    ,  
                  
   
   
    
      
                 
               
   
   *緩沖區(qū)); 

IPlugin您可以使用與上述代碼類(lèi)似的自定義來(lái)構(gòu)建自己的共享對(duì)象。在用戶enqueue()函數(shù)內(nèi)部,您可以使用 CUDA 內(nèi)核實(shí)現(xiàn)自定義處理。TensorRT 2.1 使用這種技術(shù)來(lái)實(shí)現(xiàn)Faster-RCNN插件以增強(qiáng)對(duì)象檢測(cè)。此外,TensorRT 為長(zhǎng)短期記憶 (LSTM)單元和門(mén)控循環(huán)單元 (GRU)提供了新的 RNN 層,以改進(jìn)基于記憶的時(shí)序序列識(shí)別。開(kāi)箱即用地提供這些強(qiáng)大的新層類(lèi)型可加速您在嵌入式邊緣應(yīng)用程序中部署高級(jí)深度學(xué)習(xí)應(yīng)用程序。

NVIDIA 艾薩克計(jì)劃

隨著邊緣 AI 功能的快速增長(zhǎng),NVIDIA 推出了 Isaac Initiative 以推進(jìn)機(jī)器人技術(shù)和 AI 的最新發(fā)展。Isaac是一個(gè)端到端機(jī)器人平臺(tái),用于開(kāi)發(fā)和部署智能系統(tǒng)到現(xiàn)場(chǎng),包括模擬、自主導(dǎo)航堆棧和用于部署的嵌入式 Jetson。為了開(kāi)始開(kāi)發(fā)自主 AI,Isaac 支持圖 3 所示的機(jī)器人參考平臺(tái)。這些由 Jetson 提供動(dòng)力的平臺(tái)包括無(wú)人機(jī)、無(wú)人地面車(chē)輛 (UGV)、無(wú)人水面車(chē)輛 (USV) 和人類(lèi)支持機(jī)器人 (HSR)。參考平臺(tái)提供了一個(gè)由 Jetson 驅(qū)動(dòng)的基礎(chǔ),可以在現(xiàn)場(chǎng)進(jìn)行實(shí)驗(yàn),并且該計(jì)劃將隨著時(shí)間的推移而擴(kuò)展,以包括新的平臺(tái)和機(jī)器人。

開(kāi)始部署 AI

JetPack 3.1 包括 cuDNN 6 和 TensorRT 2.1。它現(xiàn)在可用于 Jetson TX1 和 TX2。憑借將單批次推理的低延遲性能提高一倍,并支持具有自定義層的新網(wǎng)絡(luò),Jetson 平臺(tái)比以往任何時(shí)候都更有能力進(jìn)行邊緣計(jì)算。

關(guān)于作者

Dustin 是 NVIDIA Jetson 團(tuán)隊(duì)的一名開(kāi)發(fā)人員推廣員。Dustin 擁有機(jī)器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開(kāi)展項(xiàng)目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27839

    瀏覽量

    204620
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102433
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA NIM:打造AI領(lǐng)域AI-in-a-Box,提高AI開(kāi)發(fā)與部署的高效性

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計(jì)算機(jī)圖形學(xué)盛會(huì)——SIGGRAPH 2024上,NVIDIA公司對(duì)外展示了其在諸如渲染、仿真及生成式AI等前沿領(lǐng)域所取得的卓越成果,而其中最為引人注目的便是
    的頭像 發(fā)表于 07-30 16:27 ?507次閱讀

    NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展

    NVIDIA 發(fā)布了 Isaac Manipulator 和 Isaac Perceptor 等一系列基礎(chǔ)模型、機(jī)器人工具和 GPU 加速庫(kù)。 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在
    的頭像 發(fā)表于 06-04 18:00 ?3129次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> 機(jī)器人平臺(tái)利用最新的生成式 <b class='flag-5'>AI</b> 和先進(jìn)的仿真技術(shù),加速 <b class='flag-5'>AI</b> 機(jī)器人技術(shù)的發(fā)展

    電子制造商采用NVIDIA AI和 Omniverse助力工廠提高運(yùn)營(yíng)效率并降低成本

    NVIDIA Omniverse 基于物理學(xué)的渲染與模擬以及 NVIDIA Isaac AI 機(jī)器人開(kāi)發(fā)與部署。 通過(guò)使用該工作流構(gòu)建數(shù)字
    的頭像 發(fā)表于 06-04 10:22 ?504次閱讀

    全球機(jī)器人開(kāi)發(fā)領(lǐng)域采用NVIDIA 機(jī)器人開(kāi)發(fā)和生產(chǎn)

    機(jī)器人開(kāi)發(fā)領(lǐng)域的領(lǐng)先企業(yè)正在采用NVIDIA Isaac機(jī)器人平臺(tái)來(lái)研究、開(kāi)發(fā)和生產(chǎn)下一代 AI 賦能的自主機(jī)器和機(jī)器人。 比亞迪電子、西門(mén)子、泰瑞達(dá)和 Alphabet 旗下公司 I
    的頭像 發(fā)表于 06-03 18:25 ?1067次閱讀

    NVIDIA Isaac Manipulator助力讓下一代機(jī)器人技術(shù)觸手可及

    兩家公司在芝加哥 Automate 展會(huì)上宣布將圍繞 NVIDIA AIIsaac Manipulator 和 Intrinsic 平臺(tái)的使用展開(kāi)合作。
    的頭像 發(fā)表于 05-13 14:15 ?779次閱讀

    NVIDIA將數(shù)字孿生與實(shí)時(shí)AI結(jié)合實(shí)現(xiàn)工業(yè)自動(dòng)化

    NVIDIA 軟件(Omniverse、Metropolis、Isaac 和 cuOpt)共同打造了一個(gè) AI Gym,讓機(jī)器人和 AI 智能體能夠在復(fù)雜的工業(yè)
    的頭像 發(fā)表于 04-02 11:00 ?304次閱讀
    <b class='flag-5'>NVIDIA</b>將數(shù)字孿生與實(shí)時(shí)<b class='flag-5'>AI</b>結(jié)合實(shí)現(xiàn)工業(yè)自動(dòng)化

    NVIDIA融合數(shù)字孿生與實(shí)時(shí)AI,革新工業(yè)自動(dòng)化

    NVIDIA引領(lǐng)工業(yè)自動(dòng)化新潮流,通過(guò)結(jié)合數(shù)字孿生與實(shí)時(shí)AI技術(shù),推動(dòng)行業(yè)邁向新的發(fā)展階段。NVIDIA軟件套件——Omniverse、Metropolis、Isaac和cuOpt,共
    的頭像 發(fā)表于 03-27 10:44 ?380次閱讀

    NVIDIA Isaac機(jī)器人平臺(tái)升級(jí),加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過(guò)引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、
    的頭像 發(fā)表于 03-27 10:36 ?502次閱讀

    NVIDIA入局人形機(jī)器人!Isaac平臺(tái)迎來(lái)重要更新

    NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展。
    的頭像 發(fā)表于 03-26 09:07 ?816次閱讀
    <b class='flag-5'>NVIDIA</b>入局人形機(jī)器人!<b class='flag-5'>Isaac</b>平臺(tái)迎來(lái)重要更新

    NVIDIA將數(shù)字孿生與實(shí)時(shí)AI結(jié)合以用于工業(yè)自動(dòng)化

    NVIDIA 軟件(Omniverse、Metropolis、Isaac 和 cuOpt)共同打造了一個(gè) AI Gym,讓機(jī)器人和 AI 智能體能夠在復(fù)雜的工業(yè)
    的頭像 發(fā)表于 03-25 10:59 ?407次閱讀
    <b class='flag-5'>NVIDIA</b>將數(shù)字孿生與實(shí)時(shí)<b class='flag-5'>AI</b>結(jié)合以用于工業(yè)自動(dòng)化

    NVIDIA Isaac將生成式AI應(yīng)用于制造業(yè)和物流業(yè)

    NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展。
    的頭像 發(fā)表于 03-22 10:06 ?413次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b>將生成式<b class='flag-5'>AI</b>應(yīng)用于制造業(yè)和物流業(yè)

    使用 NVIDIA Isaac 仿真并定位 Husky 機(jī)器人

    如何使用 ROS 2 Husky 官方軟件包將該機(jī)器人導(dǎo)入 NVIDIA Isaac Sim 并創(chuàng)建仿真。 本 Demo 的 Husky 機(jī)器人配備了 NVIDIA Jetson O
    的頭像 發(fā)表于 12-26 18:05 ?836次閱讀
    使用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> 仿真并定位 Husky 機(jī)器人

    在線研討會(huì) | 大模型時(shí)代語(yǔ)音 AI 模型的訓(xùn)練、優(yōu)化與應(yīng)用

    AI 大模型在語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域已經(jīng)取得了令人矚目的成就。語(yǔ)音 AI(Speech AI)技術(shù)已經(jīng)廣泛應(yīng)用在數(shù)字人、實(shí)時(shí)翻譯、語(yǔ)音
    的頭像 發(fā)表于 12-15 15:50 ?491次閱讀
    在線研討會(huì) | 大模型時(shí)代語(yǔ)音 <b class='flag-5'>AI</b> 模型的<b class='flag-5'>訓(xùn)練</b>、優(yōu)化與應(yīng)用

    NVIDIA Isaac 平臺(tái)先進(jìn)的仿真和感知工具助力 AI 機(jī)器人技術(shù)加速發(fā)展

    ? NVIDIA Isaac ROS 2.0 ?和? NVIDIA Isaac Sim 2023.1? 以及感知和仿真升級(jí)進(jìn)行了發(fā)布,用以簡(jiǎn)化 ROS 開(kāi)發(fā)者對(duì)高性能
    的頭像 發(fā)表于 10-20 02:00 ?777次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> 平臺(tái)先進(jìn)的仿真和感知工具助力 <b class='flag-5'>AI</b> 機(jī)器人技術(shù)加速發(fā)展

    為什么高斯濾波廣泛的應(yīng)用在圖像處理?

    為什么高斯濾波廣泛的應(yīng)用在圖像處理
    發(fā)表于 10-09 06:31