0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

學(xué)習(xí)資源 | NVIDIA TensorRT 全新教程上線

NVIDIA英偉達 ? 來源:未知 ? 2023-08-04 17:45 ? 次閱讀

NVIDIA TensorRT是一個用于高效實現(xiàn)已訓(xùn)練好的深度學(xué)習(xí)模型推理過程的軟件開發(fā)工具包,內(nèi)含推理優(yōu)化器和運行環(huán)境兩部分,其目的在于讓深度學(xué)習(xí)模型能夠在 GPU 上以更高吞吐量和更低的延遲運行,目前已在業(yè)界得到廣泛應(yīng)用與部署。

為了幫助廣大開發(fā)者更好地了解 TensorRT,NVIDIA GPU 計算專家團隊(Devtech)工程師李瑋、王猛基于最新的 8.6.1 版本錄制了NVIDIA TensorRT 教程。本系列教程預(yù)計 4 小時,包含五個章節(jié),旨在相對全面地介紹 TensorRT。該教程濃縮了 NVIDIA TensorRT 開發(fā)團隊的技術(shù)和經(jīng)驗,以及與客戶在合作過程中遇到的各種問題和相應(yīng)的解決方法,期待開發(fā)者們在觀看該教程及配套代碼庫后能有所收獲,為學(xué)習(xí)、科研和工作添磚加瓦。

需要注意的是,在未來版本的 TensorRT 中,部分 API 和用法可能發(fā)生變化,該教程內(nèi)容也會隨之進行更新,請在配合代碼進行學(xué)習(xí)的時候,注意開發(fā)環(huán)境和軟件版本,避免兼容性方面的問題。

立即掃碼充電!

TensorRT教程介紹

第一部分:TensorRT 簡介(時長: 41 分鐘)

TensorRT 基本特性和用法Workflow:使用 TensorRT API 搭建Workflow:使用 ONNX-ParserWorkflow:使用框架內(nèi) TensorRT 接口 本章節(jié)將介紹 TensorRT 的基本特性和用法,并介紹使用 TensorRT 的三種常見工作流程。在該章節(jié)中,將從頭搭建一個可以在 TensorRT 中運行推理計算的程序,方便了解一些基本 API 的用法,然后分別使用 TensorRT 的原生 API 搭建、使用 Parser 解析 ONNX 模型,以及使用 TensorFlow 和 Pytorch 等平臺自帶的 TensorRT 接口這三種方法將 TensorRT 用起來。

第二部分:開發(fā)輔助工具(時長:24 分鐘)

trtexecNetronpolygraphyonnx-graphsurgeonNsightSystems

本章節(jié)介紹使用 TensorRT 過程中五個常用的開發(fā)輔助工具,它們在性能測試、網(wǎng)絡(luò)可視化、模型遷移、精度檢驗、計算圖編輯、模型整體性能優(yōu)化等方面都起到了重要的作用。第二章節(jié)將逐一介紹這五個工具,并列舉在實際工作中使用這些工具的范例和經(jīng)驗。

第三部分:插件書寫(時長:18 分鐘)

使用 Plugin 的簡單例子關(guān)鍵 API結(jié)合使用 Parser 和 PluginPlugin 高級話題使用 Plugin 的例子

本章節(jié)將著重介紹 TensorRT Plugin 的相關(guān)技術(shù),將從一個最簡單的標量加法的 Plugin 例子開始,講解 Plugin 的原理、特性、用法等,然后介紹一個把 Plugin 和 Parser 結(jié)合使用的例子,最后補充一些 Plugin 的高級用法,以及在工作中使用 Plugin 的一些案例。

第四部分:TensorRT高級用法(時長: 28 分鐘)

多 OptimizationProfile多 Stream多 ContextCUDAGraphTimingCacheRefitTacticSource硬件兼容+版本兼容更多工具

本章節(jié)將介紹 TensorRT 的一些高級話題。這些技術(shù)在 TensorRT 的使用過程中不是必須的,但在復(fù)雜的實際應(yīng)用場景中,這些技術(shù)對于改善模型性能和內(nèi)存占用、模型的調(diào)試分析、算法精確控制等方面有重要的作用。建議在完成前三個章節(jié)的學(xué)習(xí)后,瀏覽本章節(jié),將對 TensorRT 的使用起到錦上添花的作用。

第五部分:常見優(yōu)化策略(時長:1 小時 42 分鐘)

概述性能分析工具性能優(yōu)化實例

本章節(jié)將介紹 TensorRT 工作流程中常見的模型優(yōu)化方法。該部分內(nèi)容將深入講解 TensorRT 相關(guān)性能分析工具,并以實例方式講述曾經(jīng)遇到過的一個模型在移植、優(yōu)化、部署的過程中使用的優(yōu)化策略。

wKgaomToPMCACEEQAABDYMZ-TIM441.gif

TensorRT Hackathon、

生成式 AI 模型優(yōu)化賽

!wKgaomToPMCASfeVAAAKhK271LE512.gif

由阿里云、 NVIDIA 聯(lián)合舉辦,由阿里云天池平臺組織運營的“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型優(yōu)化賽”正在火熱報名中,截止時間 8 月 14 日上午 10:00。該賽事面向全社會開放,接受個人或不多于三人的組隊形式參賽。

掃碼報名參賽!

wKgaomToPMCAWwrxAAAcWoAng38399.png ? ? ? ? ? ? ? ? ? ?

相關(guān)資源鏈接:

?TensorRT 介紹https://developer.nvidia.com/tensorrt?TensorRT下載https://developer.nvidia.com/nvidia-tensorrt-download

?TensorRT Cookbook(本教程配套代碼,包含視頻以外的更多范例代碼):https://github.com/NVIDIA/trt-samples-for-hackathon-cn/tree/master/cookbook

?TensorRT文檔:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

?C++ API文檔:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/

?Python API文檔:https://docs.nvidia.com/deeplearning/tensorrt/api/python_api/ 點擊“閱讀原文”,查看 TensorRT 全新教程! 掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標題:學(xué)習(xí)資源 | NVIDIA TensorRT 全新教程上線

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3720

    瀏覽量

    90690

原文標題:學(xué)習(xí)資源 | NVIDIA TensorRT 全新教程上線

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機器人學(xué)習(xí)大會(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機器人(包括人形機器人)的開發(fā)工作。
    的頭像 發(fā)表于 11-09 11:52 ?106次閱讀

    使用全新NVIDIA AI Blueprint開發(fā)視覺AI智能體

    為提高生產(chǎn)力、優(yōu)化流程和創(chuàng)造更加安全的空間,埃森哲、戴爾科技和聯(lián)想等公司正在使用全新 NVIDIA AI Blueprint 開發(fā)視覺 AI 智能體。
    的頭像 發(fā)表于 11-06 13:58 ?163次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進的指導(dǎo)和獎勵模型,以及一個用于生成式 AI 訓(xùn)練的數(shù)據(jù)集。
    的頭像 發(fā)表于 09-06 14:59 ?248次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應(yīng)用部署,提高了大模型產(chǎn)業(yè)應(yīng)用效率,更大規(guī)模地釋放大模型的應(yīng)用價值?!?/div>
    的頭像 發(fā)表于 08-23 15:48 ?355次閱讀

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?499次閱讀

    英偉達推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?648次閱讀

    NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運行的AI助手及數(shù)字人

    NVIDIA 宣布推出全新 NVIDIA RTX?技術(shù),用于支持在全新 GeForce RTX AI 筆記本電腦上運行的 AI 助手及數(shù)字人。 ?
    的頭像 發(fā)表于 06-04 10:19 ?664次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優(yōu)化從 PC 到云端的
    的頭像 發(fā)表于 04-28 10:36 ?462次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結(jié)合 NVIDIA TensorRTNVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    NVIDIA宣布推出基于Omniverse Cloud API構(gòu)建的全新軟件框架

    NVIDIA 在 GTC 大會上宣布推出基于 Omniverse Cloud API(應(yīng)用編程接口)構(gòu)建的全新軟件框架。
    的頭像 發(fā)表于 03-25 09:09 ?480次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型,并借助NVIDIA Triton推理服務(wù)器在NVIDIA V1
    的頭像 發(fā)表于 01-17 09:30 ?633次閱讀

    Torch TensorRT是一個優(yōu)化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我們大家聚在一起的原因,它是一個端到端的機器學(xué)習(xí)框架。而TensorRT則是NVIDIA的高性能深度
    的頭像 發(fā)表于 01-09 16:41 ?1452次閱讀
    Torch <b class='flag-5'>TensorRT</b>是一個優(yōu)化PyTorch模型推理性能的工具

    如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

    的特點和優(yōu)勢。然而,這些工具往往未能充分發(fā)揮 GPU 的性能。 為了解決這些問題,NVIDIA 推出了一種全新的解決方案—— Tens
    的頭像 發(fā)表于 12-04 20:25 ?881次閱讀
    如何在 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM 中支持 Qwen 模型

    NVIDIA 知乎精彩問答甄選 | 查看關(guān)于 NVIDIA Omniverse 的相關(guān)精彩問答

    甄選問答將為您分享? NVIDIA Omniverse 的相關(guān)精彩問答 Q: NVIDIA 全新的 Omniverse Cloud API 有何亮點? A: NVIDIA 將為開發(fā)者和
    的頭像 發(fā)表于 12-01 18:40 ?430次閱讀
    <b class='flag-5'>NVIDIA</b> 知乎精彩問答甄選 | 查看關(guān)于 <b class='flag-5'>NVIDIA</b> Omniverse 的相關(guān)精彩問答

    華為云全新上線 Serverless 應(yīng)用中心,支持一鍵構(gòu)建文生圖應(yīng)用

    近日,華為云全新上線 Serverless 應(yīng)用中心,提供大量應(yīng)用模板,幫助用戶實現(xiàn)一鍵部署函數(shù)和周邊依賴資源,節(jié)省部署時間,快速上手將應(yīng)用部署到華為云函數(shù)工作流 FunctionGraph,并一鍵
    的頭像 發(fā)表于 11-13 09:36 ?569次閱讀
    華為云<b class='flag-5'>全新</b><b class='flag-5'>上線</b> Serverless 應(yīng)用中心,支持一鍵構(gòu)建文生圖應(yīng)用