0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Triton的概念、特性及主要功能

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-07-18 10:11 ? 次閱讀

NVIDIA Triton 推理服務器是 NVIDIA AI 平臺的一部分,它是一款開源推理服務軟件,可助力標準化模型的部署和執(zhí)行,并在生產環(huán)境中提供快速且可擴展的 AI。

什么是 NVIDIA Triton?

NVIDIA Triton 推理服務器可助力團隊在任意基于 GPUCPU 的基礎設施上部署、運行和擴展任意框架中經過訓練的 AI 模型,進而精簡 AI 推理。同時,AI 研究人員和數(shù)據(jù)科學家可在不影響生產部署的情況下,針對其項目自由選擇合適的框架。它還幫助開發(fā)者跨云、本地、邊緣和嵌入式設備提供高性能推理。

NVIDIA Triton特性

支持多個框架

NVIDIA Triton 推理服務器支持所有主流框架,例如 TensorFlow、NVIDIA TensorRT、PyTorch、MXNet、Python、ONNX、RAPIDS FIL(用于XGBoost、scikit-learn 等)、OpenVINO、自定義 C++ 等。

高性能推理

NVIDIA Triton 支持所有基于 NVIDIA GPU、x86 和 ArmCPU 的推理。它具有動態(tài)批處理、并發(fā)執(zhí)行、最優(yōu)模型配置、模型集成和串流輸入等功能,可更大限度地提高吞吐量和利用率。

專為 DevOps 和 MLOps 設計

Triton 與 Kubernetes 集成,可用于編排和擴展,導出 Prometheus 指標進行監(jiān)控,支持實時模型更新,并可用于所有主流的公有云 AI 和 Kubernetes 平臺。它還與許多 MLOps 軟件解決方案集成。

各項應用中快速且可擴展的AI

高推理吞吐量

0f9e53ee-0431-11ed-ba43-dac502259ad0.jpg

NVIDIA Triton 可在單個 GPU 或 CPU 上并行指定相同或不同框架下的多個模型。在多 GPU 服務器中,NVIDIA Triton 會自動為基于每個 GPU 的每個模型創(chuàng)建一個實例,以提高利用率。

它還可在嚴格的延遲限制條件下優(yōu)化實時推理服務,通過支持批量推理來更大限度地提高 GPU 和 CPU 利用率,并內置對音頻視頻流輸入的支持。對于需要使用多個模型來執(zhí)行端到端推理(例如對話式 AI)的用例,Triton 支持模型集成。

模型可在生產環(huán)境中實時更新,無需重啟 Triton 或應用。Triton 支持對單個 GPU 顯存無法容納的超大模型進行多 GPU 以及多節(jié)點推理。

高度可擴展的推理

0faecbe8-0431-11ed-ba43-dac502259ad0.jpg

作為一個 Docker 容器,Triton 與 Kubernetes 集成,用于編排、指標和自動縮放。Triton 還與 Kubeflow 和 Kubeflow 工作流集成,實現(xiàn)端到端的 AI 工作流,并導出 Prometheus 指標,用于監(jiān)控 GPU 利用率、延遲、內存使用率和推理吞吐量。它支持標準的 HTTP / gRPC 接口,可與 load balancer 等其他應用連接,并可輕松擴展到任意數(shù)量的服務器,以為任意模型處理日益增長的推理負載。

Triton 可通過一個模型控制 API 來服務于數(shù)十或數(shù)百個模型。您可基于為適應 GPU 或 CPU 顯存而進行的改動,將模型加載到推理服務器中或從推理服務器中卸載。支持兼具 GPU 和 CPU 的異構集群有助于跨平臺實現(xiàn)推理標準化,并動態(tài)擴展到任意 CPU 或 GPU 以處理峰值負載。

NVIDIA Triton的主要功能

Triton Forest Inference Library (FIL) 后端

新的 Forest Inference Library (FIL) 后端支持在 CPU 和 GPU 上對基于樹的模型進行具有可解釋性(Shapley 值)的高性能推理。它支持來自 XGBoost、LightGBM、scikit-learn RandomForest、RAPIDS cuML RandomForest 以及其他 Treelite 格式的模型。

Triton 模型分析器

Triton 模型分析器是一種自動評估 Triton 部署配置(例如目標處理器上的批量大小、精度和并發(fā)執(zhí)行實例)的工具。它有助于選擇優(yōu)化配置,以滿足應用的服務質量(QoS)限制(延遲、吞吐量和內存要求),并且可以將找到優(yōu)化配置所需的時間從數(shù)周縮短到數(shù)小時。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4855

    瀏覽量

    102711
  • 服務器
    +關注

    關注

    12

    文章

    8958

    瀏覽量

    85082
  • Triton
    +關注

    關注

    0

    文章

    16

    瀏覽量

    7017

原文標題:DevZone | NVIDIA Triton推理服務器

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FPD link主要功能模塊

    電子發(fā)燒友網站提供《FPD link主要功能模塊.pdf》資料免費下載
    發(fā)表于 09-27 11:38 ?0次下載
    FPD link<b class='flag-5'>主要功能</b>模塊

    電子地圖的主要功能與應用

    電子地圖,即數(shù)字地圖,是利用計算機技術,以數(shù)字方式存儲和查閱的地圖。它不僅繼承了傳統(tǒng)紙質地圖的基本功能,還通過現(xiàn)代科技手段實現(xiàn)了諸多創(chuàng)新應用。以下是電子地圖的主要功能與應用: 一、主要功能 快速存取
    的頭像 發(fā)表于 09-12 11:18 ?1411次閱讀
    電子地圖的<b class='flag-5'>主要功能</b>與應用

    GUTOR不間斷電源的主要功能是什么?

    GUTOR不間斷電源的主要功能是什么?
    發(fā)表于 09-06 17:44

    微處理器的主要功能是什么

    微處理器(Microprocessor),作為計算機系統(tǒng)的核心部件,其主要功能對于整個計算機系統(tǒng)的運行至關重要。
    的頭像 發(fā)表于 08-22 11:48 ?1385次閱讀

    RFID天線的工作原理和主要功能

    RFID(Radio Frequency Identification,無線射頻識別)天線作為RFID系統(tǒng)中的關鍵組件,其工作原理和主要功能對于整個系統(tǒng)的性能和穩(wěn)定性至關重要。以下是對RFID天線工作原理和主要功能的詳細闡述。
    的頭像 發(fā)表于 08-09 15:38 ?920次閱讀

    連接器的主要功能是什么

    連接器的主要功能是實現(xiàn)電子設備之間的電氣連接和信號傳輸。連接器的種類繁多,應用領域廣泛,其主要功能可以歸納為以下幾點: 電氣連接:連接器的主要功能是實現(xiàn)電子設備之間的電氣連接。連接器通過其金屬接觸件
    的頭像 發(fā)表于 06-20 09:22 ?843次閱讀

    接地電阻柜的主要功能是控制和限制接地電流

    中性點接地電阻柜的主要功能是控制和限制接地電流
    的頭像 發(fā)表于 05-09 15:16 ?375次閱讀
    接地電阻柜的<b class='flag-5'>主要功能</b>是控制和限制接地電流

    SMD電感器的主要功能是什么?

    SMD電感器的主要功能是什么? SMD電感器的主要功能是用于電路中的電感元件,主要用于儲存能量、傳輸信號、濾波和產生磁場等。 一、能量儲存和傳輸: SMD電感器可以儲存電能并將其傳輸?shù)诫娐返钠渌糠?/div>
    的頭像 發(fā)表于 02-03 15:07 ?1031次閱讀

    傳感器的主要功能是什么

    傳感器是一種能夠感知外界環(huán)境并將這些信息轉化為可用信號的裝置。它們在各行各業(yè)和領域中起到關鍵作用,被廣泛應用于科學研究、醫(yī)療診斷、工業(yè)控制、農業(yè)生產等眾多領域。傳感器的主要功能包括測量和監(jiān)測、控制和反饋、安全和監(jiān)控、診斷和檢測以及位置和導航,本文將詳細介紹傳感器的主要功能
    的頭像 發(fā)表于 01-27 17:10 ?2832次閱讀
    傳感器的<b class='flag-5'>主要功能</b>是什么

    濾波器的主要功能和作用科普

    濾波器是一種用于處理信號的電路或系統(tǒng),其主要功能和作用包括
    的頭像 發(fā)表于 01-25 18:10 ?7306次閱讀

    bms主要功能有哪些

    、儲能系統(tǒng)等新能源領域的關鍵部件,其主要功能是對電池組進行實時監(jiān)控、保護和管理,以保證電池組的安全、穩(wěn)定和高效運行。本文將對BMS的主要功能進行詳細介紹。 數(shù)據(jù)采集:BMS通過傳感器對電池組的電壓、電流、溫度等關鍵參數(shù)進行實時采集,以便對電池組的工作狀態(tài)進行全面了解。這些
    的頭像 發(fā)表于 01-05 18:09 ?7841次閱讀
    bms<b class='flag-5'>主要功能</b>有哪些

    集成放大電路中輸出級的主要功能

    主要功能,并探討其工作原理、應用和性能優(yōu)化。 一、輸出級的主要功能 集成放大電路輸出級的主要功能是放大輸入信號,并將其輸出到外部負載上。具體來說,它需要完成以下幾個任務: 放大信號:輸出級的核心任務是將輸入信號放
    的頭像 發(fā)表于 12-29 10:34 ?1244次閱讀

    電源濾波器的主要功能和作用

    電源濾波器是電子設備中非常重要的一部分,其主要功能是過濾電源中的雜波和干擾信號。
    的頭像 發(fā)表于 12-25 18:19 ?1532次閱讀

    EMI濾波器有哪些應用與主要功能?

    EMI濾波器有哪些應用與主要功能?相信不少人是有疑問的,今天深圳市比創(chuàng)達電子科技有限公司就跟大家解答一下!
    的頭像 發(fā)表于 11-29 10:40 ?828次閱讀
    EMI濾波器有哪些應用與<b class='flag-5'>主要功能</b>?

    AMI網絡的主要功能

    電子發(fā)燒友網站提供《AMI網絡的主要功能.pdf》資料免費下載
    發(fā)表于 11-27 11:56 ?0次下載
    AMI網絡的<b class='flag-5'>主要功能</b>