0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用MLPerf 推理 1.1提升NVIDIA績效領(lǐng)導(dǎo)力

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-08 16:03 ? 次閱讀

人工智能繼續(xù)推動跨行業(yè)的突破性創(chuàng)新,包括消費(fèi)互聯(lián)網(wǎng)、醫(yī)療保健和生命科學(xué)、金融服務(wù)、零售、制造和超級計(jì)算。研究人員繼續(xù)推動快速發(fā)展的模型在規(guī)模、復(fù)雜度和多樣性方面的發(fā)展。此外,其中許多復(fù)雜的大規(guī)模模型需要為聊天機(jī)器人、數(shù)字助理和欺詐檢測等人工智能支持的服務(wù)提供實(shí)時(shí)結(jié)果。

考慮到人工智能推理的廣泛用途,評估性能對開發(fā)人員和基礎(chǔ)設(shè)施管理人員提出了許多挑戰(zhàn)。對于數(shù)據(jù)中心、 edge 和移動平臺上的 AI 推理, MLPerf 推理 1.1 是一個(gè)行業(yè)標(biāo)準(zhǔn)基準(zhǔn),用于衡量計(jì)算機(jī)視覺、醫(yī)學(xué)成像、自然語言和推薦系統(tǒng)的性能。這些基準(zhǔn)由人工智能行業(yè)領(lǐng)導(dǎo)者組成的聯(lián)盟制定,為人工智能培訓(xùn)和推理提供了當(dāng)今最全面的同行評審績效數(shù)據(jù)集。

要在這一基準(zhǔn)測試中完成大量測試,需要一個(gè)具有強(qiáng)大生態(tài)系統(tǒng)支持的全堆棧平臺,無論是框架還是網(wǎng)絡(luò)。 NVIDIA 是唯一一家提交所有數(shù)據(jù)中心和邊緣測試并提供全面領(lǐng)先性能的公司

這項(xiàng)工作的一個(gè)重要副產(chǎn)品是,這些優(yōu)化中的許多已經(jīng)進(jìn)入了推理開發(fā)工具,如TensorRT和 NVIDIA Triton 。用于高性能深度學(xué)習(xí)推理的 TensorRT SDK 包括一個(gè)深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時(shí),為深度學(xué)習(xí)推理應(yīng)用程序提供低延遲和高吞吐量。

Triton 推理服務(wù)器軟件簡化了人工智能模型在大規(guī)模生產(chǎn)中的部署。這種開源推理服務(wù)軟件使團(tuán)隊(duì)能夠在任何基于 GPUCPU 的基礎(chǔ)設(shè)施上從本地存儲或云平臺的任何框架部署經(jīng)過培訓(xùn)的人工智能模型。

按數(shù)字

在數(shù)據(jù)中心和邊緣兩大類中, NVIDIA 憑借 NVIDIA A100 張量核 GPU 和 NVIDIA A30 張量核 GPU 在性能測試中名列榜首。自從 MLPerf 推斷 0.7 的結(jié)果發(fā)布以來,在過去一年中, NVIDIA 僅通過軟件改進(jìn)就提高了 50% 的性能。

在另一個(gè)行業(yè)中, NVIDIA 首次使用基于 GPU – 加速 ARM 的服務(wù)器提交數(shù)據(jù)中心類別,該服務(wù)器支持所有工作負(fù)載,并提供與類似配置的基于 x86 的服務(wù)器相同的結(jié)果。這些基于 ARM 的新提交為 GPU 加速 ARM 服務(wù)器創(chuàng)造了新的性能世界記錄。這標(biāo)志著這些平臺的一個(gè)重要里程碑,因?yàn)樗鼈儸F(xiàn)在已經(jīng)在同行評審的行業(yè)標(biāo)準(zhǔn)基準(zhǔn)中證明了自己,以提供市場領(lǐng)先的性能。它還展示了 NVIDIA ARM 軟件生態(tài)系統(tǒng)的性能、多功能性和就緒性,以應(yīng)對數(shù)據(jù)中心的計(jì)算挑戰(zhàn)。

pYYBAGJP7FSAb4UmAABG9iwx2cg552.png

圖 1 。使用 Ampere Altra CPU s 的基于 ARM 的服務(wù)器提供的性能與類似配置的基于 x86 的服務(wù)器相當(dāng)

MLPerf v1.1 推理關(guān)閉;每個(gè)加速器的性能源自使用數(shù)據(jù)中心脫機(jī)中報(bào)告的加速器計(jì)數(shù)的各個(gè)提交的最佳 MLPerf 結(jié)果。 x86 服務(wù)器: 1.1-034 、 ARM 服務(wù)器: 1.1-033 MLPerf 名稱和徽標(biāo)是商標(biāo)。

綜觀整體表現(xiàn), NVIDIA 全面領(lǐng)先。圖 2 顯示了服務(wù)器場景的結(jié)果,其中使用泊松分布為測試中的系統(tǒng)生成推理工作,以更緊密地模擬真實(shí)世界的工作負(fù)載模式。

pYYBAGJP7FuAQr9CAACxiiMT8EI989.png

圖 2 。 NVIDIA 與 CPU 純服務(wù)器的性能比較

MLPerf v1.1 推理關(guān)閉;使用數(shù)據(jù)中心脫機(jī)和服務(wù)器中報(bào)告的加速器計(jì)數(shù),從各個(gè)提交的最佳 MLPerf 結(jié)果中得出每個(gè)加速器的性能。高通 AI 100 : 1.1-057 和 1.1-058 ,英特爾至強(qiáng) 8380 : 1.1-023 和 1.1-024 , NVIDIA A30 : 1.1-43 , NVIDIA A100 ( ARM ): 1.1-033 , NVIDIA A100 ( x86 ): 1.1-047 。 MLPerf 名稱和徽標(biāo)是商標(biāo)。

NVIDIA 比 CPU 純服務(wù)器的性能全面提高了 104 倍。這種性能優(yōu)勢轉(zhuǎn)化為對更大、更復(fù)雜的模型以及在對話 AI 、推薦系統(tǒng)和數(shù)字助理中實(shí)時(shí)作業(yè)中運(yùn)行的多個(gè)模型進(jìn)行推理的能力。

結(jié)果背后的優(yōu)化

我們的工程團(tuán)隊(duì)實(shí)施了一些優(yōu)化,使這些偉大的結(jié)果成為可能。首先,基于 ARM 的服務(wù)器和基于 x86 的服務(wù)器的所有這些結(jié)果都是使用 TensorRT 8 生成的,現(xiàn)在普遍可用。特別令人感興趣的是雙內(nèi)核的非冪函數(shù)的使用,這是為了加速工作負(fù)載而實(shí)現(xiàn)的,比如 BERT – 大型單流場景測試。

NVIDIA 提交利用添加到 NVIDIA Triton 推理服務(wù)器的新主機(jī)策略功能。您可以在配置 NVIDIA Triton 服務(wù)器時(shí)指定主機(jī)策略,以在服務(wù)器應(yīng)用程序中啟用線程和內(nèi)存固定。利用此功能, NVIDIA Triton 可以為系統(tǒng)中的每個(gè) GPU 指定輸入的最佳位置。最佳位置可以基于系統(tǒng)的非統(tǒng)一內(nèi)存體系結(jié)構(gòu)( NUMA )配置,在這種情況下,每個(gè) NUMA 節(jié)點(diǎn)上都有一個(gè)查詢樣本庫。

您還可以使用主機(jī)策略啟用“從設(shè)備啟動”配置設(shè)置,服務(wù)器將在選擇執(zhí)行的 GPU 上拾取輸入。此設(shè)置還可以將網(wǎng)絡(luò)輸入直接輸入 GPU 內(nèi)存,完全繞過 CPU 和系統(tǒng)內(nèi)存副本。

推理能力三人組: TensorRT , NVIDIA Triton 和 NGC

NVIDIA 推理領(lǐng)導(dǎo)力來自于構(gòu)建最優(yōu)秀的人工智能加速器,用于培訓(xùn)和推理。但同樣重要的是支持所有 AI 框架和 800 多個(gè) HPC 應(yīng)用程序的 NVIDIA 端到端、全棧軟件生態(tài)系統(tǒng)。

所有這些軟件都可以在NGC、 NVIDIA 集線器上獲得,該集線器帶有 GPU ——用于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和 HPC 的優(yōu)化軟件。 NGC 負(fù)責(zé)所有管道,因此數(shù)據(jù)科學(xué)家、開發(fā)人員和研究人員可以專注于構(gòu)建解決方案、收集 i NSight 并提供業(yè)務(wù)價(jià)值。

NGC 可通過您首選的云提供商的市場免費(fèi)獲得。在那里,您可以找到 TensorRT 和 NVIDIA Triton 的最新版本,這兩個(gè)版本都有助于生成最新的 MLPerf 推斷 1.1 結(jié)果。

關(guān)于作者

Dave Salvator 是 NVIDIA 旗下 Tesla 集團(tuán)的高級產(chǎn)品營銷經(jīng)理,專注于超規(guī)模、深度學(xué)習(xí)和推理。

Jesus Corbal San Adrian 是 NVIDIA 計(jì)算架構(gòu)組的杰出工程師,專注于深度學(xué)習(xí)推理 GPU 分析和優(yōu)化。

Madhumitha Sridhara 是 TensorRT 團(tuán)隊(duì)的高級軟件工程師,專注于使用 Triton 推理服務(wù)器的 NVIDIA MLPerf推理提交。她擁有卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)工程碩士學(xué)位和印度卡納塔克邦蘇拉特卡爾國家理工學(xué)院電子通信工程學(xué)士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237073
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132312
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    625
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無論是在復(fù)雜的 AI 開發(fā)任務(wù)中,還是在高并發(fā)推理場景下,都能夠確保項(xiàng)
    的頭像 發(fā)表于 10-27 10:03 ?142次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造AI訓(xùn)練與<b class='flag-5'>推理</b>加速解決方案

    如何利用海外動態(tài)IP提升全球市場觸達(dá)

    利用海外動態(tài)IP提升全球市場觸達(dá),是一個(gè)涉及多個(gè)方面的策略。
    的頭像 發(fā)表于 09-27 08:36 ?217次閱讀

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗(yàn)。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應(yīng)用部署,提高
    的頭像 發(fā)表于 08-23 15:48 ?353次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?643次閱讀

    博聯(lián)智能榮獲“2024全屋智能領(lǐng)導(dǎo)力品牌”獎(jiǎng)

    近日,第八屆葵花獎(jiǎng)智能家居評選頒獎(jiǎng)盛典在中國建博會(廣州)廣交會展館圓滿落幕,BroadLink博聯(lián)智能憑借卓越的技術(shù)創(chuàng)新力和品牌榮獲“2024全屋智能領(lǐng)導(dǎo)力品牌”獎(jiǎng)!
    的頭像 發(fā)表于 07-19 17:34 ?970次閱讀

    DigiKey 在 2024 EDS 領(lǐng)導(dǎo)力峰會上斬獲供應(yīng)商授予的多個(gè)最高獎(jiǎng)項(xiàng)

    全球供應(yīng)品類豐富、發(fā)貨快速的商業(yè)現(xiàn)貨技術(shù)元件和自動化產(chǎn)品分銷商?DigiKey?日前宣布,在 5 月 21 日至 23 日于拉斯維加斯舉辦的 2024 年 EDS 領(lǐng)導(dǎo)力峰會上,共計(jì)獲得了供應(yīng)商
    發(fā)表于 06-26 15:30 ?184次閱讀
    DigiKey 在 2024 EDS <b class='flag-5'>領(lǐng)導(dǎo)力</b>峰會上斬獲供應(yīng)商授予的多個(gè)最高獎(jiǎng)項(xiàng)

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡化AI模型部署過程,為全球的2800萬英偉達(dá)開發(fā)者提供前所未有的便利。
    的頭像 發(fā)表于 06-04 09:15 ?621次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    ,同時(shí)降低水消耗。利用NVIDIA Blackwell架構(gòu)的高帶寬內(nèi)存性能、NVLink-C2C和專用解壓縮引擎,GB200大幅提高關(guān)鍵數(shù)據(jù)庫查詢的速度,比CPU提升18倍,并將總體擁有成本(TCO
    發(fā)表于 05-13 17:16

    沃爾沃利用英偉達(dá)的SoC和AI來提升自動駕駛的安全性

    在2024年英偉達(dá)GPU技術(shù)大會(NVIDIA GTC 2024)上,沃爾沃介紹了如何利用人工智能和日益提升的算提升自動駕駛的安全性。
    的頭像 發(fā)表于 05-08 14:38 ?1096次閱讀

    萊迪思Avant? FPGA平臺榮獲2024年環(huán)境和能源領(lǐng)導(dǎo)力獎(jiǎng)

    萊迪思半導(dǎo)體近日宣布萊迪思Avant? FPGA平臺榮獲2024年環(huán)境和能源領(lǐng)導(dǎo)力獎(jiǎng)。萊迪思Avant因其在商業(yè)和基礎(chǔ)設(shè)施領(lǐng)域中展現(xiàn)出領(lǐng)先的低功耗、高性能和小尺寸特性而獲得認(rèn)可。
    的頭像 發(fā)表于 04-30 14:28 ?428次閱讀
    萊迪思Avant? FPGA平臺榮獲2024年環(huán)境和能源<b class='flag-5'>領(lǐng)導(dǎo)力</b>獎(jiǎng)

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?532次閱讀

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型,并借助NVIDIA Triton推理服務(wù)器在NVIDIA V1
    的頭像 發(fā)表于 01-17 09:30 ?633次閱讀

    愛立信亮相2023 TM Forum數(shù)字領(lǐng)導(dǎo)力中國峰會:談通信網(wǎng)絡(luò)智能化演進(jìn)之路

    數(shù)字領(lǐng)導(dǎo)力中國峰會——網(wǎng)絡(luò)數(shù)字化轉(zhuǎn)型論壇上,愛立信云軟件和服務(wù)事業(yè)部總經(jīng)理張志軍受邀出席,分享了愛立信在探索“自智網(wǎng)絡(luò)”之路上的實(shí)踐與心得。 01 “智能”是持續(xù)挖掘5G潛能的基石 為何網(wǎng)絡(luò)要向“智能化”演進(jìn)?演講中, 張志 軍表示
    的頭像 發(fā)表于 12-07 09:50 ?2310次閱讀
    愛立信亮相2023 TM Forum數(shù)字<b class='flag-5'>領(lǐng)導(dǎo)力</b>中國峰會:談通信網(wǎng)絡(luò)智能化演進(jìn)之路

    DEKRA德凱助力實(shí)現(xiàn)卓越安全領(lǐng)導(dǎo)力和文化

    11月15-16日,2023首屆安全領(lǐng)導(dǎo)力國際研討會在北京隆重舉辦。本次研討會由應(yīng)急管理部國際交流合作中心、中國職業(yè)安全健康協(xié)會主辦,DEKRA德凱、北京朗泰華科技發(fā)展中心承辦,國際化學(xué)品制造商協(xié)會
    的頭像 發(fā)表于 11-16 09:41 ?568次閱讀