0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過稀疏性支持和變壓器優(yōu)化增強AI推理

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Saumitra Jagdale ? 2022-10-18 09:32 ? 次閱讀

英偉達張量RT 8 概述

NVIDIA 張量RT 是一個高性能推理平臺,對于利用 NVIDIA 張量核心 GPU 的強大功能至關(guān)重要。TensorRT 8 是一個具有增強功能的軟件開發(fā)工具包,旨在提高性能和準確性,以應(yīng)對邊緣和嵌入式設(shè)備中發(fā)生的越來越多的 AI 推理。它允許對張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進行廣泛的計算推斷。

與僅 CPU 平臺相比,TensorRT 可提供高達 40 倍的吞吐量,同時最大限度地減少延遲。它允許您從任何框架開始,并在生產(chǎn)中快速優(yōu)化、驗證和部署經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪對網(wǎng)絡(luò)整體計算無貢獻的弱連接。此外,張量RT 8 支持變壓器優(yōu)化和 BERT 大。變壓器優(yōu)化可提高性能,而量化感知訓(xùn)練可提高準確性。

英偉達的張量RT 8 有什么新功能?

推理的目的是在訓(xùn)練階段盡可能多地保持準確性。訓(xùn)練的模型可以在硬件設(shè)備上運行,以獲得客戶的最低響應(yīng)時間和最大的吞吐量。但是,盡可能精確的必要性有時可能與邊緣可用的內(nèi)存量和吞吐量發(fā)生沖突。訓(xùn)練有素、高度準確的模型可能運行速度太慢。

因此,TensorRT版本8結(jié)合了深度學(xué)習推理或訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用的最新進展,以理解數(shù)據(jù)如何影響響應(yīng)。它使用兩個主要功能將語言查詢推理時間減少一半:

英偉達安培架構(gòu)的稀疏性

深度神經(jīng)網(wǎng)絡(luò)擅長各種任務(wù),如計算機視覺、語音識別和自然語言處理。隨著處理這些神經(jīng)網(wǎng)絡(luò)所需的計算能力的增加,高效的建模和計算變得越來越重要。

稀疏是采用 NVIDIA 安培架構(gòu)的 GPU 的一種全新性能方法,通過減少計算流程來提高開發(fā)人員的效率。深度學(xué)習模型的其他方面不如其他方面重要,有些甚至可能為零。因此,神經(jīng)網(wǎng)絡(luò)不需要對特定權(quán)重或參數(shù)進行計算。因此,NVIDIA 可以通過使用稀疏性將模型的權(quán)重減少近一半來增強性能、吞吐量和延遲。

通過變壓器優(yōu)化減少推理計算

在張量RT 8中,性能增強是通過變壓器優(yōu)化實現(xiàn)的。量化開發(fā)人員可以利用訓(xùn)練的模型通過 8 位計算 (INT8) 執(zhí)行推理。這大大減少了張量核心中的推理計算和存儲。INT8 越來越多地用于優(yōu)化機器學(xué)習框架,如張量流和 NVIDIA 的張量壓縮包,以減少內(nèi)存和計算需求。因此,NVIDIA可以在張量RT 8上提供非常高的性能,同時保持準確性。

例如,量化感知訓(xùn)練 (QAT) 有可能將準確性提高一倍。因此,與舊版本張量RT 7相比,張量RT 8可以將許多模型的性能提高一倍。

張量RT部署在眾多行業(yè)中

TensorRT更好的性能和準確性使其成為醫(yī)療保健,汽車,互聯(lián)網(wǎng)/電信服務(wù),金融服務(wù)和零售等行業(yè)的熱門選擇。例如,張量RT用于為GE醫(yī)療保健的心血管超聲系統(tǒng)提供動力。數(shù)字診斷解決方案提供商使用該技術(shù)在其 Vivid E95 掃描器上加速了自動心臟視圖檢測。心臟病專家可以通過使用改進的視圖檢測算法,在早期階段做出更準確的診斷和檢測疾病。此外,TensorRT還被Verizon,福特,美國郵政服務(wù),美國運通和其他知名公司使用。

隨著張量RT 8的發(fā)布,NVIDIA還推出了使用張量RT的Google BERT大推理的突破,來自變形金剛的雙向編碼器表示(BERT)是一種基于變壓器的機器學(xué)習技術(shù),用于預(yù)訓(xùn)練自然語言處理。BERT-Large 模型只需 1.2 毫秒進行分析,從而可以實時響應(yīng)自然語言查詢。這意味著公司可以將其模型的尺寸增加一倍或三倍,以提高準確性。

像 BERT-Large 這樣的語言模型被許多推理服務(wù)在幕后使用。另一方面,基于語言的應(yīng)用程序通常無法識別細微差別或情感,從而導(dǎo)致整體糟糕的體驗。現(xiàn)在,公司可以使用張量RT 8在幾毫秒內(nèi)部署整個工作流程。這些突破可以為新一代對話式AI應(yīng)用程序鋪平道路,為用戶提供更智能、更低的延遲體驗。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266203
  • 變壓器
    +關(guān)注

    關(guān)注

    0

    文章

    1035

    瀏覽量

    4010
收藏 人收藏

    評論

    相關(guān)推薦

    高頻功率變壓器磁芯的作用

    實現(xiàn)電能的轉(zhuǎn)換和傳輸。在高頻應(yīng)用中,磁芯的磁導(dǎo)率和損耗特性對變壓器的性能有顯著影響。 提高效率 :通過優(yōu)化磁芯材料和設(shè)計,可以減少能量損耗,提高變壓器的效率。 電磁兼容
    的頭像 發(fā)表于 09-07 10:40 ?154次閱讀

    控制變壓器的作用是什么

    相似,但它們通常具有更高的絕緣等級和更嚴格的性能要求,以確保在各種惡劣環(huán)境下的可靠和安全。 控制變壓器的基本原理 控制變壓器的基本原理是基于電磁感應(yīng)現(xiàn)象。當交流電流
    的頭像 發(fā)表于 09-06 14:17 ?102次閱讀

    隔離變壓器和控制變壓器能通用嗎

    ,并提供安全和保護。它還可以消除電磁干擾(EMI)和射頻干擾(RFI),提高設(shè)備的性能和可靠。隔離變壓器變壓比通常是1:1,但也可以
    的頭像 發(fā)表于 09-06 11:28 ?176次閱讀

    控制變壓器是不是隔離變壓器

    設(shè)計的變壓器,主要用于控制電路中,如電機啟動、速度控制、照明控制等。它們通常具有較低的電壓和電流輸出,以適應(yīng)控制電路的需求。 2. 工作原理 控制變壓器的工作原理基于電磁感應(yīng)。當交流電通過初級線圈時,會在鐵芯中產(chǎn)生交變磁通,
    的頭像 發(fā)表于 09-06 11:25 ?140次閱讀

    變壓器預(yù)防試驗項目及意義

    。預(yù)防試驗通過變壓器各項性能指標的檢測,能夠及時發(fā)現(xiàn)并排除潛在的安全隱患,提高變壓器的可靠和安全
    發(fā)表于 08-01 13:51

    高頻變壓器和脈沖變壓器的區(qū)別

    。 高頻變壓器是一種將電能從一個電路傳輸?shù)搅硪粋€電路的電力轉(zhuǎn)換裝置。它通過將輸入電路中的電流通過磁耦合傳輸?shù)捷敵鲭娐分衼砀淖冸妷夯螂娏鞯拇笮?。高頻變壓器主要用于電力傳輸、電子設(shè)備和通信
    的頭像 發(fā)表于 03-07 16:05 ?1267次閱讀

    變壓器油的作用與用途 變壓器油的閃點是多少

    防止電流通過,從而保護變壓器內(nèi)部的線圈和絕緣材料不受損壞。這是由于變壓器油的高電阻率和絕緣性能,使得電流不能透過它而通過。此外,變壓器油還可
    的頭像 發(fā)表于 02-18 11:16 ?2984次閱讀

    降壓變壓器可以作為升壓變壓器使用嗎?

    ,而升壓變壓器通過增加輸入電源的電壓來提供較高的輸出電壓。然而,是否可以將降壓變壓器作為升壓變壓器使用,這是一個有趣的問題。本文將分析降壓變壓器
    的頭像 發(fā)表于 02-01 15:32 ?1582次閱讀

    ltspice變壓器怎么設(shè)計參數(shù)

    的功率。功率可以通過計算電器設(shè)備的負載電流和電壓(即P=IV)來確定,或者通過測量電器設(shè)備來獲得。確保選擇一個能夠滿足所需功率的變壓器。 第二步:確定變壓器的電壓比 在設(shè)計
    的頭像 發(fā)表于 12-19 17:39 ?1307次閱讀

    高頻變壓器與低頻變壓器的區(qū)別?

    高頻變壓器與低頻變壓器的區(qū)別? 高頻變壓器與低頻變壓器是根據(jù)工作頻率的不同而區(qū)分的。變壓器是電力系統(tǒng)中常用的電力變換設(shè)備,它
    的頭像 發(fā)表于 11-30 11:43 ?1360次閱讀

    什么是飽和變壓器?飽和變壓器的特點有哪些?飽和變壓器的應(yīng)用場景?

    什么是飽和變壓器?飽和變壓器的特點有哪些?飽和變壓器的應(yīng)用場景有哪些? 飽和變壓器是一種特殊的變壓器,
    的頭像 發(fā)表于 11-23 14:26 ?818次閱讀

    變壓器可以通過哪幾種方式來減小泄漏感應(yīng)?

    變壓器可以通過哪幾種方式來減小泄漏感應(yīng)? 變壓器的泄漏感應(yīng)是指在變壓器的一側(cè)產(chǎn)生的磁感應(yīng)線產(chǎn)生的磁通量未完全通過鐵心而泄漏到另一側(cè)。泄漏感應(yīng)
    的頭像 發(fā)表于 11-23 14:18 ?1458次閱讀

    工頻變壓器與高頻變壓器區(qū)別

    工頻變壓器與高頻變壓器區(qū)別? 工頻變壓器與高頻變壓器是電力和電子領(lǐng)域中常見的兩種變壓器類型。雖然它們的基本工作原理相似,都是
    的頭像 發(fā)表于 11-20 15:07 ?2763次閱讀

    變壓器保護原理介紹 什么叫變壓器充電保護?變壓器的保護有哪些?

    變壓器保護原理介紹 什么叫變壓器充電保護?變壓器的保護有哪些?? 一、變壓器保護原理介紹 變壓器是電力系統(tǒng)中常用的電力設(shè)備,用于將高電壓
    的頭像 發(fā)表于 09-27 15:55 ?2137次閱讀

    變壓器充電保護是什么意思?變壓器充電時保護如何使用?

    形成對電器設(shè)備的嚴重危害。 既然是變壓器充電保護,那就有必要先從變壓器本身說起。變壓器主要是通過電磁感應(yīng)來完成能量的傳輸,通過
    的頭像 發(fā)表于 09-27 15:45 ?1728次閱讀