0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NPU和AI TOPS是什么?它們有哪些性能?

高通中國 ? 來源:高通中國 ? 2024-06-13 10:33 ? 次閱讀

在當今快速發(fā)展的技術(shù)環(huán)境中,AI正在變革各行各業(yè)并推動創(chuàng)新,理解AI性能指標的復(fù)雜性至關(guān)重要。過去許多AI模型需要在云端運行。當我們走向由終端側(cè)生成式AI處理定義的未來時,我們必須能夠評估計算平臺可運行AI模型的性能、準確性和效率。如今,TOPS(每秒萬億次運算)是衡量處理器AI性能的主要方式之一。TOPS是基于處理器所需的架構(gòu)和頻率,衡量處理器潛在AI推理峰值性能的方法,比如神經(jīng)網(wǎng)絡(luò)處理器(NPU)。下面我們將深入探討。

NPU是什么?

在深入探討TOPS的具體內(nèi)容之前,讓我們先看看NPU的重要性。對于終端側(cè)AI處理,NPU在提高效率、為個人用戶和企業(yè)提供創(chuàng)新的應(yīng)用體驗方面發(fā)揮著關(guān)鍵作用。評估這些專用處理器的性能需要全面了解其能力背后的關(guān)鍵指標。

NPU的演進改變了人們處理計算的方式。傳統(tǒng)上,CPU負責(zé)執(zhí)行AI算法。隨著對處理性能的需求飆升,專用NPU應(yīng)運而生,成為處理AI相關(guān)軟件應(yīng)用的專用解決方案。NPU旨在高效處理AI任務(wù)所需的復(fù)雜數(shù)學(xué)計算,提供出色的效率、性能和能效。

AI TOPS是什么?

TOPS作為展示處理器計算能力的指標,是衡量NPU性能的核心。

TOPS通過以萬億單位測量一秒鐘內(nèi)執(zhí)行的運算(加法、乘法等)次數(shù)來量化NPU處理能力。

這種標準化測量方式非常明確地顯示了NPU的性能,可作為比較不同處理器和架構(gòu)AI性能的關(guān)鍵指標。因為TOPS是針對NPU的基礎(chǔ)性能指標,探索TOPS的計算參數(shù)以及它們?nèi)绾螞Q定性能至關(guān)重要,這有助于更深入地了解NPU的能力。

乘法累加(MAC)運算執(zhí)行AI工作負載中的核心數(shù)學(xué)公式。矩陣乘法由兩類基礎(chǔ)運算組成:累加器的乘法和加法。例如,一個MAC單元可在每個時鐘周期內(nèi)運行兩類基礎(chǔ)運算各一次,意味著它在每個時鐘周期內(nèi)執(zhí)行兩個運算。一個給定的NPU有一定數(shù)量的MAC單元,能夠在不同精度級別進行運算,這取決于NPU架構(gòu)。

頻率決定NPU及其MAC單元(以及CPU或GPU)運算的時鐘速度(或每秒周期數(shù)),直接影響整體性能。更高的頻率允許在單位時間內(nèi)執(zhí)行更多運算,從而提高處理速度。但是,提高頻率也會導(dǎo)致更高功耗和發(fā)熱,影響電池續(xù)航和用戶體驗。處理器TOPS計算通常使用峰值運行頻率。

精度指計算的顆粒度,通常精度越高模型準確性就越高,需要的計算強度也越高。最常見的高精度AI模型為32位和16位浮點精度,而速度更快的低精度低功耗模型通常使用8位和4位整數(shù)精度。當前行業(yè)標準為以INT8精度評估AI推理性能TOPS。

計算TOPS要從計算OPS開始,OPS等于MAC單元數(shù)乘以運行頻率的兩倍。TOPS數(shù)量是OPS除以一萬億的值,將公式更簡單地列出,即TOPS = 2×MAC單元數(shù)×頻率/1萬億。

TOPS和實際性能

盡管TOPS提供了探索NPU能力的重要信息,我們?nèi)员仨殞⒗碚撝笜撕蛯嶋H應(yīng)用聯(lián)系起來。畢竟,僅僅有高TOPS值并不能保證最佳的AI性能;各種因素協(xié)同作用的結(jié)果才能真正決定NPU實力。

因此評估NPU性能時要考慮內(nèi)存帶寬、軟件優(yōu)化和系統(tǒng)集成等方面的因素?;鶞蕼y試可以幫助我們超越數(shù)字,了解NPU在實際場景中的表現(xiàn),其中時延、吞吐量和能效尤為重要。

Procyon AI基準測試使用真實工作負載來幫助將理論性的TOPS評估轉(zhuǎn)化為用戶在使用AI推理的真實應(yīng)用中對響應(yīng)和處理能力的預(yù)期。它以多個精度運行六個模型,提供NPU不同性能表現(xiàn)的詳細洞察。類似模型在生產(chǎn)力、媒體、創(chuàng)作者和其他應(yīng)用中越來越常見。在Procyon AI和其他基準測試中有更快的性能表現(xiàn),與實現(xiàn)更快推理和更好用戶體驗息息相關(guān)。

為此,分析實際性能可以為NPU的能力和局限性提供寶貴洞察。必須從可行性和實用性角度檢驗性能指標。

未來NPU性能指標

隨著技術(shù)不斷快速發(fā)展,數(shù)字化轉(zhuǎn)型需求持續(xù)影響各行各業(yè),NPU性能指標格局將進一步演進。盡管新興趨勢正在更廣泛地定義和評估NPU性能與計算的方式,TOPS仍是很好的性能指標,將在很長一段時間內(nèi)繼續(xù)作為重要參考。

隨著各種AI新技術(shù)在未來幾年受到關(guān)注并重新定義無數(shù)行業(yè),對能夠反應(yīng)不同技術(shù)獨特特征的可靠性能指標的需求將不斷凸顯。適應(yīng)性、可擴展性和實際應(yīng)用相關(guān)性將定義未來的NPU性能指標。

根據(jù)用戶需求評估NPU性能

應(yīng)對快速變化的NPU性能評估領(lǐng)域或許會讓人望而生畏,但隨著數(shù)字化轉(zhuǎn)型(尤其是在AI領(lǐng)域)持續(xù)快速發(fā)展,深入了解TOPS對行業(yè)和個人來說都很重要。

最終,選擇合適的系統(tǒng)級芯片(SoC)取決于用戶、客戶或組織的工作負載和優(yōu)先級,而這一決策很可能需要取決于SoC中的NPU。

無論用戶是優(yōu)先考慮原始算力、能效還是模型準確度,驍龍X系列平臺面向筆記本電腦,配備高達45TOPS的NPU,能夠強力賦能PC,并將實際可用的AI體驗引入用戶的工作流程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 高通
    +關(guān)注

    關(guān)注

    76

    文章

    7334

    瀏覽量

    189578
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28863

    瀏覽量

    266184
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    247

    瀏覽量

    18380

原文標題:AI TOPS和NPU性能指標指南

文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Lunar Lake:NPU性能全面提升,能耗也大幅降低,綜合AI算力提升至120TOPS

    英特爾CEO帕特·基辛格在COMPUTEX 2024上發(fā)表主題演講,正式公布了下一代面向AI PC的移動處理器Lunar Lake,不僅CPU、GPU、NPU性能全面提升,能耗也大幅降低,綜合
    的頭像 發(fā)表于 06-05 15:54 ?3490次閱讀
    Lunar Lake:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>全面提升,能耗也大幅降低,綜合<b class='flag-5'>AI</b>算力提升至120<b class='flag-5'>TOPS</b>

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    NPU性能第一梯隊。而此次推出的Ryzen AI 9 HX 375算力進一步提升至55 TOPS。在NPU算力這條路上AMD甚是積極。 ?
    的頭像 發(fā)表于 08-07 00:28 ?2857次閱讀
    刷新<b class='flag-5'>AI</b> PC <b class='flag-5'>NPU</b>算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 <b class='flag-5'>TOPS</b>

    BananaPi BPI-M2S 是新設(shè)計的一款單板計算機,采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持攝像頭和MIPI-CSI接口,HDMI輸出,2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲
    發(fā)表于 09-30 12:41

    BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲

    G52 MP4(6EE) GPU,NPU for AI 支持 5.0 TOPS算力,支持攝像頭和MIPI-CSI接口,HDMI輸出,2個全千兆接口。板載4G內(nèi)存和16gb eMMC存儲
    發(fā)表于 09-30 14:37

    基于RKNN程序開發(fā)和模型轉(zhuǎn)換的NPU簡要說明

    /16bit 運算,運算性能高達 3.0TOPS。相較于 GPU 作為 AI 運算單元的大型芯片方案,功耗不到 GPU 所需要的 1%??芍苯蛹虞d Caffe / Mxnet / TensorFlow 模型
    發(fā)表于 05-31 11:10

    AIO-3399ProC NPU開發(fā)相關(guān)資料推薦

    “USB3.0方式連接的NPU”,具體使用方法和注意事項請查看補丁注釋。注意:PCIE-NPU加速補丁默認沒有啟用,具體啟用方法和注意事項請查看補丁注釋。NPU特性支持 8bit/16bit 運算,運算
    發(fā)表于 07-01 17:38

    恩智浦最新的應(yīng)用處理器 i.MX 95采用專有NPU IP進行片上AI加速

    恩智浦最新的應(yīng)用處理器 i.MX 95 使用恩智浦專有的 NPU IP 進行片上 AI 加速,這與之前使用第三方 IP 的 i.MX 系列產(chǎn)品有所不同。實際上,越來越多的嵌入式處理器公司正在使用自己
    發(fā)表于 02-16 11:20

    瑞芯微首款AI芯片RK3399Pro:NPU性能達2.4TOPs!

    NPU性能達2.4TOPs! 首先在CES 2018年消費電子展前夜,瑞芯微就宣布,向全球正式推出旗下首款性能超強的AI處理器RK3399
    發(fā)表于 01-11 01:53 ?5136次閱讀
    瑞芯微首款<b class='flag-5'>AI</b>芯片RK3399Pro:<b class='flag-5'>NPU</b><b class='flag-5'>性能</b>達2.4<b class='flag-5'>TOPs</b>!

    TOPS 與現(xiàn)實世界的性能AI 加速器的基準性能

    蓬勃發(fā)展的機器學(xué)習(xí)和人工智能新興用例有望通過加速信息處理和提高決策準確性為行業(yè)創(chuàng)造重大價值。但機器學(xué)習(xí)模型是計算密集型、需要高頻和實時 AI 分析場景,這導(dǎo)致企業(yè)依賴于使用每秒萬億次操作 (TOPS
    的頭像 發(fā)表于 07-14 17:17 ?1718次閱讀

    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的AI開發(fā)板,NPU AI 支持 5.0 TOPS算力,

    BananaPi BPI-M2S 是香蕉派開源社區(qū)新設(shè)計的一款單板計算機,采用Amlogic A311D,NPU for AI 支持 5.0 TOPS算力,板載4G內(nèi)存和16gb eMMC存儲
    的頭像 發(fā)表于 08-22 16:00 ?920次閱讀
    BananaPi BPI-M2S 采用Amlogic A311D開發(fā)的<b class='flag-5'>AI</b>開發(fā)板,<b class='flag-5'>NPU</b> <b class='flag-5'>AI</b> 支持 5.0 <b class='flag-5'>TOPS</b>算力,

    npu是什么意思?npu芯片是什么意思?npu到底什么用?

    npu是什么意思?npu芯片是什么意思?npu到底什么用?? NPU的概念 NPU(Neura
    的頭像 發(fā)表于 08-27 17:03 ?4w次閱讀

    驍龍X Elite處理器在AI生成圖片性能超群,英特爾亦被超越

    高通公司稱,該款處理器內(nèi)置AI協(xié)處理器(NPU),性能達到驚人的45 TOPS(每秒萬億次運算)。視頻通過實例對比英特爾酷睿 Ultra 7同樣具有
    的頭像 發(fā)表于 02-28 14:09 ?560次閱讀

    AI PC市場爭霸:英特爾、AMD、高通芯片算力誰主沉???

    目前英特爾的Meteor Lake處理器NPU只能提供10 TOPS性能,沒有達到下一代AI PC的標準。而 Lunar Lake 的 NPU
    發(fā)表于 04-18 14:29 ?307次閱讀

    AI PC引發(fā)的NPU大戰(zhàn)?英特爾:僅30%開發(fā)者選擇NPU

    隨著COMPUTEX 2024的日益臨近,關(guān)于人工智能(AI)個人計算機(PC)的話題開始變得愈發(fā)熱門和受關(guān)注。據(jù)微軟公司近期發(fā)布的相關(guān)技術(shù)規(guī)范要求,所有運行Windows操作系統(tǒng)的AI PC必須配備本地運行Copilot的功能機制,并安裝容量至少為40
    的頭像 發(fā)表于 06-03 17:24 ?740次閱讀

    40+TOPS NPU,AI PC處理器開卷算力

    的人工智能任務(wù)。同時,微軟還提出,這款全新電腦搭配擁有全新神經(jīng)處理單元NPU的芯片,可實現(xiàn)每秒超過40萬億次即40+TOPS的運算。那么也就是說,若要符合微軟給出的AI PC的定義,NPU
    的頭像 發(fā)表于 07-14 01:11 ?3678次閱讀
    40+<b class='flag-5'>TOPS</b> <b class='flag-5'>NPU</b>,<b class='flag-5'>AI</b> PC處理器開卷算力