0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

以NPU為首的AI芯片們,還有很長的路要走

ss ? 來源:鎂客maker網(wǎng) ? 作者:家衡 ? 2020-11-06 14:21 ? 次閱讀

作為AI芯片的典型,目前華為、蘋果等廠商都開始在NPU上發(fā)力。除此以外,開發(fā)者也在努力推進著手機端AI應(yīng)用的發(fā)展。

NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理器),一直都是華為發(fā)布會上的熱門詞匯,這次的麒麟9000同樣將NPU標記在芯片結(jié)構(gòu)圖的C位。而庫克在介紹最先進的A14處理器時,也著重提到了NPU。

早在2013年,高通公司就提出了“Zeroth”處理器的概念,這款處理器可以模仿類似人腦的認知能力,并實現(xiàn)自我學習的功能。

在高通的設(shè)想中,Zeroth的終極目標就是形成標準化的新型處理架構(gòu),并且第一次提出了NPU的概念,這種芯片已經(jīng)具備了AI芯片的雛形。

2017年,華為海思推出了麒麟970,這款芯片首次內(nèi)置了獨立NPU。

在此之后,幾乎所有的手機廠商都將AI作為新的亮點,一顆SoC芯片如果沒有足夠的AI算力,似乎都不能被拿到臺面上介紹。

如今距離提出NPU的概念已經(jīng)過去了七年,AI芯片在手機端的發(fā)展似乎并不如人意。

如何理解NPU

傳統(tǒng)CPU進行累加計算時,效率非常低,但當GPU做類似的計算,效率就會高很多。同樣的道理,GPU主要被用來進行圖像處理,并沒有針對神經(jīng)網(wǎng)絡(luò)計算進行特殊優(yōu)化,這時候使用專業(yè)針對神經(jīng)網(wǎng)絡(luò)計算的NPU,就可以大大提高計算效率并減少功耗。

假設(shè)我們面前有一條沒有橋的河,我們應(yīng)當如何過河?這時候大腦就會涌出各種想法并且比較各種方法的優(yōu)劣。

NPU的工作就類比大腦,在手機中模擬所有可行的方案,并從中挑選一個最優(yōu)解。有了NPU之后,手機的AI性能就能得到大幅的提升。

從麒麟970的單核NPU、到最新的麒麟9000的2+1三核NPU,NPU的升級也伴著華為的AI技術(shù)的發(fā)展,最能直觀體會到的就攝像功能帶來的進步。

比如取景時的智能場景識別功能,可以讓系統(tǒng)快速識別拍攝的物體和場景,并自動做出優(yōu)化調(diào)教。再比如被廣大消費者驚嘆的“月亮模式”,以及強大的智能防抖功能,再包括最新的物體識別。

這些功能都是通過NPU來彌補華為手機在CMOS尺寸以及ISP(圖像信號處理)上與其他廠商的差距。

在麒麟970推出之后,AI功能逐漸拓展,從手持超級夜景到語音助手、節(jié)能優(yōu)化、智慧識別、識圖翻譯......越來越多的應(yīng)用場景都開始運用AI加速運算,這些都得益于NPU的支持。

硬件層面,NPU可以代替CPU進行處理,讓SoC具備了更強的本地AI運算能力(類似于“硬解”)。相比較CPU的“軟解”,“硬解”效率更高、速度更快、功耗也更低。

但即便NPU功能十分強大,如今NPU在手機日常的應(yīng)用領(lǐng)域還處于初級階段,它的重要性還遠不如CPU、GPU和ISP,屬于錦上添花的存在。

例如高通驍龍AI Engine引擎之中就沒有獨立的NPU單元,而聯(lián)發(fā)科在Helio P60/P90引入的NeuroPilot AI技術(shù)最早也是通過多個單元協(xié)同計算(APU+CPU+GPU)。

AI芯片只是第一步

有了AI芯片的支持,或許能增強手機AI能力,但目前的AI芯片卻不能很好地適配所有的軟件。

比如,很多直播APP都有實時美顏功能,可以利用降噪、顏色空間轉(zhuǎn)換實現(xiàn)磨皮、濾鏡等基礎(chǔ)功能,但使用不同的軟件可能會造成耗電量過高的異常,這就是軟件層面的不適配。

從整個市場上來看,目前AI芯片還處于算法主導到產(chǎn)品主導的過渡期,由于各家AI芯片的設(shè)計不同,AI方案架構(gòu)方面都有不小區(qū)別,像寒武紀的“DIANNAO”、谷歌的TPU,再到華為的達芬奇架構(gòu),目前AI芯片的設(shè)計可謂百花齊放。除此以外,還有單一針對卷積神經(jīng)網(wǎng)絡(luò)的ASIC加速器,以及支持簡單編程的通用型AI芯片。

這些種類繁多的AI芯片,推動了AI技術(shù)在手機端的普及,但不可避免會帶來一些問題。

AI應(yīng)用需要開發(fā)者的努力

雖然各家的AI芯片都開始集成獨立的神經(jīng)網(wǎng)絡(luò)處理單元,但是在設(shè)計上有很大不同,這意味著在運行機器學習應(yīng)用方面,幾家AI芯片在性能和能耗上有很大差別。因此,第三方開發(fā)者是否針對幾家的芯片設(shè)計進行優(yōu)化,或只支持某一種設(shè)計,會對系統(tǒng)性能產(chǎn)生重大影響。

目前,大多數(shù)移動AI芯片在機器學習方面做了較為普適性的優(yōu)化,而對一些特定的計算方式則沒有進行太多優(yōu)化。

就算開發(fā)者開發(fā)出同一款A(yù)I應(yīng)用,其兼容性可能會存在很多問題。當AI應(yīng)用的開發(fā)進入到實際的應(yīng)用和業(yè)務(wù)層面,開發(fā)者面臨著標準不同、API配適、軟件優(yōu)化等很多的難題。也就導致開發(fā)者必須針對不同廠商的設(shè)備進行逐個優(yōu)化。加之安卓生態(tài)比較混亂,移動AI開發(fā)者很可能受到更多阻礙。

就拿之前提到獲得AI技術(shù)加持的照相功能來講,除了在畫面上的提升,還是有很多人都會吐槽華為手機存在過分美顏、過度銳化、顏色失真等問題,但這些問題在iPhone上就很少被提及。

一直以來,蘋果在照片成像上的AI技術(shù)都調(diào)教的恰到好處,不論是自帶相機還是第三方相機,“拍照真實”也成為iPhone的賣點之一,很多專業(yè)攝影師已經(jīng)選擇將iPhone作為便攜街拍設(shè)備。相比而言,“傻瓜式”的安卓手機更偏向攝影小白。

不過隨著安卓手機廠商和應(yīng)用開發(fā)者不斷對系統(tǒng)以及APP進行優(yōu)化,現(xiàn)在的安卓手機拍照也變得更加智能。

所以,AI芯片只是提供了手機AI應(yīng)用的基石,真正要挖掘出移動端AI的魅力,還需要開發(fā)者針對AI芯片的能力開發(fā)出合適的應(yīng)用。

結(jié)語

目前,以AI芯片為基礎(chǔ)打造一個AI應(yīng)用生態(tài)圈的愿望真的十分美好,但這個過程還有很長的路要走。硬件走在了前面,軟件也要跟得上。

在未來,NPU或許也會像當年FPU之于CPU一樣,成為移動Soc芯片的標準?;蛟S在未來我們能在智能手機上體會到更棒的AI應(yīng)用。

至少在現(xiàn)在,以NPU為首的AI芯片們,還有很長的路要走。

責任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    215

    文章

    34126

    瀏覽量

    249452
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24166

    瀏覽量

    194170
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266215
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    247

    瀏覽量

    18382
收藏 人收藏

    評論

    相關(guān)推薦

    40+TOPS NPU,AI PC處理器開卷算力

    的人工智能任務(wù)。同時,微軟還提出,這款全新電腦搭配擁有全新神經(jīng)處理單元NPU芯片,可實現(xiàn)每秒超過40萬億次即40+TOPS的運算。那么也就是說,若要符合微軟給出的AI PC的定義,NPU
    的頭像 發(fā)表于 07-14 01:11 ?3734次閱讀
    40+TOPS <b class='flag-5'>NPU</b>,<b class='flag-5'>AI</b> PC處理器開卷算力

    【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為AI
    發(fā)表于 09-02 10:09

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)最近AMD官網(wǎng)上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理器。原本Ryzen AI 9 HX 370的NPU達到了50 TOPS,
    的頭像 發(fā)表于 08-07 00:28 ?2865次閱讀
    刷新<b class='flag-5'>AI</b> PC <b class='flag-5'>NPU</b>算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 TOPS

    AI PC引發(fā)的NPU大戰(zhàn)?英特爾:僅30%開發(fā)者選擇NPU

    隨著COMPUTEX 2024的日益臨近,關(guān)于人工智能(AI)個人計算機(PC)的話題開始變得愈發(fā)熱門和受關(guān)注。據(jù)微軟公司近期發(fā)布的相關(guān)技術(shù)規(guī)范要求,所有運行Windows操作系統(tǒng)的AI PC必須配備本地運行Copilot的功能機制,并安裝容量至少為40 TOPS的神經(jīng)網(wǎng)
    的頭像 發(fā)表于 06-03 17:24 ?740次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    實測NPU“空轉(zhuǎn)”,AI PC首個落地應(yīng)用只調(diào)用GPU?

    AI PC的一大特征是在傳統(tǒng)PC的CPU+GPU基礎(chǔ)上,增加NPU加強AI 算力。不過有意思的是,最近某品牌PC機型上的AI助手率先落地,支持云端和本地運算兩種模式,確實能夠完成宣傳上
    的頭像 發(fā)表于 05-22 00:16 ?2917次閱讀

    NPU是什么?為何它是開啟終端側(cè)生成式AI的關(guān)鍵?

    生成式AI變革已經(jīng)到來。隨著生成式AI用例需求在有著多樣化要求和計算需求的垂直領(lǐng)域不斷增加,我們顯然需要專為AI定制設(shè)計的全新計算架構(gòu)。這首先需要一個面向生成式AI全新設(shè)計的神經(jīng)網(wǎng)絡(luò)處
    的頭像 發(fā)表于 03-07 11:25 ?1888次閱讀
    <b class='flag-5'>NPU</b>是什么?為何它是開啟終端側(cè)生成式<b class='flag-5'>AI</b>的關(guān)鍵?

    采用芯原NPU IP的人工智能(AI)類芯片已在全球出貨超過1億顆

    2024年2月29日,中國上海——芯原股份(芯原,股票代碼:688521.SH)今日宣布集成了芯原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片已在全球范圍內(nèi)出貨超過1億顆
    的頭像 發(fā)表于 03-06 17:10 ?541次閱讀

    高通NPU和異構(gòu)計算提升生成式AI性能?

    異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負擔,需要配備不同的處理器,如專注于AI工作負載的定制設(shè)計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?575次閱讀

    采用芯原NPU IP的AI芯片已在全球出貨超過1億顆

    芯原股份發(fā)布重要消息,其集成了芯原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片,已在全球范圍內(nèi)出貨超過1億顆。這一里程碑式的成就標志著芯原在AI領(lǐng)域的持續(xù)領(lǐng)先和創(chuàng)新。
    的頭像 發(fā)表于 03-06 10:54 ?682次閱讀

    采用芯原NPU IP的AI芯片已在全球出貨超過1億顆

    芯原股份(芯原,股票代碼:688521.SH)今日宣布集成了芯原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片已在全球范圍內(nèi)出貨超過1億顆,主要應(yīng)用于物聯(lián)網(wǎng)、可穿戴設(shè)備、智慧電視、智慧家居、安
    的頭像 發(fā)表于 02-29 10:26 ?333次閱讀

    OpenAI表示Sora還有很長要走

    近日,OpenAI發(fā)布的Sora視頻生成器在技術(shù)圈內(nèi)引起了廣泛關(guān)注。盡管其初步展示的效果令人印象深刻,但該工具目前仍處在研究階段,距離實際應(yīng)用還有相當?shù)木嚯x。
    的頭像 發(fā)表于 02-27 17:38 ?604次閱讀

    微軟畫圖即將支持NPU,Windows內(nèi)置應(yīng)用AI功能持續(xù)優(yōu)化

    神經(jīng)網(wǎng)絡(luò)處理單元(NPU),作為一款Win11筆記本上的專屬硬件組件,主要承擔AI及機器學習任務(wù)處置。相較于云服務(wù)或通CPU,NPU能有效提升本地設(shè)備的AI任務(wù)處理能力。
    的頭像 發(fā)表于 02-26 13:51 ?517次閱讀

    簡單三步在Windows上調(diào)用低功耗NPU部署AI模型

    相信很多小伙伴都已經(jīng)知道,在最新一代的英特爾 酷睿 Ultra 移動端處理中已經(jīng)集成了被稱為 NPU 的神經(jīng)網(wǎng)絡(luò)加速處理器,提供低功耗的 AI 算力,特別適合于 PC 端需要長時間穩(wěn)定運行的
    的頭像 發(fā)表于 02-22 17:17 ?2558次閱讀
    簡單三步在Windows上調(diào)用低功耗<b class='flag-5'>NPU</b>部署<b class='flag-5'>AI</b>模型

    Arm最強處理器架構(gòu)技術(shù)解析

    V2 芯片的架構(gòu)調(diào)整很微妙,但顯然很有效。但同樣明顯的是,13% 的性能提升距離 Arm 早在 2019 年設(shè)定的每時鐘指令數(shù) (IPC) 30% 的提升目標還有很長
    的頭像 發(fā)表于 09-29 06:44 ?850次閱讀
    Arm最強處理器架構(gòu)技術(shù)解析