0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為移動AI芯片麒麟970的GPU技術(shù)創(chuàng)新

pmkA_arm_china ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-09-26 09:47 ? 次閱讀

今日,Arm生態(tài)系統(tǒng)合作伙伴華為于北京召開發(fā)布會,正式在國內(nèi)發(fā)布搭載10nm工藝制程的年度旗艦處理器麒麟970,同時也是全球首款內(nèi)置神經(jīng)元網(wǎng)絡單元(NPU)的智能芯片。

在核心配置方面,麒麟970采用了4*Cortex-A73+4*Cortex-A53的大小核設計,其中A73大核主頻為2.4GHz,A53小核主頻為1.8GHz。在GPU上,麒麟970為Mali-G72 MP12,在視頻方面首次支持HDR10,支持4K@60fps視頻解碼。相機雙ISP,支持人工智能場景識別、人臉追焦、智能運動場景檢測,夜拍效果得到加強。

作為Arm今年新發(fā)的高端GPU,Mali-G72已“裝機”麒麟970,它有哪些強大之處?它又是如何對人工智能與機器學習算法進行支持的呢?

機器學習與GPU技術(shù)的完美Match

人工智能的最近一次浪潮起源于 2011 年前后深度學習(Deep Learning)引起的大發(fā)展。在其背后,快速發(fā)展的 GPU 功不可沒。機器學習作為人工智能領(lǐng)域的一個小分支,如今已是移動計算的關(guān)鍵應用場景之一。通常而言,機器學習在云端上進行,運用訓練神經(jīng)網(wǎng)絡的大量數(shù)據(jù)集實現(xiàn)智能連接,但越來越多的數(shù)據(jù)也需要在設備端進行,比如像翻譯這樣的簡單任務,通過云端持續(xù)傳送大量數(shù)據(jù),不但增加成本,而且速度也很慢,這也是為何業(yè)界開始研究“將機器學習界面放到設備本身”的原因。

搭載了Mali-G71的華為Mate 9便是一次不錯的嘗試,它其中的機器學習算法會找出你最常用的應用程序,并對其能耗性能進行優(yōu)先設置,保證實現(xiàn)最優(yōu)性能,其中,基于Bifrost架構(gòu)的Mali-G71功不可沒,而Mali-G72性能則更優(yōu)。相比Mali-G71,Mali-G72性能提升了40%、能效提升25%、每平方毫米的芯片面積效能提升20%,并針對機器學習進行了優(yōu)化,為機器學習效率帶來17%的提升,從而使得Arm能夠在整個SoC上更高效地現(xiàn)實分布式智能。期待搭載Mali-G72的新機華為Mate 10的上市。

為何Mali-G72這么牛?除了繼續(xù)保持Bifrost架構(gòu)最主要的高效能特色外,像是CPU與GPU彼此間完整的系統(tǒng)一致性、索引式定位著色器等,Mali-G72同時還有多項新武器。Arm增加了區(qū)塊緩沖存儲器(tile buffer memory),以便讓GPU在每個運行區(qū)塊(tile)支持更多的儲存空間,也重新平衡了執(zhí)行引擎的數(shù)據(jù)路徑,移除某些鮮少使用的指令,并以更簡單的指令順序取而代之。同時,Arm針對更多復雜運算進行了優(yōu)化,為了進一步降低帶寬,增加了一級緩存與寫回緩存的大小,同時也改變指令緩存邏輯,以便在不增加整體面積與耗電情況下進行更佳利用,并減少對復雜內(nèi)容產(chǎn)生的緩存遺漏情況。綜上,Mali-G72算法優(yōu)化及增加的高速緩存已經(jīng)非常成熟,借由此大幅降低帶寬,可以實現(xiàn)機器學習最大的效率與效能。

Arm GPU架構(gòu)使用發(fā)展史

2007年Arm推出基于Utgard架構(gòu)的Mali-200,當時面向的設備分辨率較低,內(nèi)容比較簡單。Utgard架構(gòu)的特點是并非像現(xiàn)代GPU設計那樣采用了統(tǒng)一渲染引擎,它依舊是一個典型的頂點和像素分離式渲染的產(chǎn)物。

2010年末,Arm推出基于Midgard架構(gòu)構(gòu)建的首款GPU Mali-T604,面向的設備可達1080p HD的分辨率,內(nèi)容變得越來越復雜了。從架構(gòu)上來看,Midgard是之前Utgard的繼承者,但是統(tǒng)一渲染架構(gòu)和分離式渲染架構(gòu)的差異如此之大,使得這兩個架構(gòu)又不能直接比較。當然,Midgard還是繼承了不少Utgard中優(yōu)秀的部分,尤其是部分周圍功能模塊。

2016年,隨著內(nèi)容變得越來越精細,越來越復雜,在GPU渲染的角度來說會有更復雜光影的處理,包括全局光照的處理。從顯示面板的角度來看,未來4K的面板也會大量涌現(xiàn)。為滿足這樣的市場需求,Arm推出了基于嶄新GPU架構(gòu)Bifrost的產(chǎn)品。雖然Bifrost架構(gòu)看上去與Midgard類似,但其內(nèi)部的功能模塊均有顯著的提升,基于前面提到的各種各樣的應用場景,包括設備的需求,以及面對的挑戰(zhàn),Bifrost架構(gòu)都可以解決這樣的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128166
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266254
  • Huawei
    +關(guān)注

    關(guān)注

    1

    文章

    176

    瀏覽量

    20066

原文標題:揭秘華為首款移動AI芯片麒麟970背后的GPU技術(shù)創(chuàng)新

文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為
    發(fā)表于 09-02 10:09

    飛凌嵌入式技術(shù)創(chuàng)新日(深圳站)精彩回顧

    2024年8月26日下午,飛凌嵌入式技術(shù)創(chuàng)新日深圳站在深圳威尼斯英迪格酒店盛大舉行,此次活動匯聚了近200位嵌入式技術(shù)領(lǐng)域的專家和企業(yè)代表,共享嵌入式技術(shù)的盛宴,共創(chuàng)嵌入式技術(shù)的美好未
    發(fā)表于 08-28 09:06

    后摩智能與聯(lián)想集團簽署戰(zhàn)略協(xié)議 共同探索AI PC技術(shù)創(chuàng)新與應用

    ? 近日,后摩智能與聯(lián)想集團宣布簽署戰(zhàn)略合作協(xié)議,雙方將共同探索AI PC的技術(shù)創(chuàng)新與應用。根據(jù)協(xié)議約定,后摩智能將發(fā)揮其在存算一體AI芯片領(lǐng)域的創(chuàng)
    的頭像 發(fā)表于 07-31 17:24 ?742次閱讀

    湃??萍紖⒓?b class='flag-5'>華為云企業(yè)快成長技術(shù)創(chuàng)新峰會,推動企業(yè)數(shù)智化轉(zhuǎn)型

    4月20日,“釋放數(shù)智新動能·華為云企業(yè)快成長技術(shù)創(chuàng)新峰會”在上海成功舉辦。本屆峰會聚焦企業(yè)數(shù)智化創(chuàng)新技術(shù)、AI應用、數(shù)字人等議題,就如何輔助企業(yè)業(yè)務增長、護航數(shù)據(jù)安全展開討論。
    的頭像 發(fā)表于 04-23 09:47 ?672次閱讀

    愛立信與中國移動聯(lián)合榮獲“2024 GTI移動技術(shù)創(chuàng)新突破獎”

    在2024年世界移動通信大會期間,愛立信與中國移動攜手研發(fā)的多維度節(jié)能技術(shù),憑借其卓越的創(chuàng)新性和實際應用成果,榮獲了“2024 GTI 年度獲獎產(chǎn)品與方案—
    的頭像 發(fā)表于 03-06 09:31 ?732次閱讀

    紫光展銳5G IoT NTN衛(wèi)星通信SoC芯片V8821榮獲“移動技術(shù)創(chuàng)新突破獎”

    在2024年GTI國際產(chǎn)業(yè)大會的盛會上,紫光展銳的V8821芯片因其卓越的技術(shù)創(chuàng)新和行業(yè)領(lǐng)導地位,成功獲得了GTI頒發(fā)的“移動技術(shù)創(chuàng)新突破獎”。這是繼“中國芯”等國內(nèi)權(quán)威獎項后,該
    的頭像 發(fā)表于 03-03 15:37 ?891次閱讀

    高通第三代驍龍8榮獲GTI Awards移動技術(shù)創(chuàng)新突破獎

    名單正式揭曉,其中,高通技術(shù)公司最新旗艦移動平臺第三代驍龍8憑借其卓越的技術(shù)創(chuàng)新和領(lǐng)先的市場表現(xiàn),榮獲了GTI Awards移動技術(shù)創(chuàng)新突破
    的頭像 發(fā)表于 03-01 09:31 ?606次閱讀

    麒麟a2芯片哪里生產(chǎn)的 華為麒麟a2芯片功能介紹

    技術(shù)(星閃連接核心技術(shù))的音頻芯片——麒麟A2。麒麟A2芯片內(nèi)置先進的藍牙模組,傳輸帶寬能力得到
    的頭像 發(fā)表于 10-17 15:55 ?1129次閱讀

    麒麟a2芯片是什么芯片 華為麒麟a2芯片參數(shù)配置

    麒麟a2芯片是什么芯片 麒麟A2是華為旗下的音頻芯片。麒麟
    的頭像 發(fā)表于 10-17 15:49 ?2199次閱讀

    華為麒麟芯片a2啥時間發(fā)布 麒麟a2芯片架構(gòu)怎么樣

    華為麒麟芯片a2啥時間發(fā)布 華為麒麟芯片a2芯片是2
    的頭像 發(fā)表于 10-17 15:40 ?1450次閱讀

    a17芯片麒麟芯片哪個好?a17芯片和驍龍8gen3哪個好?

    芯片是蘋果公司最新推出的一款高性能芯片,采用了先進的5nm工藝制程。它在CPU、GPUAI性能方面都有顯著的提升,具備出色的處理能力和AI
    的頭像 發(fā)表于 10-16 16:44 ?2091次閱讀

    華為手機麒麟芯片有哪些型號?

    華為手機麒麟芯片有很多型號,主要包括以下幾款: 麒麟970:采用了臺積電10nm制程工藝,是華為
    的頭像 發(fā)表于 10-16 14:35 ?6661次閱讀

    麒麟a1芯片麒麟990的區(qū)別

    研發(fā)的新一代手機處理器,海思麒麟990處理器將會使用臺積電二代的7nm工藝制造。麒麟990處理器在整體性能表現(xiàn)上會比麒麟980提升10%左右。 2019年9月6日,華為發(fā)布
    的頭像 發(fā)表于 10-14 16:47 ?2680次閱讀

    華為麒麟a2芯片參數(shù)配置 麒麟a2芯片的應用場景有哪些

    華為麒麟a2芯片參數(shù)配置 麒麟A2是華為旗下的音頻芯片麒麟
    的頭像 發(fā)表于 10-08 10:05 ?2760次閱讀

    麒麟a2芯片工藝制程 麒麟a2芯片相當于高通驍龍芯片

    麒麟a2芯片和高通驍龍芯片在多個方面存在顯著差異。在綜合性能、GPU性能、AI性能和基帶等方面,兩者之間都存在一定的差距。  
    的頭像 發(fā)表于 09-28 15:43 ?1820次閱讀