0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

麒麟980性能大揭秘 濃縮的都是精品

傳感器技術 ? 來源:feiyan ? 2018-12-09 10:55 ? 次閱讀

不久前外媒ChipRebel剛剛發(fā)布了華為Mate 20手機拆解,并公布了麒麟980處理器的透視照片,讓我們有了一窺這款讓華為表示“穩(wěn)了”的處理器,并首次看到Arm全新Cortex A76 CPU和全新Mali G76 GPU的真容。

高通三星在2016年下半年發(fā)布驍龍835和Exynos 8895這兩款使用10nm LPE工藝的產品時,麒麟960卻只能選擇臺積電16nm FFC工藝,這種劣勢顯著的體現(xiàn)在芯片的能耗比方面。

麒麟970雖然縮小了制造工藝方面的差距,但由于其設計周期較早,錯過了Arm當時最新的Cortex A75架構,只能基于Cortex A73架構設計,而推出較晚的驍龍845則全面基于Cortex A75和Cortex A55設計。

在這次的麒麟980,華為終于再次集齊了最先進的制造工藝和最新的架構設計,從這方面來看,麒麟980背負著比麒麟970和麒麟960更大的期望和歷史任務,有望復制甚至超越幾年前麒麟950的成功。

濃縮的都是精品

雖然華為在此前公布麒麟980時表示其核心面積小于100mm2,但實際上麒麟980的硅片尺寸要比官宣還有要小得多,僅為74.13mm2。在CPU、GPU、NPU及內存等全面升級的情況下,麒麟980相比去年麒麟970的96.72mm2小了30%,可說是相當驚人了。

芯片的左上角是全新的Mali G76 MP10 GPU集群,雷鋒網曾介紹過,Mali G76達到Mali G72翻倍的性能只需132%的芯片面積,理論上單位面積性能提升了50%。華為將麒麟980的GPU面積維持在了11.97mm2,僅稍大于驍龍845中Adreno 630的10.69mm2,遠小于Exynos 9810 Mali G72 MP18的24.53mm2和蘋果A12 GPU的14.88mm2。

GPU模塊右側是CPU模塊,Cortex A76架構在核心尺寸方面仍然非常小巧,配備512KB L2緩存時的單核面積僅為1.26mm2,同樣遠小于三星自研Exynos M3“貓鼬”架構核心的3.5mm2,甚至比不含L2緩存的蘋果A12的Vortex架構核心(2.07mm2)還要小。

此次華為充分利用了Arm的新DSU集群及異步CPU配置,將麒麟980中Cortex A76架構的高性能CPU集群細分為兩組,高頻率的一組運行在2.6GHz頻率上,另一組Cortex A76 CPU的運行頻率為1.92GHz(這應該是一個很好的能效比平衡點),各自運行在不同的頻率和電壓上,可根據不同使用場景靈活調用,有效提升實際使用時的能效比。

緩存方面,所有Cortex A76都帶有推薦的512KB L2緩存配置,而Cortex A55則采用128KB緩存。在雷鋒網此前分析Cortex A76的文章中曾提到過,在最新的DynamIQ群集配置中,L2緩存是每個CPU核心獨占的。DSU中的L3緩存則為4MB共享式設計,容量為驍龍845和麒麟970的兩倍。

改進的內存延遲

SoC的存儲子系統(tǒng)對其性能表現(xiàn)至關重要,麒麟970便在這方面吃了一些虧,它在高頻率下運行時似乎有些問題,這使得華為不得不在默認情況下選擇降低其設備的頻率,導致了一些性能下降,尤其是在對內存延遲敏感的工作負載中。

與麒麟970相比,麒麟980的內存延遲得到了顯著改善。測試中使用的是完全隨機延遲,包括TLB未命中等在內的所有可能的懲罰,但是這仍然是一個重要的性能指標。

Cortex A76架構的獨占L2緩存延遲非常出色,只有4ns,不到麒麟970中Cortex A73共享L2緩存延遲的一半。而4MB共享L3緩存確實與CPU核心異步運行,在測試中可以看到明顯的延遲懲罰,但仍然在合理范圍內。

對比安卓陣營的幾款SoC,麒麟980的L3緩存看起來略慢于驍龍845,可能是由于華為略微降低了L3緩存的運行頻率;Exynos 9810的緩存延遲最大,雖然在內存延遲方面略有優(yōu)勢,但這是以很大的功耗代價沖擊高頻率換來的,當核心運行在合理的頻率上時,Exynos 9810的優(yōu)勢會喪失殆盡。

(PS:蘋果A12處理器在緩存和內存延遲方面都遙遙領先,在所有指標和深度上都展示了巨大的優(yōu)勢,讓安卓陣營的所有SoC都相形見絀。)

CPU性能和能耗比

華為在發(fā)布會上表示,麒麟980相比麒麟970可獲得75%的性能提升,能耗比則比麒麟970提高58%。演講中的PPT腳注顯示其能效數(shù)據基于Dhrystone,而Dhrystone非常專注于考驗CPU核心,相對在內存等其他方面不會給SoC帶來太大的壓力。

現(xiàn)在,使用麒麟980的Mate 20、Mate 20 Pro及Magic 2均已上市,SPECint2006和SPECfp2006的測試成績比華為的官宣更能體現(xiàn)這款處理器的真實性能水平。

下圖顯示了完成測試中的電能消耗量及平均功耗,左邊的條形表示消耗的能量,以J(焦耳)為單位,條形越短代表耗能越少,相應的平臺的效率越高;右邊的條代表性能分數(shù),條形越長代表性能越強。

測試成績出人意料,麒麟980的SPEC2006性能達到了麒麟970的2倍,甚至超過了此前基于Arm Cortex A76架構的預測。CPU的能耗比則相比麒麟970只提升了28%,全新Cortex A76架構和麒麟980的內存子系統(tǒng)耗電量更大,SPECint測試中平均達到2.14W,SPECfp測試中達到2.65W,比麒麟970的1.38W和1.72W有顯著增加。

從這方面來看,Arm的新架構是在以線性的方式提升功耗和性能,包括驍龍845的Cortex A75。當然,只要控制好性能和功耗的關系,這樣的提升方式并不能說是消極的。麒麟980的CPU性能是蘋果A12的57%~62%,功耗是蘋果A12的59%~62%,二者處理相同任務消耗的能量基本相同,這有什么不對的呢?

相比之下,Exynos 9810是個典型的反例,在沖擊高頻時付出了極大的功耗代價,卻沒有表現(xiàn)出與之相匹配的性能提升,能效比極差。

在SPECint2006測試中,麒麟980或者說Cortex A76同樣在各方面都表現(xiàn)出了相當均衡的性能,在403.gcc測試項中的成績相比麒麟970提高了2.67倍。而456.hmmer和464.h264ref是SPECint2006測試中兩個最強的后端綁定測試中,Cortex A76也展示了與其時鐘頻率及亂序4發(fā)射前端相符的分數(shù)。在這一測試中,驍龍845的內存延遲表現(xiàn)不太好,因為它的L4系統(tǒng)緩存塊在規(guī)格上確實有一點缺陷。

在SPECfp2006的結果中,麒麟980同樣展現(xiàn)出了大幅度的進步。總而言之,麒麟980在所有測試中都有著全面改進,在性能和能耗方面的表現(xiàn)都非常出色。麒麟980以及Arm的Cortex A76都兌現(xiàn)了他們的承諾,甚至超過了此前人們根據官方消息所做的預測。

當然,麒麟980的絕對性能還無法與蘋果的A12相比,而且這種情況很可能在接下來的幾代中不會發(fā)生太大變化,至少在安卓陣營的這些SoC廠商設計出更好、更健壯的內存子系統(tǒng)之前都會是這樣。

GPU性能和能耗比

GPU的性能和能耗比一直是麒麟960和麒麟970的一大痛點,而麒麟980是世界上第一款使用了Arm全新Mali G76 GPU的SoC,華為表示麒麟980的GPU性能相比麒麟970提升46%,能耗比則大幅提升178%。

在3DMark Sling Shot Extreme Unlimited的圖形測試中,Mate 20和Mate 20 Pro都展現(xiàn)出了可觀的峰值性能值,與麒麟970相比提升相當顯著,但在達到熱平衡之前仍然有較大的波動。

在GFXBench測試最新的Aztec Ruins Vulkan場景中,高質量模式下,Mate 20和Mate 20 Pro的性能表現(xiàn)在安卓陣營里獨樹一幟:峰值性能并不是特別高,但持續(xù)性能幾乎與峰值性能相同。而在普通質量模式下,Mate 20 Pro則表現(xiàn)出比Mate 20更高的持續(xù)性能。

在GFXBench測試的曼哈頓3.1場景中,麒麟980的峰值性能和持續(xù)性能也均有可觀的提升。與Aztec Ruins Vulkan場景相比,Mate 20和Mate 20 Pro在曼哈頓3.1場景中的峰值性能和持續(xù)性能表現(xiàn)出了正常的差異,性能與大多數(shù)驍龍845設備相當。

遺憾的是,麒麟980的性能表現(xiàn)和此前的預測非常吻合,但能耗比與預測相差較大,功耗要比此前預測的3.5瓦高出1W,最終麒麟980的能耗比相比麒麟970提高了100%,仍然是相當大的代際改進。外媒Anandtech表示,此前華為官宣的178%能耗比提升,可能是指麒麟980在與麒麟970相同的性能時的比較。

而在T-Rex測試場景中,麒麟980相比麒麟970的峰值性能提升幅度要小得多,在Mate 20 Pro上的持續(xù)性能只提升了50%。但T-Rex測試場景已經比較老舊,在現(xiàn)代SoC上的幀速率普遍非常高,通常可達到一二百幀,因此在許多方面都會受到制約,很難搞清楚瓶頸究竟在哪里,參考價值遠不如更加現(xiàn)代的曼哈頓3.1和Aztec Ruins Vulkan測試場景。

第二代NPU

在去年1月測試麒麟970的NPU性能時,可選的測試軟件只有魯大師的AI測試,但它不支持華為的HiAI API,相關運算均依靠CPU實現(xiàn)進行處理。不幸的是,到了麒麟980和Mate 20上依然如此。

“AI-Benchmark”是由瑞士ETH蘇黎世計算機視覺實驗室的Andrey Ignatov開發(fā)的新基準測試程序,也是第一個廣泛使用Android 8.1新NNAPI,而不依賴于每個SoC供應商自己的SDK工具和API的基準測試程序。AI-Benchmark應該能夠更好地準確地表示從使用NNAPI的應用程序所預期的最終NN性能。

需要記住的一點是,NNAPI不僅僅是一些能夠在NPU上運行神經網絡模型的通用轉換層,而且API和SoC供應商的底層驅動程序必須能夠支持公開的函數(shù),并且能夠在IP塊上運行它。這里的區(qū)別在于,使用NNAPI尚未支持的特性(必須退回到CPU上運算)的模型和能夠硬件加速并對量化的INT8或FP16數(shù)據進行操作的模型。還有一些模型依賴于FP32數(shù)據,這里同樣依賴于底層驅動程序,它可以在CPU上運行,也可以在GPU上運行。

前三個CPU測試項使用了NNAPI尚未支持的函數(shù)的模型,影響性能的僅僅是CPU性能以及性能響應時間,這意味著DVFS和調度器響應等機制可能對結果產生巨大影響,比如Galaxy S9上的表現(xiàn)就要明顯優(yōu)于同為Exynos 9810處理器的Note9。

盡管如此,將麒麟970與麒麟980進行對比,依然展示了Cortex A76強大的性能,以及華為的DVFS/調度器方面可能的改進。

接下來的測試項基于8位整數(shù)量化的NN模型。不幸的是,華為手機的NNAPI驅動程序似乎仍未提供硬件加速,這些測試沒有使用麒麟處理器上的NPU,測試結果展示的依然是CPU性能,華為表示計劃在未來版本的驅動中修正這個問題。

在使用驍龍845的設備中,一加6和Pixel 3在性能上遙遙領先,甚至相比同為驍龍845的Galaxy S9+也是如此,原因是這兩款手機都使用了高通公司最新更新的NNAPI驅動程序,該驅動程序與Android 9/P BSP一起發(fā)布,可通過HVX DSP加速NN應用。

接下來的FP16測試項終于啟用了麒麟處理器的NPU,并且在新老兩代處理器上都取得了領先的成績。在這里麒麟980的雙核NPU終于得以體現(xiàn),Mate 20展現(xiàn)出了碾壓性的巨大領先優(yōu)勢。不過一加6似乎在其NNAPI驅動程序中出現(xiàn)了一些非常奇怪的問題,使得它的性能比其他平臺差一個數(shù)量級,不知道這項測試是跑在了其CPU上還是GPU上。

而在最后的FP32測試項中,大多數(shù)手機都再次回到CPU上進行運算,麒麟980的改進有限。

總體而言,AI-Benchmark至少驗證了華為對NPU性能的宣傳并非虛言,不過從這些測試結果中得出的真正結論是,大多數(shù)具有NNAPI驅動程序的設備目前本身尚不成熟且功能仍然非常有限,與蘋果如今的CoreML生態(tài)系統(tǒng)相比相差甚遠。

總結

麒麟980的CPU性能表現(xiàn)應該在很大程度上可以代表下一代驍龍8150的情況,高通或許會在CPU頻率上稍稍提升一些,但最大的問題在于內存子系統(tǒng)方面,高通能不能解決L4系統(tǒng)緩存引入的延遲懲罰問題。

而Cortex A76對于三星來說就實在是太可怕了,如果Exynos 9820所用的Exynos M4架構只是一次常規(guī)迭代,說實話在Cortex A76面前是沒什么競爭力的。三星需要在性能和能耗比兩個方面均作出重大改進,才能與麒麟980相匹敵。

GPU方面,能耗比方面與此前的預測存在差距,這恐怕不能直接甩鍋給華為的芯片設計,因為Arm玩GPU確實比從桌面端過來的Imagination和高通(GPU團隊來自ATI)差得遠。

雖然三星Exynos SoC的GPU能耗比要好于麒麟SoC,Exynos 9810的能耗比甚至非常接近于驍龍845,但這是三星犧牲了相當大的芯片面積來堆砌GPU核心數(shù)換來的。雷鋒網經過思考和對比后認為,華為之所以選擇“少核高頻”的策略,很可能是為了在有限的空間內給NPU騰地方不得已而為之。

Exynos 9810的GPU面積很大(24.53mm2),使其可以將頻率壓低到只有560MHz左右,以此換來了尚可的功耗表現(xiàn)。之所以這樣操作,是因為三星有自己的半導體工廠,且Exynos 9810既沒有集成NPU,也不是麒麟970這樣動輒出貨量三五千萬的走量主力產品,更多的是作為一款產品象征性地存在,最終才能以118.94mm2這樣一個屬于平板級的巨大芯片面積問世。

根據不久前公布的消息,三星下一代集成NPU的Exynos 9820也只采用了Mali G76 MP12的配置,遠不如以前動輒MP18或MP20那么豪邁了,自然頻率也不可能像此前一樣低至560MHz左右,很可能達到與麒麟980相仿或更高的水平,具體參數(shù)以及實際表現(xiàn)如何,只有等Exynos 9820的具體參數(shù)和測試成績公布后才能得知了。

移動SoC帶上NPU越來越成為廠商的趨勢,未來隨著越來越多的app開始使用到它,擁有先發(fā)優(yōu)勢華為將可把它轉化成更大的市場優(yōu)勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 麒麟950
    +關注

    關注

    0

    文章

    51

    瀏覽量

    8709
  • 麒麟970
    +關注

    關注

    10

    文章

    264

    瀏覽量

    63158
  • 麒麟980
    +關注

    關注

    5

    文章

    399

    瀏覽量

    22180
  • 華為Mate20
    +關注

    關注

    1

    文章

    43

    瀏覽量

    5616

原文標題:麒麟980性能表現(xiàn)大起底:既有情理之中,又有意料之外

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高通驍龍7nm芯片單核性能暴增50%!麒麟980遭遇勁敵

    集微網消息,前幾天華為在IFA2018上發(fā)布了號稱有六項世界第一的麒麟980,在現(xiàn)場華為官方特地做了一張麒麟980在CPU性能與功耗、AI計
    的頭像 發(fā)表于 09-05 11:34 ?5391次閱讀

    麒麟980/麒麟970/麒麟960處理器怎么樣

    麒麟980/麒麟970/麒麟960處理器怎么樣?有什么區(qū)別?有什么差距?
    發(fā)表于 10-20 07:56

    麒麟980怎么樣?驍龍845如何為手機輸出強大性能

    麒麟980發(fā)布在即,而驍龍845的繼任者將在今年四季度發(fā)布。麒麟處理器新品一般在三季度發(fā)布,而驍龍則是年末,二者有一代左右的代差。所以雖然麒麟980
    發(fā)表于 08-30 14:19 ?1109次閱讀

    麒麟980跑分性能強大 驍龍855能否一戰(zhàn)

    林利集團的報告用自家的驍龍845懟了華為麒麟970,這次華為在發(fā)布會現(xiàn)場毫不客氣地對比了驍龍845,擁有代差優(yōu)勢的麒麟980在CPU、GPU、AI等性能以及能效上毫無疑問碾壓了驍龍84
    發(fā)表于 09-02 10:43 ?1.1w次閱讀

    麒麟980更早面世 驍龍845為手機提供澎湃性能

    發(fā)布近9個月的時間,但即便如此驍龍845的實力依然十分強勁,正在為魅族、vivo、黑鯊等眾多手機廠商的旗艦手機提供澎湃的性能支持。 驍龍845雖然比麒麟980上市時間更早,但驍龍845是如何將強大的參數(shù)如何轉化成實際體驗的呢?要
    發(fā)表于 09-12 06:53 ?933次閱讀

    華為麒麟980,性能追平驍龍855媲美蘋果A12

    如圖,麒麟980單核成績?yōu)?360分,接近驍龍855的3400分,蘋果A12的單核成績依然無敵,高達4800分;麒麟980的多核成績?yōu)?1000分,蘋果A12和驍龍855為11500分
    發(fā)表于 09-17 16:09 ?3559次閱讀

    麒麟980與驍龍845玩游戲如何?小米8吃雞滿幀馳騁

    麒麟980與驍龍845作為手機系統(tǒng)級芯片,對手機游戲的性能關系密切。麒麟980與驍龍845的產品定位不同,相比
    發(fā)表于 11-13 17:00 ?613次閱讀

    揭秘華為麒麟980芯片內核照

    麒麟980的內核面積只有74.13平方毫米,不但大大小于官方給出的范圍,也比麒麟970 96.72平方毫米小了足足30%,可見臺積電7nm實在給力。
    的頭像 發(fā)表于 11-11 11:19 ?6520次閱讀

    麒麟980和驍龍845差距

    麒麟980和驍龍845處理都是安卓陣營里面頂級的處理器,本身都是非常優(yōu)秀的。相較于蘋果的A系列處理器而言,性能上各有千秋;只不過由于蘋果的A
    的頭像 發(fā)表于 03-20 15:06 ?1.9w次閱讀

    麒麟980怎么樣

    近些年來華為麒麟處理器風頭正盛,從麒麟970開始已經成為最受關注的高端處理器產品,雖然在性能上,它和同時代的驍龍或者三星Exynos相比還有一定差距,但憑借優(yōu)秀的整體性能,已經超越了聯(lián)
    的頭像 發(fā)表于 03-20 15:10 ?1.2w次閱讀

    麒麟980性能到底怎么樣

    2018年8月31日,華為正式發(fā)布了全新一代自研手機SoC麒麟980,這款號稱六項全球第一的芯片,隨著華為Mate 20系列、榮耀Magic 2相繼搭載上市,它的強勁性能、出色能效比、卓越智慧、頂尖通信能力,以及為手機用戶帶來的
    的頭像 發(fā)表于 03-28 09:40 ?7w次閱讀

    驍龍855和麒麟980哪個性能最好

    Hello大家好,我們在之前的視頻中測試過榮耀V20的游戲性能,當時是跟一些驍龍845機型對比,綜合游戲性能和發(fā)熱控制,麒麟980和驍龍845各有勝負,差距不大?,F(xiàn)在搭載驍龍855的手
    的頭像 發(fā)表于 03-26 11:38 ?19w次閱讀
    驍龍855和<b class='flag-5'>麒麟</b><b class='flag-5'>980</b>哪個<b class='flag-5'>性能</b>最好

    華為麒麟970和麒麟980的區(qū)別

    華為發(fā)布了新一代麒麟980處理器,開創(chuàng)了六個世界第一,也是目前最強國產處理器,綜合性能在高通驍龍845之上。麒麟980作為我們熟知的
    的頭像 發(fā)表于 05-28 15:49 ?2.7w次閱讀
    華為<b class='flag-5'>麒麟</b>970和<b class='flag-5'>麒麟</b><b class='flag-5'>980</b>的區(qū)別

    華為的麒麟980麒麟985芯片分別有什么特點

    近日,有媒體報道,華為已完成麒麟985的設計和制造工作,即將推出,從麒麟980麒麟985,華為的芯片研發(fā)真的很順
    的頭像 發(fā)表于 03-30 09:46 ?1.5w次閱讀

    麒麟820和980哪個性能好?

    麒麟820和980哪個性能好?? 近年來,手機市場呈現(xiàn)出多元化發(fā)展趨勢,各大廠商紛紛推出新的芯片方案,而華為的麒麟820和麒麟
    的頭像 發(fā)表于 08-29 17:19 ?2w次閱讀