前言
對(duì)于智能手機(jī)來(lái)說(shuō),SoC的重要性不言而喻,而作為國(guó)產(chǎn)自研的海思麒麟處理器,一直以來(lái)備受關(guān)注,發(fā)展至今,逐漸躋身于移動(dòng)處理器中的領(lǐng)先水平,在麒麟960這款產(chǎn)品上,做到了“留長(zhǎng)補(bǔ)短”,被稱(chēng)作麒麟歷史上具有突破性的產(chǎn)品,在隨后的實(shí)際體驗(yàn)上,搭載麒麟960的產(chǎn)品都有著不錯(cuò)的表現(xiàn)。因此,而我們今天就來(lái)測(cè)試一下麒麟960在深層次上的性能。
?
注:ANANDTECH將麒麟960的工藝寫(xiě)成TSMC 16nm FFC,而實(shí)際上麒麟960的工藝為T(mén)SMC 16nm FF+。
從麒麟960、麒麟955、麒麟950三款(兩代)產(chǎn)品參數(shù)表來(lái)看,相比于上代產(chǎn)品,麒麟960是全球首款采用ARM最新的A73架構(gòu)的SoC,相比麒麟950,大核主頻由2.3GHz提升至2.36GHz,小核主頻從1.81升至1.84GHz,但略低于麒麟955的2.52GHz。可以看到,麒麟處理器對(duì)于CPU主頻的還是做了一定的限制、以賦予GPU可以做到更高的性能。
麒麟960采用的A73架構(gòu)出自于ARM在歐洲的設(shè)計(jì)團(tuán)隊(duì),而非設(shè)計(jì)出A15/A57/A72系列的德克薩斯奧斯丁團(tuán)隊(duì),因此盡管A72與A73在編號(hào)上只差了1個(gè)數(shù),但在CPU的性能設(shè)計(jì)上則截然不同。A57、A72則是偏重高性能,承擔(dān)著高端處理器上應(yīng)付復(fù)雜數(shù)據(jù)的處理。A73則更加著重于對(duì)性能與功耗的平衡。
▲A73采用雙發(fā)射L/S
值得一提的是,A73與A72比較明顯的區(qū)別在于解碼器的寬度,A73采用雙發(fā)射L/S單元,在發(fā)射寬度上小于A72的三發(fā)射。雖然從紙面上有所降低,但根據(jù)資料顯示,A73架構(gòu)的11級(jí)核心流水線深度比A72的15級(jí)核心流水線深度更精簡(jiǎn),因此發(fā)射寬度并沒(méi)有決定性的影響到A73的性能。另外,A73更短的流水線減少了前端延遲,包括1-2個(gè)更少的解碼器周期,它可以解碼單個(gè)周期中的大多數(shù)指令,以及1個(gè)更少的周期用于讀取層面。
電源管理:
這張圖顯示了A73相比于A72,在相同的進(jìn)程和相同的主頻下,A73能夠比A72減少20-30%的功耗。并且A73號(hào)稱(chēng)目前處理器中面積最小的高端核心,每顆核心的面積在0.65mm,相比于A72上1.15mm的面積整整小了43%。
▲G71架構(gòu)圖
一直以來(lái),麒麟處理器的GPU性能相比于驍龍被人詬病,因此在麒麟960上,GPU則最大限度的保持了性能。在麒麟960上,同樣配備了ARM最新的G71處理器:Mali-G71 MP8,主頻最高為1037MHz。G71采用ARM最新的Bifrost架構(gòu)。與之前midgrad架構(gòu)相比,Bifrost最大的創(chuàng)新在于使用指令組著色器(ClausedShader)。在G71上重新設(shè)計(jì)了執(zhí)行單元,更好的利用著色器核心,增加吞吐量和性能。另外Bifrost架構(gòu)還采用Quad based vectorization技術(shù),相比于之前SIMD矢量化技術(shù)一次只能執(zhí)行單一線程,Quad矢量化技術(shù)最高支持四線程執(zhí)行,共享控制邏輯,使用率接近100%。
通過(guò)解讀麒麟960的架構(gòu),我們了解了麒麟960的設(shè)計(jì)思路:注重CPU性能與功耗的平衡,以及GPU的極限性能,整個(gè)麒麟960沒(méi)有哪部分成為明顯的短板為人詬病。
CPU跑分測(cè)試:
▲SPECint2000單項(xiàng)測(cè)試
麒麟960 IPC#e#
▲麒麟960 IPC
通過(guò)SPECint 2000可以看到,麒麟960在CPU整數(shù)運(yùn)算性能上相比麒麟950有了比較大的進(jìn)步,A73的IPC比A72的高出11%、比A57增加29%。值得一提的是,竟然比驍龍821的kryo高出30%,比8890的Mongoose高15%。在這里,我們也只能說(shuō)一句公版大法好了。
▲單線程整數(shù)IPC
GeekBench4的整數(shù)運(yùn)算單線程跑分,可以看到,麒麟960總體來(lái)說(shuō)也是有好有壞。相比麒麟950,在邊緣檢測(cè)(Canny)和直方圖均衡(HE)項(xiàng)目中,麒麟960輸給了其它三位對(duì)手,而在HTML5 Parse和HTML5 DOM的測(cè)試中,麒麟960則有上佳的表現(xiàn)。而在IPC的計(jì)算中,A73略優(yōu)與A72 4%,但在SPECint2000的整數(shù)運(yùn)算中,A73的優(yōu)勢(shì)則為11%,二者差距比較大,并且在單項(xiàng)測(cè)試中的起伏不定,因此比較A73與A72之間的好壞,則 是一個(gè)非常困難的事情。
另外,可以看到,A73的整數(shù)運(yùn)算IPC大概是A53的1.7-2倍,這也是為什么那些只配備A53的中低端SoC性能表現(xiàn)不好的原因之一。
▲浮點(diǎn)單項(xiàng)測(cè)試
GeekBench4浮點(diǎn)運(yùn)算,麒麟960的表現(xiàn)并不能算好。與麒麟950相比也不算優(yōu)秀,而對(duì)比驍龍821則全面落?。ó?dāng)然,驍龍的浮點(diǎn)運(yùn)算一直都不錯(cuò))。考慮到A73的NEON執(zhí)行單元與A72相比并沒(méi)有改變,而降低了特殊指令的延遲,使得NEON的性能還提升了5%。因此這樣的結(jié)果還是有些意外,只能猜測(cè)為有些測(cè)試項(xiàng)目受到A73解碼器寬度的變化。但最終的原因,也只能在之后測(cè)試其它采用A73的SoC上的表現(xiàn)在下結(jié)論。
▲浮點(diǎn)測(cè)試IPC結(jié)果
在浮點(diǎn)IPC的結(jié)論中,麒麟960不出意外的只能排在中游水準(zhǔn),比驍龍821、麒麟950、三星8890都落后。而這也意味著麒麟960會(huì)在不同的任務(wù)之間有著比較大的性能變化。
內(nèi)存性能:
此次ARM將A73的一級(jí)緩存由48kB提升至64kB,二級(jí)緩存由A72的最大2MB提升至8MB,并且為一級(jí)緩存和二級(jí)緩存都配備了獨(dú)立的預(yù)讀器,使得A73可以獲得接近理論的最大帶寬值。并且,與A72一樣,A73中配備了兩個(gè)AGU,能夠同時(shí)加載和存儲(chǔ)操作,而不像A72中只能單個(gè)操作,這對(duì)提高主系統(tǒng)內(nèi)存的發(fā)射率。
CPU緩存和內(nèi)存延遲:
▲系統(tǒng)延遲與傳輸速度
可以看到,得益于A73 64kb的一級(jí)緩存,麒麟960保持了1.27ns的穩(wěn)定延遲,對(duì)比麒麟950的1.74ns,有著27%的提升。
▲帶寬讀取測(cè)試
▲帶寬寫(xiě)入測(cè)試
上面兩個(gè)圖標(biāo)顯示了使用兩線程讀/寫(xiě)NEON指令,有助于表明麒麟960的內(nèi)存帶寬。讀取時(shí),麒麟960的L1緩存優(yōu)于麒麟950,但從64kb分界線可以明顯看出,當(dāng)?shù)竭_(dá)2級(jí)緩存的時(shí)候,帶寬則有著明顯的下降。圖2可以看到,寫(xiě)入時(shí),L1、L2下麒麟960都低于麒麟950,而在1024kb分界線過(guò)后,寫(xiě)入系統(tǒng)時(shí),則低于麒麟960。緩存帶寬的減少,也從側(cè)面解釋了GeekBench4浮點(diǎn)測(cè)試中麒麟960的劣勢(shì)。
在GeekBench4的內(nèi)存測(cè)試中(單線程),盡管麒麟960的L1、L2的緩存性能都是混合的,但在系統(tǒng)內(nèi)存方面還是比麒麟950有著不錯(cuò)的表現(xiàn)。內(nèi)存延遲提升了25%、內(nèi)存帶寬提升了69%,但在內(nèi)存復(fù)制上,麒麟960還是被驍龍821甩在了身后。說(shuō)明kryo對(duì)于內(nèi)存數(shù)據(jù)的管理還是有著明顯的優(yōu)勢(shì)。
當(dāng)然,上面測(cè)試的都是理論性能,而理論性能究竟有多少能轉(zhuǎn)化為真實(shí)性能,則體現(xiàn)出廠商的優(yōu)化能力。當(dāng)然,不同的廠商對(duì)于處理器性能的策略也導(dǎo)致會(huì)出現(xiàn)不同的結(jié)果,比如發(fā)熱(后降頻)的閾值、CPU的核心調(diào)度策略等,也都會(huì)使同樣的處理器在不同的產(chǎn)品上有著不同的體驗(yàn)。
▲PCMark綜合測(cè)試成績(jī)
▲瀏覽器網(wǎng)絡(luò)測(cè)試
▲寫(xiě)入測(cè)試
PCMark通過(guò)模擬一些現(xiàn)實(shí)的工作場(chǎng)景,調(diào)用許多常永的安卓應(yīng)用API,突出對(duì)CPU、GPU、RAM等部分的測(cè)試。而在瀏覽器測(cè)試、數(shù)據(jù)操縱等測(cè)試項(xiàng)目的評(píng)分中,麒麟960都均為最高(采用Mate9測(cè)試)??梢钥吹?,kryo架構(gòu)對(duì)于整數(shù)性能的測(cè)試一直都比較頭疼,因此在整數(shù)性能權(quán)重比較重的測(cè)試項(xiàng)目中,驍龍820/821的手機(jī)落后于采用公版A72/A73架構(gòu)的手機(jī)。
最后的數(shù)據(jù)操縱測(cè)試是對(duì)整數(shù)運(yùn)算的測(cè)試項(xiàng)目,通過(guò)測(cè)量多種不同類(lèi)型文件的數(shù)據(jù)包解壓速度,然后記錄動(dòng)態(tài)交叉表的幀率。而在這個(gè)測(cè)試中,麒麟960比麒麟950快了30%,比驍龍821快了37%。
▲Kraken測(cè)試?
▲WebXPRT測(cè)試
▲JetStream
注:Kraken在Chrome/Safari/IE中測(cè)試javascript性能;WebXPRT測(cè)試不同瀏覽器之間的Web性能(基于HTML5和Javascript)、JetStream測(cè)試JavaScript的性能;
在Javescript測(cè)試中,我們選取了不同的應(yīng)用在不同的瀏覽器當(dāng)中測(cè)試,綜合來(lái)看,麒麟960的表現(xiàn)比不錯(cuò),在旗艦中堪稱(chēng)優(yōu)秀。
GPU能耗和發(fā)熱:
對(duì)于CPU理論性能與真實(shí)體驗(yàn)之間轉(zhuǎn)換,功耗一直是一個(gè)比較矛盾的問(wèn)題。性能強(qiáng),CPU的功耗自然比較大,而功耗過(guò)大又會(huì)限制CPU峰值能力的穩(wěn)定性,因此控制性能與功耗之間的平衡,則是考驗(yàn)廠家對(duì)SoC把握的重要部分。在麒麟950時(shí),海思曾經(jīng)做到比較不錯(cuò)的功耗比,而ARM宣稱(chēng)A73在同頻、同任務(wù)下相比A72能減少20-30%的功耗,因此我們對(duì)麒麟960的能耗比也有所期待。
從表格可以看到,麒麟960的四顆大核所消耗的功率遠(yuǎn)超A72架構(gòu)的麒麟950,這與ARM所宣傳的A73架構(gòu)更加省電并不太相符。從單純的數(shù)據(jù)來(lái)看,麒麟960的峰值功率與超頻過(guò)后的麒麟955比較接近,每顆核心與低頻的Exynos 7420相近,只有大約50mW。
而與驍龍820/821的兩個(gè)kryo大核相比,麒麟960的功耗更低,兩顆大核的功率大致為2.8W,而kryo則能達(dá)到3.1-3.3W。但剩余的兩顆小核在運(yùn)行時(shí)消耗更低的功率,相比之下,麒麟960之前的優(yōu)勢(shì)不再。
續(xù)航測(cè)試:
盡管在峰值功耗上麒麟960明顯更高,但華為Mate9在續(xù)航測(cè)試中的表現(xiàn)結(jié)果卻非常不錯(cuò)。在PCMark的測(cè)試中,接近10小時(shí)的續(xù)航時(shí)間比Mate8甚至都高出27%,與單純的CPU性能測(cè)試的結(jié)果并不相符,恐怕也只能說(shuō)這一代的系統(tǒng)優(yōu)化更加出色。
▲續(xù)航測(cè)試
在這張圖中,顯示了Mate9在運(yùn)行PCMark 2.0性能測(cè)試時(shí)的總系統(tǒng)功耗(測(cè)試環(huán)境:無(wú)線電關(guān)閉、屏幕亮度僅為10nits),而除了在加載下一個(gè)測(cè)試場(chǎng)景時(shí)的引起的較高功率之外,總功率消耗保持在3W以下,且平時(shí)一般都低于2W,遠(yuǎn)低于麒麟960四顆大核測(cè)量的5.3W。
而在這個(gè)表中的測(cè)試項(xiàng)目:瀏覽器網(wǎng)絡(luò)測(cè)試、視頻測(cè)試、文件寫(xiě)入、圖片編輯和數(shù)據(jù)操作,這些項(xiàng)目基本上都是我們平時(shí)經(jīng)常用到的手機(jī)功能??梢钥吹?,線程從小核心轉(zhuǎn)移到大核心以及手機(jī)動(dòng)態(tài)地調(diào)整電壓匹配CPU頻率和負(fù)載,在大部分場(chǎng)景下,CPU只開(kāi)啟1-2個(gè)大核,麒麟960比麒麟950的功率多使用754mW,而非四核全開(kāi)時(shí)的1601mW。因此,雖然CPU效率很重要,但我們需要根據(jù)實(shí)際使用的情況來(lái)考慮,也不能忘記軟件(程序調(diào)度、CPUidle)對(duì)續(xù)航的影響。
系統(tǒng)功耗:
單方面的只看功耗是片面的,一款設(shè)備的功耗大于其它設(shè)備,但如果它在更短的時(shí)間內(nèi)完成任務(wù),實(shí)際上可以使用更少的功耗,以獲得更長(zhǎng)的待機(jī)時(shí)間。而在上兩個(gè)圖中,同樣關(guān)閉無(wú)線電、屏幕亮度為10nits,減少不同屏幕對(duì)結(jié)果的影響。
第一張圖中,顯示了每款手機(jī)在PCMark 2.0性能測(cè)試時(shí)所消耗的總功耗。Mate9比Mate8大概超出了16%,而使用GPU的視頻和圖片編輯功能時(shí)從高到低差距最大,而在數(shù)據(jù)操縱和寫(xiě)入時(shí),驍龍821的功耗比麒麟960還略大,因?yàn)樵谶@樣的測(cè)試中必須使用兩顆大核,而非GPU(可見(jiàn)麒麟的CPU功耗較低、GPU功耗略高)。
第二張圖片是將PCMark分?jǐn)?shù)除以顯示效率后所得到的功耗值(越高越高),可以看到,在寫(xiě)入測(cè)試以及數(shù)據(jù)操縱的項(xiàng)目中,Mate9都比Mate8的效率更高,但在視頻和照片編輯部分,Mate9的GPU效率偏低,而高通的Adreno依然是效率最高的。
屏幕亮度-功耗曲線圖:
盡管麒麟960的SoC功耗更高,但在續(xù)航測(cè)試中Mate9卻優(yōu)于Mate8,因此可以猜想,華為在其它地方做出了更多的優(yōu)化。而在這種圖中,可以明顯的看出,在顯示效率方面Mate9要遠(yuǎn)勝與Mate8。而作為一個(gè)手機(jī)最大的電量消耗部分,在屏幕方面的進(jìn)步使得Mate9在續(xù)航方面有著不錯(cuò)的表現(xiàn)。
CPU線程穩(wěn)定性:
在CPU穩(wěn)定方面的測(cè)試中,使用了與之前一樣的電源病毒,在A73的兩顆大核上運(yùn)行兩線程,持續(xù)時(shí)間30分鐘,確定設(shè)備能夠保持CPU的峰值性能,而不至于像我們平時(shí)說(shuō)的“三秒真男人”。這個(gè)測(cè)試也綜合考驗(yàn)了CPU功耗、元器件散熱能力和對(duì)于熱量調(diào)度管理的水平。
通過(guò)測(cè)試,Mate8和麒麟950可以非常穩(wěn)定的保持在A72的峰值,Mate9卻沒(méi)能做到。因?yàn)轺梓?60的功耗較高,因此CPU的峰值大約維持在11分鐘,但仍然是一個(gè)不錯(cuò)的結(jié)果。一般來(lái)說(shuō),以手機(jī)CPU為中心的工作負(fù)載能夠?qū)⒋蠛说膸p峰維持到這個(gè)時(shí)間就已經(jīng)表現(xiàn)不錯(cuò),因此Mate9的效率還算不錯(cuò)。那么接下來(lái),我們也比較期待像P10這樣身材較小的手機(jī)能否有很好的散熱。
GPU功耗測(cè)試:
麒麟960采用ARM最新的Mali-G71 GPU,與之前麒麟的 SoC不同,G71采用8核GPU以提高峰值性能。當(dāng)然,更多的 核心也意味著更高的功耗,因此我們對(duì)GPU的持續(xù)性也比較感興趣。
測(cè)試方法:在手機(jī)上運(yùn)行GFXBench曼哈頓3.1和霸王龍性能測(cè)試,通過(guò)設(shè)備的電量計(jì)收集數(shù)據(jù),在運(yùn)行每個(gè)測(cè)試時(shí)將總功率減去設(shè)備空閑的功率,得到系統(tǒng)負(fù)載功率。
曼哈頓3.1離屏功耗測(cè)試:
從圖中可以看到,Mate9平均8.63W的功耗也是整個(gè)小組中成績(jī)最高的,這樣的成績(jī)對(duì)于智能手機(jī)的SoC實(shí)在是過(guò)高,因?yàn)檫@么高的數(shù)據(jù)對(duì)于想要長(zhǎng)時(shí)間穩(wěn)定在峰值功率基本不太可能?;蛟S是由于G71的主頻有點(diǎn)過(guò)高(1037MHz)導(dǎo)致的。畢竟三星8890的Mali-T880主頻也只有650MHz。
在測(cè)試中,Mate9的曼哈頓3.1離屏成績(jī)?yōu)?2.49Fps,比Mate8時(shí)期提高了整整3倍性能,但相同的,平均功耗也是Mate8的3倍,因此在效率方面基本持平。而高通的Adreno 530在驍龍820/821上同樣的成績(jī),但功耗只有麒麟的一半??梢钥吹剑贕PU方面,高通依舊有著巨大的優(yōu)勢(shì)。
霸王龍離屏測(cè)試:
在霸王龍離屏的測(cè)試中,麒麟960的成績(jī)變得更加糟糕,平均功率增加至9.51W,GPU的效率甚至低過(guò)麒麟950。而相比之下,三星S7的Exynos 8890使用的Mali-T880 MP12,主頻為650MHz,平均功耗4.7W,只有麒麟960的一半,效率卻能達(dá)到88%。
在類(lèi)似的測(cè)試中,無(wú)論是蘋(píng)果、高通還是三星,其SoC的平均功耗都在5W為上限,而到了5W時(shí)GPU就很難長(zhǎng)時(shí)間保持在峰值性能,會(huì)因?yàn)檫^(guò)熱而降頻,因此麒麟960這樣的成績(jī)實(shí)在有些難以接受。
曼哈頓3.1續(xù)航測(cè)試:
過(guò)高的功耗對(duì)于麒麟960的電池續(xù)航也有著一定的影響,尤其是在游戲環(huán)節(jié),Mate9比Mate8還少1小時(shí)的續(xù)航,說(shuō)明在運(yùn)行過(guò)程中Mate9并沒(méi)有對(duì)GPU的使用作出太明顯的優(yōu)化。而最終,Mate9在續(xù)航測(cè)試中只有比較中等的水平,與比它電池容量明顯減小的一加3T等水平相同。
GPU穩(wěn)定性(曼哈頓3.1):
通過(guò)圖表可以看到,Mate9在GPU降頻之前堅(jiān)持了1分鐘左右,在8分鐘時(shí)幀數(shù)為21Fps,相對(duì)于峰值減少38%,在30分鐘后達(dá)到比較穩(wěn)定的狀態(tài),幀率為19Fps,不過(guò)依然比麒麟950的峰值的11.5Fps要強(qiáng)。而相比之下, 樂(lè)Pro3從峰值的33Fps峰值隨后會(huì)下降至19Fps,基本與麒麟960差不多。
而在這張圖中可以看到,Mate9的GPU頻率和功耗在游戲續(xù)航測(cè)試前15分鐘的變化:一旦GPU主頻下降至533MHz,其平均功耗會(huì)下降至4W,這也屬于可持續(xù)穩(wěn)定的功耗。這說(shuō)明麒麟應(yīng)該把GPU的主頻下調(diào)至650MHz至700MHz更為明智,目前來(lái)看,1037MHz的峰值主頻確實(shí)有些Hold不住。
總結(jié):
性能方面,在進(jìn)行整數(shù)運(yùn)算時(shí),麒麟960的A73比950的A72效率更高,甚至優(yōu)于高通的kryo和A57,但在浮點(diǎn)運(yùn)算時(shí),結(jié)果正相反,高通的kryo和A72要優(yōu)于A73。麒麟960采用更大的64KB L1緩存,使得延遲和讀取帶寬都有所提高,但寫(xiě)入帶寬則低于麒麟950;寫(xiě)入方面,麒麟960的L2緩存帶寬對(duì)于讀取和寫(xiě)入都較低與麒麟950。綜合來(lái)看,麒麟960對(duì)于主內(nèi)存的延遲降低了25%,帶寬提高了69%。而截至CPU的部分,麒麟960的提升顯而易見(jiàn)。
但麒麟960的GPU功耗卻出了問(wèn)題,甚至低于麒麟950。盡管ARM宣稱(chēng)A73的功耗低于A72不少,但在麒麟960上卻并沒(méi)有體現(xiàn),GPU功耗過(guò)高可能與主頻有關(guān)。不過(guò)在其它方面,Mate9對(duì)于顯示效率的提升、CPU功耗的控制使得在續(xù)航方面,Mate9依然有不錯(cuò)的表現(xiàn)。
相比過(guò)去,麒麟960的進(jìn)步確實(shí)給人留下了深刻的印象,并且也增強(qiáng)了我們對(duì)麒麟970的期待。麒麟960提供了ARM最強(qiáng)的A73架構(gòu)、更強(qiáng)性能的G71 GPU和CCI-550互聯(lián)。并且支持Cat12/13的鏈接速度以及UFS 2.1的內(nèi)存規(guī)格。麒麟960并非簡(jiǎn)單的對(duì)麒麟950的升級(jí),而是一顆全新的處理器,在實(shí)際體驗(yàn)中也優(yōu)于麒麟950。在Mate9上的表現(xiàn),證明了麒麟960稱(chēng)得上一顆旗艦級(jí)的SoC,并且我們也期待在下一款產(chǎn)品身上,華為能夠解決其現(xiàn)有缺陷,在各方面都能躋身于優(yōu)秀的水準(zhǔn)。
評(píng)論
查看更多