0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cortex-A15架構(gòu)解析:它為什么這么強(qiáng)

電子工程師 ? 2018-04-06 08:36 ? 次閱讀

Cortex-A15架構(gòu)解析:它為什么這么強(qiáng),今年的新手機(jī)趨勢(shì)無(wú)異是全面向四核靠攏,不過(guò)同樣是四核,在實(shí)際的性能上其實(shí)是千差萬(wàn)別。例如針對(duì)入門(mén)級(jí)主流市場(chǎng)的四核手機(jī)普遍采用的都是Cortex-A7以及Cortex-A9級(jí)別的CPU內(nèi)核,這類(lèi)內(nèi)核性能、成本以及發(fā)熱都會(huì)

今年的新手機(jī)趨勢(shì)無(wú)異是全面向四核靠攏,不過(guò)同樣是四核,在實(shí)際的性能上其實(shí)是千差萬(wàn)別。例如針對(duì)入門(mén)級(jí)主流市場(chǎng)的四核手機(jī)普遍采用的都是Cortex-A7以及 Cortex-A9 級(jí)別的CPU內(nèi)核,這類(lèi)內(nèi)核性能、成本以及發(fā)熱都會(huì)較低,因此在入門(mén)市場(chǎng)上大行其道。

而在高端智能手機(jī)中則出現(xiàn)了一些新的變化,除了去年就已經(jīng)嶄露頭角的高通Krait系列架構(gòu)四核外,ARM正統(tǒng)的Cortex-A15也開(kāi)始走上了四核手機(jī)的舞臺(tái),例如三星的Exynos 5 Octa、NVIDIA 的Tegra 4。

Cortex-A15是ARM Cortex-A家族中目前最強(qiáng)勁的CPU內(nèi)核架構(gòu),發(fā)布時(shí)間為2010年,德州儀器是最早(2011年)投產(chǎn)基于該架構(gòu)處理器(型號(hào)為OMAP 5)的授權(quán)廠商。

和ARM的Cortex-A7、Cortex-A9等微架構(gòu)相比,Cortex-A15有很大的不同。

A15和A9同樣具備亂序執(zhí)行,但是Cortex-A15具備(兩倍)的指令發(fā)射端口和執(zhí)行資源,指令解碼能力也要高出50%,動(dòng)態(tài)分支預(yù)測(cè)能力更強(qiáng)(采用了多層級(jí)分支表緩存),指令拾取帶寬更強(qiáng)(128 bit vs 64 bit),這些都能讓A15的流水線執(zhí)行具備更高的效率。除此以外,A15采用了VFPv4浮點(diǎn)單元設(shè)計(jì),能執(zhí)行FMA指令以及硬件除法指令,相較而言A9的峰值向量浮點(diǎn)性能基本上只有A15的一半。

不過(guò)在現(xiàn)實(shí)中,A15 的對(duì)手應(yīng)該是高通自行設(shè)計(jì)的 ARMv7A 兼容處理器架構(gòu) Krait。高通對(duì) Krait 的架構(gòu)細(xì)節(jié)透露并不是很多,大致上就是 3 個(gè)指令解碼端口(和 A15 一樣)、7個(gè)指令發(fā)射端口(A15 是8個(gè))、4個(gè)發(fā)射端口(A15 是8個(gè)),具備4KB+4KB的單周期時(shí)延L0 Cache設(shè)計(jì)。

如果采用老掉牙的Dhrystone DMIPS/MHz作為性能衡量指標(biāo),Krait 是3.3,A9 是2.5,而A15則是3.5,從紙面上看Krait的確非常適合作為A15的對(duì)手。

不過(guò)Dhrystone的缺點(diǎn)是顯而易見(jiàn),它是完全可以塞進(jìn)CPU的L1 cache里執(zhí)行,這就意味著無(wú)法以此對(duì)L2 cache(A15是一體化設(shè)計(jì),Krait是分離式設(shè)計(jì),一體化設(shè)計(jì)可以減少內(nèi)存交換導(dǎo)致的大量時(shí)延)、亂序執(zhí)行的硬件效率/復(fù)雜性、內(nèi)存子系統(tǒng)單元(A15的內(nèi)存單元可以實(shí)現(xiàn)在一定條件下預(yù)執(zhí)行一條加載指令,而Krait能否具備這樣的能力尚不清楚)等諸多體系架構(gòu)區(qū)別對(duì)實(shí)際性能的影響作出有價(jià)值評(píng)估。

當(dāng)然,ARM采用的DMIPS指標(biāo)實(shí)際上并非28年前的那個(gè)Dhrystone,而是來(lái)自EEBMC Coremark(其實(shí) Coremark 就是前者的改善版本,主要是為了減少預(yù)優(yōu)化、對(duì)測(cè)試有比較嚴(yán)格的規(guī)則),但是CoreMark同樣可以塞進(jìn)現(xiàn)今大多數(shù)處理器的L1 cache里,Dhrystone不能反映現(xiàn)今移動(dòng)設(shè)備真實(shí)應(yīng)用的問(wèn)題在這里依然存在。

由于應(yīng)用環(huán)境日趨復(fù)雜,要正確評(píng)估一個(gè)移動(dòng)設(shè)備處理器的性能變得越來(lái)越復(fù)雜,因?yàn)楝F(xiàn)在的移動(dòng)設(shè)備跑的網(wǎng)頁(yè)瀏覽、三維游戲、音視頻、人工智能等都不可能可以完全塞進(jìn)L1 Cache里,因?yàn)檫@些應(yīng)用牽涉到大量的數(shù)據(jù)處理。

這時(shí)候,人們?cè)谂_(tái)式機(jī)性能評(píng)估上學(xué)到的經(jīng)驗(yàn)和測(cè)試辦法就可以在移動(dòng)設(shè)備上采用了。對(duì)CPU測(cè)試來(lái)說(shuō),最合理的測(cè)試方式是采用多種計(jì)算規(guī)模的真實(shí)應(yīng)用源代碼以本機(jī)代碼進(jìn)行編譯再進(jìn)行測(cè)試,在這樣的情況下移動(dòng)設(shè)備的計(jì)算單元、內(nèi)存單元都得以充分考驗(yàn),測(cè)試結(jié)果最具參考價(jià)值。

能夠獲得業(yè)界(計(jì)算機(jī)工業(yè)、學(xué)術(shù)科研)官方認(rèn)可的CPU測(cè)試當(dāng)屬SPEC.org的SPEC CPU,它就是采用源代碼方式,讓測(cè)試人員可以編譯為本機(jī)代碼來(lái)測(cè)試,許多處理器在研發(fā)伊始就采用SPEC CPU作為最重要的性能評(píng)估指標(biāo)。

SPEC CPU的最新版本為CPU2006,但是CPU2006針對(duì)的是當(dāng)前的臺(tái)式機(jī)、工作站、服務(wù)器處理器應(yīng)用環(huán)境,內(nèi)存容量(CPU2006 支持多線程測(cè)試,因此要求的內(nèi)存容量相當(dāng)高,8線程處理器用16 GB內(nèi)存也是有點(diǎn)勉強(qiáng))和自身存儲(chǔ)空間(未編譯時(shí)就要數(shù)GB空間,編譯后就要占用1xGB了)要求都較高,因此采用CPU2006對(duì)目前的移動(dòng)設(shè)備來(lái)說(shuō)是不太現(xiàn)實(shí)的。

SPEC CPU是每隔幾年就更新一次,在CPU2006之前的舊版本為CPU2000,它的speed整數(shù)性能測(cè)試完全可以在1GB級(jí)別的移動(dòng)設(shè)備上運(yùn)行,在以前甚至有一些 CPU2000的測(cè)試被移植到GPU上做加速性能測(cè)試。

ARM陣營(yíng)極少公布SPEC CPU測(cè)試結(jié)果,這當(dāng)然也是有原因的,因?yàn)樵谶^(guò)去的不少時(shí)間里,ARM針對(duì)的設(shè)備大都只有幾百兆內(nèi)存空間,塞進(jìn)操作系統(tǒng)后,留給程序運(yùn)行的空間就更少,此外由于省電先決的考量ARM處理器的性能其實(shí)真的不怎么樣。

不過(guò)有意思的是,今年ARM陣營(yíng)里的NVIDIA在發(fā)布Tegra 4的時(shí)候公布了CPU2000INT的測(cè)試結(jié)果:在1.9GHz 頻率設(shè)定的NVIDIA參考平臺(tái)里,Tegra 4的SPEC PU2000int_base 為1168。這個(gè)測(cè)試結(jié)果相當(dāng)于2003年第四季度 SPEC.org 上公布的AMD K8 Sledgehammer 2GHz測(cè)試結(jié)果。

NVIDIA還進(jìn)行了在小米手機(jī)2(采用高通 Snapdragon S4 Pro 即 APQ8064 1.7GHz)上的CPU2000測(cè)試,并且根據(jù)高通公布的S800相對(duì)S600在IPC(每周期指令)和頻率上的變化幅度而估算出來(lái)的S800的CPU2000測(cè)試結(jié)果:

從圖表來(lái)看,S600的CPUINT2000_base測(cè)試結(jié)果相當(dāng)于Tegra 4的一半不到,這在很大程度上反映了Cortex-A15相對(duì)Krait系處理器的真實(shí)應(yīng)用差別。

需要指出的是,雙方的測(cè)試平臺(tái)本身也是有一些影響的,例如小米手機(jī)2執(zhí)行這個(gè)測(cè)試的時(shí)候,CPU頻率是否存在降頻現(xiàn)象,NVIDIA對(duì)此沒(méi)有說(shuō)明。

一般來(lái)說(shuō),像APQ8064在四核全速運(yùn)行的時(shí)候,會(huì)在一段時(shí)間內(nèi)由于過(guò)熱而導(dǎo)致頻率從最高的1.7GHz開(kāi)始下降。當(dāng)然,NVIDIA在這里公布的是speed模式下的CPU2000INT測(cè)試結(jié)果,這個(gè)模式下是單線程的測(cè)試,只有一個(gè)CPU內(nèi)核會(huì)被使用。

比較遺憾的是高通對(duì)這個(gè)測(cè)試結(jié)果尚未提出異議(據(jù)說(shuō)高通對(duì)于處理器性能的孰高孰低并不十分看重,他們戲稱(chēng)是賣(mài)基帶送CPU),而CPU2000的配置對(duì)一般人來(lái)說(shuō)是相當(dāng)復(fù)雜的事情,所以這個(gè)測(cè)試暫時(shí)沒(méi)有第三方使用同樣的平臺(tái)測(cè)試佐證。

威盛電子在發(fā)布Nano X2處理器的時(shí)候曾經(jīng)公布過(guò)一份文件,里面也有采用CPU2000對(duì)Nano X2 1.2+GHz和Atom D525進(jìn)行測(cè)試,其中g(shù)cc編譯器出來(lái)的CPU2000 INT成績(jī)分別為799和582,采用Intel編譯器出來(lái)的成績(jī)分別是955和725。

NVIDIA的Tegra 4的CPU屬于ARMv7A指令集,因此編譯器很可能是armcc或者gcc,NVIDIA新近收購(gòu)的PGI是一家老牌編譯器廠商,也許它能提供內(nèi)部測(cè)試版給 NVIDIA,只是PGI過(guò)往從未發(fā)布過(guò)ARM系編譯器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Cortex-A15
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    13153
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    iTOP-3562開(kāi)發(fā)板/核心板采用RK3562,集成四核A53+Mali G52架構(gòu)

    A53+Mali G52架構(gòu),主頻2GHZ,內(nèi)置1TOPSNPU算力,RK809動(dòng)態(tài)調(diào)頻。支持OpenGLES1.1/2.0/3.2、0penCL2.0、Vulkan 1.1內(nèi)嵌高性能2D加速硬件
    發(fā)表于 09-05 11:30

    X86架構(gòu)處理器有哪些優(yōu)點(diǎn)和缺點(diǎn)

    X86架構(gòu)處理器作為計(jì)算機(jī)領(lǐng)域的重要組成部分,具有多個(gè)顯著的優(yōu)點(diǎn)和一定的缺點(diǎn)。以下是對(duì)X86架構(gòu)處理器優(yōu)缺點(diǎn)的詳細(xì)分析。
    的頭像 發(fā)表于 08-22 11:25 ?435次閱讀

    X86架構(gòu)和ARM架構(gòu)有什么區(qū)別

    X86架構(gòu)和ARM架構(gòu)是兩種主流的CPU架構(gòu),它們?cè)诙鄠€(gè)方面存在顯著的差異。以下是對(duì)這兩種架構(gòu)的詳細(xì)比較,涵蓋了追求目標(biāo)、應(yīng)用領(lǐng)域、技術(shù)特點(diǎn)、性能功耗比、軟件生態(tài)以及未來(lái)趨勢(shì)等方面。
    的頭像 發(fā)表于 08-22 11:21 ?3093次閱讀

    探索RISC-V二進(jìn)制翻譯,openKylin成功在SG2042平臺(tái)運(yùn)行X86架構(gòu)軟件!

    眾所周知,在新的指令集架構(gòu)發(fā)展初期,往往采用兼容其他架構(gòu)軟件的方法來(lái)拓展自身生態(tài)體系,如蘋(píng)果公司的Rosetta2和微軟的Arm64EC,都是將X86架構(gòu)軟件運(yùn)行在ARM架構(gòu)的系統(tǒng)之上
    的頭像 發(fā)表于 07-24 08:34 ?268次閱讀
    探索RISC-V二進(jìn)制翻譯,openKylin成功在SG2042平臺(tái)運(yùn)行X86<b class='flag-5'>架構(gòu)</b>軟件!

    ElfBoard技術(shù)貼|如何將libwebsockets庫(kù)編譯為x86架構(gòu)

    在之前的文章中,我們已經(jīng)詳細(xì)介紹了如何交叉編譯libwebsockets并將其部署到ELF1開(kāi)發(fā)板上。然而在調(diào)試階段,發(fā)現(xiàn)將libwebsockets在Ubuntu環(huán)境下編譯為x86架構(gòu)可能更為方便
    的頭像 發(fā)表于 07-10 09:38 ?1004次閱讀
    ElfBoard技術(shù)貼|如何將libwebsockets庫(kù)編譯為x86<b class='flag-5'>架構(gòu)</b>

    迅為RK3562核心板四核A53+MaliG52架構(gòu),應(yīng)用于商業(yè)平板電腦,視頻會(huì)議,智能家居,教育電子,醫(yī)療設(shè)備,邊緣計(jì)算,工業(yè)應(yīng)用

    迅為RK3562核心板四核A53+MaliG52架構(gòu),應(yīng)用于商業(yè)平板電腦,視頻會(huì)議,智能家居,教育電子,醫(yī)療設(shè)備,邊緣計(jì)算,工業(yè)應(yīng)用
    發(fā)表于 07-09 10:57

    I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(kù)(X86架構(gòu)

    使用X86架構(gòu)的OpenCV庫(kù),利用主機(jī)的強(qiáng)大計(jì)算性能和豐富的調(diào)試工具,可以加速開(kāi)發(fā)進(jìn)程并簡(jiǎn)化調(diào)試環(huán)節(jié)。下面就跟小伙伴詳細(xì)講述如何在Ubuntu環(huán)境下將 OpenCV 編譯為 X86 架構(gòu)。 開(kāi)發(fā)環(huán)境
    發(fā)表于 06-07 09:32

    移動(dòng)端芯片性能提升,Armv9架構(gòu)新升級(jí)引發(fā)關(guān)注

    “數(shù)碼博主”5月17日的最新爆料指出,聯(lián)發(fā)科積極推進(jìn)Armv9新一代IP BLACKHAWK“黑鷹”的架構(gòu)設(shè)計(jì),預(yù)計(jì)天璣9400芯片將采用這一架構(gòu),有望以“全大核”設(shè)計(jì)再度領(lǐng)跑移動(dòng)SoC CPU性能榜單。
    的頭像 發(fā)表于 05-17 16:51 ?784次閱讀

    鴻湖萬(wàn)聯(lián)成功舉辦基于x86架構(gòu)的OpenHarmony應(yīng)用生態(tài)挑戰(zhàn)賽

    近日,由開(kāi)放原子開(kāi)源基金會(huì)、央視網(wǎng)、江蘇省工業(yè)和信息化廳、無(wú)錫市人民政府、江蘇軟件產(chǎn)業(yè)人才發(fā)展基金會(huì)、蘇州工業(yè)園區(qū)、無(wú)錫高新區(qū)等共同承辦,鴻湖萬(wàn)聯(lián)參與共建的“基于x86架構(gòu)的OpenHarmony應(yīng)用生態(tài)挑戰(zhàn)賽”決賽路演在無(wú)錫圓滿(mǎn)落幕。
    的頭像 發(fā)表于 04-23 09:26 ?247次閱讀
    鴻湖萬(wàn)聯(lián)成功舉辦基于x86<b class='flag-5'>架構(gòu)</b>的OpenHarmony應(yīng)用生態(tài)挑戰(zhàn)賽

    arm架構(gòu)和x86架構(gòu)區(qū)別 linux是x86還是arm

    ARM架構(gòu)和x86架構(gòu)是兩種不同的計(jì)算機(jī)處理器架構(gòu),它們?cè)隗w系結(jié)構(gòu)、指令集、應(yīng)用領(lǐng)域等方面有著明顯的區(qū)別。Linux操作系統(tǒng)則具有廣泛的適配性,可以運(yùn)行在各種架構(gòu)上,包括x86和ARM
    的頭像 發(fā)表于 01-30 13:46 ?1.4w次閱讀

    Arm Cortex-M52的主要特性和規(guī)格

    Arm Cortex-M52是一款采Arm Helium 技術(shù)的新型微控制器內(nèi)核,旨在將AI功能引入更小、成本更低的物聯(lián)網(wǎng)設(shè)備,而不是基于Arm Cortex-M55內(nèi)核的SoC,Arm Cortex-M52
    的頭像 發(fā)表于 01-02 11:12 ?1104次閱讀
    Arm <b class='flag-5'>Cortex</b>-M52的主要特性和規(guī)格

    Debian宣布停止i386架構(gòu)支持

    近日,在英國(guó)劍橋市舉行的小規(guī)模DebConf活動(dòng)中,Debian GNU/Linux的發(fā)布團(tuán)隊(duì)召開(kāi)春季會(huì)議,探討了未來(lái)發(fā)展方向,其中包括停止對(duì)i386架構(gòu)的支持。
    的頭像 發(fā)表于 12-19 10:16 ?642次閱讀

    Arm微架構(gòu)學(xué)習(xí)—開(kāi)啟Armv9時(shí)代

    在上一篇文章“從A76到A78——在變化中學(xué)習(xí)Arm微架構(gòu)”中,我們了解了Arm處理器微架構(gòu)的基本組成,介紹了Armv8架構(gòu)最后幾代經(jīng)典處理
    的頭像 發(fā)表于 11-27 16:46 ?933次閱讀
    Arm微<b class='flag-5'>架構(gòu)</b>學(xué)習(xí)—開(kāi)啟Armv9時(shí)代

    如何在X86架構(gòu)的嵌入式系統(tǒng)上部署掌紋識(shí)別算法

    安全性而備受關(guān)注。在這一背景下,越來(lái)越多的應(yīng)用領(lǐng)域開(kāi)始采用掌紋識(shí)別技術(shù),包括金融、安全、物流和智能門(mén)禁等。本文將介紹如何在X86架構(gòu)的嵌入式系統(tǒng)上部署一個(gè)開(kāi)源的掌紋識(shí)別算法。
    的頭像 發(fā)表于 11-10 16:53 ?1307次閱讀
    如何在X86<b class='flag-5'>架構(gòu)</b>的嵌入式系統(tǒng)上部署掌紋識(shí)別算法

    NXP的Kinetis和LPC有什么區(qū)別?

    想問(wèn)問(wèn)NXP的Kinetis和LPC中同樣是Cortex-M4架構(gòu)的單片機(jī),用起來(lái)有什么區(qū)別,特別是在寄存器方面
    發(fā)表于 11-10 08:15