0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM發(fā)布全新架構(gòu)CPU、GPU及AI內(nèi)核 性能全面提升

DPVg_AI_era ? 來源:yxw ? 2019-05-29 17:11 ? 次閱讀

近日,ARM發(fā)布了下一代架構(gòu)設(shè)計方案,三款重磅利器騰空出世:Cortex-A77 CPU、Mali-G77 GPU和ARM ML處理器,性能全面提升。ARM表示,新的旗艦級IP將定義2020年高端智能手機(jī)性能,提供新一代的人工智能體驗(yàn)。

ARM祭出了三把利器。

昨日,全球領(lǐng)先半導(dǎo)體知識產(chǎn)權(quán)(IP)提供商ARM重磅發(fā)布了下一代架構(gòu)設(shè)計方案,其中包括:

Cortex-A77 CPU;

Mali-G77 GPU;

ARM ML處理器。

ARM表示,新的旗艦級IP將定義2020年高端智能手機(jī)性能,提供新一代的人工智能體驗(yàn)。

而在此前,新智元也報道了ARM宣布暫停與華為的合作的相關(guān)消息,或許此次ARM發(fā)布的旗艦級IP將與華為無緣。

不過,華為目前已經(jīng)獲得了ARM8架構(gòu)的永久授權(quán)(ARM8是ARM公司的32/64位指令集,目前的處理器都是這一指令集的產(chǎn)物)。也有可能完全自主設(shè)計ARM處理器,并掌握核心技術(shù)和完整知識產(chǎn)權(quán),具備長期自主研發(fā)ARM處理器的能力。

(對Cortex和Mali不了解?沒關(guān)系,新智元在文末附了它倆的全家福!)

代號Deimos,新一代CPU性能大幅提升

去年的ARM發(fā)布的Cortex-A76其實(shí)是一個非常成功的核心架構(gòu),全新的架構(gòu)體系與7nm TSMC工藝的結(jié)合,帶來了巨大的性能和效率飛躍,麒麟980和驍龍855就是很好的例子。

但ARM真正的競爭對手主要來自蘋果的CPU設(shè)計團(tuán)隊(duì)。僅從CPU來說,目前,蘋果的A11、A12仍然有著較為明顯的性能、效率優(yōu)勢。

ARM發(fā)布的Cortex-A77代號為Deimos(戴莫斯,畏懼之神),與上一代A76可謂是一脈相承,很大程度上保持了上一代的特性。

從官方給出的參數(shù)來看,有如下幾個關(guān)鍵特性:

依舊采用Armv8.2架構(gòu),支持 AArch32 和 AArch64;

64KB L1指令和數(shù)據(jù)緩存;

256或512KB L2緩存;

以及高達(dá)4Mb L3緩存

ARM表示,Cortex-A77和Cortex-A76保持相同的3.GHz峰值頻率目標(biāo)。但預(yù)計廠商不會在新一代Soc達(dá)到這么高的頻率。

Cortex-A77將更多的計算能力用于設(shè)備安全的邊緣計算上。這些計算能力使用范圍包括AI攝像機(jī)、視覺場景檢測、3D掃描、生物特征用戶ID(人臉識別)、語音識別、游戲中的ML和AR中的ML等。

從性能角度來看,Cortex-A77相比于A76有了許多性能上改進(jìn):

單線程性能提升20%;

FP性能提升35%;

內(nèi)存寬帶提升15%。

更高的性能也意味著能更好地響應(yīng)支持AR的新應(yīng)用程序以及帶來的體驗(yàn)。通過Cortex-A77,手機(jī)游戲領(lǐng)域的增強(qiáng)現(xiàn)實(shí)技術(shù)在未來幾年有望實(shí)現(xiàn)大幅增長。并且Cortex-A77還將支持5G,愛立信在2018年11月的移動報告中預(yù)測,到2024年,將有大約15億臺智能手機(jī)設(shè)備具備5G功能。

而眾所周知,對于計算密集型ML、AR和其他新出現(xiàn)的設(shè)備來說,5G是一個基本需求。它將帶來更快的速度、大帶寬(5到20 Gbps)、8K分辨率的流媒體和360度視頻

ARM GPU采用全新架構(gòu)Valhall,性能大躍進(jìn)

除了Cortex-A77之外,ARM還重磅發(fā)布了新一代Mali-G77。

劃重點(diǎn):Mali-G77采用了全新架構(gòu),Valhall。而在G71-G76采用的架構(gòu)都是Bifrost。

Mali-G77在性能、密度和效率方面取得了一些重大改進(jìn)。雖然去年的Mali-G76引入了對執(zhí)行引擎計算架構(gòu)的一些重大更改,但G77的改進(jìn)更大,并且脫離了ARM相對不同尋常的計算核心設(shè)計。

據(jù)ARM官方宣稱,Mali-G77較前代產(chǎn)品相比:

效能提升30%、性能提升30%、機(jī)器學(xué)習(xí)性能提升60%;

每mm2性能較A76預(yù)計提升1.4倍;

在相同的工藝和相同的性能下,實(shí)現(xiàn)30%的同比能效改進(jìn);

并且比Mali-G72節(jié)省50%的功耗。

從官方給出的性能來看,ARM Mali-G77的性能已然接近目前蘋果A12的性能,同時也超過了高通Adreno 640的性能。

ARM ML NPU

隨著智能手機(jī)和計算機(jī)繼續(xù)利用AI來實(shí)現(xiàn)攝影中的場景識別或增強(qiáng)現(xiàn)實(shí)中的物體識別等功能。同時,許多公司也構(gòu)建了專門的神經(jīng)處理單元來處理這些任務(wù),從而減輕了CPU和GPU的壓力。

而此次,ARM還發(fā)布了其最新的NPU,提供了高達(dá)兩倍的能效,并且是上一代內(nèi)存壓縮的三倍。與開源的ARM NN軟件框架相結(jié)合,ARM表示該芯片的八核版本可提供高達(dá)32 TOP/s的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9027

    瀏覽量

    366482
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1360

    瀏覽量

    40185
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210834
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128593

原文標(biāo)題:ARM發(fā)布全新架構(gòu)CPU、GPU及AI內(nèi)核,華為或?qū)o緣

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺服務(wù)器配備多個GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-05 16:20 ?125次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器<b class='flag-5'>AI</b>網(wǎng)絡(luò)<b class='flag-5'>架構(gòu)</b>設(shè)計

    《算力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔:從基準(zhǔn)測試到CPU架構(gòu)的深度探索

    。這一方法突顯了現(xiàn)代超算的核心優(yōu)勢——并行計算能力。舉一個具體實(shí)例來說,天河二號采用了異構(gòu)架構(gòu),集成了英特爾至強(qiáng)處理器和中國自主研發(fā)的申威眾核加速器。這種CPU與協(xié)處理器的結(jié)合不僅提升了整體計算
    發(fā)表于 10-19 01:21

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    、GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對全書內(nèi)容有一個整體了解
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn);中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為A
    發(fā)表于 09-02 10:09

    ai服務(wù)器是什么架構(gòu)類型

    架構(gòu)AI服務(wù)器通常具有較高的通用性,可以運(yùn)行各種人工智能算法。但是,CPU架構(gòu)AI服務(wù)器在處理大規(guī)模并行計算時,
    的頭像 發(fā)表于 07-02 09:51 ?876次閱讀

    英偉達(dá)或?qū)⑼瞥鋈诤?b class='flag-5'>Arm與Blackwell內(nèi)核AI PC芯片

    近日,業(yè)內(nèi)傳出英偉達(dá)正在研發(fā)一款全新芯片的傳聞。據(jù)悉,這款芯片將結(jié)合下一代Arm Cortex CPU內(nèi)核與英偉達(dá)自家的Blackwell GPU
    的頭像 發(fā)表于 05-31 10:31 ?556次閱讀

    Arm發(fā)布針對旗艦智能手機(jī)的新一代CPUGPU IP

    全球領(lǐng)先的芯片設(shè)計公司Arm宣布了針對旗艦智能手機(jī)市場的全新CPUGPU IP設(shè)計方案——Cortex-X925 CPU和Immortal
    的頭像 發(fā)表于 05-31 09:44 ?528次閱讀

    ARM發(fā)布旗艦手機(jī)芯片:性能提升、AI性能增強(qiáng)、節(jié)能減耗

    ARM為Cortex-X系列CPU重新命名,以強(qiáng)調(diào)其性能的顯著提升。據(jù)稱,X925的單核性能較X4提升
    的頭像 發(fā)表于 05-30 11:26 ?567次閱讀

    Arm發(fā)布Arm v9架構(gòu)CPUGPU IP及設(shè)計軟件,助力AI計算

    長期以來,全球智能手機(jī)處理器均采用Arm架構(gòu),包括蘋果、高通、聯(lián)發(fā)科在內(nèi)的眾多廠商均依賴Arm提供的IP,且該應(yīng)用范圍已逐漸擴(kuò)展至個人電腦與數(shù)據(jù)中心領(lǐng)域。
    的頭像 發(fā)表于 05-30 09:17 ?690次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    ,推理能力提升 15 倍 GB200由兩個B200Blackwell GPU和一個基于Arm的Grace CPU組成,采用[臺積電]4納米工藝制程,共有2080億個[晶體管],其
    發(fā)表于 05-13 17:16

    天璣9300旗艦芯:全大核CPU架構(gòu),性能與能效的提升

    “全大核”CPU 架構(gòu)設(shè)計打破常規(guī),摒棄小核,采用超大核(Arm Cortex-X)與大核(Arm Cortex-A)的組合,以更高時鐘頻率提升
    的頭像 發(fā)表于 05-06 10:22 ?555次閱讀

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu)性能提升四倍

    等領(lǐng)先企業(yè)均已推出搭載 Ethos-U 的量產(chǎn)芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應(yīng)用場
    的頭像 發(fā)表于 04-16 09:10 ?4487次閱讀
    <b class='flag-5'>Arm</b>推動生成式<b class='flag-5'>AI</b>落地邊緣!<b class='flag-5'>全新</b>Ethos-U85 <b class='flag-5'>AI</b>加速器支持Transformer <b class='flag-5'>架構(gòu)</b>,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>四倍

    X-Silicon發(fā)布RISC-V新架構(gòu) 實(shí)現(xiàn)CPU/GPU一體化

    X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計將 CPUGPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計不同,前者有獨(dú)立的
    發(fā)表于 04-08 11:34 ?526次閱讀
    X-Silicon<b class='flag-5'>發(fā)布</b>RISC-V新<b class='flag-5'>架構(gòu)</b> 實(shí)現(xiàn)<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一體化

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計算,大幅提升AI、數(shù)據(jù)處理、高性能計算和云工作負(fù)載的
    發(fā)表于 03-19 10:05 ?306次閱讀
    NVIDIA <b class='flag-5'>發(fā)布</b><b class='flag-5'>全新</b>交換機(jī),<b class='flag-5'>全面</b>優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> 計算和 <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施

    Intel酷睿Ultra CPU IPC性能實(shí)測

    Intel全新的酷睿Ultra號稱公司有史以來最具革命性的產(chǎn)品,擁有全新制造工藝、CPU/GPU架構(gòu)、分離式模塊化
    的頭像 發(fā)表于 01-04 09:49 ?1419次閱讀
    Intel酷睿Ultra <b class='flag-5'>CPU</b> IPC<b class='flag-5'>性能</b>實(shí)測