0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU+GPU架構(gòu)超算的未來(lái)發(fā)展趨勢(shì)分析

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-03-01 09:46 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經(jīng)開(kāi)始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達(dá)則因?yàn)樵?a href="http://ttokpm.com/tags/gpu/" target="_blank">GPU上的頭號(hào)交椅地位,成了堅(jiān)持所有堅(jiān)持CPU+GPU架構(gòu)超算的首選。

非但如此,英偉達(dá)開(kāi)始在ARM生態(tài)上有所動(dòng)作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級(jí)計(jì)算機(jī)系統(tǒng)阿爾卑斯所用。然而近來(lái)的一系列動(dòng)向表明,超算市場(chǎng)并不會(huì)就此維持定局。

英特爾:GPU和異構(gòu)開(kāi)始猛追

英特爾耕耘了這么多年HPC和超算市場(chǎng),自然不會(huì)白白認(rèn)輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會(huì)上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個(gè)Xeon插槽的設(shè)計(jì),由此推出全新的XPU,代號(hào)名為Falcon Shores。

Falcon Shores將融合通用x86處理器核心和高度并行計(jì)算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說(shuō)法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個(gè)插槽的計(jì)算密度提升5倍,與現(xiàn)有的設(shè)計(jì)相比,可將性能功耗比提升5倍以上。

這對(duì)于英特爾目前的戰(zhàn)略來(lái)說(shuō),基本上可以說(shuō)是必選的一條技術(shù)路線。考慮到英特爾在先進(jìn)封裝技術(shù)上并未止步,工藝節(jié)點(diǎn)也開(kāi)始跟上主流代工廠的節(jié)奏,異構(gòu)計(jì)算的設(shè)計(jì)已經(jīng)在英特爾近期推出的諸多產(chǎn)品中得到了驗(yàn)證,通用內(nèi)存也已經(jīng)在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經(jīng)在其Sapphire Rapids Xeon服務(wù)器處理器上用到了HBM2e這類高帶寬內(nèi)存,F(xiàn)alcon Shores中自研的高帶寬內(nèi)存會(huì)有何等性能確實(shí)令人好奇。

Falcon Shores的另一大優(yōu)勢(shì)在與靈活的核心配比,根據(jù)工作負(fù)載來(lái)調(diào)整x86核心與Xe核心。英特爾在會(huì)上不斷給出十萬(wàn)億億級(jí)的概念,這樣的性能在Falcon Shores的性能下似乎是可行的,不過(guò)這一XPU正式進(jìn)入超算市場(chǎng)的時(shí)間不會(huì)太快,而是要等到2024年,借助那時(shí)的埃米級(jí)工藝和Foveros封裝技術(shù)才能實(shí)現(xiàn)。

英偉達(dá):不放棄ARM,也不放棄互聯(lián)

前陣子英偉達(dá)收購(gòu)ARM失敗的消息傳來(lái),不少人認(rèn)為英偉達(dá)會(huì)就此放棄這塊蛋糕,然而英偉達(dá)CEO黃仁勛卻表示他們并不會(huì)就此放棄ARM生態(tài),未來(lái)將繼續(xù)推出Grace這樣基于ARM架構(gòu)的CPU。之所以能有如此的底氣,在于英偉達(dá)那20年的ARM架構(gòu)授權(quán)。

目前擁有ARM架構(gòu)授權(quán)的企業(yè)屈指可數(shù),更不用說(shuō)64位的授權(quán),并將其用于HPC市場(chǎng)了。英偉達(dá)如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場(chǎng)其實(shí)又有所不同。

Grace雖然性能不差,但與這些x86 CPU在通用計(jì)算上相比還是略遜一籌,況且也不是所有研究機(jī)構(gòu)或超算中心都會(huì)像日本一樣,構(gòu)建富岳或紫藤花這種規(guī)模的ARM超算。英偉達(dá)追求的并不是在通用計(jì)算上超過(guò)其他兩家數(shù)十年的積累,而是專注于AI算力。訓(xùn)練自然語(yǔ)言處理模型、利用GPU加速深度學(xué)習(xí),這才是英偉達(dá)的優(yōu)勢(shì)所在。

這時(shí)問(wèn)題來(lái)了,為何超算不選擇其它通用CPU或其它的GPU產(chǎn)品呢?這樣既能兼顧通用計(jì)算性能,也能用的GPU的加速性能。這是因?yàn)橛ミ_(dá)準(zhǔn)備了專用于自家CPU和GPU的互聯(lián)技術(shù)NVLink。過(guò)去僅有GPU產(chǎn)品的英偉達(dá)僅僅將NVLink技術(shù)用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink 4.0可以為Grace CPU和英偉達(dá)GPU牽線搭橋。

更不用說(shuō)英偉達(dá)已經(jīng)在2020年收購(gòu)了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網(wǎng)互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術(shù)。英偉達(dá)與Mellanox的結(jié)合,直接覆蓋了三分之二的頂級(jí)超算系統(tǒng)。未來(lái)的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達(dá)擔(dān)心競(jìng)品的出現(xiàn),而是其性能表現(xiàn)之強(qiáng),讓你不得不選擇他們旗下的產(chǎn)品。

小結(jié)

英特爾在超算上的發(fā)力歸根結(jié)底還是靠Xe HPC這樣的GPU核心,但作為GPU新秀的英特爾短時(shí)間還是無(wú)法撼動(dòng)英偉達(dá)在超算上的地位。而英偉達(dá)的ARM計(jì)劃未來(lái)如何演進(jìn)也令人十分期待,畢竟這一產(chǎn)品線不像其消費(fèi)級(jí)GPU,還未有任何路線圖公布。但喜人的一點(diǎn)是,超算從百億億級(jí)過(guò)渡到十萬(wàn)億億級(jí)的過(guò)程中,勢(shì)必會(huì)有更多的創(chuàng)新方案出現(xiàn)。

原文標(biāo)題:超算硝煙再起,CPU+GPU還能玩出新花樣?

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9027

    瀏覽量

    366476
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9861

    瀏覽量

    171287
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210828

原文標(biāo)題:?超算硝煙再起,CPU+GPU還能玩出新花樣?

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解力芯片GPU

    本篇閱讀學(xué)習(xí)第七、八章,了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算
    發(fā)表于 11-03 12:55

    力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第二篇閱讀心得:芯片拓?fù)鋵W(xué):并行擴(kuò)展與CPU設(shè)計(jì)的巨頭對(duì)決

    得到了創(chuàng)新應(yīng)用,通過(guò)環(huán)形總線系統(tǒng)來(lái)管理緩存并隱藏延遲,這種設(shè)計(jì)為后來(lái)的高性能GPU架構(gòu)奠定了重要基礎(chǔ)。 2 神威太湖之光:中國(guó)的里程碑 SW26010處理器的設(shè)計(jì)哲學(xué)令人著迷,它像
    發(fā)表于 10-29 01:48

    邊緣計(jì)算的未來(lái)發(fā)展趨勢(shì)

    邊緣計(jì)算的未來(lái)發(fā)展趨勢(shì)呈現(xiàn)出多元化和高速增長(zhǎng)的態(tài)勢(shì),以下是對(duì)其未來(lái)發(fā)展趨勢(shì)分析: 一、技術(shù)融合與創(chuàng)新 與5G、AI技術(shù)的深度融合 隨著5G
    的頭像 發(fā)表于 10-24 14:21 ?408次閱讀

    未來(lái)AI大模型的發(fā)展趨勢(shì)

    未來(lái)AI大模型的發(fā)展趨勢(shì)將呈現(xiàn)多元化和深入化的特點(diǎn),以下是對(duì)其發(fā)展趨勢(shì)分析: 一、技術(shù)驅(qū)動(dòng)與創(chuàng)新 算法與架構(gòu)優(yōu)化 : 隨著Transfor
    的頭像 發(fā)表于 10-23 15:06 ?386次閱讀

    力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——力之巔:從基準(zhǔn)測(cè)試到CPU架構(gòu)的深度探索

    。這一方法突顯了現(xiàn)代的核心優(yōu)勢(shì)——并行計(jì)算能力。舉一個(gè)具體實(shí)例來(lái)說(shuō),天河二號(hào)采用了異構(gòu)架構(gòu),集成了英特爾至強(qiáng)處理器和中國(guó)自主研發(fā)的申威眾核加速器。這種CPU與協(xié)處理器的結(jié)合不僅提升
    發(fā)表于 10-19 01:21

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    、GPU、NPU,給我們剖析了力芯片的微架構(gòu)。書中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書
    發(fā)表于 10-15 22:08

    變阻器的未來(lái)發(fā)展趨勢(shì)和前景如何?是否有替代品出現(xiàn)?

    變阻器是一種用于調(diào)節(jié)電路中電阻值的電子元件,廣泛應(yīng)用于各種電子設(shè)備和系統(tǒng)中。隨著科技的不斷進(jìn)步和應(yīng)用領(lǐng)域的擴(kuò)展,變阻器的未來(lái)發(fā)展趨勢(shì)和前景備受關(guān)注。 未來(lái)變阻器將趨向于智能化和多功能化,隨著物聯(lián)網(wǎng)
    發(fā)表于 10-10 14:35

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    ;社區(qū)活動(dòng)專版標(biāo)題名稱必須包含【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+自擬標(biāo)題 注意事項(xiàng) 1、活動(dòng)期間
    發(fā)表于 09-02 10:09

    音頻信號(hào)分析未來(lái)發(fā)展趨勢(shì)是什么

    音頻信號(hào)分析儀是一種用于測(cè)量和分析音頻信號(hào)的電子設(shè)備。隨著科技的不斷進(jìn)步,音頻信號(hào)分析儀的發(fā)展趨勢(shì)也在不斷演變。 引言 音頻信號(hào)分析儀作為音
    的頭像 發(fā)表于 06-03 16:43 ?500次閱讀

    國(guó)產(chǎn)ARM建設(shè)歷程 Arm計(jì)算在領(lǐng)域的實(shí)踐

    ARM 指令集兼容架構(gòu)已成為HPC 主流技術(shù)與未來(lái)發(fā)展的重要趨勢(shì),可滿足大型系統(tǒng)與商用HPC
    的頭像 發(fā)表于 01-25 14:06 ?1174次閱讀
    國(guó)產(chǎn)ARM<b class='flag-5'>超</b><b class='flag-5'>算</b>建設(shè)歷程 Arm計(jì)算在<b class='flag-5'>超</b><b class='flag-5'>算</b>領(lǐng)域的實(shí)踐

    DC電源模塊的未來(lái)發(fā)展趨勢(shì)

    BOSHIDA ?DC電源模塊的未來(lái)發(fā)展趨勢(shì) 未來(lái)DC電源模塊的發(fā)展趨勢(shì)可以預(yù)測(cè)如下: ?DC電源模塊的未來(lái)
    的頭像 發(fā)表于 01-25 10:55 ?502次閱讀
    DC電源模塊的<b class='flag-5'>未來(lái)</b><b class='flag-5'>發(fā)展趨勢(shì)</b>

    靜壓主軸的應(yīng)用、優(yōu)勢(shì)及發(fā)展趨勢(shì)?|深圳恒興隆機(jī)電a

    靜壓軸承,無(wú)需能量轉(zhuǎn)換,能夠降低能源消耗。同時(shí),無(wú)需潤(rùn)滑劑也減少了環(huán)境污染。三、靜壓主軸的發(fā)展趨勢(shì)1、更高速度隨著加工工藝的進(jìn)一步提高,對(duì)靜壓主軸在高速度下的穩(wěn)定性和精度要求也越來(lái)越高。因此,未來(lái)
    發(fā)表于 01-22 10:32

    探索AIGC未來(lái)CPU源碼優(yōu)化、多GPU編程與中國(guó)力瓶頸與發(fā)展

    近年來(lái),AIGC的技術(shù)取得了長(zhǎng)足的進(jìn)步,其中最為重要的技術(shù)之一是基于源代碼的CPU調(diào)優(yōu),可以有效地提高人工智能模型的訓(xùn)練速度和效率,從而加快了人工智能的應(yīng)用進(jìn)程。同時(shí),多GPU編程技術(shù)也在不斷發(fā)展
    的頭像 發(fā)表于 12-08 11:49 ?1460次閱讀
    探索AIGC<b class='flag-5'>未來(lái)</b>:<b class='flag-5'>CPU</b>源碼優(yōu)化、多<b class='flag-5'>GPU</b>編程與中國(guó)<b class='flag-5'>算</b>力瓶頸與<b class='flag-5'>發(fā)展</b>

    智能家居市場(chǎng)分析發(fā)展趨勢(shì)

    電子發(fā)燒友網(wǎng)站提供《智能家居市場(chǎng)分析發(fā)展趨勢(shì).pdf》資料免費(fèi)下載
    發(fā)表于 11-17 15:19 ?1次下載
    智能家居市場(chǎng)<b class='flag-5'>分析</b>及<b class='flag-5'>發(fā)展趨勢(shì)</b>

    CPU、GPU和內(nèi)存知識(shí)科普

    本文內(nèi)容包括CPU、內(nèi)存和GPU知識(shí),本期重點(diǎn)更新GPUCPU部分知識(shí)。比如:GPU更新包括架構(gòu)
    的頭像 發(fā)表于 11-13 11:47 ?1801次閱讀
    <b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>和內(nèi)存知識(shí)科普