電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經(jīng)開(kāi)始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達(dá)則因?yàn)樵?a href="http://ttokpm.com/tags/gpu/" target="_blank">GPU上的頭號(hào)交椅地位,成了堅(jiān)持所有堅(jiān)持CPU+GPU架構(gòu)超算的首選。
非但如此,英偉達(dá)開(kāi)始在ARM生態(tài)上有所動(dòng)作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級(jí)計(jì)算機(jī)系統(tǒng)阿爾卑斯所用。然而近來(lái)的一系列動(dòng)向表明,超算市場(chǎng)并不會(huì)就此維持定局。
英特爾:GPU和異構(gòu)開(kāi)始猛追
英特爾耕耘了這么多年HPC和超算市場(chǎng),自然不會(huì)白白認(rèn)輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會(huì)上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個(gè)Xeon插槽的設(shè)計(jì),由此推出全新的XPU,代號(hào)名為Falcon Shores。
Falcon Shores將融合通用x86處理器核心和高度并行計(jì)算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說(shuō)法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個(gè)插槽的計(jì)算密度提升5倍,與現(xiàn)有的設(shè)計(jì)相比,可將性能功耗比提升5倍以上。
這對(duì)于英特爾目前的戰(zhàn)略來(lái)說(shuō),基本上可以說(shuō)是必選的一條技術(shù)路線。考慮到英特爾在先進(jìn)封裝技術(shù)上并未止步,工藝節(jié)點(diǎn)也開(kāi)始跟上主流代工廠的節(jié)奏,異構(gòu)計(jì)算的設(shè)計(jì)已經(jīng)在英特爾近期推出的諸多產(chǎn)品中得到了驗(yàn)證,通用內(nèi)存也已經(jīng)在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經(jīng)在其Sapphire Rapids Xeon服務(wù)器處理器上用到了HBM2e這類高帶寬內(nèi)存,F(xiàn)alcon Shores中自研的高帶寬內(nèi)存會(huì)有何等性能確實(shí)令人好奇。
Falcon Shores的另一大優(yōu)勢(shì)在與靈活的核心配比,根據(jù)工作負(fù)載來(lái)調(diào)整x86核心與Xe核心。英特爾在會(huì)上不斷給出十萬(wàn)億億級(jí)的概念,這樣的性能在Falcon Shores的性能下似乎是可行的,不過(guò)這一XPU正式進(jìn)入超算市場(chǎng)的時(shí)間不會(huì)太快,而是要等到2024年,借助那時(shí)的埃米級(jí)工藝和Foveros封裝技術(shù)才能實(shí)現(xiàn)。
英偉達(dá):不放棄ARM,也不放棄互聯(lián)
前陣子英偉達(dá)收購(gòu)ARM失敗的消息傳來(lái),不少人認(rèn)為英偉達(dá)會(huì)就此放棄這塊蛋糕,然而英偉達(dá)CEO黃仁勛卻表示他們并不會(huì)就此放棄ARM生態(tài),未來(lái)將繼續(xù)推出Grace這樣基于ARM架構(gòu)的CPU。之所以能有如此的底氣,在于英偉達(dá)那20年的ARM架構(gòu)授權(quán)。
目前擁有ARM架構(gòu)授權(quán)的企業(yè)屈指可數(shù),更不用說(shuō)64位的授權(quán),并將其用于HPC市場(chǎng)了。英偉達(dá)如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場(chǎng)其實(shí)又有所不同。
Grace雖然性能不差,但與這些x86 CPU在通用計(jì)算上相比還是略遜一籌,況且也不是所有研究機(jī)構(gòu)或超算中心都會(huì)像日本一樣,構(gòu)建富岳或紫藤花這種規(guī)模的ARM超算。英偉達(dá)追求的并不是在通用計(jì)算上超過(guò)其他兩家數(shù)十年的積累,而是專注于AI算力。訓(xùn)練自然語(yǔ)言處理模型、利用GPU加速深度學(xué)習(xí),這才是英偉達(dá)的優(yōu)勢(shì)所在。
這時(shí)問(wèn)題來(lái)了,為何超算不選擇其它通用CPU或其它的GPU產(chǎn)品呢?這樣既能兼顧通用計(jì)算性能,也能用的GPU的加速性能。這是因?yàn)橛ミ_(dá)準(zhǔn)備了專用于自家CPU和GPU的互聯(lián)技術(shù)NVLink。過(guò)去僅有GPU產(chǎn)品的英偉達(dá)僅僅將NVLink技術(shù)用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink 4.0可以為Grace CPU和英偉達(dá)GPU牽線搭橋。
更不用說(shuō)英偉達(dá)已經(jīng)在2020年收購(gòu)了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網(wǎng)互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術(shù)。英偉達(dá)與Mellanox的結(jié)合,直接覆蓋了三分之二的頂級(jí)超算系統(tǒng)。未來(lái)的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達(dá)擔(dān)心競(jìng)品的出現(xiàn),而是其性能表現(xiàn)之強(qiáng),讓你不得不選擇他們旗下的產(chǎn)品。
小結(jié)
英特爾在超算上的發(fā)力歸根結(jié)底還是靠Xe HPC這樣的GPU核心,但作為GPU新秀的英特爾短時(shí)間還是無(wú)法撼動(dòng)英偉達(dá)在超算上的地位。而英偉達(dá)的ARM計(jì)劃未來(lái)如何演進(jìn)也令人十分期待,畢竟這一產(chǎn)品線不像其消費(fèi)級(jí)GPU,還未有任何路線圖公布。但喜人的一點(diǎn)是,超算從百億億級(jí)過(guò)渡到十萬(wàn)億億級(jí)的過(guò)程中,勢(shì)必會(huì)有更多的創(chuàng)新方案出現(xiàn)。
原文標(biāo)題:超算硝煙再起,CPU+GPU還能玩出新花樣?
文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
ARM
+關(guān)注
關(guān)注
134文章
9027瀏覽量
366476 -
英特爾
+關(guān)注
關(guān)注
60文章
9861瀏覽量
171287 -
cpu
+關(guān)注
關(guān)注
68文章
10804瀏覽量
210828
原文標(biāo)題:?超算硝煙再起,CPU+GPU還能玩出新花樣?
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論