0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

服務(wù)器市場被AMD蠶食,下一代至強(qiáng)能否逆轉(zhuǎn)頹勢

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-11-09 09:47 ? 次閱讀
Arm虎視眈眈,RISC-V新秀崛起的處境下,x86處理器內(nèi)部的競爭也進(jìn)入了白熱化階段。AMD繼推出Zen CPU架構(gòu)以來,總市場份額上正在一步步迎頭趕上,雖說桌面和移動CPU上英特爾與AMD打得有來有回,但服務(wù)器處理器市場份額上,AMD保持著穩(wěn)步增長的態(tài)勢,越來越多的云服務(wù)商和數(shù)據(jù)中心轉(zhuǎn)投了“AMD Yes”的陣營,更是在今年第三季度打破了市占率記錄,達(dá)到了16%。盡管英特爾依然占據(jù)著70%以上的市場,面臨多方壓力下,這種優(yōu)勢似乎難以繼續(xù)維持了。

在今年上半年推出了第三代至強(qiáng)可擴(kuò)展處理器之后,英特爾于近期透露了下一代服務(wù)器處理器“Sapphire Rapids”的更多情報(bào)。鑒于我們已經(jīng)在消費(fèi)級桌面處理器12代酷睿上看到了Intel 7制程帶來的驚艷改進(jìn),那么同用這一制程的下一代Xeon處理器,是否也能在明年發(fā)布之際一鳴驚人呢?

新的I/O與內(nèi)存

考慮到Sapphire Rapids定于明年發(fā)售,AMD的新一代EPYC處理器又發(fā)售在即,英特爾并沒有公布太多通用計(jì)算性能上的情報(bào)。但從英特爾在Innovation 2021和Linley Fall Processor兩場大會上公布的模組化芯片設(shè)計(jì),也能看出Sapphire Rapids并非什么泛泛之輩。

與剛發(fā)布的12代酷睿一樣,Sapphire Rapids 同樣引入了對PCIe 5.0的支持,也在此之上進(jìn)一步提升了處理器的DDIO和QoS能力。除此之外,CXL 1.1和全新的UPI 2.0也在支持之列。在UPI 2.0的互聯(lián)技術(shù)支持下,

Sapphire Rapids IP布局 / Intel

在服務(wù)器和數(shù)據(jù)中心應(yīng)用上,內(nèi)存也是最容易出現(xiàn)瓶頸的一大組成要素。我們可以從芯片原理圖中可以看出Sapphire Rapids集成了4個內(nèi)存控制器,以此最高支持8通道DDR5內(nèi)存。針對計(jì)算或額外開銷特別大的場景,英特爾也提供了旗下傲騰持久內(nèi)存Optane 300系列的支持,作為內(nèi)存支持的同時也可以作為存儲使用。英特爾還將推出支持HBM的版本,提供遠(yuǎn)高于8通道DDR5的內(nèi)存帶寬。該版本將提供兩種HBM模式,一種是HBM Flat模式,支持HBM+DDR5混用或是僅用HBM的模式。另一種是HBM緩存模式,將HBM作為DRAM的備用緩存,類似于一個L4緩存。

通用計(jì)算中的AI加速

隨著AI逐漸在服務(wù)器工作流中提高占比,AI計(jì)算能力成了每個服務(wù)器處理器都躲不開的參數(shù),這也成了英特爾在宣傳Sapphire Rapids時不離口的話題。第三代至強(qiáng)可擴(kuò)展處理器中,英特爾在其中內(nèi)置了深度學(xué)習(xí)加速器和AVX-512向量擴(kuò)展,為int8和bfloat16數(shù)據(jù)的推理和訓(xùn)練提供了支持。而在Sapphire Rapids中,英特爾又加入了兩大全新加速引擎AMX(先進(jìn)矩陣擴(kuò)展)和DSA(數(shù)據(jù)流加速器)。

AMX架構(gòu) / Intel

AMX乃是一種全新的切片式指令集擴(kuò)展,支持以切片運(yùn)作的加速器,也是英特爾專為張量運(yùn)算準(zhǔn)備的指令集擴(kuò)展。該擴(kuò)展由兩部分組成,切片和加速器。切片由8個2D寄存器堆組成,支持加載、清除和設(shè)為常量等基礎(chǔ)數(shù)據(jù)運(yùn)算符。每個寄存器堆大小可達(dá)1KB,但設(shè)計(jì)者也可以根據(jù)自己的算法來減小其規(guī)模。除此之外,英特爾也已經(jīng)確認(rèn)Linux 5.16版本將正式加入對于AMX的支持。

英特爾目前僅發(fā)布了TMUL加速器(切片矩陣乘法單元),但AMX是一個可以繼續(xù)擴(kuò)展下去的架構(gòu),未來還可以加入新的加速器,也可以改進(jìn)現(xiàn)有的TMUL加速器實(shí)現(xiàn)更高的性能,從而在單個指令和單個微操作下表達(dá)更多的工作,節(jié)省fetch、decode以及OOO的功耗。在測試中,同一個Sapphire Rapids處理器分別使用AMX指令和AVX-512 VNNI,AMX的運(yùn)算速度是后者的7.8倍。

過去AVX-512的使用中,經(jīng)常會出現(xiàn)功率上去后頻率也隨之降低的情況,不少人也擔(dān)心全新的AMX是否會有類似的情況。英特爾確認(rèn)在快速自動的得當(dāng)電源控制下,AMX不會出現(xiàn)AVX的頻率抖動現(xiàn)象。

有無DSA的CPU占用對比 / Intel

在高性能存儲、連接和密集處理的應(yīng)用中,人們總是想找到解放處理器核心來提升整體性能的方式。英特爾在這個需求上推出了DSA數(shù)據(jù)流加速器,DSA可以轉(zhuǎn)移CPU緩存、DDR內(nèi)存以及其他I/O附加設(shè)備的數(shù)據(jù),它的目標(biāo)是為數(shù)據(jù)轉(zhuǎn)移和轉(zhuǎn)換運(yùn)算提供更高的總體系統(tǒng)性能,讓CPU周期解放出來完成其他更高級的功能。根據(jù)英特爾給出的數(shù)據(jù),在OpenvSwitch的虛擬交換機(jī)應(yīng)用中,加入DSA分擔(dān)工作流后,CPU占用率降低了39%,數(shù)據(jù)轉(zhuǎn)移性能提高了2.5倍。

至強(qiáng)可以替代GPU嗎?

我們都知道如今的服務(wù)器市場已經(jīng)不是CPU一家獨(dú)大的天下了,無論是語音識別還是圖像處理,GPU帶來的AI計(jì)算能力滲透進(jìn)了每一個場景,任意深度學(xué)習(xí)“煉丹師”最先考慮的硬件設(shè)備也是GPU。在英特爾對Sapphire Rapids的描述中,稱其AI性能相較于上一代Ice Lake芯片有了30倍的提升,如此大幅度的提升能夠替代GPU嗎?

英特爾為Sapphire Rapids給出的對比對象為英偉達(dá)的A30 GPU,在ResNet-50 v1.5的圖像分類推理中,單個A30的輸出速度為15411張每秒,而兩個Sapphire Rapids的成績達(dá)到了24000張每秒以上。這一數(shù)字對比看起來似乎優(yōu)勢巨大,甚至接近于29855張每秒的A100 GPU,但測試中用到的乃是高端Sapphire Rapids型號(40核以上),無論是功耗和價格都要遠(yuǎn)超A30。

因而現(xiàn)階段下,仍在使用大量AI負(fù)載的服務(wù)器并不會從現(xiàn)有的GPU或ASIC架構(gòu)遷移。不過Sapphire Rapids本身也并非僅針對AI的特化產(chǎn)品,之所以x86 CPU要費(fèi)心費(fèi)力地去提高AI性能,也是面向通用計(jì)算與AI結(jié)合這樣越來越普遍的輕度AI場景。

小結(jié)

要想把AMD奪去的市場份額奪回來并不容易,英特爾面臨的已經(jīng)不是本世紀(jì)初的雙雄爭霸局面了。Sapphire Rapids可以說是換帥、換制程和換架構(gòu)后的首個服務(wù)器產(chǎn)品,如果不能一鳴驚人的話,不少客戶可能都會被AMD未來更注重成本效能的Zen 4D與Zen 5奪走。而面對Arm、RISC-V、GPU、ASIC等多方入局AI的挑戰(zhàn),如果英特爾仍想保持x86的霸主地位,也必須加速開發(fā)自身的Xe服務(wù)器GPU,同時繼續(xù)擴(kuò)展x86下的AI加速器生態(tài)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18927

    瀏覽量

    227231
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5376

    瀏覽量

    133382
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9748

    瀏覽量

    170652
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10702

    瀏覽量

    209373
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8701

    瀏覽量

    84549
收藏 人收藏

    評論

    相關(guān)推薦

    控制當(dāng)前和下一代功率控制的輸入功率

    電子發(fā)燒友網(wǎng)站提供《控制當(dāng)前和下一代功率控制的輸入功率.pdf》資料免費(fèi)下載
    發(fā)表于 09-18 11:31 ?0次下載
    控制當(dāng)前和<b class='flag-5'>下一代</b>功率控制<b class='flag-5'>器</b>的輸入功率

    通過電壓轉(zhuǎn)換啟用下一代ADAS域控制應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《通過電壓轉(zhuǎn)換啟用下一代ADAS域控制應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 11:32 ?0次下載
    通過電壓轉(zhuǎn)換啟用<b class='flag-5'>下一代</b>ADAS域控制<b class='flag-5'>器</b>應(yīng)用說明

    Intel預(yù)告下一代至強(qiáng)處理:Diamond Rapids攜LGA9324接口震撼登場

    據(jù)8月23日最新消息,Intel 已在緊鑼密鼓地準(zhǔn)備其下一代至強(qiáng)處理的安裝測試工具,這款代號“Diamond Rapids”的處理預(yù)示著又
    的頭像 發(fā)表于 08-23 14:51 ?608次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    大規(guī)模生產(chǎn)環(huán)境落地應(yīng)用的條件。某種程度上,IoD 技術(shù)已成為下一代高性能算力底座的核心技術(shù)與最佳實(shí)踐。 白皮書下載:*附件:IaaS+on+DPU(IoD)+下一代高性能算力底座+技術(shù)白皮書(1).pdf
    發(fā)表于 07-24 15:32

    24芯M16插頭在下一代技術(shù)中的潛力

      德索工程師說道隨著科技的飛速發(fā)展,下一代技術(shù)正逐漸展現(xiàn)出其獨(dú)特的魅力和潛力。在這背景下,24芯M16插頭作為種高性能、多功能的連接,將在
    的頭像 發(fā)表于 06-15 18:03 ?178次閱讀
    24芯M16插頭在<b class='flag-5'>下一代</b>技術(shù)中的潛力

    金山云發(fā)布第九高效型云服務(wù)器SE9

    近日,金山云正式發(fā)布了基于英特爾?至強(qiáng)?6能效核處理的第九服務(wù)器高效型SE9。這款新型云服務(wù)器在計(jì)算性能和性價比上均實(shí)現(xiàn)了顯著提升,為
    的頭像 發(fā)表于 06-11 09:31 ?470次閱讀

    AMD計(jì)劃采用三星3nm GAA制程量產(chǎn)下一代芯片

    在近日于比利時微電子研究中心(imec)舉辦的2024年全球技術(shù)論壇(ITF World 2024)上,AMD首席執(zhí)行官蘇姿豐透露了公司的最新技術(shù)動向。她表示,AMD將采用先進(jìn)的3nm GAA(Gate-All-Around)制程技術(shù)來量產(chǎn)其
    的頭像 發(fā)表于 05-31 09:53 ?499次閱讀

    超微發(fā)布新款AMD H13CPU服務(wù)器產(chǎn)品

    超微(Supermicro)近日宣布推出全新AMD H13CPU服務(wù)器產(chǎn)品系列,再度鞏固其在人工智能、云技術(shù)、存儲和5G/邊緣計(jì)算領(lǐng)域的領(lǐng)先地位。此次新品在性能和效率上均實(shí)現(xiàn)了卓越平衡,搭載
    的頭像 發(fā)表于 05-28 10:30 ?535次閱讀

    華碩微星發(fā)布AGESA固件更新,確認(rèn)兼容AMD一代Ryzen處理

    近日,華碩與微星先后對 AMD 600 系列主板推出AGESA固件更新,確認(rèn)了其兼容“下一代AMD Ryzen CPU”的能力;技嘉亦證實(shí),下一代Ryzen桌面處理
    的頭像 發(fā)表于 04-24 15:34 ?445次閱讀

    臺達(dá)推出提高人工智能服務(wù)器和數(shù)據(jù)中心能效的下一代電源解決方案

    臺達(dá)電子(Delta)是電源與散熱管理解決方案的領(lǐng)導(dǎo)廠商,在IEEE應(yīng)用電力電子會議暨博覽會(APEC)2024上,推出了提高人工智能(AI)服務(wù)器和數(shù)據(jù)中心能效的下一代電源解決方案。
    的頭像 發(fā)表于 04-10 15:06 ?756次閱讀

    BlackBerry宣布與AMD合作革新下一代機(jī)器人系統(tǒng)

    德國,紐倫堡 – 2024年4月9日 – 在今日舉行的國際嵌入式展會(Embedded World)上,BlackBerry(紐約證券交易所代碼:BB;多倫多證券交易所代碼:BB)宣布與AMD合作,旨在通過實(shí)現(xiàn)新水平的低延遲、低抖動和可重復(fù)確定性,革新下一代機(jī)器人系統(tǒng)。
    的頭像 發(fā)表于 04-10 14:39 ?537次閱讀

    第五英特爾至強(qiáng)處理,AI特化的通用服務(wù)器CPU

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI已經(jīng)成了數(shù)據(jù)中心與服務(wù)器市場的主流應(yīng)用,就連通用服務(wù)器CPU,也開始著重加強(qiáng)AI計(jì)算能力。為此,英特爾于去年年底發(fā)布了第五
    的頭像 發(fā)表于 03-18 08:14 ?3801次閱讀
    第五<b class='flag-5'>代</b>英特爾<b class='flag-5'>至強(qiáng)</b>處理<b class='flag-5'>器</b>,AI特化的通用<b class='flag-5'>服務(wù)器</b>CPU

    英特爾展示下一代至強(qiáng)處理,助力vRAN性能顯著提升

    里程碑事件不僅凸顯了移動行業(yè)推動vRAN和Open RAN發(fā)展的長期投入,也表明了英特爾正在持續(xù)踐行其以領(lǐng)先的產(chǎn)品路線圖助力行業(yè)發(fā)展的堅(jiān)定承諾。代號為Granite Rapids–D的下一代至強(qiáng)處理將于2025年發(fā)布,這款處理
    的頭像 發(fā)表于 03-01 15:43 ?300次閱讀
    英特爾展示<b class='flag-5'>下一代</b><b class='flag-5'>至強(qiáng)</b>處理<b class='flag-5'>器</b>,助力vRAN性能顯著提升

    寶德服務(wù)器全面升級到第五英特爾?至強(qiáng)?平臺

    發(fā)布全新一代基于第五英特爾?至強(qiáng)?可擴(kuò)展處理的寶德服務(wù)器。 ? 卓越性能,新一代寶德
    的頭像 發(fā)表于 12-21 16:12 ?550次閱讀
    寶德<b class='flag-5'>服務(wù)器</b>全面升級到第五<b class='flag-5'>代</b>英特爾?<b class='flag-5'>至強(qiáng)</b>?平臺

    AMD選擇三星代工廠制造下一代的4nm Zen 5c架構(gòu)產(chǎn)品

    AMD向傾向于使用臺積電打造其最先進(jìn)的硅設(shè)計(jì),當(dāng)然,并不包括他們目前正在研發(fā)中的下一代Zen 5c架構(gòu)產(chǎn)品。根據(jù)份來自臺灣的新報(bào)告,AMD
    的頭像 發(fā)表于 11-22 13:44 ?579次閱讀
    <b class='flag-5'>AMD</b>選擇三星代工廠制造<b class='flag-5'>下一代</b>的4nm Zen 5c架構(gòu)產(chǎn)品