0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD EPYC(霄龍)Genoa服務(wù)器 | 綜合評(píng)測(cè)

GPU視覺識(shí)別 ? 來源:GPU視覺識(shí)別 ? 作者:GPU視覺識(shí)別 ? 2022-11-17 16:05 ? 次閱讀

當(dāng)生命科學(xué)、醫(yī)藥研發(fā)、東數(shù)西算、數(shù)據(jù)分析、數(shù)據(jù)挖掘、算力、數(shù)據(jù)中心、智算中心、遙感測(cè)繪、地質(zhì)遙感等場(chǎng)景逐漸成熟,上層應(yīng)用場(chǎng)景改變了底層硬件基礎(chǔ),計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)架構(gòu)的迭代升級(jí)和調(diào)整融合,對(duì)服務(wù)器產(chǎn)品的形態(tài),性能等方面提出了更高的要求,更強(qiáng)算力、更高性能還要兼顧節(jié)能成為企業(yè)用戶的關(guān)注點(diǎn)。

注:由于篇幅有限需要更多 AMD、Intel 詳細(xì)資料,請(qǐng)?jiān)诠娞?hào)末尾留下您的郵箱,小編會(huì)將PDF文件發(fā)您郵箱,共同進(jìn)步學(xué)習(xí)。

企業(yè)為尋求更加敏捷、靈活和高效的應(yīng)用開發(fā)模式,以加速應(yīng)用的創(chuàng)新和快速上市,云原生等應(yīng)用開發(fā)模式拉近了業(yè)務(wù)和計(jì)算平臺(tái)之間的聯(lián)系,應(yīng)用開發(fā)團(tuán)隊(duì)將定義基礎(chǔ)設(shè)施的性能、可用性和規(guī)模,直接推動(dòng)計(jì)算平臺(tái)架構(gòu)的變革和創(chuàng)新。

在這個(gè)背景下,代號(hào)為“Genoa”的 AMD EPYC 9004系列產(chǎn)品在11月11日推出。該芯片在數(shù)據(jù)中心、企業(yè)數(shù)據(jù)服務(wù)、云計(jì)算、高性能計(jì)算中經(jīng)常使用,提高了15-25%的性能。全新 AMD EPYC Genoa 改變了服務(wù)器的基礎(chǔ)即每個(gè)插槽 50-60%(或更多)的改進(jìn),這意味著可以實(shí)現(xiàn) 3:2 或 2:1 的整合)。如果使用3-5 年的至強(qiáng)可擴(kuò)展服務(wù)器到 EPYC,整合潛力將更加巨大(有望達(dá)到4:1)。這個(gè)新系列不僅是額外的內(nèi)核或一些新功能突出。

藍(lán)海大腦AMD EYPC 9004系列服務(wù)器

當(dāng)前CPU市場(chǎng)背景

目前獨(dú)立顯卡市場(chǎng)僅有英偉達(dá)和AMD兩家,集成顯卡市場(chǎng)還要算上英特爾。

一、英特爾

英特爾在液冷GPU服務(wù)器領(lǐng)域布局,自首款產(chǎn)品Pentium Pro推出以來,已經(jīng)有25年之久。英特爾擁有高達(dá) 28 個(gè)內(nèi)核和 6 個(gè) DDR4 通道的芯片(Ice Lake和Cooper Lake是其第三代英特爾至強(qiáng)可擴(kuò)展家族的一部分),可以擴(kuò)展到 4-8 個(gè)插槽(或減少至一個(gè))。和40核和8通道的DDR4用于2個(gè)插槽應(yīng)用程序(完整的指令集是常見的但是也有例外,如bfloat16支持兩者之間并不相同)。

如果想要配置具有 2 個(gè) 40 核 Ice Lake Xeon CPU 的高端雙插槽 Ice Lake 服務(wù)器,以及具有 4 個(gè) 28 核 CPU 的高端 4 插槽服務(wù)器,那么將總共獲得 192 個(gè)內(nèi)核(與高端雙插槽熱那亞服務(wù)器相同)。總內(nèi)存帶寬也將處于類似的范圍內(nèi)。當(dāng)Sapphire Rapids在2023年到來時(shí),英特爾將專注于16-64核心的主流市場(chǎng)。

二、AMD

AMD在高端芯片中擁有大約50%的核心數(shù)量?jī)?yōu)勢(shì),其重點(diǎn)在購(gòu)買較低內(nèi)核數(shù)SKU的市場(chǎng)中心進(jìn)行競(jìng)爭(zhēng),并利用加速器提供遠(yuǎn)遠(yuǎn)超出內(nèi)核本身所能提供的性能提升。

全新的AMD EPYC Bergamo(使用與熱那亞相同的AMD Socket SP5,但重點(diǎn)是最大化云工作負(fù)載的核心數(shù)量)通過減少緩存大小以適應(yīng)更多內(nèi)核。全新的AMD EPYC Bergamo是AMD的高內(nèi)核數(shù)解決方案,每個(gè)插槽最多128個(gè)內(nèi)核。AMD EPYC 9004 CPU的宣傳只有96個(gè)核心。

Genoa-X將打破L3緩存的1GB /插槽障礙。使用標(biāo)準(zhǔn) EYPC 9004 CPU,每個(gè)插槽可獲得高達(dá) 384MB 的 L3 緩存或每個(gè) 768P 服務(wù)器高達(dá) 2MB 的 L3 緩存。使用Milan-X,有 64 個(gè)內(nèi)核,每個(gè)插槽高達(dá) 768MB 的三級(jí)緩存。

預(yù)計(jì) 2023年AMD 將在雙插槽服務(wù)器中提供超過 2GB 的 L3 緩存。Genoa-X將針對(duì)HPC領(lǐng)域的應(yīng)用,在這些應(yīng)用中,添加3DV緩存可以提高數(shù)據(jù)局部性,從而減少移動(dòng)數(shù)據(jù)浪費(fèi)的功率。新的AMD EPYC(霄龍)平臺(tái)將更適用于邊緣計(jì)算、HPC和云計(jì)算等領(lǐng)域。

pYYBAGN16zuABbdGAAUOfLci-vg163.png

AMD EYPC Zen4架構(gòu)

EPYC 9004系列基于和桌面銳龍7000系列同款的Zen4架構(gòu),只是針對(duì)服務(wù)器與數(shù)據(jù)中心應(yīng)用做了適當(dāng)?shù)恼{(diào)整優(yōu)化。

整體而言,綜合計(jì)算33種不同的服務(wù)器負(fù)載,Zen4架構(gòu)的IPC相比Zen3提升了大約14%,這比銳龍7000系列的提升高了1個(gè)百分點(diǎn)。

不同模塊的貢獻(xiàn)差不多,最大的還是前端部分,接下來是載入/存儲(chǔ)、分支預(yù)測(cè)、執(zhí)行引擎、二級(jí)緩存。

AMD EPYC 9004 系列主要在兩個(gè)方面進(jìn)行改進(jìn)。

一、微架構(gòu)的改進(jìn)

AMD EPYC Zen 4是Zen 3代相對(duì)較小的微架構(gòu)更新。但這并不是說沒有更新,只是不是Zen 2到Zen 3或Zen 4到Zen 5計(jì)劃的巨大飛躍。

二、緩存層次結(jié)構(gòu)的改進(jìn)

最大的變化之一是AMD正在添加更多的緩存,并做更多的工作來啟動(dòng)不同的緩存階段。憑借雙倍的二級(jí)緩存,新芯片可以將更多數(shù)據(jù)保留在內(nèi)核本地,而不必發(fā)送到內(nèi)存層次結(jié)構(gòu)的更高級(jí)別。

poYBAGN16zuAC0ppAAGhrqZyUEg580.png

Zen 3 和 Zen 4 微架構(gòu)不同部分的一些關(guān)鍵比較

AVX-512指令集其實(shí)也是一模一樣的,但它在服務(wù)器數(shù)據(jù)中心顯然更加如魚得水,作用更加明顯。

根據(jù)AMD提供的數(shù)字,EYPC 9004系列相比EPYC 7763系列,得益于規(guī)格性能的改進(jìn),尤其是AVX-512指令集的加持,NLP吞吐量、物體檢測(cè)吞吐量、圖像識(shí)別吞吐量分別增加了大約4.2倍、3.5倍、3倍之多!

pYYBAGN16zuAdYLeAAB2vBmPlG8818.jpg

安全方面也更豐富,其中安全加密虛擬化(SEV)方面,除了繼續(xù)支持SME、SEVES、SEV-SNP,還將內(nèi)存加密升級(jí)到AES-256-XTS,并支持1006個(gè)加密客戶機(jī),支持多重主機(jī)密鑰(SMKE)。

另外強(qiáng)化了對(duì)客戶機(jī)的保護(hù),尤其是可免于SMT攻擊。

poYBAGN16zuAa5QHAABZ5uIHRwY973.jpg

SOC 平臺(tái)

AMD EPYC(霄龍)9004系列依然沒有獨(dú)立芯片組,而是一個(gè)完整的SoC,延續(xù)chiplet小芯片設(shè)計(jì)可將 8 核 CCD 的數(shù)量從 4 個(gè)擴(kuò)展到 12 個(gè)。9004系列內(nèi)部包含一個(gè)IOD、最多12個(gè)CCD。(CCD每個(gè)集成8顆Zen4 CPU核心、32MB三級(jí)緩存,合計(jì)最多96核心、384MB三級(jí)緩存,同時(shí)也有8個(gè)CCD、4個(gè)CCD的版本,分別最多64核心、32核心)。IOD內(nèi)集成了DDR5內(nèi)存控制器、PCIe 5.0/CXL 1.1+控制器、第三代Infinity Fabric控制器、安全處理器。

pYYBAGN16zyAGdZKAABujJHu6a0585.jpg

AMD EPYC 9004 小芯片架構(gòu) 4x CCD

單路配置下,EPYC 9004系列可搭配最多24條DDR5內(nèi)存,每通道2條(2DPC),可提供128條PCIe 5.0、8條PCIe 3.0通道。

雙路配置下,每個(gè)內(nèi)存通道就只能裝1條了(1DPC),最多還是12條,PCIe 5.0通道對(duì)外可用則是最多160條,每路80條對(duì)外、48條用于彼此互連,另外還有12條PCIe 3.0,每路6條。

AA143VpV.img?w=600&h=337&m=6

IF高速總線升級(jí)到了第三代,最高帶寬32Gbps,可選3條或4條鏈接,前者是默認(rèn)的,此時(shí)對(duì)應(yīng)的系統(tǒng)可用PCIe 5.0通道數(shù)量就是剛才說的160條。

如果選擇4鏈接,每路處理器就要貢獻(xiàn)一半的PCIe 5.0通道用于彼此互連,留給系統(tǒng)可用的就是128條,這和上代是相同的。當(dāng)然,即便同樣128條,從PCIe 4.0升級(jí)到PCIe 5.0,可用帶寬也是翻倍的。

AA143GHf.img?w=600&h=337&m=6

I/O性能方面,EPYC 9004支持新的高級(jí)虛擬中斷控制器(AVIC),提升虛擬中斷性能,并改善了中斷處理吞吐量,包括CPU核心內(nèi)部與SoC層面。

搭配PCIe 4.0 x16規(guī)格的200Gbps(20萬兆)網(wǎng)卡,默認(rèn)設(shè)置下效率即可超過90%,最高達(dá)94%,單向能跑到188Gbps,雙向則能跑到375Gbps。

如果搭配PCIe 5.0 x16規(guī)格的400Gbps(40萬兆) InfiBand高速網(wǎng)絡(luò),標(biāo)準(zhǔn)配置下效率也能超過90%,最高甚至達(dá)99%,能跑出396Gbps。

AMD擁有新一代的Infinity Fabric接口(插座與插座互聯(lián)),AMD的Infinity Fabric使用SerDes,可以處理PCIe之類的事情,因此隨著這些SerDes對(duì)PCIe的速度越來越快,Infinity Fabric也緊隨其后。AMD在鏈路上從PCIe Gen3時(shí)代轉(zhuǎn)向Gen5時(shí)代意味著互連帶寬現(xiàn)在很大。

內(nèi)存DDR5

內(nèi)存方面,一如桌面銳龍7000系列,EPYC 9004也僅支持DDR5,可以帶來更高的頻率與帶寬、更低的電壓與功耗、更好的電源管理(板載PMIC)、更多的通道與更低的延遲、更大的容量、更好的校驗(yàn)糾錯(cuò)(板載ECC)等。

AA143BWy.img?w=600&h=337&m=6

EPYC 9004系列支持12個(gè)DDR5內(nèi)存通道(12 個(gè)內(nèi)存通道中的許多通道都是為了在高端部件上保持相同的比例),單路最大容量6TB(單條512GB)。標(biāo)準(zhǔn)的4800MHz頻率下,峰值理論帶寬可達(dá)460GB/s。

延遲方面,EPYC 9004略有增加,但影響不大,其中SoC約73ns、設(shè)備約45ns,總計(jì)約118ns,比上代分別增加了3ns、10ns。

EPYC 9004還支持每路多重內(nèi)存節(jié)點(diǎn)(NPS),可以對(duì)12條內(nèi)存進(jìn)行分組管理,進(jìn)一步優(yōu)化性能。

poYBAGN16zyAUx9gAAF8f8LqCnU551.png

CXLL概述

CXLL,也就是Compute EXpress Link,一種緩存一致性高速互連行業(yè)標(biāo)準(zhǔn),主要用于處理器、內(nèi)存擴(kuò)展與加速器。

CXLL有三種工作模式,EPYC 9004并不支持第一種(面向NIC網(wǎng)卡)、第二種(面向GPU/FPGA/加速器等密集計(jì)算),而僅支持第三種,也就是內(nèi)存緩沖,可擴(kuò)展內(nèi)存帶寬與容量,協(xié)議走的是cxl.io、cxl.mem。

pYYBAGN16zyAdB8nAAIuMGj8XYg195.png

總的來說,AMD EPYC 9004系列在延續(xù)chiplet設(shè)計(jì)的同時(shí),升級(jí)了工藝、架構(gòu),升級(jí)了內(nèi)存、擴(kuò)展連接等,整體規(guī)格、特性上了一個(gè)大大的臺(tái)階。

此外,Zen EPYC家族還會(huì)陸續(xù)還會(huì)推出采用3D V-Cache技術(shù)的更高性能版“Genoa-X”,面向云計(jì)算服務(wù)的“Bergamo”(貝爾加莫),以及面向電信基礎(chǔ)設(shè)施和邊緣計(jì)算的“Siena”(錫耶納),組成完整的產(chǎn)品矩陣。

poYBAGN16zyATZGYAAJkEWIpjks613.png

新芯片支持 CXL 1.1(多達(dá) 64 個(gè)通道可用于 CXL 設(shè)備,并且 CXL 1.1 x16 連接的帶寬大致與兩個(gè) DDR5 通道一樣多,從理論上講,AMD 不僅可以使用 CXL 1.1 設(shè)備獲得更多內(nèi)存容量,還可以獲得更多可用帶寬),具有一些前向功能。AMD 僅支持可以視為內(nèi)存擴(kuò)展設(shè)備的 Type 3 內(nèi)存緩沖區(qū)。這些節(jié)點(diǎn)通常在操作系統(tǒng)中顯示為具有附加內(nèi)存容量但沒有 CPU 的新 NUMA 節(jié)點(diǎn)。

SKU

AMD EPYC 9004 Genoa 系列推出時(shí)有 18 個(gè) SKU(14 個(gè)不同的 SKU),有 4 個(gè)單插槽“P”變體。擁有四個(gè)“F”SKU,用于頻率優(yōu)化部件,增量為 16、24、32 和 48。有五個(gè)較低的內(nèi)核計(jì)數(shù) SKU,其中 32 個(gè)內(nèi)核有一個(gè) P 變體。最后,還有密度優(yōu)化的SKU,有五個(gè)模型和三個(gè)P變體。

總的來說,AMD旨在增加更新更快內(nèi)核的價(jià)值。AMD正在大量部署單插槽服務(wù)器。在前幾代產(chǎn)品中,AMD 證明了范式轉(zhuǎn)變。對(duì)于Genoa,似乎擁有大規(guī)模1P系統(tǒng)的能力意味著AMD并沒有大幅打折1P。

pYYBAGN16z2AZhDTAAGwGTZ2HrQ925.png

AMD EPYC 9004 SKU 列表及功能

芯片性能

在實(shí)際工作負(fù)載中,如果在大型芯片上運(yùn)行單個(gè)工作負(fù)載,有時(shí)工作負(fù)載中存在單線程部分。會(huì)導(dǎo)致大型芯片的性能非常差,因?yàn)檫@些工作負(fù)載看起來像這樣,384 個(gè)線程中有 1 個(gè)以 100% 的速度運(yùn)行。在雙 4 核/8 線程服務(wù)器上,單個(gè)線程占總線程數(shù)的 6% 以上。在雙 96 核/192 線程服務(wù)器上,單個(gè)線程剛剛超過 0.26%。

許多工作負(fù)載已經(jīng)擴(kuò)展多年,但僅限于 256 個(gè)線程。這意味著 1/3 的線程未被使用。

展望未來,我們將越來越多地使用裸機(jī)容器,然后使用虛擬化工作負(fù)載進(jìn)行擴(kuò)展。這與VMware VMmark類似,但KVM是更大的虛擬機(jī)管理程序,其云采用,VMware對(duì)VMmark施加了限制。盡管如此,在未來考慮兩者仍然很重要,因?yàn)橛幸环N觀點(diǎn)認(rèn)為,在 384 線程系統(tǒng)上擊中工作負(fù)載的單線程部分對(duì)整體性能來說是可怕的。

STH nginx CDN性能

基準(zhǔn)測(cè)試的世界幾乎總是在整個(gè) CPU 上運(yùn)行單個(gè)工作負(fù)載。即渲染工作負(fù)載、HPC 工作負(fù)載等將使用整個(gè)芯片。盡管如此,大多數(shù)芯片確實(shí)用于容器化或虛擬化工作負(fù)載。云計(jì)算就是一個(gè)典型的例子。未來我們將越來越多地使用裸機(jī)容器,然后使用虛擬化工作負(fù)載進(jìn)行擴(kuò)展。這類似于 VMware VMmark 所做的,但 KVM 是更大的虛擬機(jī)管理程序,它采用云計(jì)算,而 VMware 對(duì) VMmark 施加了限制。

在設(shè)計(jì)基準(zhǔn)套件時(shí),可以在網(wǎng)上看到的許多工作負(fù)載理想情況下會(huì)嘗試在整個(gè) CPU 上運(yùn)行一個(gè)工作負(fù)載。在實(shí)際工作負(fù)載中,如果在大型芯片上運(yùn)行單個(gè)工作負(fù)載,有時(shí)工作負(fù)載會(huì)有單線程部分。這導(dǎo)致大芯片上的一些性能非常差,384 個(gè)線程中有 1 個(gè)線程以 100% 運(yùn)行。

在雙 4 核 / 8 線程服務(wù)器上,單線程占總線程數(shù)的 6% 以上。在雙 96 核/192 線程服務(wù)器上,單線程僅超過 0.26%。

一、Python Linux 4.4.2 內(nèi)核編譯基準(zhǔn)

任務(wù)很簡(jiǎn)單,我們有一個(gè)標(biāo)準(zhǔn)配置文件,來自kernel.org的 Linux 4.4.2 內(nèi)核,并利用系統(tǒng)中的每個(gè)線程進(jìn)行標(biāo)準(zhǔn)的自動(dòng)生成配置。以每小時(shí)編譯的形式表示結(jié)果,以使結(jié)果更易于閱讀。

pYYBAGN16z6AMuA1AAKD1iNgqSA499.png

二、c-ray 1.1 性能

這是一個(gè)非常流行的光線追蹤基準(zhǔn)測(cè)試,用于顯示多線程工作負(fù)載下處理器的差異。以下是 8K 結(jié)果:

poYBAGN16z6AfixhAALTHrCZLuE866.png

有趣的是,當(dāng) 8K 渲染會(huì)對(duì)四路服務(wù)器施加壓力數(shù)分鐘時(shí),我們就開始收集有關(guān)這種渲染風(fēng)格基準(zhǔn)的數(shù)據(jù)?,F(xiàn)在,新一代在 13 秒內(nèi)完成了運(yùn)行。

三、7-zip 壓縮性能

7-zip是一種廣泛使用的跨平臺(tái)壓縮/解壓縮程序。在早期的Windows測(cè)試中開始使用該程序。它現(xiàn)在是Linux-Bench的一部分。這里使用傳統(tǒng)運(yùn)行來顯示擴(kuò)展,即使不點(diǎn)擊加速器。

pYYBAGN16z6ARdfQAAME8zeWm9s452.png

同樣,這是一個(gè)出色的性能,盡管在壓縮方面看到更高核心數(shù)量的擴(kuò)展挑戰(zhàn)。然而,壓縮是一項(xiàng)在未來將無處不在的功能,但也將保證卸載到加速器。

四、國(guó)際象棋基準(zhǔn)測(cè)試

國(guó)際象棋是一個(gè)有趣的用例,因?yàn)樗哂袔缀鯚o限的復(fù)雜性。

poYBAGN16z-AMBKIAALOp7R_s0g799.png

這里的一個(gè)主要挑戰(zhàn)是基準(zhǔn)測(cè)試在 256 個(gè)線程時(shí)停止了擴(kuò)展。必須將基準(zhǔn)測(cè)試拆分為通過容器在兩個(gè) 192 線程實(shí)例中運(yùn)行以獲得上述結(jié)果。否則,三分之一的芯片沒有被使用。

五、SPEC CPU2017 結(jié)果

首先,展示最常用的企業(yè)和云基準(zhǔn),SPEC CPU2017的整數(shù)速率性能:

pYYBAGN16z-AYYTTAAL8EnUtros404.png

在這里,需要添加更多內(nèi)核、更高的時(shí)鐘速度和內(nèi)存帶寬會(huì)產(chǎn)生令人震驚的結(jié)果。據(jù)報(bào)告顯示,進(jìn)行全平臺(tái)調(diào)優(yōu)的 OEM 在 1790 時(shí)將略低于 1800。這比我們得到的要高,但這是一個(gè)令人震驚的數(shù)字。AMD 將有效地?fù)碛?3 倍于頂級(jí)雙插槽 Intel Xeon 8380 的結(jié)果,但插槽數(shù)相同。這也意味著 AMD 在每個(gè)內(nèi)核上實(shí)現(xiàn)了更好的性能,即使將內(nèi)核打包成 96 核部件也是如此。

AMD EYPC Genoa 功耗

在功耗方面,Genoa是強(qiáng)大的。我們通常在 1kW-1.2kW 之間測(cè)試雙插槽 AMD EPYC 9654 系統(tǒng)。嘗試將TDP從360W提高到400W。性能提高個(gè)位數(shù)百分比,但在雙插槽配置中使用這種模式,我們看到墻上增加了 100-120W。對(duì)于現(xiàn)代風(fēng)冷系統(tǒng),增加更多的CPU TDP通常會(huì)帶來15-20%的“風(fēng)扇稅”,以增加功耗。

poYBAGN160CAVyLhAAGmPlvmIF8260.jpg

AMD EPYC 9654 熱那亞 SP5 插槽 1

在每瓦性能的基礎(chǔ)上,這是驚人的。AMD 通常將性能提高 2-3 倍,同時(shí)將功耗提高 20-40%,這是大多數(shù)組織每天都會(huì)做出的權(quán)衡。

我們只是要在這里快速指出,這不是一個(gè)關(guān)注PSU / PDU功耗非常重要的領(lǐng)域。功率密度的增加也會(huì)以非線性方式增加空氣冷卻要求。此外,AMD的很多性能來自12通道DDR5。如果我們只采用封裝功率,我們會(huì)查看 CPU 的性能功率增加,而不是內(nèi)存為實(shí)現(xiàn)該性能水平而消耗的額外功率。在 24x DDR5 服務(wù)器中,內(nèi)存使用超過 100W 或 ~10% 的系統(tǒng)功率的情況并不少見。Genoa和藍(lán)寶石急流之間的差異也將來自這些額外內(nèi)存通道的系統(tǒng)功耗成本。

pYYBAGN160CAGTQ0AAHR6R7ODgQ990.jpg

AMD EPYC 9654 SP5 插槽 4

盡管如此,Genoa的每瓦性能仍大大提高。

AMD EPYC 熱那亞雙通道 DDR5 及更多產(chǎn)品

就平臺(tái)而言,AMD擁有更像是最小可行產(chǎn)品,而英特爾則擁有非常成熟的產(chǎn)品,但它需要生產(chǎn)更多的芯片。AMD的最小可行產(chǎn)品對(duì)于大多數(shù)市場(chǎng)來說仍然足夠好(或比這好得多)。此外,將48x DIMM安裝到雙插槽服務(wù)器本身并不是一件容易的事,因此存在實(shí)際的物理限制,可以使許多服務(wù)器僅保持在1DPC,例如我們測(cè)試的QCT系統(tǒng)。

大型服務(wù)器與小型服務(wù)器

在低端市場(chǎng),Genoa更具挑戰(zhàn)性。新的EPYC(霄龍)CPU需要PCIe Gen5,主板材料更好。此外,AMD的新芯片有12個(gè)內(nèi)存通道。對(duì)于 96 核機(jī)器,12 個(gè)內(nèi)存通道感覺是正確的選擇。對(duì)于 16 核機(jī)器來說,感覺不平衡。

poYBAGN160CANHxnAAFzrqJFBWo188.jpg

AMD EPYC 9004 2P QCT 1

許多服務(wù)器位于超大規(guī)模數(shù)據(jù)中心之外。許多客戶在 2023 年沒有采用 DPU。其他人甚至沒有在整個(gè)隊(duì)列中采用PCIe Gen5 NVMe SSD或其他設(shè)備。因此,新平臺(tái)將過于昂貴。

目前DDR5的現(xiàn)貨定價(jià)比DDR4溢價(jià)約50%。以 50% 更高的價(jià)格增加 50% 的模塊是我們看到非二進(jìn)制 DDR5 容量等功能的原因。

AMD的許多客戶將在2023 年繼續(xù)使用 AMD EPYC 7003米蘭。如果一個(gè)組織每個(gè)插槽需求的內(nèi)存少于512GB,不需要DDR5帶寬,并且只使用100GbE NIC和一些SSD,那么米蘭將是不錯(cuò)的選擇,也許是更好的選擇。第二個(gè)實(shí)際上是即將推出的AMD EPYC Siena系列。世界上許多應(yīng)用程序的轉(zhuǎn)型速度比技術(shù)進(jìn)步慢。

雖然我們已經(jīng)看到AMD多年來過渡到新平臺(tái),但隨著米蘭的出現(xiàn),我們看到低端羅馬占據(jù)了一段時(shí)間的低成本細(xì)分市場(chǎng)?,F(xiàn)在,隨著Genoa變得越來越大,AMD需要一些東西來解決低端問題。

AMD EYPC 9004產(chǎn)品參數(shù)

AMD此次發(fā)出9004系列共18款產(chǎn)品,其中包括9654P、9654等。

一、9654P

采用AMD Infinity Guard、AMD Infinity 架構(gòu)技術(shù),盡可能減少潛在攻擊危險(xiǎn),無論在軟件啟動(dòng)時(shí),執(zhí)行期間,還是訪問關(guān)鍵數(shù)據(jù)時(shí),都在為你保駕護(hù)航。為新型數(shù)據(jù)中心提供強(qiáng)勁動(dòng)力,讓您企業(yè)的關(guān)鍵應(yīng)用快速看到結(jié)果并提高能源效率。

1)9654P架構(gòu)

平臺(tái):服務(wù)器

產(chǎn)品家族:AMD EPYC? (霄龍)

產(chǎn)品系列:AMD EPYC? 9004 Series

CPU 核心數(shù)量:96

線程數(shù)量:192

最大加速時(shí)鐘頻率:最高可達(dá)3.7GHz

所有核心智能頻率提升:3.55GHz

基準(zhǔn)時(shí)鐘頻率:2.4GHz

三級(jí)緩存:384MB

默認(rèn) TDP/TDP:360W

AMD Configurable TDP (cTDP):320-400W

封裝:SP5

支持的CPU插槽數(shù):1P

Launch Date:2022年11月10日

2)連接性

PCI Express 版本:PCIe 5.0 x128

內(nèi)存類型:DDR5

內(nèi)存通道:12

最高內(nèi)存速度:最高可達(dá)4800MHz

內(nèi)存帶寬(每路):460.8 GB/s

二、9654

采用AMD Infinity Guard、AMD Infinity 架構(gòu)技術(shù),盡可能減少潛在攻擊危險(xiǎn),無論在軟件啟動(dòng)時(shí),執(zhí)行期間,還是訪問關(guān)鍵數(shù)據(jù)時(shí),都在為你保駕護(hù)航。為新型數(shù)據(jù)中心提供強(qiáng)勁動(dòng)力,讓您企業(yè)的關(guān)鍵應(yīng)用快速看到結(jié)果并提高能源效率。

1)9654架構(gòu)

平臺(tái):服務(wù)器

產(chǎn)品家族:AMD EPYC? (霄龍)

產(chǎn)品系列:AMD EPYC? 9004 Series

CPU 核心數(shù)量:96

線程數(shù)量:192

最大加速時(shí)鐘頻率:最高可達(dá)3.7GHz

所有核心智能頻率提升:3.55GHz

基準(zhǔn)時(shí)鐘頻率:2.4GHz

三級(jí)緩存:384MB

默認(rèn) TDP/TDP:360W

AMD Configurable TDP (cTDP):320-400W

封裝:SP5

支持的CPU插槽數(shù):1P/2P

Launch Date:2022年11月10日

2)連接性

內(nèi)存類型:DDR5

內(nèi)存通道:12

最高內(nèi)存速度:最高可達(dá)4800MHz

內(nèi)存帶寬(每路):460.8 GB/s

pYYBAGN160GAf5GnAAF1_qz2kM0713.png

第四代AMD EYPC處理器服務(wù)器

藍(lán)海大腦高性能計(jì)算事業(yè)群液冷事業(yè)部搭載AMD EYPC 9004系列處理器平臺(tái)測(cè)試系統(tǒng)的穩(wěn)定性。

藍(lán)海大腦AMD EYPC 9004系列GPU平臺(tái)概述

值得一提的是雙AMD EPYC(霄龍)處理器。每個(gè)處理器都有16 個(gè) DDR5 內(nèi)存插槽,總共 32 個(gè) DIMM。所有這些 DIMM 通道都可以填充在 1DPC 配置中,因此添加 DDR5 DIMM 可提高性能。

藍(lán)海大腦同時(shí)搭載AMD平臺(tái)中的 EPYC Genoa風(fēng)冷冷卻器用于適配深度學(xué)習(xí)、高性能計(jì)算、訓(xùn)練推理等場(chǎng)景。藍(lán)海大腦參考英特爾平臺(tái)的第四代至強(qiáng)可擴(kuò)展散熱器,使用英特爾至強(qiáng)CPU進(jìn)行手動(dòng)基準(zhǔn)測(cè)試。英特爾表示其Xeon Max部件將達(dá)到350W,AMD為360W,CTDP為400W,因此它在散熱器上具有更密集的鰭片設(shè)計(jì)。

新的SP5插槽絕對(duì)是巨大的。一個(gè)很大的變化是插槽只有一個(gè)螺釘來固定CPU。AMD在這一代中正在改變,使用冷卻器的螺釘對(duì)芯片施加壓力。芯片要大得多,因此需要平衡壓力。

AMD EPYC 9004 CPU 相較于Intel酷睿更具挑戰(zhàn)性。雖然它們相對(duì)較大,但不會(huì)是在每個(gè)內(nèi)核上表現(xiàn)最好的,甚至不會(huì)在這個(gè)周期中擁有AMD最高的內(nèi)核數(shù)量。AMD 現(xiàn)在有足夠的規(guī)模來超越整個(gè)市場(chǎng)的單一設(shè)計(jì),擴(kuò)展內(nèi)核、頻率和 TDP。相反,AMD現(xiàn)在將為一些較大的細(xì)分市場(chǎng)提供特定于細(xì)分市場(chǎng)的解決方案。在人工智能深度學(xué)習(xí)的推動(dòng)下,誰將更勝一籌,我們將拭目以待!

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8732

    瀏覽量

    84625
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD EPYC 4004系列處理成為中小型企業(yè)的信賴選擇

    AMD宣布推出AMD EPYC) 4004系列處理,該系列處理
    的頭像 發(fā)表于 09-20 15:30 ?142次閱讀

    AMD全新處理擴(kuò)大數(shù)據(jù)中心CPU的領(lǐng)先地位

    年下半年發(fā)布的、具有領(lǐng)先性能和效率的第五代 AMD EPYC 服務(wù)器處理AMD 宣布分別推出第三代支持AI的
    的頭像 發(fā)表于 09-19 11:01 ?334次閱讀

    第五代AMD EPYC處理預(yù)計(jì)下半年發(fā)布

    近日,在Computex 2024上,AMD董事會(huì)主席及首席執(zhí)行官Lisa Su博士向大家預(yù)覽了具有超強(qiáng)性能的下一代 EPYC 處理——第五代 AMD
    的頭像 發(fā)表于 09-18 11:06 ?330次閱讀

    ai服務(wù)器和通用服務(wù)器的區(qū)別在哪

    注重穩(wěn)定性和可靠性,通常采用較為穩(wěn)定的硬件配置。 1.1 CPU AI服務(wù)器通常采用高性能的CPU,如Intel Xeon或AMD EPYC等。這些CPU具有更多的核心和更高的主頻,可以提供更高的計(jì)算能力。而通用
    的頭像 發(fā)表于 07-02 09:46 ?592次閱讀

    AMD推出全新AMDEPYC處理,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    到個(gè)人電腦的端到端?AI 基礎(chǔ)架構(gòu)帶來強(qiáng)大算力。AMD預(yù)覽了將于?2024 年下半年發(fā)布的、具有領(lǐng)先性能和效率的第五代?AMD EPYC 服務(wù)器處理
    的頭像 發(fā)表于 06-04 19:21 ?884次閱讀
    <b class='flag-5'>AMD</b>推出全新<b class='flag-5'>AMD</b>銳<b class='flag-5'>龍</b>和<b class='flag-5'>EPYC</b>處理<b class='flag-5'>器</b>,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    超微發(fā)布新款AMD H13代CPU服務(wù)器產(chǎn)品

    超微(Supermicro)近日宣布推出全新AMD H13代CPU服務(wù)器產(chǎn)品系列,再度鞏固其在人工智能、云技術(shù)、存儲(chǔ)和5G/邊緣計(jì)算領(lǐng)域的領(lǐng)先地位。此次新品在性能和效率上均實(shí)現(xiàn)了卓越平衡,搭載AMD
    的頭像 發(fā)表于 05-28 10:30 ?568次閱讀

    新加坡裸機(jī)云多IP服務(wù)器網(wǎng)線路綜合測(cè)評(píng)

    在數(shù)字化高速發(fā)展的今天,新加坡裸機(jī)云多IP服務(wù)器以其卓越的性能和穩(wěn)定性,成為了眾多企業(yè)和個(gè)人用戶的首選。源庫(kù)主機(jī)評(píng)測(cè)將對(duì)新加坡裸機(jī)云多IP服務(wù)器的網(wǎng)線路進(jìn)行綜合測(cè)評(píng),以幫助讀者更深入地
    的頭像 發(fā)表于 05-28 10:09 ?183次閱讀

    AMD EPYC 8004系列處理優(yōu)勢(shì)介紹

    AMD EPYC 8004系列處理就是專為單路平臺(tái)設(shè)計(jì)的高能效處理,它體積小巧,非常適合空間和功率有限的部署環(huán)境。
    發(fā)表于 04-15 11:30 ?284次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>EPYC</b> 8004系列處理<b class='flag-5'>器</b>優(yōu)勢(shì)介紹

    AMD EPYC處理:AI推理能力究竟有多強(qiáng)?

    如今,AMD EPYC處理已經(jīng)成為最常被選擇用于AI推理的服務(wù)器平臺(tái),尤其是第四代Genoa EPYC
    發(fā)表于 03-15 09:47 ?364次閱讀

    AMD 2023年Q4業(yè)績(jī)報(bào)告:桌面、筆記本、服務(wù)器市場(chǎng)份額全面提升

    服務(wù)器和數(shù)據(jù)中心領(lǐng)域,AMD EPYC更是取得了輝煌成績(jī),占據(jù)了23.1%的市場(chǎng)份額(其中收入占比達(dá)到了31.1%),并且與去年同期相比大幅上升5.5%。
    的頭像 發(fā)表于 02-18 09:58 ?737次閱讀
    <b class='flag-5'>AMD</b> 2023年Q4業(yè)績(jī)報(bào)告:桌面、筆記本、<b class='flag-5'>服務(wù)器</b>市場(chǎng)份額全面提升

    AMD第四代EPYC)系列處理介紹

    與上一代AMD EPYC 7763處理相比,AMD EPYC 9534處理搭載的“Zen 4
    發(fā)表于 01-29 12:25 ?1499次閱讀

    超微gpu服務(wù)器評(píng)測(cè)

    微GPU服務(wù)器進(jìn)行評(píng)測(cè)。 一、超微GPU服務(wù)器概述 超微GPU服務(wù)器是一種基于超微服務(wù)器平臺(tái)與GPU技術(shù)相結(jié)合的高性能計(jì)算設(shè)備。它采用了超微
    的頭像 發(fā)表于 01-10 10:37 ?1069次閱讀

    AMD Instinct加速AMD EPYC處理為Microsoft帶來全新AI和計(jì)算能力

    VM — ? 近日,在Microsoft Ignite全球技術(shù)大會(huì)上,AMD和Microsoft共同展示了包括即將到來的AMD Instinct加速AMD
    的頭像 發(fā)表于 12-04 13:54 ?513次閱讀

    AMD擴(kuò)展其第三代AMD EPYC處理家族并推出6款全新產(chǎn)品

    AMD加強(qiáng)廣受好評(píng)的第三代EPYC CPU產(chǎn)品組合,為支持主要業(yè)務(wù)基礎(chǔ)設(shè)施的服務(wù)器提供性能和能效— —包括Cisco、Dell Technologies、Gigabyte、HPE、Lenovo
    的頭像 發(fā)表于 11-11 10:37 ?1202次閱讀

    面向電信和邊緣應(yīng)用的新一代EPYC處理Siena

    Hot Chips 2023大會(huì)上,AMD展示了一系列新產(chǎn)品,包括備受期待的AMD EPYC Genoa、Genoa-X和Bergamo C
    的頭像 發(fā)表于 10-11 14:53 ?630次閱讀
    面向電信和邊緣應(yīng)用的新一代<b class='flag-5'>EPYC</b>處理<b class='flag-5'>器</b>Siena