0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD祭出殺手锏 首個百億億級GPU

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2021-11-13 09:05 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)在不久前結(jié)束的 “加速數(shù)據(jù)中心”發(fā)布會上,AMD正式公開了下一代服務(wù)器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產(chǎn)品系列不僅面向數(shù)據(jù)中心,也將面向一系列HPC和超算應(yīng)用,把通用計算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級計算機百億億級(Exascale)的算力的基本構(gòu)成單元。

在市場合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯(lián)合發(fā)布了星星海服務(wù)器產(chǎn)品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務(wù)器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數(shù)據(jù)中心部署AMD的服務(wù)器產(chǎn)品。

Milan-X:6nm的大緩存怪獸

繼上一代Milan處理器推出后不到一年,AMD就發(fā)布了該芯片的6nm改進版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術(shù),在Ryzen桌面處理器上做了3D Chiplet架構(gòu)的演示。如今第三代Epyc處理器Milan-X,將成為首個使用該技術(shù)的服務(wù)器產(chǎn)品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達到了可怕的768MB。

英特爾一樣,AMD在正式發(fā)售前并沒有公布Milan-X的具體性能細節(jié),而是通過合作伙伴的測試來展示了Milan-X在EDA和公有云應(yīng)用中表現(xiàn)。在新思的VCS功能驗證中,Milan-X在1小時內(nèi)完成了40.6項任務(wù),而同樣核心數(shù)的Milan僅完成了24.4項。微軟在基于Milan-X的Azure服務(wù)器中進行了早期測試,無論是在航天模擬,還是在汽車碰撞測試建模中,Milan-X都做到了50%以上的性能提升。

除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報?;赯en 4架構(gòu)的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達到上一代的1.25倍以上。Genoa最高支持96個Zen 4核心,同時也將加入一系列新標(biāo)準的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對要求多核多線程的云原生計算,最高核心數(shù)將達到128核,晚于Genoa發(fā)布。

Genoa計劃在2022年量產(chǎn)和發(fā)布,屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領(lǐng)域爭雄了。

Instinct MI200:GPU終于迎來MCM時代了?

除了Milan-X之外,發(fā)布會的最大亮點其實是全球首個MCM GPU,Instinct MI200。同樣基于臺積電的6nm工藝,Instinct MI200系列單芯片的晶體管數(shù)目達到580億,最高集成了220個計算單元。作為首個采用AMD CDNA2架構(gòu)的服務(wù)器GPU,Instinct MI200的目標(biāo)很明確,那就是將計算能力推向ExaScale級。

在CDN2架構(gòu)和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實現(xiàn)了遠超競品的性能表現(xiàn)。數(shù)據(jù)對比環(huán)節(jié),AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF,F(xiàn)P64矩陣計算能力達到95.7TF,均為A100的4.9倍。而在AI領(lǐng)域常用的FP16和BF16矩陣計算中,MI250X的算力也達到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內(nèi)存帶寬也達到了3.2TB/s,遠超A100的2TB/s。不過MI250X的功耗確實要高出不少,峰值狀態(tài)下的功耗可以達到560W,而A100的峰值功耗為300W。

與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺積電合作帶來的技術(shù)紅利,尤其是臺積電的3D Fabric封裝技術(shù)集合,而Instinct MI200則是這些技術(shù)的集大成之作。作為首個采用多Die設(shè)計的GPU,Instinct MI200選用了兩個SoC+8個HBM2E的方案,AMD在發(fā)布會上宣稱這一設(shè)計的實現(xiàn)要歸功于2.5D的Elevated Fanout Bridge(EFB)架構(gòu)。

從圖解上來看,AMD的EFB與臺積電的InFO-L 2.5D封裝技術(shù)可以說是從一個模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規(guī)模的異構(gòu)似乎也只有臺積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯(lián))芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯(lián)。

其實英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內(nèi)放入一個硅橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其至于基板的模具中,模具內(nèi)分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對于基板的加工提出了很高的要求,這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術(shù),未來也許會有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰(zhàn),但為了使用標(biāo)準的基板降低成本,EFB和LSI明顯是最優(yōu)解。

在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計算項目(OCP)定下的通用加速器模組標(biāo)準,對于想要規(guī)?;渴餑PU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標(biāo)準,OAM已經(jīng)在服務(wù)器領(lǐng)域有了不小的規(guī)模,不僅是英特爾、AMD和英偉達這些半導(dǎo)體廠商,浪潮、聯(lián)想、百度和阿里巴巴等其他服務(wù)器與公有云廠商也開始支持這一標(biāo)準。

目前OAM的MI250和MI250X已經(jīng)進入可交付階段,從今年第三季度起,AMD就已經(jīng)在為美國能源部的橡樹嶺國家實驗室持續(xù)交付MI250X GPU了,用于組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運算的場景。

結(jié)語

隨著英特爾、三星和臺積電在2.5D/3D封裝技術(shù)上的逐漸成熟,服務(wù)器芯片將成為受益最大的產(chǎn)品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在服務(wù)器/數(shù)據(jù)中心市場上的動向,也側(cè)面體現(xiàn)了IDM與Fabless廠商之間在技術(shù)選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺積電這樣的晶圓代工廠,在服務(wù)器市場的優(yōu)勢可能會越來越小。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5376

    瀏覽量

    133431
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9773

    瀏覽量

    170741
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2838

    瀏覽量

    107047

原文標(biāo)題:AMD祭出殺手锏,首個百億億級GPU

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Apple Intelligence未達預(yù)期,iPhone 16銷量受挫,AI全球化挑戰(zhàn)浮現(xiàn)

    蘋果公司今年的重頭戲——Apple Intelligence本應(yīng)成為推動iPhone 16銷量飆升的“殺手锏”,然而現(xiàn)實卻給市場潑了一盆冷水。iPhone 16系列的首周末預(yù)售銷量較去年iPhone
    的頭像 發(fā)表于 09-20 14:45 ?383次閱讀

    下一代GPU的預(yù)測瞬態(tài)仿真分析

    圖形處理單元(GPU)不斷迭代更新,其中的晶體管數(shù)目也不斷增加以提高處理器性能。如今這個數(shù)目已達到數(shù)百億的級別,與此同時,功率需求也相應(yīng)呈指數(shù)增長,這讓滿足瞬態(tài)響應(yīng)規(guī)范變得極為困難。
    的頭像 發(fā)表于 08-28 10:58 ?933次閱讀
    下一代<b class='flag-5'>GPU</b>的預(yù)測瞬態(tài)仿真分析

    英國公司實現(xiàn)英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標(biāo)志著在GPU計算領(lǐng)域,NVIDI
    的頭像 發(fā)表于 07-18 14:40 ?474次閱讀

    AMD雄心勃勃:計劃構(gòu)建百萬GPU超級計算機集群

    在全球科技競賽的舞臺上,AMD近日宣布了一項令人矚目的計劃——打造一個包含多達120萬顆GPU的超級計算機集群。這一宏大的舉措立即引發(fā)了業(yè)界的廣泛關(guān)注,許多人認為,這是AMD為了與英偉達等競爭對手一較高下而邁出的重要一步。
    的頭像 發(fā)表于 06-27 14:37 ?523次閱讀

    AMD發(fā)布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名現(xiàn)身,而Navi 44則以Gfx1200之名亮相。這兩款GPU的出現(xiàn),至少暗示了AMD正在逐步完善RDNA 4 GPU的研發(fā)工作。
    的頭像 發(fā)表于 05-24 16:11 ?425次閱讀

    AMD計劃在臺投資設(shè)立研發(fā)中心

    近日證實,繼英偉達在臺設(shè)立亞洲首個AI研發(fā)中心后,全球知名的半導(dǎo)體公司超威半導(dǎo)體(AMD)也將緊隨其后,在臺灣投資設(shè)立研發(fā)中心。據(jù)悉,AMD計劃投資高達50元新臺幣,這一決策無疑將為
    的頭像 發(fā)表于 05-21 09:30 ?518次閱讀

    英偉達、AMD、英特爾GPU產(chǎn)品及優(yōu)勢匯總

    主導(dǎo)地位,其銷售額預(yù)計將達到400美元,遠超過競爭對手AMD和英特爾。那么這三家公司都有哪些GPU產(chǎn)品,各自的產(chǎn)品有何優(yōu)勢呢? ? 英偉達????????????????????????????????????????????
    的頭像 發(fā)表于 05-10 00:59 ?4070次閱讀

    AMD市值首次突破3000美元

    AMD的市值首次突破了3000美元,這一里程碑式的成就得益于該公司股價的大幅上漲。上周四,AMD的股價上漲了9.1%,使得其市值首次突破了3000美元。相較于去年10月的低點,
    的頭像 發(fā)表于 03-04 11:25 ?703次閱讀

    AMD收盤市值站上3100美元

    AMD收盤市值站上3100美元 受益人工智能的熱炒,相關(guān)的科技股股價大幅上漲,周四晚間美股AMD股價大幅上漲9%,AMD收盤時市值站上3100
    的頭像 發(fā)表于 03-01 14:18 ?449次閱讀

    AMD將推新GPU,效能媲美英偉達RTX 4080

    據(jù)悉,AMD正努力研制新品級GPU,性能堪比英偉達的RTX 4080,而售價卻只有后者的一半。據(jù)多個在線社區(qū)反映,AMD即將發(fā)布的Radeon RX 8000系列GPU效能與NVIDI
    的頭像 發(fā)表于 01-31 10:00 ?2098次閱讀

    深入解讀AMD最新GPU架構(gòu)

    GCN 取代了 Terascale,并強調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后,AMD 將其 GPU 架構(gòu)開發(fā)分為單獨的 CDNA 和 RDNA 線路,分別專門用于計算和圖形。
    發(fā)表于 01-08 10:12 ?988次閱讀
    深入解讀<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b>架構(gòu)

    AMDGPU架構(gòu)GCN現(xiàn)代化解讀

    隨著HD 5000和6000系列的發(fā)展,AMD的Terascale(萬億)架構(gòu)變得非常具有競爭力。
    的頭像 發(fā)表于 01-08 09:58 ?912次閱讀
    <b class='flag-5'>AMD</b>的<b class='flag-5'>GPU</b>架構(gòu)GCN現(xiàn)代化解讀

    問界新M7聲學(xué)系統(tǒng)有何稀奇

     問界新M7是華為推出的一款智能座艙車型,其中的鴻蒙智能座艙被稱為其“殺手锏”。該系統(tǒng)可以實現(xiàn)手機與車機之間的無縫聯(lián)動交互。
    的頭像 發(fā)表于 12-08 16:01 ?1568次閱讀

    AMD游戲GPU架構(gòu)的優(yōu)勢分析

    目前AMDGPU 分為兩個截然不同的產(chǎn)品領(lǐng)域,一個是針對游戲的,另一個是用于超級計算機、大數(shù)據(jù)分析和機器學(xué)習(xí)系統(tǒng)的。
    發(fā)表于 11-19 12:21 ?565次閱讀
    <b class='flag-5'>AMD</b>游戲<b class='flag-5'>GPU</b>架構(gòu)的優(yōu)勢分析

    XPC-3399規(guī)格書

    在電子產(chǎn)品的世界中,性能是個永恒的話題,世界各大廠家使出渾身解數(shù)交替拋出殺手锏來證明自己的實力。而在這些廠家中,不能不提到
    發(fā)表于 10-09 06:21