0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD最強(qiáng)芯片 全村的希望!

sakobpqhz ? 來源:半導(dǎo)體行業(yè)觀察 ? 2023-06-20 16:50 ? 次閱讀

由于 GPU 嚴(yán)重短缺,Nvidia 收取的費(fèi)用是制造成本的 5 倍左右,業(yè)內(nèi)每個(gè)人都迫切希望找到替代方案。雖然谷歌在 AI 工作負(fù)載方面具有結(jié)構(gòu)性性能/TCO 優(yōu)勢(shì),但由于其 TPU具有成熟的硬件和軟件OCS,因此與其他大型科技公司相比,我們認(rèn)為存在結(jié)構(gòu)性問題會(huì)阻止他們成為外部使用的領(lǐng)導(dǎo)者。

1、谷歌 TPU 將只能從 1 個(gè)公司在 1 個(gè)云中獲得。

2、谷歌Google 在芯片部署很久之后才會(huì)公開他們的芯片,因?yàn)榇筚I家需要在發(fā)布前記錄下來,并在 ramp 之前提供早期訪問系統(tǒng)。

3、多年來,谷歌一直向用戶隱藏多項(xiàng)主要硬件功能,包括內(nèi)存/計(jì)算相關(guān)和網(wǎng)絡(luò)/部署靈活性。

4、谷歌拒絕為那些想要編寫自定義內(nèi)核以最大化性能的奇才在外部提供低級(jí)別的硬件文檔。

谷歌在 AI 基礎(chǔ)設(shè)施方面的最大技術(shù)進(jìn)步的守門人將使他們?cè)诮Y(jié)構(gòu)上與基于 Nvidia 的云產(chǎn)品相比處于落后地位,除非谷歌改變他們的運(yùn)作方式。來自亞馬遜和微軟等其他云的內(nèi)部芯片仍然遠(yuǎn)遠(yuǎn)落后。

在商業(yè)芯片的世界里, Cerebras 目前是最接近的競爭對(duì)手,在 GPT-3 上表現(xiàn)穩(wěn)定開源模型令人印象深刻,但硬件可訪問性非常有限,每臺(tái)服務(wù)器成本高達(dá)數(shù)百萬美元。在云中訪問 Cerebras 的唯一方法是通過他們自己的產(chǎn)品。缺乏訪問權(quán)會(huì)損害開發(fā)的靈活性。

Nvidia 生態(tài)系統(tǒng)的生命線是人們?cè)诟鞣N各樣的系統(tǒng)上進(jìn)行開發(fā),從他們花費(fèi)數(shù)百美元的游戲 GPU 到最終能夠擴(kuò)展到擁有數(shù)萬個(gè)本地 GPU 或與所有第 3 方云服務(wù)提供商合作. 而Tenstorrent 等其他初創(chuàng)公司則表現(xiàn)出希望我們認(rèn)為硬件/軟件距離真正大踏步前進(jìn)還有一段距離。

盡管收購了兩家不同的數(shù)據(jù)中心 AI 硬件公司 Nervana 和 Habana,但世界上最大的商用芯片供應(yīng)商英特爾卻不見蹤影。Nervana幾年前就被拋棄了,現(xiàn)在的Habana身上似乎也發(fā)生了同樣的事情。英特爾目前正在使用他們的第二代Habana Gaudi 2,除了 AWS 上可用的一些實(shí)例外,幾乎沒有采用。

此外,隨著該產(chǎn)品被納入 2025 Falcon Shores GPU,英特爾已經(jīng)將路線圖宣告失敗。英特爾的 GPU,Ponte Vecchio 也好不到哪兒去。已經(jīng)很晚了,直到最近才完成對(duì)拖延已久的 Aurora 超級(jí)計(jì)算機(jī)的交付,再過 2 年就沒有繼任者了。它的性能通常無法與 Nvidia 的 H100 GPU 競爭。

這就讓AMD成為了英偉達(dá)的最后一個(gè)有力競爭者。

AMD 是唯一一家擁有成功交付用于高性能計(jì)算的芯片記錄的公司。雖然這主要適用于他們的 CPU 端是一臺(tái)運(yùn)行良好的執(zhí)行機(jī)器,但它還可以進(jìn)一步擴(kuò)展。AMD 于 2021 年為全球首臺(tái) ExaFLop 超級(jí)計(jì)算機(jī) Frontier 交付了 HPC GPU 芯片。雖然為 Frontier 提供動(dòng)力的 MI250X 足以完成其主要工作,但它未能在云計(jì)算和超大規(guī)模用戶的大客戶中獲得任何影響力。

現(xiàn)在,每個(gè)人都期待著 AMD 的 MI300,它將于今年晚些時(shí)候交付給 El Capitan,這是他們的第二個(gè) Exascale 超級(jí)計(jì)算機(jī)獲勝者。出于這個(gè)原因,一旦您將目光脫離 Nvidia ,AMD 即將推出的 MI300 GPU 將成為討論最多的芯片之一。我們也一直在密切關(guān)注其與Meta 的 PyTorch 2.0 和 OpenAI 的 Triton軟件的適配前景。自 Nvidia 的 Volta GPU 和 AMD 的 Rome CPU 以來,數(shù)據(jù)中心芯片還沒有引起如此大的轟動(dòng)。

MI300,代號(hào) Aqua Vanjaram,由多個(gè)復(fù)雜的硅層組成,坦率地說是工程奇跡。首席執(zhí)行官 Lisa Su 今年早些時(shí)候在 CES 上展示了 MI300 套件,讓我們了解 MI300 的結(jié)構(gòu)。我們看到 4 個(gè)硅片被 8 個(gè) HBM 堆棧包圍。這是 HBM3 的最高 5.6 GT/s 速度,八個(gè) 16GB 堆棧形成 128GB 統(tǒng)一內(nèi)存,帶寬高達(dá) 5.734 TB/s。

與 3.3 TB/s 的 Nvidia H100 SXM 80GB 相比,其帶寬增加了 72%,容量增加了 60%。

AMD 獲得任何數(shù)量的 AI 計(jì)算美元的機(jī)會(huì)最終歸結(jié)為成為 hyperscalers 與 Nvidia 的可靠第二來源。假設(shè)是漲潮會(huì)托起所有船只。

當(dāng)然,預(yù)計(jì)在 AI 數(shù)據(jù)中心基礎(chǔ)設(shè)施上的大量支出將以某種方式使 AMD 受益。

AMD 硬件只是 AI 支出熱潮中的一個(gè)注腳。事實(shí)上,目前 AMD 在生成 AI 基礎(chǔ)設(shè)施建設(shè)方面相對(duì)失敗,因?yàn)樗麄冊(cè)跀?shù)據(jù)中心 GPU 方面缺乏成功安利,在 HGX H100 系統(tǒng)中缺乏 CPU 勝利,以及 普遍放棄 CPU 支出。因此,MI300 的成功至關(guān)重要。

01.基本構(gòu)建塊 - Elk Range 有源中介層芯片

MI300 的所有變體都以稱為 AID(active interposer die) 的相同基本構(gòu)建塊開始,即是所謂的有源中介層裸片。這是一款名為 Elk Range 的小芯片,尺寸約為 370mm2,采用臺(tái)積電的 N6 工藝技術(shù)制造。該芯片包含 2 個(gè) HBM 內(nèi)存控制器、64MB 內(nèi)存附加末級(jí) (MALL) Infinity Cache、3 個(gè)最新一代視頻解碼引擎、36 通道 xGMI/PCIe/CXL,以及 AMD 的片上網(wǎng)絡(luò) (NOC)。在 4 塊配置中,MALL 緩存為 256MB,而 H100 為 50MB。

AID 最重要的部分是它在 CPU 和 GPU 計(jì)算方面是模塊化的。AMD 和臺(tái)積電使用混合鍵合技術(shù)將 AID 連接到其他小芯片。這種通過銅 TSV 的連接允許 AMD 混合和匹配 CPU 與 GPU 的最佳比例。四個(gè) AID 以超過 4.3 TB/s 的對(duì)分帶寬相互通信,啟用超短距離 (USR:Ultra Short Reach) 物理層,如 AMD Navi31 游戲 GPU 中的小芯片互連所示,盡管這次同時(shí)具有水平和垂直鏈路和具有對(duì)稱的讀/寫帶寬。方形拓?fù)溥€意味著對(duì)角線連接需要 2 跳(hops),而相鄰 AID 需要 1 跳。

ab1c2af6-0c02-11ee-962d-dac502259ad0.png ?

這些 AID 中的 2 個(gè)或 4 個(gè)(根據(jù) MI300 變體具有不同的計(jì)算)在CoWoS 硅中介層的頂部組合在一起。AID 有兩種不同的流片,它們的. T鏡像很像英特爾的 Sapphire Rapids。

02.Compute Tiles——Banff XCD 和 DG300 Durango CCD

AID 之上的模塊化計(jì)算塊可以是 CPU 或 GPU。

在 GPU 方面,計(jì)算小芯片稱為 XCD,代號(hào)為 Banff。Banff在 TSMC N5 工藝技術(shù)上制造,約為 ~115mm2 。盡管只啟用了 38 個(gè)計(jì)算單元,但它總共包含 40 個(gè)計(jì)算單元。

該架構(gòu)由 AMD 的 MI250X 演變而來,在 GitHub 上,AMD 將其稱為 gfx940,但公開稱其為 CDNA3。它針對(duì)計(jì)算進(jìn)行了優(yōu)化,盡管是“GPU”,但不能真正處理圖形。

這同樣適用于 Nvidia 的 H100,它們的大部分 GPC 都無法處理圖形。

ab42d4da-0c02-11ee-962d-dac502259ad0.png ?

總的來說,每個(gè) AID 可以有 2 個(gè) Banff die,總共有 76 個(gè) CU。MI300 的最大 XCD/GPU 配置將提供 304 個(gè) CU。作為對(duì)比,AMD MI250X 具有 220 個(gè) CU。 MI300 的另一個(gè)模塊化計(jì)算方面是 CPU 方面。AMD 部分重用了他們的 Zen 4 CCD 小芯片,盡管進(jìn)行了一些修改。

他們改變了一些金屬層掩模,為 SoIC 和 AID 創(chuàng)建焊盤,需要重新設(shè)計(jì)一些金屬掩模的新流片。這個(gè)修改過的 Zen 4 CCD,GD300 Durango 禁用了 GMI3 PHY。AID 的帶寬明顯高于 GMI3。此 CCD 采用 TSMC 的 5nm 工藝技術(shù),并保留與臺(tái)式機(jī)和服務(wù)器上的 Zen 4 CCD相同的 ~70.4mm 2芯片尺寸。

每個(gè) AID 可以有 3 個(gè) Zen 4 小芯片,總共 24 個(gè)內(nèi)核。MI300的最大CCD/CPU配置可以提供多達(dá)96個(gè)核心。

03.先進(jìn)封裝——品味未來

AMD 的MI300 是世界上最令人難以置信的先進(jìn)封裝形式。有超過 100 塊硅粘在一起,全部位于使用 TSMC 的 CoWoS-S 技術(shù)的破紀(jì)錄的 3.5x 光罩硅中介層之上。

這種硅的范圍從 HBM 存儲(chǔ)層到有源中介層以進(jìn)行計(jì)算,再到用于結(jié)構(gòu)支持的空白硅。這個(gè)巨大的中介層幾乎是 NVIDIA H100 上中介層的兩倍。MI300 的封裝工藝流程非常復(fù)雜,是行業(yè)的未來。

ab7fac3e-0c02-11ee-962d-dac502259ad0.png ?

復(fù)雜的封裝需要 AMD 的重大靈活性和修改才能按時(shí)獲得 MI300。最初的設(shè)計(jì)是使用采用臺(tái)積電CoWoS-R技術(shù)的有機(jī)再分布層 (RDL) 中介層。事實(shí)上,臺(tái)積電去年確實(shí)推出了CoWoS-R測(cè)試封裝,其結(jié)構(gòu)與小米300有著驚人的相似之處??赡苡捎诰哂腥绱舜蟪叽绲挠袡C(jī)中介層的翹曲和熱穩(wěn)定性問題而改變了中介層材料。

AID 以 9um 間距與 SoIC gen 1 混合鍵合到 XCD 和 CCD。由于工藝不成熟,AMD 不得不放棄轉(zhuǎn)向TSMC 的 SoIC gen 2 的計(jì)劃,該 SoIC 的間距為 6um 。

然后將它們封裝在 CoW 無源中介層之上。通過這個(gè)過程有十幾塊支撐硅片。最終的 MI300 包含傳統(tǒng)的倒裝芯片質(zhì)量回流和 TCB 以及晶圓上的芯片、晶圓上的晶圓和晶圓上的重構(gòu)晶圓混合鍵合。

04.MI300 配置

AMD MI300 有 4 種不同的配置,但我們不確定是否所有 4 種都會(huì)真正發(fā)布。

ab9a43aa-0c02-11ee-962d-dac502259ad0.png ?

MI300A 憑借異構(gòu) CPU+GPU 計(jì)算成為頭條新聞,El Capitan Exascale 超級(jí)計(jì)算機(jī)正在使用該版本。MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝,適合插槽 SH5 LGA 主板,每塊板有 4 個(gè)處理器。它有效地支付了開發(fā)成本。它已經(jīng)出貨,但真正在第三季度出現(xiàn)增長。標(biāo)準(zhǔn)服務(wù)器/節(jié)點(diǎn)將是 4 個(gè) MI300A。

不需要主機(jī) CPU,因?yàn)樗莾?nèi)置的。這是迄今為止市場(chǎng)上最好的 HPC 芯片,并將保持一段時(shí)間。

MI300X 是 AI hyperscaler 變體,如果成功,將成為真正的容量推動(dòng)者。全是 GPU,以實(shí)現(xiàn) AI 的最佳性能。AMD這里推的服務(wù)器級(jí)配置是8顆MI300X+2顆Genoa CPU。

MI300C 將走相反的方向,成為僅具有 96 核 Zen4 + HBM 的 CPU,以響應(yīng)英特爾的 Sapphire Rapids HBM。然而,這個(gè)市場(chǎng)可能太小而且產(chǎn)品太貴,以至于 AMD 無法生產(chǎn)這個(gè)變體。

MI300P 就像一半大小的 MI300X。它是一種可以以較低功率進(jìn)入 PCIe 卡的產(chǎn)品。這又需要主機(jī) CPU。這將是最容易開始開發(fā)的版本,盡管我們認(rèn)為它更像是 2024 年的版本。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • TSMC
    +關(guān)注

    關(guān)注

    3

    文章

    177

    瀏覽量

    84351
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    138

    瀏覽量

    20650
  • USR
    USR
    +關(guān)注

    關(guān)注

    1

    文章

    49

    瀏覽量

    10986
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5747

原文標(biāo)題:AMD最強(qiáng)芯片,全村的希望!

文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Lunar Lake大戰(zhàn)Strix Point!AMD、英特爾掀起新一輪AI PC芯片“大躍進(jìn)”

    傳統(tǒng)PC芯片大廠的動(dòng)作來看,AI PC的趨勢(shì),以及Arm陣營的強(qiáng)勢(shì)產(chǎn)品入局,都讓AMD、Intel加快了產(chǎn)品迭代進(jìn)度。 ? AMD :拿下最強(qiáng)NPU 寶座
    的頭像 發(fā)表于 06-06 09:15 ?3874次閱讀

    AMD穩(wěn)固合作,贏得索尼PS6處理器芯片設(shè)計(jì)合同

    9月18日,國際科技界傳來重要消息,據(jù)權(quán)威外媒披露,AMD已成功奪得索尼下一代游戲主機(jī)PS6的處理器芯片設(shè)計(jì)訂單,這一合作不僅標(biāo)志著AMD與索尼自PS4、PS5時(shí)代以來穩(wěn)固伙伴關(guān)系的延續(xù),也彰顯了
    的頭像 發(fā)表于 09-18 16:37 ?503次閱讀

    AMD AI芯片需求井噴,業(yè)績預(yù)估再獲提升

    全球芯片巨頭AMD近期發(fā)布的財(cái)報(bào)與未來財(cái)測(cè)數(shù)據(jù)令人矚目,尤其是其在數(shù)據(jù)中心領(lǐng)域的強(qiáng)勁表現(xiàn),再次引發(fā)了市場(chǎng)的熱烈反響。AMD的執(zhí)行長蘇姿豐更是直接表示,AI芯片的需求“超乎預(yù)期”,這一積
    的頭像 發(fā)表于 08-02 16:38 ?602次閱讀

    使用STM32F407ZGT6的設(shè)備無法連接到AMD處理器的電腦上,怎么處理?

    使用貴公司的STM32芯片,型號(hào):STM32F407ZGT6。CAN總線轉(zhuǎn)串口,可以正常連接到英特爾處理器的電腦上;但是無法連接到AMD處理器的電腦上。請(qǐng)問怎么處理? 連接到AMD處理器的電腦上,串口顯示如下:
    發(fā)表于 07-23 07:58

    英特爾、AMD等聯(lián)手推出UALink,希望用它取代Nvidia NVLink接口

    周四,英特爾、AMD、博通、思科、谷歌、HPE、Meta和微軟宣布正在建立一個(gè)新的行業(yè)組織——Ultra Accelerator Link(UALink)推廣組,以指導(dǎo)數(shù)據(jù)中心AI加速器芯片之間連接組件的發(fā)展。
    的頭像 發(fā)表于 05-31 11:46 ?1488次閱讀
    英特爾、<b class='flag-5'>AMD</b>等聯(lián)手推出UALink,<b class='flag-5'>希望</b>用它取代Nvidia NVLink接口

    AMD預(yù)計(jì)提前推出X860(E)芯片

    AMD近日宣布,將提前推出全新的消費(fèi)級(jí)旗艦主板芯片組X860(E),這一舉動(dòng)打破了原先預(yù)計(jì)的X760(E)更迭計(jì)劃。新芯片組將與英特爾的Z890旗艦主板芯片組同屬800系列,展示了
    的頭像 發(fā)表于 05-29 14:26 ?627次閱讀

    AMD Chiplet小芯片架構(gòu)年減排數(shù)萬噸溫室氣體

    AMD公司的企業(yè)責(zé)任總監(jiān)Justin Murrill介紹,在生產(chǎn)第四代EPYC(霄龍) CPU時(shí),AMD采用了8個(gè)獨(dú)立的計(jì)算芯片CCD,而非整塊單芯片,此舉有望在2023年減少約5萬噸
    的頭像 發(fā)表于 04-24 16:05 ?393次閱讀

    AMD收盤市值站上3100億美元 華爾街熱捧AI芯片制造商

    市場(chǎng)分析師對(duì)AMD的樂觀預(yù)測(cè)得到了花旗銀行的支持。該銀行近期報(bào)告中將AMD、博通(Braodcom)和英偉達(dá)列為AI芯片半導(dǎo)體領(lǐng)域的優(yōu)選股票。
    的頭像 發(fā)表于 03-01 15:59 ?1077次閱讀

    特斯拉CEO馬斯克計(jì)劃購買AMD芯片

    特斯拉首席執(zhí)行官埃隆·馬斯克近日表示,特斯拉計(jì)劃從AMD購買芯片,以應(yīng)對(duì)人工智能計(jì)算硬件支出的增長。然而,他并未透露具體的購買數(shù)量。
    的頭像 發(fā)表于 02-04 09:57 ?579次閱讀

    AMD上調(diào)人工智能芯片銷售預(yù)期至35億美元以上

    AMD發(fā)布了最新的財(cái)報(bào),調(diào)高了人工智能芯片業(yè)務(wù)的業(yè)績預(yù)期。根據(jù)預(yù)測(cè),AMD預(yù)計(jì)2024年的銷售額將增長75%,達(dá)到超過35億美元。
    的頭像 發(fā)表于 01-31 15:40 ?515次閱讀

    AMD棄用XilinxCPLD芯片,也不提供替代品

    AMD公司近日宣布,將停產(chǎn)一系列老舊的芯片產(chǎn)品,包括CoolRunner和CoolRunner II CPLD芯片,以及Spartan II和Spartan 3 FPGA芯片。
    的頭像 發(fā)表于 01-18 17:00 ?1145次閱讀

    英偉達(dá)與AMD激戰(zhàn)AI芯片市場(chǎng),臺(tái)積電成最大贏家

    AI芯片市場(chǎng)上,英偉達(dá)和AMD之間的競爭越來越激烈。AMD的MI300A系列產(chǎn)品已開始批量生產(chǎn),并受到了客戶的熱情追捧。
    的頭像 發(fā)表于 01-10 18:11 ?1202次閱讀

    值得入手的AMD Radeon 顯卡推薦—— AMD Radeon RX 7900 XT

    結(jié)合5nm和6nm工藝節(jié)點(diǎn),采用先進(jìn)的小芯片(Chiplets)設(shè)計(jì),全新的計(jì)算單元和第二代AMD高速緩存技術(shù),相比AMD RDNA 2架構(gòu)的每瓦性能提高54%;
    的頭像 發(fā)表于 01-04 16:27 ?1004次閱讀
    值得入手的<b class='flag-5'>AMD</b> Radeon 顯卡推薦—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    請(qǐng)問卡片電腦性能最強(qiáng)的是哪一個(gè)?

    卡片電腦性能最強(qiáng)的是哪一個(gè)?
    發(fā)表于 09-28 06:21

    a17芯片最強(qiáng)芯片嗎 a17芯片和m2差距怎么樣啊

    a17芯片最強(qiáng)芯片嗎 蘋果A17是移動(dòng)終端芯片之王。蘋果A17作為移動(dòng)終端芯片的頂尖王者,性能上無可爭議地領(lǐng)先于其他安卓陣營的
    的頭像 發(fā)表于 09-26 16:11 ?1.6w次閱讀