0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD的CPU架構(gòu)之路

要長高 ? 來源:雜談與閑話 ? 作者: 唐杰賬號 ? 2022-06-14 15:03 ? 次閱讀

最近AMD的喜事不斷,關(guān)注CPU架構(gòu)和超算的朋友的應(yīng)該知道在中國缺席的情況下,在ISC2022 上,美國的超算Frontier成為榜首,而且由AMD+HPE+Cray打造更多的E級的集群會陸續(xù)建成。蘇媽宣稱的High Performance Computing的確是大勢所趨。

在上周的AMD 的FAD2022 中,繼續(xù)放出了很多大招。其中讓我比較關(guān)注的就是IF的演進(jìn)和迭代。IF是AMD chip let的核心。從最初的CPU 的MCM之間的互聯(lián)和chip2chip 的互聯(lián),終于跨出了和CPU/GPU的互聯(lián),以及GPU之間的互聯(lián)。

poYBAGKoMLuAYlVsAAL_rbGH48o689.png

特別是第三代,妥妥的是NV-Link的初級版本,NV-Link都有了,NV-Switch還遠(yuǎn)嗎,果然4代出現(xiàn)了。

poYBAGKoMMeAVTMLAAK8-akluvI397.png

4代的確不同凡響,AMD的GPU計算和游戲核心,Xilinx的AIE以及FPGA都可以連接。而且支持CXL2.0 的memory pool和系統(tǒng)級別的cache coherency。這個和最初的IF的差別已經(jīng)很大了,在最初的IF中實現(xiàn)了兩個不同的數(shù)據(jù)路徑,SDF由MCM Die之間和Chip2Chip之間的。

pYYBAGKoMNWANKspAAHhYVWhHi4870.png

其中比較有意思的是使用CAKE(Coherent AMD socKet Extender ) 對于本地的SDF的情況進(jìn)行編碼,使用128-bit的serdes接口。作為MCM之間互聯(lián)的接口,CAKE一直和memory 控制器跑在相同的時鐘域。但是在加入更多的計算單元,特別是FPGA之后,這個時鐘區(qū)域不會像之前那么簡單了。但是沒關(guān)系,一切于3D-VCache為中心,對于數(shù)據(jù)分析界的尼古拉斯。趙四同學(xué)來講,如果一片64M的3D-VCach不能解決問題,來一個128M的就好。

pYYBAGKoMOKAFX9RAAMumin0oUY471.png

AMD已有的HBM和3D Cache的封裝技術(shù),相對于Micro Bump省省省。等一下,這個Micro Bump不是當(dāng)年Xilinx的多Die器件的成本的大頭嗎?

poYBAGKoMPyAbwI0AATE_Q-r6XU995.png

這個,有點意思,事情可能有一些變化了。AMD目前對于集成AIE (其實就是Xilinx做的AI 加速的ASIC)和GPU都公開宣布了,如何集成一個SLR, 這個有意思了。

poYBAGKoMQyATFPiAAJB7CZ2xqg054.png

到這里,按俺的風(fēng)格,就需要開始考古了。IF的公開資料不多,主要的信息都在Papermaster的2017年的公開信息中。一個是控制路徑,一個數(shù)據(jù)路徑。使用這個分離的主要目的其實和它的祖先HT的目的有點不同了,控制和數(shù)據(jù)分開的好處對于軟件是明顯的,但是硬件里面這么搞,很好奇它能走到NV-Switch的路上去。

poYBAGKoMR-AEURKAAlTvYQwnv8472.png

另一個千年的老問題,就是NUMA的影響。對于IF來講,memory 和interconnection的協(xié)議相同,但是速率不同。NUMA有影響,但是有了龐大的3D cache,大家都雖然慢,但是我的cache大。

pYYBAGKoMSuAR08PAAPuR4pJ_mI810.png

poYBAGKoMTmAG60mAAQ5wZbnDQw921.png

對于SDF的CC,的確有一些有意思的用法。

poYBAGKoMVCAcyZZAAOzc5AiyZY073.png

AMD推薦了兩種refill的策略。

poYBAGKoMWOAI1EvAAGxHJU_Iv8577.png

poYBAGKoMXuAT0EjAAGtJtQPgu8266.png

這個收益的確不錯,畢竟AMD的cache latency 不會隨著size增加而縮小。

pYYBAGKoMZaATOaNAAG-teEqxXc304.png

從AMD的DataFlow 來看,更能說明問題。隨著Core 的密度和memclk的提升。這個到了考驗Data Farbic的時候。

pYYBAGKoMaOAHGzLAAJV5GC85FE717.png

今天傳出的一個消息,NV終于在自己的DGX中選用了Intel的藍(lán)寶石,替代了之前2代的AMD 的CPU。NV的理由是在乎單線程的性能,雖然Intel的core不多,但是對稱的4 Die方案對于latency的優(yōu)勢應(yīng)該是明顯的。當(dāng)然,有人會理解成為NV怕AMD的GPU的競爭了,說實在的,在A100出來的2年之后,到現(xiàn)在都沒有一個可以一打的對手,H100是在AI領(lǐng)域孤獨求敗呀。只能說,“同學(xué),你想多了。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1620

    文章

    21510

    瀏覽量

    598937
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5376

    瀏覽量

    133382
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10702

    瀏覽量

    209373
收藏 人收藏

    評論

    相關(guān)推薦

    AMD揭開Zen CPU核心技術(shù)Ryzen神秘面紗

    在英特爾巨大的壓力下,AMD 在芯片市場一直不如意,借助最新的 Zen CPU ,它們極有可能完成絕地反擊。近日,該 CPU 的核心架構(gòu)也有了自己的名字──Ryzen。隨著 2017
    發(fā)表于 12-15 10:26 ?1244次閱讀

    誰能比較通俗的解釋一下cpu架構(gòu)?

    不同架構(gòu)cpu比如手機里面的cpu為什么不能運行windows,甚至一些手機cpu都比以前的Intel的cpu強。同樣
    發(fā)表于 04-26 21:30

    inter,amd,arm公司以及x86,arm,mips等架構(gòu)的關(guān)系

    芯片設(shè)計公司市場:微處理器(單片機等),手機移動市場處理器(cotex-a77等)和gpu mail,主要以出售芯片技術(shù)授權(quán)(高通,華為)2.amd: pc市場的cpu,和顯卡3.inter:電腦cpu注:arm總是分不清,記一
    發(fā)表于 07-01 06:01

    AMD CPU核心簡介

    AMD CPU核心簡介           Athlon
    發(fā)表于 12-24 10:08 ?891次閱讀

    AMD走上復(fù)興之路 將打造公平競爭的產(chǎn)業(yè)環(huán)境

    AMD走上復(fù)興之路 將打造公平競爭的產(chǎn)業(yè)環(huán)境   雖然2009年對很多企業(yè)仍不是個好年景,卻是AMD揚眉吐氣的一年。AMD變得更加專注、專業(yè),做為業(yè)內(nèi)首個可以提供
    發(fā)表于 01-21 10:52 ?671次閱讀

    AMD公布Zen架構(gòu)詳情曝光:全新CPU真身是這樣的八核心

    每一個CPU復(fù)合體內(nèi)包含四個amd zen CPU核心,但它們是彼此完全獨立的,不像推土機架構(gòu)那樣,彼此不會共享任何單元。每個核心都有自己的64KB一級指令緩存、32KB一級數(shù)據(jù)緩存、
    發(fā)表于 08-24 17:49 ?2811次閱讀

    AMD與Intel的CPU插槽區(qū)別

    AMDCPU與Intel的CPU有什么區(qū)別?從性能到功耗再到發(fā)熱,還有性價比,這樣的話題可以說上一天一夜都說不完。對玩家來說,技術(shù)參數(shù)之外最好的區(qū)分就是外觀——AMD
    發(fā)表于 06-25 15:11 ?9870次閱讀

    雙路CPU可讓性能輕松翻倍,AMD和Intel為什么不做

    如何提升CPU性能?這個問題是擺在AMD及Intel兩家X86處理器主導(dǎo)者面前的頭等大事,升制程、改架構(gòu)、提頻率都是提高CPU性能的方式。如果有一種方式能夠瞬間讓
    的頭像 發(fā)表于 12-26 08:48 ?2.4w次閱讀

    AMD和Intel為什么不推出雙路CPU

    如何提升CPU性能?這個問題是擺在AMD及Intel兩家X86處理器主導(dǎo)者面前的頭等大事,升制程、改架構(gòu)、提頻率都是提高CPU性能的方式。如果有一種方式能夠瞬間讓
    發(fā)表于 12-26 09:55 ?2876次閱讀

    AMD官方公布Zen CPU架構(gòu)路線圖 要等到2022年上半年

    FAD 2020分析師大會上,AMD官方公布了未來Zen CPU架構(gòu)路線圖,包括企業(yè)級的EPYC霄龍、消費級的Ryzen銳龍兩條線。
    的頭像 發(fā)表于 03-06 13:51 ?4141次閱讀

    AMD Zen顯卡這把火已經(jīng)在CPU市場越燒越旺

    AMD不止一次表示:Zen奠定了AMD未來幾年產(chǎn)品的路線圖,現(xiàn)如今,Zen這把火已經(jīng)在CPU市場越燒越旺。 對比CPU架構(gòu)Zen,
    的頭像 發(fā)表于 11-18 18:27 ?1848次閱讀

    AMD的魄力來自于哪里?AMD正式揭曉Zen?3?CPU架構(gòu)

    AMD正式揭曉了全新Zen?3?CPU架構(gòu),發(fā)布銳龍5000系列桌面處理器,不過,這些都在大家的預(yù)計之中,有點缺乏新意。與之相比,同時間被爆出的另一則關(guān)于AMD的消息顯然要有趣很多。
    的頭像 發(fā)表于 11-24 16:37 ?1780次閱讀
    <b class='flag-5'>AMD</b>的魄力來自于哪里?<b class='flag-5'>AMD</b>正式揭曉Zen?3?<b class='flag-5'>CPU</b><b class='flag-5'>架構(gòu)</b>

    AMD CPU之路-Chiplets

    AMD的ZEN架構(gòu)出現(xiàn)一開始,就是定義一個基本原則,一個core的架構(gòu),從laptop到desktop到server,這個也符合2015年AMD的股價
    的頭像 發(fā)表于 06-30 09:27 ?930次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>CPU</b><b class='flag-5'>之路</b>-Chiplets

    AMD計劃生產(chǎn)基于Arm架構(gòu)CPU

    英偉達(dá)已經(jīng)開始設(shè)計基于 Arm 架構(gòu)CPU。該處理器將運行微軟 Windows 操作系統(tǒng)。此外,AMD 也計劃生產(chǎn)基于 Arm 架構(gòu)CPU
    的頭像 發(fā)表于 10-27 10:53 ?950次閱讀

    淺談Arm架構(gòu)各廠家的CPU混戰(zhàn)

    過去,英特爾在全球個人電腦處理器市場上具有壓倒性優(yōu)勢,常年擁有約70%的市場份額。 而剩余的市場份額主要由AMD占據(jù)(采用X86架構(gòu)),ARM則占據(jù)10%的市場份額。 據(jù)悉,AMD也將加入采用ARM
    發(fā)表于 11-19 16:16 ?661次閱讀
    淺談Arm<b class='flag-5'>架構(gòu)</b>各廠家的<b class='flag-5'>CPU</b>混戰(zhàn)