0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

細品AMD的3D緩存技術(shù)

Linelayout ? 來源:電子工程專輯 ? 2023-01-30 16:56 ? 次閱讀

今年P(guān)C行業(yè)的內(nèi)卷還在持續(xù),尤其AMDIntel的技術(shù)與產(chǎn)品競爭仍處于膠著狀態(tài)。AMD這邊的Zen 4架構(gòu)表現(xiàn)雖然未如預(yù)期,但這家公司的新年產(chǎn)品仍有不少亮點。

月初的CES上,AMD面向個人電腦發(fā)布的新款Ryzen 7000系列CPU中,繼續(xù)包含了采用3D V-Cache的型號,且相比去年多有強化。我們此前特別撰文談過3D V-Cache技術(shù)——簡而言之,這是一種增加處理器L3 cache的方案:將L3 cache單獨作為一片die(Extended L3 Die,以下簡稱L3D),以先進封裝的方式疊到原本的處理器die上方,大幅增加CPU的cache容量。

其實在去年的IEEE ISSCC上,AMD有進一步詳述3D V-Cache技術(shù)。這次我們也借著AMD的新品發(fā)布,來再度談?wù)勥@項給CPU堆cache的技術(shù)。

這次堆了更多的L3 cache

處理器采用更大的、在垂直方向疊起來的L3 cache,在PC市場上,是AMD于游戲用戶的殺手锏——隔壁Intel沒有用這項技術(shù)。所以3D V-Cache現(xiàn)階段還真是AMD在市場上差異化競爭的組成部分。不過我們此前也特別撰文提到過,面向個人電腦市場的CPU,堆L3 cache的價值并沒有那么大:主要價值都在游戲上,對其他PC應(yīng)用(比如生產(chǎn)力產(chǎn)經(jīng))甚至有負加成。

AMD本身也將這個系列的型號主要定位于游戲用戶,但這次發(fā)布的新品部分彌補了上代產(chǎn)品的不少短板。

7cc70126-9411-11ed-bfe3-dac502259ad0.png ?

CES上AMD發(fā)布了3款采用3D V-Cache的處理器:Ryzen 9 7950X3D、7900X3D和Ryzen 7 7800X3D。初代采用3D V-Cache的處理器就只有一款;這次AMD顯然是在初代試水之后,更看好這項技術(shù)了。

其中最高配的Ryzen 9 7950X3D為16核心。由于3D堆疊能讓L3 cache增多64MB,所以7950X3D的L3 cache總?cè)萘繛?28MB。值得一提的是,7950X3D核心睿頻達到了5.7GHz,與原本沒有堆3D V-Cache的7950X一樣;只不過基頻相比7950X降低了300MHz。

這一點之所以重要是因為,上代的5800X3D睿頻只有4.5GHz——這就讓5800X3D,在除游戲之外的其他絕大部分負載中,性能弱于原版5800X。堆疊cache,還是要讓核心部分付出代價的。這次睿頻沒降,也就不至于讓更依賴核心峰值性能的負載受到太多不良影響——雖然基頻還是略有下降的。

與此同時7950X3D標定的TDP為120W,PPT(Package Power Tracking)162W。這兩個標稱值還低于原版7950X的170W/230W,可能是因為基頻下降、全核睿頻相對不帶L3D的7950X更低、以及新增cache die容許略高的運行溫度。有一點格外值得一提,7950X3D這個處理器16個核心,按照Zen 4架構(gòu)是分成了兩個CCD(Core Complex Die)的——也就是兩片die,每片die有8個核心。

只有一片die是疊了L3D的:Lisa Su最早在發(fā)布會上展示的3D V-Cache處理器也是只在一片die上疊cache(上圖中左上的那片die),另一片仍然是普通的CCD die(右上那片die;下面較大的那片是I/O die)。沒有疊cache的CCD die上的核心才能用上最高頻率,而疊了3D V-Cache這邊的核心做不到全速運轉(zhuǎn)(或這片die的全核睿頻更受限制)。所以3D V-Cache依然對堆疊的那片L3D的處理器核心性能產(chǎn)生了少許影響。

基于這一點,AMD目前正在跟微軟合作進行Windows優(yōu)化,AMD芯片組驅(qū)動能夠識別不同的游戲,選擇更傾向于堆疊了L3D的CCD,還是更傾向于沒有疊cache的CCD。

另外兩個型號7900X3D和7800X3D,分別是12核心+128MB L3 cache,以及8核心+96MB L3 cache。在7800這個型號上,AMD今年只推了帶L3D的7800X3D,而沒有出不帶L3D的版本,所以沒法做規(guī)格上的直接比較了。

再有就是上代5800X3D是無法對核心做超頻的,這代的三顆處理器開始支持自動超頻PBO,以及使用Curve Optimizer;只不過仍然無法直接進行超頻操作。

7cfba872-9411-11ed-bfe3-dac502259ad0.png ? 7d253b60-9411-11ed-bfe3-dac502259ad0.png ?

AMD宣稱,Ryzen 9 7950X3D相比于Intel酷睿i9-13900K,在游戲中的表現(xiàn)領(lǐng)先13-24%;部分生產(chǎn)力應(yīng)用領(lǐng)先4-52%。不過從AMD此前給出第一方數(shù)據(jù)的可信度來說,這個數(shù)據(jù)還是僅供參考。而從此前5800X3D的游戲表現(xiàn)來看,這代處理器的1080p分辨率游戲表現(xiàn)應(yīng)該的確會相當不錯——非常值得期待。

3D V-Cache技術(shù)更大的服務(wù)場景應(yīng)該是面向服務(wù)器的Epyc處理器。去年AMD把3D V-Cache應(yīng)用到了挺多Epyc處理器上,從16-64核處理器都有。8個CCD的Epyc處理器,如果每個都疊上L3D,則處理器總共能堆出768MB的L3 cache——這個數(shù)字以前還真是不可想象。

3D緩存是早有“預(yù)謀”的

AMD暫時還沒有公布這幾顆芯片的售價。從去年的情況來看,3D V-Cache版本會比原版貴一些——最終售價對于用戶來說,基本就是在更多的核心數(shù)和更大的cache容量之間做抉擇,看你更愿意為SRAM買單,還是為邏輯電路買單了——這還真得看用戶購買CPU的真實用途在哪兒了,因為增大L3 cache容量呈現(xiàn)出了顯著的邊際遞減效應(yīng):增加cache命中率帶來的那點紅利,很多時候無法抵消延遲增加造成的不良影響。

從去年IEEE的技術(shù)匯報來看,半導體制造工藝雖然還在進步,但器件微縮主要體現(xiàn)在邏輯電路方向上,SRAM bitcell尺寸的縮減速度急劇放緩,尤其從臺積電N5到N3工藝,SRAM單元面積微縮幅度是5%。而且很快要大規(guī)模量產(chǎn)的N3E工藝,SRAM單元面積還要增大。這其實是技術(shù)發(fā)展過程中的桎梏。

3D V-Cache是符合這樣的時代發(fā)展主旋律的,也就是把SRAM往垂直方向去堆。而且這也增加了產(chǎn)品SKU的靈活性,畢竟很多應(yīng)用場景其實并不需要那么大的cache。AMD表示,在沒有增加橫向datapath距離的情況下就增加cache容量,保持動態(tài)低功耗和低延遲的同時,也縮減了封裝尺寸——節(jié)約的尺寸可以用來做其他事,比如說增加更多的核心。

7d45b976-9411-11ed-bfe3-dac502259ad0.jpg ?

3D V-Cache處理器總體包含三個組成部分,CCD(上圖最下層)、L3D(上層中間部分)和結(jié)構(gòu)支持die(兩側(cè)的die)。對AMD Zen架構(gòu)處理器有了解的同學應(yīng)該很清楚CCD是什么——現(xiàn)在的架構(gòu)中,大體上8個核心構(gòu)成一個CCD(如下圖),當然CCD內(nèi)部本身也是有L3 cache的。比如說原版Ryzen 9 7950X,兩片CCD總共配有64MB L3 cache。

7d67da1a-9411-11ed-bfe3-dac502259ad0.png ?

不過AMD在ISSCC上說,往CCD上面堆L3D并不是臨時起意。對于3D V-Cache的支持,無論是架構(gòu)上還是物理電路上,都是從此前Zen 3處理器設(shè)計之初就做好了準備的。也就是說從最初設(shè)計CCD、還沒有向市場推出3D V-Cache版本的處理器之時,CCD上面就預(yù)留了必要的邏輯電路以及TSV(硅通孔)信號pad。這就極大地節(jié)省了NRE成本、減少了掩膜組數(shù)量,簡化了整體的chiplet設(shè)計。

換句話說,Zen 3架構(gòu)的CCD原生就支持L3D擴展,包括TSV柱。AMD表示這種預(yù)留會對面積造成大約4%的影響——也就是需要額外4%的面積。

往上疊加的L3D這片die,制造工藝和CCD是一樣的。Wikichip在分析文章中提到,L3D內(nèi)部有13層銅層,和1層鋁層。L3D的確就是純粹的cache die。在Zen 3架構(gòu)那一代(即Ryzen 5000系列,臺積電N7工藝),L3D總共64MB SRAM,面積41mm2。

7d7d6fba-9411-11ed-bfe3-dac502259ad0.png

來源:Wikichip

L3D疊在上層,剛好覆蓋差不多一半的CCD;L3D僅位于CCD部分的L2/L3 cache區(qū)域上方——因為cache區(qū)域的功率密度相對更低,則 3D堆疊產(chǎn)生的散熱影響會相對更小一些。CCD上面的L3 cache設(shè)計為16-way set associative;總共8個切片,每片4MB。L3D也是這種設(shè)定。

所以L3D也是8個切片,每片包含8MB數(shù)據(jù),和816KB的tags/LRU。上一代的5800X3D因此就有了總共96MB L3 cache。AMD提供的數(shù)據(jù)是,新增堆疊的L3 cache,只會有增多4個周期的延遲。

除了CCD和疊在上面的L3D之外,還有做結(jié)構(gòu)支持的die——在L3D旁邊,也就是相對的位于下層CCD的處理器核心區(qū)域上方。這是一種物理結(jié)構(gòu)上的輔助設(shè)計,主要是在鍵合(bonding)過程中;與此同時也作為CPU die的散熱通道:結(jié)構(gòu)支持die需要在Z軸達成高度的匹配,畢竟最終封裝的散熱頂蓋也需要與die做到充分接觸。

還有機會再往上疊

AMD說L3D的設(shè)計是往高密度、低功耗的方向走的。實際在Zen 2走向Zen 3架構(gòu)的時候,AMD就為處理器選擇了高密度SRAM bitcell(而非高電流單元)。如此一來,每個核心分配到的L3 cache切片容量就更大,同時保持die面積可控。

L3D則用了高密度的8T SRAM bitcell,有功耗方面的紅利。其他縮減功耗的特性還包括用更高Vt的器件、floating bitline,以及一些電源門控技術(shù)。

Zen 2到Zen 3架構(gòu)變化過程中,每個CCX(core complex)的核心數(shù)翻番到8個,則核間通訊架構(gòu)就需要重做。Zen 2時代,CCX內(nèi)部的核心數(shù)還沒有這么多,所以采用crossbar型核間通訊。到了Zen 3,Wikichip在剖析文章里提到,由于核心數(shù)增多,所以核間通訊改用ring bus雙向環(huán)形總線。Zen 3每個CCD的L3 cache是32MB(不加L3D的情況下),分成8個切片(每核心4MB),也就是8 stops。

在新增L3D以后,每核心可分配到的L3 cache增大至12MB,仍然是雙向環(huán)形總線(64MB L3D,每個切片8MB——加上原本CCD上每個切片4MB,也就是每個stop 12MB)。

有關(guān)供電的詳情,由于篇幅原因不做贅述。有興趣的讀者可以去看一看Wikichip的分析。簡單來說,CCD有三種主要供電軌,RVdd——用于L3 cache logic;Vdd是為核心供電的;VddM針對L2和L3數(shù)據(jù)bitcell做門控供電。

7db34356-9411-11ed-bfe3-dac502259ad0.jpg ?

這里再談一下Hybrid Bonding混合鍵合。3D V-Cache的3D堆疊采用的是Hybrid Bonding方案,此前初代產(chǎn)品在做宣傳的時候,很多同學就應(yīng)該已經(jīng)知道了。這在高性能處理器上應(yīng)該是Hybrid Bonding的首個應(yīng)用。這種混合鍵合能夠把兩片wafer或者兩片die鍵合到一起,而且是直接的銅到銅——電介質(zhì)到電介質(zhì)的互聯(lián),而不用microbump。

7dd24e0e-9411-11ed-bfe3-dac502259ad0.jpg

來源:GlobalFoundries

具體到臺積電的技術(shù),用的SoIC工藝的F2B(face-to-back)鍵合。封裝時,CCD本身面朝下,以C4介面面向substrate;CCD的背面通過薄化(thinned down)露出TSV;然后L3D die同樣面朝下,混合鍵合到CCD上;最后把結(jié)構(gòu)支持die鍵合上去。就微觀層面來看,L3D的M13金屬層通過BPV(Bond Pad Via)連接到BPM(Bond Pad Metal)上。

AMD說,3D V-Cache應(yīng)用的SoIC封裝能夠做到最小9μm的TSV間距。這種較小的間距,本來也就是Hybrid Bonding的優(yōu)勢所在,此前電子工程專輯談先進封裝工藝的文章詳細闡述過。不過TechInsights的逆向工程顯示,Zen 3架構(gòu)的這代產(chǎn)品TSV間距是17μm。理論上最新發(fā)布且采用了新制造工藝的Ryzen 7000系列3D V-Cache新品應(yīng)該進一步讓這個間距下降了。

Hybrid Bonding本身包括低電阻之類的優(yōu)勢就不多談了,畢竟也還算知名;顯著更小的互聯(lián)間距才是其相比其他方案的真正優(yōu)勢。

最后值得一說的是,臺積電的F2B SoIC這套方案是完全可重復(fù)操作的。也就是說L3D本身的背面可以再做一次這樣的鍵合。那么理論上就能再往上堆L3D了。而且Wikichip認為,操作上所需的改動并不大——只不過需要供電方面的一些調(diào)整,供電到疊層上方,以及一些Die-to-Die信號的額外邏輯電路。

還是那句話,雖說就個人電腦來說,再增大L3 cache對于絕大部分非游戲類應(yīng)用而言并沒有太大價值,甚至產(chǎn)生副作用;但當應(yīng)用方向明確為存儲敏感型的,那么大cache就會非常有價值。

想必新發(fā)布的三款采用了3D V-Cache的處理器,能夠在新一年的游戲應(yīng)用上大殺四方了。等產(chǎn)品發(fā)布時,可以看看它們與酷睿i9-13900K的對比結(jié)果,畢竟這代酷睿處理器也大幅增加了cache容量,而且核心數(shù)和頻率都提高了。而且在游戲設(shè)定更高分辨率時,3D V-Cache的優(yōu)勢可能逐漸消失。當然對Epyc客戶而言,關(guān)注點可能又不同了。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18927

    瀏覽量

    227233
  • CCD
    CCD
    +關(guān)注

    關(guān)注

    32

    文章

    870

    瀏覽量

    141863
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5376

    瀏覽量

    133382
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10702

    瀏覽量

    209379
  • cache技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    1033

原文標題:當CPU三級緩存堆到768MB時:細品AMD的3D緩存

文章出處:【微信號:IC大家談,微信公眾號:IC大家談】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    TI DLP? Pico?技術(shù)3D掃描改進

    電子發(fā)燒友網(wǎng)站提供《TI DLP? Pico?技術(shù)3D掃描改進.pdf》資料免費下載
    發(fā)表于 08-23 10:02 ?0次下載
    TI DLP? Pico?<b class='flag-5'>技術(shù)</b><b class='flag-5'>3D</b>掃描改進

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D模型設(shè)計師,還是希望在視頻播放和模型
    的頭像 發(fā)表于 07-16 10:04 ?292次閱讀

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實際應(yīng)用中可以與2D結(jié)合做檢測。利用3D的特性,可以檢
    的頭像 發(fā)表于 06-14 15:02 ?248次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b>視覺檢測<b class='flag-5'>技術(shù)</b>

    潮流科技單推薦——英倫科技裸眼3D智能數(shù)碼相框云相冊

    在科技的浪潮中,我們總是追求著最新的技術(shù)和最前沿的產(chǎn)品。而在今天,我要向大家介紹一款顛覆傳統(tǒng)的電子產(chǎn)品——英倫科技裸眼3D數(shù)碼相框。這款產(chǎn)品不僅能夠?qū)⒛滟F的2D照片轉(zhuǎn)換成震撼的裸眼3D
    的頭像 發(fā)表于 06-03 10:54 ?434次閱讀
    潮流科技單<b class='flag-5'>品</b>推薦——英倫科技裸眼<b class='flag-5'>3D</b>智能數(shù)碼相框云相冊

    VIVERSE 推行實時3D渲染: 探索Polygon Streaming技術(shù)力量與應(yīng)用

    在商業(yè)領(lǐng)域和娛樂行業(yè)中,3D渲染技術(shù)一直是推動視覺體驗革新的關(guān)鍵力量。隨著技術(shù)的進步,實時3D渲染技術(shù)逐漸成為主流,近期VIVERSE平臺對
    的頭像 發(fā)表于 05-31 15:49 ?2174次閱讀
    VIVERSE 推行實時<b class='flag-5'>3D</b>渲染: 探索Polygon Streaming<b class='flag-5'>技術(shù)</b>力量與應(yīng)用

    AMD 3D V-Cache技術(shù)帶來更高密度和能效

    直接從高速緩存中獲取各類數(shù)據(jù),使響應(yīng)時間更短,從而提升游戲的性能表現(xiàn)。 AMD 3D V-Cache技術(shù)應(yīng)運而生。它將“Zen 3”的裸片變
    的頭像 發(fā)表于 04-01 11:39 ?795次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>3D</b> V-Cache<b class='flag-5'>技術(shù)</b>帶來更高密度和能效

    新質(zhì)生產(chǎn)力探索| AICG浪潮下的3D打印與3D掃描技術(shù)

    隨著技術(shù)的不斷進步,3D打印和3D掃描已經(jīng)成為現(xiàn)代制造業(yè)和設(shè)計領(lǐng)域的重要工具。為了深入探討這些技術(shù)的最新發(fā)展和應(yīng)用前景。蘑菇云創(chuàng)客空間舉辦了以《AICG浪潮下的新質(zhì)生產(chǎn)力》為主題的開放
    的頭像 發(fā)表于 04-01 09:28 ?308次閱讀

    Exaddon開發(fā)了一種低于20μm間距進行間距探測的3D微打印探針

    總部位于瑞士的微型 3D 打印公司Exaddon 開發(fā)了能夠以低于 20 μm 間距進行間距探測的 3D微打印探針。間距探針測試是用于測試半導體芯片的極其復(fù)雜且精確的過程。
    的頭像 發(fā)表于 01-26 18:23 ?1619次閱讀

    2D3D視覺技術(shù)的比較

    作為一個多年經(jīng)驗的機器視覺工程師,我將詳細介紹2D3D視覺技術(shù)的不同特點、應(yīng)用場景以及它們能夠解決的問題。在這個領(lǐng)域內(nèi),2D3D視覺
    的頭像 發(fā)表于 12-21 09:19 ?907次閱讀

    提供3D打印材料與解決方案,助力3D打印產(chǎn)業(yè)發(fā)展

    提供3D打印材料與解決方案,助力3D打印產(chǎn)業(yè)發(fā)展
    的頭像 發(fā)表于 12-12 11:12 ?389次閱讀

    3D 封裝與 3D 集成有何區(qū)別?

    3D 封裝與 3D 集成有何區(qū)別?
    的頭像 發(fā)表于 12-05 15:19 ?760次閱讀
    <b class='flag-5'>3D</b> 封裝與 <b class='flag-5'>3D</b> 集成有何區(qū)別?

    當芯片變身 3D系統(tǒng),3D異構(gòu)集成面臨哪些挑戰(zhàn)

    當芯片變身 3D 系統(tǒng),3D 異構(gòu)集成面臨哪些挑戰(zhàn)
    的頭像 發(fā)表于 11-24 17:51 ?613次閱讀
    當芯片變身 <b class='flag-5'>3D</b>系統(tǒng),<b class='flag-5'>3D</b>異構(gòu)集成面臨哪些挑戰(zhàn)

    100MB緩存!AMD游戲神U再添兩員悍將:超便宜

    一個是銳龍7 5700X3D,可以視為銳龍7 5800X3D的降頻版,主頻從3.4-4.5GHz來到了3.0-4.1GHz,同時依然有8核心16線程、4MB二級緩存、96MB三級緩存(
    的頭像 發(fā)表于 11-22 17:07 ?976次閱讀
    100MB<b class='flag-5'>緩存</b>!<b class='flag-5'>AMD</b>游戲神U再添兩員悍將:超便宜

    我們距離“裸眼3D自由”,還有多遠?

    對裸眼3D的憧憬,驅(qū)使著人們不斷用新技術(shù),為世界制造“幻想”,奉上“奇跡”;3D技術(shù)再往前走,就是不依靠3D眼鏡/VR頭顯等設(shè)備,化身為裸眼
    的頭像 發(fā)表于 10-24 00:40 ?1076次閱讀
    我們距離“裸眼<b class='flag-5'>3D</b>自由”,還有多遠?

    3D ToF 技術(shù)大熱,哪些方案值得關(guān)注?

    ,2018年8月份,自O(shè)PPO R17 Pro搭載ToF 3D傳感技術(shù)后,12月vivo NEX雙屏版也搭載了ToF 3D超感應(yīng)技術(shù),今年2月華為發(fā)布的榮耀V20內(nèi)置了ToF
    發(fā)表于 10-08 14:23
    <b class='flag-5'>3D</b> ToF <b class='flag-5'>技術(shù)</b>大熱,哪些方案值得關(guān)注?