0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DRAM設(shè)計中的散熱問題

要長高 ? 來源:semiengineering ? 作者: KAREN HEYMAN ? 2022-06-14 17:13 ? 次閱讀

DRAM 世界中,散熱問題正處于危機點。在 14nm 及以下,在最先進的封裝方案中,可能需要一個全新的指標來解決熱密度如何越來越多地將小問題變成大問題的乘數(shù)效應。

一些過熱的晶體管可能不會對可靠性產(chǎn)生很大影響,但數(shù)十億個晶體管產(chǎn)生的熱量會影響可靠性。對于 AI/ML/DL 設(shè)計尤其如此,高利用率會增加散熱,但熱密度會影響每個先進的節(jié)點芯片和封裝,這些芯片和封裝用于智能手機、服務(wù)器芯片、AR/VR 和許多其他高-性能設(shè)備。對于所有這些,DRAM布局和性能現(xiàn)在是首要的設(shè)計考慮因素。

Nantero 的首席系統(tǒng)架構(gòu)師、《The JEDEC DDR5 NVRAM 規(guī)范。“從 90° 到 95°C,它開始恐慌。超過 95°C,您將開始丟失數(shù)據(jù),因此您最好開始關(guān)閉系統(tǒng)?!?/p>

Gervasi 說,這些數(shù)字基于 14nm 技術(shù)。他預計先進節(jié)點和先進封裝的情況會更糟?!爱斈憧s小到 10nm、7nm、5nm 或 3nm 時,會發(fā)生什么?你的聯(lián)系失控了。你讓自己更容易受到串擾的影響,所以橫錘開始變得更加危機。這是一個非常嚴重的問題。”

造成這種情況的主要原因之一是 DRAM 的基本設(shè)計。盡管 DRAM 接口的數(shù)量不斷增加——無論是 DDR5、LPDDR5、GDDR6、HBM 還是其他接口——它們都保留了基本相似的結(jié)構(gòu)。

“DRAM 芯片的核心基本上是一個連接到開關(guān)的非常小的電容器,” Cadence產(chǎn)品營銷集團總監(jiān) Marc Greenberg 說?!耙獙?shù)據(jù)寫入該單元,您允許電流流入該電容器以從該單元讀取數(shù)據(jù)。你能感覺到那個電容器上是否有電荷。”

不幸的是,這導致了一個眾所周知的缺點?!按鎯υ谶@些微型電容器上的電荷是相對少量的電荷,”格林伯格說?!爱斔儫釙r,它對泄漏非常敏感?!?/p>

無論架構(gòu)多么新穎,大多數(shù)基于 DRAM 的內(nèi)存仍面臨因過熱而導致性能下降的風險。易失性內(nèi)存的刷新要求(作為標準指標,大約每 64 毫秒一次)加劇了風險?!爱斈鷮囟忍岣叩?85°C 以上時,您需要更頻繁地刷新電容器上的電荷,”格林伯格說。“因此,您將開始轉(zhuǎn)向更頻繁的刷新周期,以解釋由于設(shè)備變得越來越熱,電荷從這些電容器中泄漏得更快的事實。不幸的是,刷新該電荷的操作也是電流密集型操作,它會在 DRAM 內(nèi)部產(chǎn)生熱量。天氣越熱,你就越需要更新它,但你會繼續(xù)讓它變得更熱,整個事情就會分崩離析?!?/p>

這是不歸路?!叭绻粋€ DRAM 由于熱量/熱量而發(fā)生故障,那么其他 DRAM 很可能也會發(fā)生故障,” Rambus的研究員和杰出發(fā)明家 Steven Woo 說?!霸蚴撬械?DRAM 通常都彼此靠近,所以如果溫度很高,那么對所有 DRAM 都是危險的。即使使用強大的服務(wù)器內(nèi)存系統(tǒng),由于與熱相關(guān)的故障而僅丟失幾個 DRAM 也可能意味著整個系統(tǒng)出現(xiàn)故障。所以熱量和熱量對于內(nèi)存系統(tǒng)來說是一個非常重要的問題?!?/p>

它不僅僅是服務(wù)器。一個芯片上大約有 80 億個晶體管,手機會變得很熱,可能需要在冰箱里呆上幾分鐘。發(fā)生這種情況時,應用程序?qū)o法正常運行。

對于越來越密集的高級封裝也是如此。Synopsys研究員Victor Moroz 說:“熱量成為內(nèi)存的一個問題,特別是在使用堆疊技術(shù)時,例如邏輯上的 SRAM 。” “當你這樣做時,會產(chǎn)生影響,因為那是它從相鄰邏輯中溢出熱量的時候,這對內(nèi)存來說是一件壞事——對于 SRAM 來說,不是那么多,但對于 DRAM 來說這是一件大事,因為這個刷新時間成倍地依賴于溫度,因為它是一個結(jié)泄漏。當你把DRAM和邏輯放在同一個封裝里,如果是高性能計算的邏輯,那么DRAM就會吃虧。你的刷新時間縮短了,你必須更頻繁地刷新它。”

多年來,對耐熱性的需求不斷增加。“當我第一次加入公司時,0° 或負 40°C 可能是低端,而高端則為 100° 或 110°C,”Woo 說?!暗缃?,汽車行業(yè)需要一些最極端的溫度保證。”

更高的溫度會導致更高的刷新率,從而降低性能,尤其是在數(shù)據(jù)密集型應用程序中。“在某些情況下,如果溫度接近可接受的工作范圍的上限,系統(tǒng)可能會選擇提高 DRAM 的刷新率,”他說?!癉RAM 保留其數(shù)據(jù)的時間取決于溫度,在更高的溫度下,可能需要提高刷新率以確保數(shù)據(jù)不會丟失。更高的刷新率意味著我們正在占用 DRAM 的一些帶寬,因此系統(tǒng)的性能可能會在更高的刷新率下受到影響?!?/p>

這必須融入設(shè)計?!袄纾绻阏谠O(shè)計一個 I/O 控制器,你就會有這個數(shù)據(jù)流被扔給你,你需要吸收它,”Gervasi 解釋說。“在當今設(shè)計所有線卡的 DRAM 世界中,如果 DRAM 刷新 350 納秒,則該內(nèi)存處于離線狀態(tài)。但數(shù)據(jù)流不會停止。這意味著您必須圍繞緩沖數(shù)據(jù)設(shè)計整個架構(gòu) 350 納秒,然后才能再次開始清空該緩沖區(qū)?!?/p>

嘗試調(diào)整刷新率會導致不愉快的權(quán)衡。“現(xiàn)在 5% 的系統(tǒng)性能專門用于保留您已經(jīng)編寫的內(nèi)容,”Gervasi 說。“這是解決辦法嗎?顯然是這樣,因為如果人們想要在 85°C 以上運行,就必須這樣做——放棄一些系統(tǒng)性能以獲得數(shù)據(jù)完整性?!?/p>

內(nèi)存選擇很重要

為了應對這些擔憂,半導體生態(tài)系統(tǒng)正在嘗試多種解決方案,以最大限度地減少熱問題并提高可靠性。是德科技內(nèi)存解決方案項目經(jīng)理 Randy White 指出,LPDDR 通過整合一種稱為“溫度補償自刷新”的功能來解決刷新問題。 “當您需要刷新內(nèi)存庫時,芯片上有一個內(nèi)置溫度傳感器。有一個查找表顯示,“核心溫度每升高 1 度,就需要按比例增加刷新周期的頻率?!?同樣,DDR5 DRAM 現(xiàn)在包括一個內(nèi)部溫度傳感器。設(shè)計精確的片上溫度傳感器很困難,因此它的精度只有 +/-5°C。但總比沒有好,這就是 DDR4 的存在。這至少有助于了解何時打開風扇,并大致說明氣流設(shè)計的效果如何?!?/p>

在標準層面,JEDEC 一直在嘗試可能的修復方案,Gervasi 說,“我們已經(jīng)在 DRAM 內(nèi)部設(shè)置了熱跳閘點,并討論了在下一代擁有后門訪問端口的可能性,DRAM 可以在說,‘我這里太熱了。你需要做點什么。要么減慢數(shù)據(jù)訪問速度,要么加快風扇速度?!?/p>

格林伯格說,市場上已經(jīng)流行的一種方法是在芯片中內(nèi)置糾錯功能?!霸诟冗M的 DRAM 類型中,如 LPDDR5 和 DDR5 等密度非常高的類型,內(nèi)存制造商正在實施片上糾錯。當一個位由于其電荷泄漏而變得不可讀時,DRAM 設(shè)備上的糾錯電路能夠通過將該位單元中應該存在的數(shù)據(jù)與它周圍的其他位單元以及一些錯誤拼湊在一起來糾正該錯誤校正位,也包含在 DRAM 芯片中。”

這種技術(shù)使內(nèi)存制造商能夠提供擴展溫度范圍的 DRAM。許多方法都基于漢明碼,這是一種可以追溯到打孔帶時代的糾錯方案,但仍有助于糾正一個錯誤并檢測兩個錯誤。更先進的方法也已進入市場。當然,沒有人會透露他們的專有算法,但在之前的博客文章中,Synopsys 的高級技術(shù)營銷經(jīng)理 Vadhiraj Sankaranarayanan 對 DRAM 糾錯進行了高級概述。

Cadence 和其他公司還為高可靠性應用提供了超出 ECC 現(xiàn)有功能的額外校正。

十多年來一直在取笑該行業(yè)的一項技術(shù)是微流體冷卻。除了散熱器、風扇或外部液體冷卻等標準商用冷卻元件外,學術(shù)實驗室正在進行的實驗正在將冷卻直接整合到芯片中,這種方法稱為集成微流體冷卻,其中微流體通道被蝕刻到芯片中,允許冷卻液流過它。

盡管這在理論上聽起來像是一個近乎完美的解決方案,并且已被證明可以在實驗室中工作,但Siemens Digital Industries Software的電子和半導體行業(yè)負責人 John Parry指出,它不太可能在商業(yè)生產(chǎn)中發(fā)揮作用?!皬牧黧w腐蝕到泄漏問題,您都遇到了各種問題,因為您正在處理極小、非常精細的物理幾何形狀。他們被抽了。我們通常發(fā)現(xiàn)與之相關(guān)的可靠性最低的功能之一是機電設(shè)備,例如風扇和泵,因此您最終會在許多不同的方向上變得復雜?!?/p>

不同的方法

Nantero 的 NRAM 是經(jīng)過徹底重新思考并成功走出實驗室的內(nèi)存設(shè)計。它不是 DRAM,而是由碳納米管制成的非易失性芯片,并且已經(jīng)證明它可以承受極端的熱條件。概念驗證:Gervasi 指出,它在修復哈勃望遠鏡的航天飛機任務(wù)中在太空中進行了測試。

對于 JEDEC,Gervasi 正在開發(fā)允許 NRAM 芯片無縫插入 DRAM 的規(guī)范。但不管 NRAM 最終取得怎樣的成功,他認為碳至少提供了一條擺脫熱難題的方法?!疤技{米管是卷起的鉆石。它們幾乎是熱分布。它們實際上將被部署,即使它們不將它們用作存儲單元,因為這是進行熱擴散和熱分布的好方法。碳納米管也被討論用于印刷電路板布線或芯片布線,因為它在熱分布方面非常完美。”

格林伯格說,無論選擇何種芯片和其他組件,都必須在設(shè)計階段左移并模擬熱問題,而不是將它們視為以后可以修復的不便?!澳阋欢ㄒ紤]事情會變得多熱。這往往是事后的想法。人們只是假設(shè)要完成您必須做的計算工作,總有一個更大的散熱器可以購買。那些制造電池供電設(shè)備、手機、平板電腦和手表的人關(guān)心的是功耗,而不是熱量??梢圆捎迷S多模擬技術(shù)來改善功耗和改善散熱狀況?!?/p>

當然,生產(chǎn)前的模擬需要與生產(chǎn)后的物理分析相結(jié)合,特別是測試芯片并根據(jù)它們的性能對它們進行分類?!叭绻梢缘脑挘阏娴南虢⒁环N設(shè)計,因為這可以讓你獲得規(guī)模經(jīng)濟,”Rambus 的 Woo 說?!叭缓竽憧赡芟敫鶕?jù)不同的規(guī)格對其進行測試。測試流程是當你有機會說,‘這個設(shè)備實際上覆蓋了非常廣泛的范圍,所以也許我們可以把它賣到汽車市場。

最后,如果更糟到絕對最壞,可以更改規(guī)范,但這對于某些用例(例如移動設(shè)備)可能是一場災難。相比之下,允許大型數(shù)據(jù)中心中的芯片溫度升高可能會帶來令人驚訝的環(huán)境效益。至此,是德科技的 White 回憶說,一家公司曾要求 JEDEC 將工作溫度的規(guī)格提高 5 度。對潛在節(jié)省的估計是驚人的。根據(jù)他們每年用于冷卻的能源消耗量,他們計算出 5 度的變化可以轉(zhuǎn)化為每年關(guān)閉三個燃煤電廠。JEDEC 最終在這個建議上妥協(xié)了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DRAM
    +關(guān)注

    關(guān)注

    40

    文章

    2301

    瀏覽量

    183221
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9613

    瀏覽量

    137685
  • NRAM
    +關(guān)注

    關(guān)注

    1

    文章

    12

    瀏覽量

    9505
收藏 人收藏

    評論

    相關(guān)推薦

    DRAM存儲器的基本單元

    DRAM(Dynamic Random Access Memory),即動態(tài)隨機存取存儲器,是現(xiàn)代計算機系統(tǒng)不可或缺的內(nèi)存組件。其基本單元的設(shè)計簡潔而高效,主要由一個晶體管(MOSFET)和一個電容組成,這一組合使得DRAM
    的頭像 發(fā)表于 09-10 14:42 ?615次閱讀

    影響IGBT功率模塊散熱的因素

    IGBT(絕緣柵雙極型晶體管)功率模塊作為電力電子系統(tǒng)的核心部件,其散熱問題直接影響到系統(tǒng)的穩(wěn)定性、可靠性和效率。以下是對IGBT功率模塊散熱問題的詳細分析,包括散熱機制、影響因素、
    的頭像 發(fā)表于 07-26 17:24 ?648次閱讀

    DRAM芯片的基本結(jié)構(gòu)

    如果內(nèi)存是一個巨大的矩陣,那么DRAM芯片就是這個矩陣的實體化。如下圖所示,一個DRAM芯片包含了8個array,每個array擁有1024行和256列的存儲單元。
    的頭像 發(fā)表于 07-26 11:41 ?864次閱讀
    <b class='flag-5'>DRAM</b>芯片的基本結(jié)構(gòu)

    DRAM在計算機的應用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機存取存儲器)在計算機系統(tǒng)扮演著至關(guān)重要的角色。它是一種半導體存儲器,用于存儲和快速訪問數(shù)據(jù),是計算機主內(nèi)存的主要組成部分。以下是對DRAM在計算機
    的頭像 發(fā)表于 07-24 17:04 ?848次閱讀

    散熱基本原理及常見的幾種方式!

    機體的熱量以熱射線的形式散發(fā)給周圍溫度較低的物體,即散發(fā)于低溫空氣,稱為輻射散熱。這是安靜狀態(tài)下的主要散熱方式,受環(huán)境溫度的影響。 例如CPU散熱,CPU通過導熱硅膠墊片把熱量傳遞給
    的頭像 發(fā)表于 06-25 11:43 ?495次閱讀

    電機為什么需要散熱

    嚴重影響。因此,電機的散熱問題成為了電機設(shè)計和運行過程必須考慮的重要因素。本文將從電機的工作原理、熱量產(chǎn)生機制、散熱需求以及散熱不良的影響等方面,詳細探討電機為什么需要
    的頭像 發(fā)表于 06-14 11:48 ?1166次閱讀

    位式控制液壓系統(tǒng)散熱裝置的應用

    為了突出設(shè)備的人性化特點,自動控制在系統(tǒng)的應用已日益廣泛。加之,散熱在液壓系統(tǒng)是一個不容忽視的問題,尤其是在結(jié)構(gòu)緊簇的閉式回路。這里我們將這種控制方式應用于我公司自行研制的液壓無
    發(fā)表于 02-15 16:35 ?325次閱讀
    位式控制液壓系統(tǒng)<b class='flag-5'>散熱</b>裝置<b class='flag-5'>中</b>的應用

    如何利用 PCB 設(shè)計改善散熱?

    一站式PCBA智造廠家今天為大家講講如何在PCB設(shè)計過程處理好散熱?PCB電路板散熱設(shè)計技巧。在電子設(shè)備,電路板(PCB)是一項關(guān)鍵的組成部分。它承載著各種電子元件,并負責傳遞電信
    的頭像 發(fā)表于 02-02 09:05 ?1166次閱讀
    如何利用 PCB 設(shè)計改善<b class='flag-5'>散熱</b>?

    pcb開窗為什么能散熱

    PCB(Printed Circuit Board,印刷電路板)是電子產(chǎn)品不可或缺的組成部分。為了保證電子器件和元件的正常運行,有效的散熱是必不可少的。而PCB開窗是一種常用的散熱方式之一。本文將
    的頭像 發(fā)表于 12-25 11:06 ?4099次閱讀

    dram和nand的區(qū)別

    dram和nand的區(qū)別? DRAM和NAND是兩種不同類型的存儲器。DRAM(Dynamic Random Access Memory)是一種隨機存取存儲器,而NAND(Not AND)是一種邏輯
    的頭像 發(fā)表于 12-08 10:32 ?7011次閱讀

    PCB電路板散熱技巧是怎樣的?

    PCB電路板散熱技巧是怎樣的 在現(xiàn)代電子設(shè)備,尤其是高性能電子設(shè)備,電路板的散熱問題變得越來越重要。散熱不好的電路板可能導致電子元件過熱
    的頭像 發(fā)表于 11-30 15:08 ?1154次閱讀

    DRAM的范式轉(zhuǎn)變歷程

    DRAM制造技術(shù)進入10nm世代(不到20nm世代)已經(jīng)過去五年了。過去五年,DRAM技術(shù)和產(chǎn)品格局發(fā)生了巨大變化。因此,本文總結(jié)和更新了DRAM的產(chǎn)品、發(fā)展和技術(shù)趨勢。
    的頭像 發(fā)表于 11-25 14:30 ?1327次閱讀
    <b class='flag-5'>DRAM</b>的范式轉(zhuǎn)變歷程

    DRAM選擇為何突然變得更加復雜?

    芯片制造商正在使用更多的DRAM。在某些情況下,DRAM——尤其是高帶寬存儲器(HBM)——正在取代一些SRAM。DRAM在耐用性方面有著良好的記錄,也有成熟的工藝,而且比SRAM便宜得多
    的頭像 發(fā)表于 11-22 16:36 ?938次閱讀
    <b class='flag-5'>DRAM</b>選擇為何突然變得更加復雜?

    散熱在高速PCB設(shè)計的作用

    在實際應用,散熱的措施有散熱器和風扇兩種方式或者二者的同時使用。散熱器通過和芯片表面的緊密接觸使芯片的熱量傳導到散熱器,
    發(fā)表于 11-16 17:43 ?200次閱讀

    芯片設(shè)計DRAM類型如何選擇

    DRAM有多種類型可供選擇。有些速度非常快,如HBM,但也很昂貴。其他類型速度較慢,但價格便宜,如基本的DDR DIMM。然而,變化的是,在異構(gòu)架構(gòu),兩者都可以發(fā)揮重要作用,以及多種其他DRAM類型和更狹義的存儲器,如MRAM
    發(fā)表于 11-15 11:27 ?605次閱讀
    芯片設(shè)計<b class='flag-5'>中</b><b class='flag-5'>DRAM</b>類型如何選擇