0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SRAM如何克服其擴展問題?有哪些方法呢?

半導體產業(yè)縱橫 ? 來源:半導體產業(yè)縱橫 ? 2024-02-25 10:05 ? 次閱讀

在高級節(jié)點使用 SRAM 需要新的方法。

SRAM無法擴展,這給功耗和性能目標帶來了挑戰(zhàn),迫使設計生態(tài)系統(tǒng)提出從硬件創(chuàng)新到重新思考設計布局的策略。與此同時,盡管 SRAM 的初始設計已經存在很長的歷史,并且目前還存在擴展限制,但它已成為人工智能的主力存儲器。

SRAM 配置有六個晶體管,這使其訪問時間比 DRAM 更快,但代價是在讀取和寫入時消耗更多能量。相比之下,DRAM 采用一個晶體管/一個電容器的設計,這使得它更便宜。但 DRAM 會影響性能,因為電容器因電荷泄漏而需要刷新。因此,自推出 60 多年以來,SRAM 一直是優(yōu)先考慮較低延遲和可靠性的應用中的首選存儲器。

bc3ac262-d2cb-11ee-a297-92fbcf53809c.png

圖 1:SRAM 單元尺寸縮小得比進程更慢。來源:新興內存技術報告

事實上,對于 AI/ML 應用來說,SRAM 不僅僅具有其自身的優(yōu)勢。“SRAM 對于 AI 至關重要,尤其是嵌入式 SRAM。它是性能最高的存儲器,您可以將其直接與高密度邏輯芯片集成。僅出于這些原因,這一點就很重要。”Alphawave Semi首席技術官托尼·陳·卡魯松 (Tony Chan Carusone) 說道。

功耗和性能挑戰(zhàn)

但是,在跟上 CMOS 縮放的步伐時,SRAM 卻表現(xiàn)不佳,這對功耗和性能產生了影響。“在傳統(tǒng)的平面器件縮放中,柵極長度和柵極氧化物厚度一起按比例縮小,以提高性能和對短溝道效應的控制。更薄的氧化物可以在更低的 VDD 電平下實現(xiàn)性能增益,這有利于 SRAM 減少泄漏和動態(tài)功耗?!?a href="http://ttokpm.com/tags/西門子/" target="_blank">西門子 EDA的存儲器技術專家 Jongsin Yun 說道?!叭欢?,在最近的技術節(jié)點遷移中,我們幾乎沒有看到氧化層或 VDD 電平進一步縮小。此外,晶體管的幾何收縮導致金屬互連更薄,從而導致寄生電阻增加,這就導致更多的功率損耗和 RC 延遲。

隨著人工智能設計越來越需要更多的內部存儲器訪問,SRAM 在技術節(jié)點遷移中進一步擴大其功耗和性能優(yōu)勢已成為一項重大挑戰(zhàn)?!?/p>

這些問題加上 SRAM 的高成本,不可避免地會導致性能下降。Rambus的杰出發(fā)明家 Steve Woo 表示:“如果無法獲得足夠的 SRAM 來滿足處理器內核的數(shù)據(jù)存儲需求,那么內核最終將不得不將數(shù)據(jù)移至更遠的地方?!?“在 SRAM 和 DRAM 之間移動數(shù)據(jù)需要額外的電力,因此系統(tǒng)消耗更多的電力,從 DRAM 訪問數(shù)據(jù)需要更長的時間,因此性能會下降。”

imecDTCO 項目總監(jiān) Geert Hellings 表示:“展望納米片,SRAM 的尺寸縮放預計會非常小?!?“可以說,如果所有其他工藝/布局裕度保持不變,用納米片(~15nm 寬)替換鰭片(約 15nm 寬)將使 SRAM 位單元高度增加 40nm(每個 4 個鰭片)。顯然,這不是一個很好的價值主張。因此,工藝/布局余量的改進有望抵消這一點。然而,將SRAM從finFET擴展到納米片是一場艱苦的戰(zhàn)斗。

Flex Logix曾在幾個最低節(jié)點工作過,包括臺積電的 N7 和 N5,最近還收到了英特爾 1.8A節(jié)點的 PDK。Flex Logix 首席執(zhí)行官 Geoffrey Tate 表示:“我們使用先進節(jié)點的客戶都抱怨該邏輯的擴展性比 SRAM 更好、更快?!?“這對于處理器來說是一個問題,因為擁有比整個處理器更大的緩存內存是不尋常的。但如果你把它放在芯片外,你的性能就會急劇下降?!?/p>

臺積電正在聘請更多內存設計師來提高 SRAM 密度,但他們是否能從 SRAM 中獲得更多收益還有待觀察。Tate說:“有時,你可以通過雇傭更多的人來讓事情變得更好,但僅限于一定程度?!?“隨著時間的推移,客戶將需要考慮不再像現(xiàn)在那樣頻繁使用 SRAM 的架構。”

事實上,早在 20 納米時代,SRAM 就無法與邏輯相稱地擴展,這預示著當片上存儲器變得比芯片本身更大時,將會出現(xiàn)功耗和性能挑戰(zhàn)。針對這些問題,系統(tǒng)設計人員和硬件開發(fā)人員都在應用新的解決方案并開發(fā)新技術。

沿著這些思路,AMD采取了不同的方法。Rambus 的 Woo 表示:“他們推出了一種名為 3D V-Cache 的技術,該技術允許將單獨芯片上的附加 SRAM 高速緩存存儲器堆疊在處理器頂部,從而增加處理器內核可用的高速緩存量?!?“額外的芯片增加了成本,但允許訪問額外的 SRAM。另一種策略是擁有多級緩存。處理器內核可以擁有只有它們才能訪問的私有(非共享)一級和二級緩存,以及在處理器內核之間共享的更大的末級緩存 (LLC)。由于處理器擁有如此多的內核,共享 LLC 允許某些內核使用更多容量,以便在所有處理器內核上更有效地使用總容量。”

糾錯

縮放也增加了可靠性問題。Flex Logix 首席技術官 Cheng Wang 表示:“SRAM 傳統(tǒng)上使用比邏輯單元更激進、更小的尺寸,但它與傳統(tǒng)邏輯門不同,傳統(tǒng)邏輯門永遠不會發(fā)生爭用,并且您總是在其中寫入新值?!?由于 SRAM 只有六個晶體管,因此您無法添加大量門來使其在寫入時變弱,在不寫入時放大。你也不能讓 SRAM 太小,因為這可能會因 α 粒子等問題導致單粒子擾動 (SEU),其中離子的能量壓倒 SRAM 單元中的能量,隨著 SRAM 縮小,這種情況更容易發(fā)生。

Wang 表示,糾錯可能會成為一項常見要求,特別是對于汽車設備。

權衡

這導致設計方面發(fā)生很多變化。“每個人都試圖在芯片上使用更少的 SRAM。”Wang 說。設計人員采取的另一種方法是盡可能只使用單核存儲器。“在較舊的工藝節(jié)點中,當我們編寫寄存器文件時,使用雙核內存的可能性要大得多,”他說?!暗羞@些都增加了面積。因此,在較低的節(jié)點中,設計人員試圖讓所有東西都從內存中的單個端口運行,因為這些是可用的最小、最密集的全功率選項。他們不一定會放棄SRAM,但他們會盡可能地使用單核存儲器。他們試圖使用更小的內存,并選擇SRAM作為可用帶寬,而不是真正的大存儲。大型存儲要么轉移到 DRAM,如果你能承受延遲,要么轉移到 HBM,如果你能負擔得起成本。

替代方法:新架構

為了不斷提高 SRAM 的功耗性能,我們已經評估和應用了超出位單元設計的許多更新,包括 SRAM 外圍設計中的附加支持電路,Yun 表示。

“SRAM 和外圍設備不再共享電源。取而代之的是,采用雙電源軌來單獨利用最有效的電壓水平,”西門子的 Yun 說道?!霸谀承┰O計中,SRAM 可以進入休眠模式,施加保留數(shù)據(jù)所需的最低電壓,直到 CPU 下次訪問數(shù)據(jù)。這帶來了顯著的功耗優(yōu)勢,因為漏電流與 VDD 呈指數(shù)關系。一些 SRAM 設計采用了額外的電路來解決操作弱點,旨在提高最低工作電壓。”

例如,高密度 (HD) SRAM 單元可以通過對 6 個晶體管使用單鰭晶體管來實現(xiàn)最小的幾何形狀。然而,由于相同尺寸的上拉 (PU) 和通柵極 (PG) 晶體管在寫入操作期間存在爭用問題,HD 單元在低電壓操作中面臨挑戰(zhàn)。

“在SRAM輔助電路中,如負位線,瞬態(tài)電壓崩潰技術被廣泛采用,以緩解這些問題并增強低電壓操作,”Yun說?!盀榱藴p輕寄生電阻效應,最新的位單元設計使用雙軌或三軌金屬線作為合并位線(BL)或字線(WL)。BL方法根據(jù)操作選擇性地連接金屬軌道,降低有效電阻并平衡陣列頂部和底部之間的放電率。在持續(xù)的開發(fā)中,正在探索埋地電源軌以進一步降低布線電阻。這涉及將所有電源軌放置在晶體管下方,從而緩解晶體管上方的信號路徑擁塞?!?/p>

其他存儲器、其他結構

新的嵌入式存儲器類型通常被提出作為 SRAM 的替代品,但每種類型都有自己的一系列問題?!爸饕母偁幷進RAM和ReRAM僅占用一個晶體管面積,”Yun 說?!半m然它比 SRAM 中的晶體管大,但它們的整體單元尺寸仍約為 SRAM 的三分之一,最終的宏觀尺寸目標(包括外圍電路)約為 SRAM 尺寸的一半。有明顯的尺寸優(yōu)勢,但寫入速度的表現(xiàn)仍然遠慢于SRAM。實驗室在寫入速度和耐用性方面取得了一些成果,但在汽車用閃存替代 MRAM 生產之后,高速 MRAM 的開發(fā)計劃已經延長。L3 緩存替換的尺寸優(yōu)勢當然值得考慮,但 eflash 類型 MRAM 的生產必須有一個提前的提升?!?/p>

如果物理學不允許使用更小的 SRAM,則替代方案將需要重新考慮架構并采用小芯片?!叭绻?SRAM 無法在 N3 或 N2 中擴展,那么可以將更先進的邏輯芯片與采用舊技術制造的 SRAM 芯片結合起來,”imec 的 Hellings 說。“這種方法將受益于邏輯 PPA 的改進,同時為 SRAM 使用經濟高效的(較舊的,可能更高的產量和更便宜的)技術節(jié)點。原則上,AMD 基于 V 緩存的系統(tǒng)可以進行擴展,僅將邏輯芯片移動到下一個節(jié)點,然后需要使用 3D 集成或小芯片方法 (2.5D) 組合兩個芯片?!?/p>

Ambiq 首席技術官 Scott Hanson 指出,chiplet 解決方案非常適合正在進行的集成革命?!?a href="http://ttokpm.com/analog/" target="_blank">模擬電路很久以前就停止了縮放,出于功耗、性能和成本方面的原因,從 DRAM 到 SRAM 到 NVM 的所有類型的存儲器都更喜歡在不同的節(jié)點上制造。邏輯芯片更喜歡在仍然滿足成本和泄漏要求的最小節(jié)點上制造。通過多芯片集成,可以將芯片組合到單個封裝中。許多人在移動和數(shù)據(jù)中心領域都聽說過這一點,但它也在人工智能和物聯(lián)網領域迅速發(fā)生?!?/p>

在有限的情況下,系統(tǒng)技術協(xié)同優(yōu)化 (STCO) 也可以提供幫助?!皩τ谀承?,原則上不需要片上緩存,”Hellings 說?!袄纾谌斯ぶ悄苡柧氈?,訓練數(shù)據(jù)僅使用一次,而模型參數(shù)應該可以在芯片上輕松訪問。軟件和芯片架構可以繞過緩存層次結構,促進這種一次性數(shù)據(jù)移動,具有很大的潛力?!?/p>

所有這些都激發(fā)了人們對新布局和互連協(xié)議(例如 UCIe 和 CXL)的興趣?!爱斈阌懈蟮娜斯ぶ悄芄ぷ髫撦d時,內存會隨著計算而擴展,但如果其中一個組件的擴展速度比另一個組件快一點,根據(jù)系統(tǒng)的設計方式,你會遇到不同的瓶頸,”新思科技的戰(zhàn)略營銷經理 Ron Lowman 說?!叭斯ぶ悄芄ぷ髫撦d大大增加了所需處理器陣列的數(shù)量。他們甚至突破了芯片掩模版尺寸的限制,因此現(xiàn)在您需要用于芯片到芯片系統(tǒng)的高速互連(例如 UCIe),這意味著多芯片系統(tǒng)不可避免地要處理人工智能工作負載?!?/p>

解決問題的新堆棧

華邦電子通過其 CUBE 堆棧(定制超帶寬元素)重新思考了內存架構?!拔覀兪褂?DRAM 作為存儲單元,但也通過過孔進行 3D 堆疊,”華邦 DRAM 營銷經理 Omar Ma 解釋道?!澳梢蕴峁牡撞炕逡恢钡?SoC 芯片的連接。它更具成本效益,因為 DRAM 不使用 SRAM 的六個晶體管。”

CUBE 可以提供足夠高的密度來替代 SRAM 直至 3 級緩存?!盀榱诉_到一定的帶寬要求,只有兩個選擇——提高時鐘速度或增加 I/O 數(shù)量,”O(jiān)mar Ma 解釋道。“使用 CUBE,您可以根據(jù)需要增加它們,同時減少時鐘。這在系統(tǒng)層面帶來了很多好處,包括減少對電力的需求?!?CUBE 目前處于原型階段,但預計將于 2024 年第四季度或 2025 年初投入生產。

結論

SRAM 被完全取代,這似乎不太可能,至少在短期內是這樣?!皫啄昵?,英特爾演示了使用鐵電存儲器作為緩存,”O(jiān)bjective Analysis 總經理吉姆·漢迪 (Jim Handy) 說?!八麄冋f這是 DRAM,但說實話,這是 FRAM。他們表示,優(yōu)勢在于他們能夠使用3D NAND技術使其變得非常緊密。換句話說,他們展示了一個擁有大量內存的微小空間。其中一種類型的研究工作(無論是像英特爾所展示的那樣還是 MRAM 等其他方法)很可能最終會取代 SRAM 的位置,但這可能不會很快發(fā)生?!?/p>

Handy 預計它會導致架構和操作系統(tǒng)軟件發(fā)生變化。“你不太可能看到同一個處理器同時具有 SRAM 緩存和鐵電緩存,因為軟件必須進行一些更改才能利用這一點,”他說。“此外,緩存的結構將略有不同。主緩存可能會稍微縮小,而輔助緩存可能會變得非常大。在某個時候,具有 SRAM 緩存的處理器將會問世。下一代處理器將具有鐵電或 MRAM 緩存或類似的東西,并對軟件進行重大更改以使該配置更好地工作。”





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • CMOS
    +關注

    關注

    58

    文章

    5652

    瀏覽量

    235006
  • 電容器
    +關注

    關注

    63

    文章

    6189

    瀏覽量

    99154
  • 存儲器
    +關注

    關注

    38

    文章

    7434

    瀏覽量

    163521
  • sram
    +關注

    關注

    6

    文章

    762

    瀏覽量

    114592
  • VDD
    VDD
    +關注

    關注

    1

    文章

    311

    瀏覽量

    33039

原文標題:SRAM如何克服其擴展問題?

文章出處:【微信號:ICViews,微信公眾號:半導體產業(yè)縱橫】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電容式觸摸按鍵的按鍵擴展方法

    電子發(fā)燒友網站提供《電容式觸摸按鍵的按鍵擴展方法.pdf》資料免費下載
    發(fā)表于 09-27 11:43 ?0次下載
    電容式觸摸按鍵的按鍵<b class='flag-5'>擴展</b><b class='flag-5'>方法</b>

    SRAM和DRAM什么區(qū)別

    靜態(tài)隨機存儲器(Static Random Access Memory,簡稱SRAM)和動態(tài)隨機存儲器(Dynamic Random Access Memory,簡稱DRAM)是兩種不同類
    的頭像 發(fā)表于 09-26 16:35 ?1142次閱讀

    STM32U5如何把數(shù)據(jù)保存到SRAM2中?

    stm32u575xx可以在StandBy模式下保留SRAM2,那我應該如何把數(shù)據(jù)保留在SRAM2?直接使用絕對地址嗎?或者更優(yōu)雅的形式?
    發(fā)表于 05-23 07:51

    STM32F103VCT6如何擴展SRAM(IS62WV51216bll)?

    STM32F103VCT6如何擴展SRAM(IS62WV51216bll),誰有代碼啊
    發(fā)表于 05-17 10:10

    Microchip推出容量更大、速度更快的串行SRAM產品線

    為滿足客戶對更大更快的SRAM的普遍需求,MicrochipTechnology(微芯科技公司)擴展了旗下串行SRAM產品線,容量最高可達4Mb,并將串行外設接口/串行四通道輸入/輸出接口(SPI
    的頭像 發(fā)表于 04-12 08:23 ?350次閱讀
    Microchip推出容量更大、速度更快的串行<b class='flag-5'>SRAM</b>產品線

    Microchip推出容量更大、速度更快的串行 SRAM產品線

    Technology(微芯科技公司)擴展了旗下 串行 SRAM 產品線,容量最高可達4 Mb,并將串行外設接口/串行四通道輸入/輸出接口(SPI/SQI?)的速度提高到143 MHz。新產品線包括提供2 Mb和4
    發(fā)表于 04-03 15:24 ?1136次閱讀

    Microchip Technology擴展了旗下串行SRAM產品線,容量最高可達4Mb

    為滿足客戶對更大更快的 SRAM 的普遍需求,Microchip Technology(微芯科技公司)擴展了旗下串行SRAM產品線,容量最高可達4 Mb,并將串行外設接口/串行四通道輸入/輸出接口(SPI/SQI?)的速度提高到
    的頭像 發(fā)表于 03-29 17:18 ?689次閱讀

    SRAM CLA和SRAM什么區(qū)別

    每個SRAM單元的核心由兩個CMOS反相器構成,這兩個反相器相互連接,每個反相器的輸出電位被用作另一個反相器的輸入。這種結構使得每個SRAM單元都可以保存一個二進制位(0或1),直到它被新的數(shù)據(jù)覆蓋。
    的頭像 發(fā)表于 02-19 11:02 ?853次閱讀
    <b class='flag-5'>SRAM</b> CLA和<b class='flag-5'>SRAM</b><b class='flag-5'>有</b>什么區(qū)別

    電感線圈的繞組方法哪些?電感線圈應該如何繞線組

    電感線圈的繞組方法哪些?電感線圈應該如何繞線組? 電感線圈的繞組方法很多種,每種方法都有
    的頭像 發(fā)表于 02-03 15:07 ?2639次閱讀

    常見的降低接地電阻的方法哪些?

    常見的降低接地電阻的方法哪些? 降低接地電阻是保證電氣設備正常運行和提高設備安全性的重要措施之一。在實際工程應用中,可以采取多種方法來降低接地電阻。下面將詳細介紹常見的降低接地電阻
    的頭像 發(fā)表于 01-23 15:28 ?2655次閱讀

    什么方法可以提高晶體管的開關速度

    什么方法可以提高晶體管的開關速度? 電子行業(yè)一直在尋求提高晶體管速度的方法,以滿足高速和高性能計算需求。下面將詳細介紹幾種可以提高晶體管開關速度的
    的頭像 發(fā)表于 01-12 11:18 ?1157次閱讀

    sram讀寫電路設計

    SRAM (Static Random Access Memory)是一種高速、隨機訪問的存儲器,它以其快速的讀寫操作和不需要刷新的特點而受到廣泛使用。本文將詳細介紹SRAM的讀寫電路設計,從
    的頭像 發(fā)表于 12-18 11:22 ?1909次閱讀

    熱電阻測量技巧:如何準確判斷好壞?常見錯誤和解決方法哪些

    熱電阻測量技巧:如何準確判斷好壞?常見錯誤和解決方法哪些 熱電阻是一種常見的溫度傳感器,廣泛應用于工業(yè)自動化、電力系統(tǒng)、環(huán)境監(jiān)測等領域中。熱電阻的好壞對測量結果具有重要影響,因此準確判斷熱電阻
    的頭像 發(fā)表于 12-15 10:31 ?1914次閱讀

    ROS的擴展哪些方法

    也是毫不夸張的。 ROS的擴展即ROS universe,是全球范圍的代碼,不同國家的ROS社區(qū)組織開發(fā)和維護。 有的是庫代碼,如OpenCV、PCL等;庫的上一層是從功能角度提供的代碼,如人臉識別,導航等,調用下層的庫;最上層的代碼是應用級的代碼,讓機器人完成某一確定
    的頭像 發(fā)表于 11-21 18:12 ?662次閱讀

    AD9361哪些方法可以算出接收信號的大???

    AD9361 在知道接收信號范圍,但不具體數(shù)值的情況下,哪些方法可以算出接收信號的大小,AGC為slow attack 模式
    發(fā)表于 11-16 08:11