0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

中國團隊公開“Big Chip”架構(gòu)能終結(jié)摩爾定律?

傳感器技術 ? 來源:半導體行業(yè)觀察 ? 2024-01-09 10:16 ? 次閱讀

摩爾定律的終結(jié)——真正的摩爾定律,即晶體管隨著工藝的每次縮小而變得更便宜、更快——正在讓芯片制造商瘋狂。

有兩種不同的方法可以制造容量更大但通常不是更快的計算引擎——將設備分解成小芯片并將它們連接在一起或?qū)⑺鼈兾g刻在整個硅晶圓上——再加上第三種覆蓋層,這兩種方法都可以與 2.5D 和 3D 堆疊一起使用,以擴展容量和功能。

無論如何,所有這些方法都受到用于蝕刻芯片的光刻設備的掩模版限制的限制。

目前的設備是針對 300 mm 硅晶圓定制的,該屏障為 858 mm 2,僅此而已。它就像終結(jié)者,或者真空中的光速。你不能與它爭論或討價還價。沒有任何芯片可以蝕刻得比這更大。在過去的三十年里,從 150 毫米晶圓到 200 毫米晶圓到 300 毫米晶圓并沒有改變掩模版極限,從可見光光刻到水浸光刻再到極紫外光刻也沒有改變掩模版極限。假設轉(zhuǎn)向 450 毫米晶圓也不會改變掩模版限制。

盡管我們會指出,到 2023 年,擁有 450 毫米晶圓將允許更大容量的晶圓級計算引擎。但 450 毫米晶圓的工程挑戰(zhàn)對于 IBM、英特爾三星、臺積電、GlobalFoundries 和尼康來說太難解決,但這一努力于 2015 年被放棄。

光罩限制(光穿過芯片掩模以在硅晶圓上蝕刻晶體管的孔徑大?。┎粌H定義了小芯片的設計方式,而且還限制了離散計算和內(nèi)存塊的大小單個晶圓。如果我們有 450 毫米的晶圓,并且晶圓級計算機的所有邏輯都可以用比晶圓更大的掩模版一次性蝕刻,那將是令人驚奇的,但這不是光刻設備的工作原理??偠灾⌒酒途A級之間的區(qū)別實際上在于如何構(gòu)建互連,以利用計算和內(nèi)存的離散元件來構(gòu)建計算引擎插槽。

盡管存在這樣的限制,業(yè)界始終需要構(gòu)建更強大的計算引擎,并且在摩爾定律結(jié)束時,如果能夠找到一種方法,讓這些設備的制造成本也更低,那就太好了。

中國科學院計算技術研究所的研究人員剛剛在《Fundamental Research》雜志上發(fā)表了一篇論文,討論了光刻和小芯片的局限性,并提出了一種他們稱之為“Big Chip”的架構(gòu),該架構(gòu)模仿了不幸的晶圓級公司Trilogy Systems 在 20 世紀 80 年代的努力以及Cerebras Systems 在 2020 年代成功的晶圓級架構(gòu)。埃隆·馬斯克 (Elon Musk) 的特斯拉正在打造自己的“Dojo”超級計算機芯片,但這不是晶圓級設計,而是將Dojo D1 核心復雜地封裝成某種東西,如果你瞇著眼睛看,它看起來就像是由 360 個小芯片構(gòu)建的晶圓級插槽。也許通過 Dojo2 芯片,特斯拉將轉(zhuǎn)向真正的晶圓級設計??雌饋聿⒉恍枰龊芏喙ぷ骶湍芡瓿蛇@樣的壯舉。

中國科學院整理的這篇論文討論了很多關于為什么需要開發(fā)晶圓級器件的問題,但沒有提供太多關于他們開發(fā)的大芯片架構(gòu)實際上是什么樣子的細節(jié)。它并沒有表明 Big Chip 是否會像特斯拉對 Dojo 那樣采用小芯片方法,或者像 Cerebras 從一開始就一路向晶圓級發(fā)展。但其含義很明顯,就像特斯拉一樣。

據(jù)中科院研究人員介紹,名為“Zhejiang”的大芯片將使用22 納米工藝制造。

“Zhejiang”大芯片由 16 個小芯片組成,每個小芯片有 16 個 RISC-V 內(nèi)核。研究人員表示,該設計能夠在單個分立器件中擴展至 100 個小芯片,我們過去稱之為插槽,但對我們來說聽起來更像是系統(tǒng)板。目前尚不清楚這 100 個小芯片將如何配置,也不清楚這些小芯片將實現(xiàn)什么樣的內(nèi)存架構(gòu)(陣列中將有 1,600 個內(nèi)核)。

我們所知道的是,隨著大芯片“Zhejiang”的迭代,有 16 個 RISC-V 處理器使用芯片上的網(wǎng)絡在共享主內(nèi)存上進行對稱多處理,相互連接,并且小芯片之間有 SMP 鏈接,因此每個塊可以在整個復合體中共享內(nèi)存。

以下是“Zhejiang” RISC-V 小芯片的框圖:

7b0d442c-ae7c-11ee-8b88-92fbcf53809c.jpg ?

以下是如何使用中介層將 16 個小芯片捆綁在一起形成具有共享內(nèi)存的 256 核計算復合體,從而實現(xiàn)芯片間 (D2D) 互連:

7b1bae04-ae7c-11ee-8b88-92fbcf53809c.jpg

CAS 研究人員表示,絕對沒有什么可以阻止這種小芯片設計以晶圓級實現(xiàn)。然而,對于這次迭代,看起來它將是使用 2.5D 中介層互連的小芯片。

互連與計算元件一樣重要,這在系統(tǒng)和子系統(tǒng)設計中始終如此。

“該接口是使用基于時間復用機制的通道共享技術設計的,”研究人員在談到 D2D 互連時寫道?!斑@種方法減少了芯片間信號的數(shù)量,從而最大限度地減少了 I/O 凸塊和內(nèi)插器布線資源的面積開銷,從而可以顯著降低基板設計的復雜性。小芯片終止于頂部金屬層,微型 I/O 焊盤就建在該金屬層上。”

雖然一個大芯片計算引擎作為多芯片或晶圓級復合體可能很有趣,但重要的是如何將這些設備互連以提供百億億級計算系統(tǒng)。以下是 CAS 研究人員對此的看法:

研究人員在談到這種計算和內(nèi)存的分層結(jié)構(gòu)時寫道:“對于當前和未來的億億級計算,我們預測分層小芯片架構(gòu)將是一種強大而靈活的解決方案?!比缦聢D所示?!胺謱有⌒酒軜?gòu)被設計為具有多個內(nèi)核和許多具有分層互連的小芯片。在chiplet內(nèi)部,內(nèi)核使用超低延遲互連進行通信,而chiplet之間則以得益于先進封裝技術的低延遲互連,從而在這種高可擴展性系統(tǒng)中實現(xiàn)片上延遲和NUMA效應可以最小化。存儲器層次結(jié)構(gòu)包含核心存儲器、片內(nèi)存儲器和片外存儲器。這三個級別的內(nèi)存在內(nèi)存帶寬、延遲、功耗和成本方面有所不同。在分層chiplet架構(gòu)的概述中,多個核心通過交叉交換機連接并共享緩存。這就形成了一個pod結(jié)構(gòu),并且pod通過chiplet內(nèi)網(wǎng)絡互連。多個pod形成一個chiplet,chiplet通過chiplet間網(wǎng)絡互連,然后連接到片外存儲器。需要仔細設計才能充分利用這種層次結(jié)構(gòu)。合理利用內(nèi)存帶寬來平衡不同計算層次的工作負載可以顯著提高chiplet系統(tǒng)效率。正確設計通信網(wǎng)絡資源可以確保小芯片協(xié)同執(zhí)行共享內(nèi)存任務?!?br />
7b1f5504-ae7c-11ee-8b88-92fbcf53809c.jpg ?

我們很難反駁這句話中所說的任何內(nèi)容,但 CAS 研究人員并沒有說明他們將如何實際處理這些問題。這是最困難的部分。

有趣的是,該圖中的內(nèi)核被稱為“可編程”和“可重新配置”,但我們不確定這意味著什么。它可能需要使用可變線程技術(例如 IBM 的 Power8、Power9 和 Power10 處理器)來完成更多工作,而不是在核心中混合使用 CPUFPGA 元件。這很難說。

CAS 研究人員表示,大芯片計算引擎將由超過 1 萬億個晶體管組成,占據(jù)數(shù)千平方毫米的總面積,采用小芯片封裝或計算和存儲塊的晶圓級集成。對于百億億次 HPC 和 AI 工作負載,我們認為 CAS 很可能正在考慮 HBM 堆疊 DRAM 或其他一些替代雙泵浦主內(nèi)存,例如英特爾和 SK Hynix 開發(fā)的 MCR 內(nèi)存。RISC-V 內(nèi)核可能會有大量本地 SRAM 進行計算,這可能會消除對 HBM 內(nèi)存的需求,并允許使用 MCR 雙泵浦技術加速 DDR5 內(nèi)存。很大程度上取決于工作負載以及它們對內(nèi)存容量和內(nèi)存帶寬的敏感程度。

Big Chip 論文列出了一份未來技術的愿望清單,例如光電計算、近內(nèi)存計算以及可以添加到 Big Chip 復合體中的 3D 堆棧式緩存和主內(nèi)存 - 看起來像是使用光學 I /O 處理器是首選。但 CAS 并未透露其正在研究的內(nèi)容以及何時可以交付。

據(jù)我們所知,大芯片及其大系統(tǒng)已經(jīng)建成,CAS現(xiàn)在只是在談論它。例如,谷歌就是這樣做的,但隨著像谷歌這樣的公司使用有趣的系統(tǒng)作為招聘技術人員的方式,將某些東西投入該領域和談論它之間的時間一直在縮短。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19100

    瀏覽量

    228814
  • 摩爾定律
    +關注

    關注

    4

    文章

    630

    瀏覽量

    78892
  • 晶體管
    +關注

    關注

    77

    文章

    9609

    瀏覽量

    137655
  • 芯片制造
    +關注

    關注

    9

    文章

    607

    瀏覽量

    28750
  • RISC-V
    +關注

    關注

    44

    文章

    2204

    瀏覽量

    45958

原文標題:終結(jié)摩爾定律?中國團隊公開“Big Chip”架構(gòu)

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    擊碎摩爾定律!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)摩爾定律是由英特爾創(chuàng)始人之一戈登·摩爾提出的經(jīng)驗規(guī)律,描述了集成電路上的晶體管數(shù)量和性能隨時間的增長趨勢。根據(jù)摩爾定律,集成電路上可容納的晶體管數(shù)目約每隔18個月便會
    的頭像 發(fā)表于 06-04 00:06 ?3948次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    奇異摩爾專用DSA加速解決方案重塑人工智能與高性能計算

    隨著摩爾定律下的晶體管縮放速度放緩,單純依靠增加晶體管密度的通用計算的邊際效益不斷遞減,促使專用計算日益多樣化,于是,針對特定計算任務的專用架構(gòu)成為計算創(chuàng)新的焦點。
    的頭像 發(fā)表于 09-19 11:45 ?547次閱讀
    奇異<b class='flag-5'>摩爾</b>專用DSA加速解決方案重塑人工智能與高性能計算

    高算力AI芯片主張“超越摩爾”,Chiplet與先進封裝技術迎百家爭鳴時代

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)英特爾CEO基辛格此前表示,摩爾定律并沒有失效,只是變慢了,節(jié)奏周期正在放緩至三年。當然,摩爾定律不僅是周期從18個月變?yōu)榱?年,且開發(fā)先進制程成本高昂,經(jīng)濟效益也變得
    的頭像 發(fā)表于 09-04 01:16 ?2988次閱讀
    高算力AI芯片主張“超越<b class='flag-5'>摩爾</b>”,Chiplet與先進封裝技術迎百家爭鳴時代

    “自我實現(xiàn)的預言”摩爾定律,如何繼續(xù)引領創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應邀在《電子》雜志上發(fā)表了一篇四頁短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?231次閱讀

    封裝技術會成為摩爾定律的未來嗎?

    你可聽說過摩爾定律?在半導體這一領域,摩爾定律幾乎成了預測未來的神話。這條定律,最早是由英特爾聯(lián)合創(chuàng)始人戈登·摩爾于1965年提出,簡單地說就是這樣的:集成電路上可容納的晶體管數(shù)量大約
    的頭像 發(fā)表于 04-19 13:55 ?291次閱讀
    封裝技術會成為<b class='flag-5'>摩爾定律</b>的未來嗎?

    電源解決方案跟摩爾定律有何關系?它如何跟上摩爾定律的步伐?

    根據(jù)電源解決方案或與功耗、能源效率或整體能源或碳足跡相關的分析來對任何系統(tǒng)(或系統(tǒng)集合)進行分析時,將源與負載分開出來幫助整個過程。
    的頭像 發(fā)表于 03-28 13:50 ?751次閱讀
    電源解決方案跟<b class='flag-5'>摩爾定律</b>有何關系?它如何跟上<b class='flag-5'>摩爾定律</b>的步伐?

    功能密度定律是否替代摩爾定律?摩爾定律和功能密度定律比較

    眾所周知,隨著IC工藝的特征尺寸向5nm、3nm邁進,摩爾定律已經(jīng)要走到盡頭了,那么,有什么定律能接替摩爾定律呢?
    的頭像 發(fā)表于 02-21 09:46 ?611次閱讀
    功能密度<b class='flag-5'>定律</b>是否<b class='flag-5'>能</b>替代<b class='flag-5'>摩爾定律</b>?<b class='flag-5'>摩爾定律</b>和功能密度<b class='flag-5'>定律</b>比較

    半導體行業(yè)能否走出低谷,中國影響幾何?

    英特爾和臺積電都在技術上投入資金。三星和其他內(nèi)存制造商必須跟上技術節(jié)點的轉(zhuǎn)變,即使同時保持產(chǎn)能遠離市場。他們需要跟上技術的步伐,以在摩爾定律的基礎上保持競爭力,摩爾定律推動了內(nèi)存業(yè)務的基本成本。
    的頭像 發(fā)表于 01-29 11:05 ?737次閱讀

    摩爾定律終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    在動態(tài)的半導體技術領域,圍繞摩爾定律的持續(xù)討論經(jīng)歷了顯著的演變,其中最突出的是 MonolithIC 3D 首席執(zhí)行官Zvi Or-Bach于2014 年的主張。
    的頭像 發(fā)表于 01-25 14:45 ?1015次閱讀
    <b class='flag-5'>摩爾定律</b>的<b class='flag-5'>終結(jié)</b>:芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    英特爾CEO基辛格:摩爾定律放緩,仍能制造萬億晶體

    帕特·基辛格進一步預測,盡管摩爾定律顯著放緩,到2030年英特爾依然可以生產(chǎn)出包含1萬億個晶體管的芯片。這將主要依靠新 RibbonFET晶體管、PowerVIA電源傳輸、下一代工藝節(jié)點以及3D芯片堆疊等技術實現(xiàn)。目前單個封裝的最大芯片含有約1000億個晶體管。
    的頭像 發(fā)表于 12-26 15:07 ?614次閱讀

    英特爾CEO基辛格:摩爾定律仍具生命力,且仍在推動創(chuàng)新

    摩爾定律概念最早由英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1970年提出,明確指出芯片晶體管數(shù)量每兩年翻一番。得益于新節(jié)點密度提升及大規(guī)模生產(chǎn)芯片的能力。
    的頭像 發(fā)表于 12-25 14:54 ?560次閱讀

    摩爾定律時代,Chiplet落地進展和重點企業(yè)布局

    如何超越摩爾定律,時代的定義也從摩爾定律時代過渡到了后摩爾定律時代。 后摩爾定律時代,先進封裝和Chiplet技術被寄予厚望。近日,由博聞創(chuàng)意主辦的第七屆
    的頭像 發(fā)表于 12-21 00:30 ?1443次閱讀

    應對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法

    應對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法
    的頭像 發(fā)表于 12-05 15:32 ?523次閱讀
    應對傳統(tǒng)<b class='flag-5'>摩爾定律</b>微縮挑戰(zhàn)需要芯片布線和集成的新方法

    奇異摩爾與潤欣科技加深戰(zhàn)略合作開創(chuàng)Chiplet及互聯(lián)芯粒未來

    模式的創(chuàng)新,就多種 Chiplet 互聯(lián)產(chǎn)品和互聯(lián)芯粒的應用領域拓展合作空間。 在摩爾定律持續(xù)放緩與最大化計算資源需求的矛盾下,Chiplet 已成為當今克服摩爾定律與硅物理極限挑戰(zhàn)的核心戰(zhàn)術。Chiplet 作為一種互連技術,其核心是對?SoC
    的頭像 發(fā)表于 11-30 11:06 ?3520次閱讀

    摩爾定律失效#計算機

    計算機軟件網(wǎng)絡
    未來加油dz
    發(fā)布于 :2023年11月15日 18:12:55