0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新一代GPU之王B200面世,帶動產業(yè)鏈狂歡!

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2024-03-19 23:58 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)作為AI時代不容置疑的無冕之王,英偉達每年舉辦的GTC大會不僅是針對英偉達軟硬件生態(tài)開發(fā)者的一場盛會,也是英偉達展示肌肉的舞臺。在近日舉辦的GTC大會上,英偉達CEO黃仁勛在發(fā)布新品的同時,也宣告了一個新的計算時代的到來。

黃仁勛表示,我們需要更大的模型,然后用更多的多模數(shù)據(jù)去訓練它,而不再局限于互聯(lián)網(wǎng)上的文本數(shù)據(jù),還有圖片、圖表。正如我們通過電視來獲取支持知識一樣,這些大模型也將快速接入視頻數(shù)據(jù),比如最近爆火的Sora等。

192GB HBM3e內存,Blackwell架構的前鋒

為了應對更大的模型,自然也就需要更大的GPU,這才有了英偉達此次發(fā)布的Blackwell GPU平臺。Blackwell架構以數(shù)學家David Harold Blackwell命名,作為兩年前發(fā)布的Hopper架構繼任者,Blackwell可以說實現(xiàn)了設計到性能上的全方位升級,而首個享受這些升級的,就是B200 GPU。

全新的B200 GPU基于臺積電4NP工藝,采用了兩個GPU die集成在同一芯片上的設計,并配備了192GGB的HBM3e超大內存。也正因如此,B200單芯片的晶體管數(shù)量達到了驚人的2080億個,TDP也高達1000W。但這樣瘋狂的堆料帶來的自然是性能的翻倍提升,在FP8精度的訓練性能上,B200 GPU的算力是上一代的2.5倍。

wKgaomX5twWARXkfAAmVJFg1468232.png?
兩代GPU架構支持精度 / 英偉達


有趣的一點在于,在英偉達第二代Transformer引擎的支持下,此次B200加入了對FP4精度的支持,從而支持到規(guī)模更大,性能要求更高的模型。在FP4精度下的推理性能,B200的算力更是達到了上一代的5倍。如果以1750億參數(shù)的GPT-3大模型作為實例進行測試的話,B200 GPU的總體性能是H100的7倍,訓練速度則是H100的4倍。

為了更好地提升B200的擴展性,英偉達基于最新的第五代NVLink技術,開發(fā)了一塊全新的NVLink Switch芯片,雙向帶寬高達1800GB/s,是上一代的兩倍。與此同時,NVLink支持的最大擴展規(guī)模也得到了提升,如今最多支持576塊B200 GPU互聯(lián)互通。

wKgaomX5tyOAX88kABIoDTWVbVY026.png?
GB200超級芯片 / 英偉達


除了新架構的GPU外,英偉達基于NVLink C2C互聯(lián)技術,也為超級芯片GH200打造了下一代繼任者GB200。GB200超級芯片由一個Grace CPU與兩塊B200 GPU組成,并以超低功耗卻能實現(xiàn)900GB/s超大帶寬的互聯(lián)。不過此次英偉達并沒有對CPU的架構進行升級,仍然采用的是72核Arm Neoverse N2的設計,所以此次GH200的主要性能提升還是在GPU上,英偉達GB200在LLM推理性能上有了30倍的提升,但能效比也提升了25倍。

wKgZomX5t0OAZKvkACBFL86q3WQ679.png?
GB200 NVL72與GB200配置與性能 / 英偉達


針對萬億參數(shù)級別的超級大模型,英偉達基于GB200和NVLink技術推出了集成36/72個GPU的GB200 NVL36/72方案?;贕B200 NVL72打造的MGX系統(tǒng)更是可以實現(xiàn)30TB的統(tǒng)一內存,130TB/s的總帶寬,甚至是單機柜exaFLOP級(FP4精度)的AI算力。英偉達表示,即便面對1.8萬億參數(shù)的GPT-MoE-1.8T超大模型,也可以實現(xiàn)比同數(shù)量H100 GPU高出4倍的訓練性能,以及實時的AI推理。

B200發(fā)布后,哪些產業(yè)同步受益

過去英偉達先進AI GPU的熱度,已經(jīng)帶動了一批上下游產業(yè)的發(fā)展,而隨著B200的發(fā)布,相關市場或再度迎來一輪爆發(fā)。從制造上游來看,無疑晶圓代工廠受益最大,無論是提供邏輯代工、先進封裝方案的臺積電,還是為新GPU提供大容量HBM內存的三大存儲廠商(SK海力士、三星和美光)。

四年之前,英偉達在GA100采取了將芯片分成兩半,通過高速互聯(lián)技術來完成通信的設計,然而這一大膽的設計卻很少被人注意。而如今在CUDA、GPU團隊,以及臺積電的先進邏輯與封裝工藝下,B200終于采用了Chiplet的設計,將兩個GPU die集成在單個封裝內,并做到了逼近臺積電4NP工藝節(jié)點的極限die面積,以及高達10TB/s的C2C互聯(lián)速度。

再考慮到未來即將出貨的H200和B100 GPU,這一系列芯片將進一步推動臺積電4nm工藝走向滿載的產能利用率,而這還是在過去只被視為淡季的Q1。更不用說這一系列芯片帶來的CoWoS產能壓力,據(jù)報道,臺積電已經(jīng)計劃投資160億美元在臺灣建設6座新的CoWoS封裝設施,甚至有爆料稱臺積電開始考慮出海擴張CoWoS封裝產能,第一站很可能會在日本,足以看出GPU的訂單數(shù)量之夸張。

這也進一步推動了存儲廠商在HBM上的營收占比,三大參與廠商在HBM產能供應上的競爭已經(jīng)進入了白熱化階段。本次GTC線下活動中,SK海力士、三星和美光均展示了自己的HBM3e解決方案。據(jù)TrendForce預估,2024年全年HBM產能將同比提升260%,于整個DRAM行業(yè)產值占比從去年的8.4%擴大至20.1%。不過,對于存儲廠商而言,今年的訂單基本已經(jīng)排滿了,依照英偉達和AMD的發(fā)布計劃來看,即便在瘋狂擴產下,2025年的產能恐怕也抵不住即將瘋狂襲來的訂單。

另一個即將從數(shù)據(jù)中心進一步攫取更多市場機會的產業(yè)為液冷,而且服務器廠商們早已準備好了對應的解決方案。目前隨著服務器AI算力的不斷增強,液冷解決方案的普及率在整個服務器市場依然算不上高,甚至不到5%。

B200、GB200以及GB200 NVL72盡管一再強調提高了能效比,但對于單個系統(tǒng)的散熱要求依然提高了。畢竟單個GB200 NVL72機柜的計算單元規(guī)模就比過去的DGX系統(tǒng)高出不少,液冷是英偉達目前給出的唯一設計,畢竟單個GB200超級芯片的最高TDP可達2700W。

為此服務器OEM幾乎同時宣布了對應的液冷服務器配置方案,比如戴爾推出了首個采用液冷配置的PowerEdge XE9680服務器,Supermicro也發(fā)布了液冷ORV3 MGX系統(tǒng)。鴻海集團也發(fā)布了針對GB200 NVL72的先進液冷解決方案,具備高達1300kW的強大散熱能力。

最后自然就是服務器上的高速通信了,與B200同步公布的還有Quantum-X800 InfiniBand和Spectrum?-X800 Ethernet這兩大高速網(wǎng)絡解決方案。在與英偉達LinkX線纜和光模塊的組合下,可以做到最高2公里內的800GB/s網(wǎng)絡傳輸速度。盡管這是英偉達收購Mellanox后發(fā)布的專用方案,但無疑加快了800G網(wǎng)絡普及的進程。

計算光刻,反哺芯片制造

去年,英偉達推出了cuLitho這一軟件庫,借助GPU的強大算力有望將光罩的開發(fā)速度提升40倍。在今天的GTC大會上,英偉達也宣布和臺積電、新思達成合作,正式將其計算光刻技術投入生態(tài)當中去,并充分利用英偉達此次發(fā)布的Blackwell GPU。

計算光刻主要用于芯片的開發(fā)和制造環(huán)節(jié),通過建立大量的數(shù)學和物理模型來幫助客戶設計光罩。相比傳統(tǒng)基于CPU的計算光刻技術,基于GPU加速和生成式AI算法的計算光刻技術要高效得多,英偉達聲稱集成了350個H100的系統(tǒng)就可以替代掉一個由40000個CPU組成的計算光刻系統(tǒng),加速生產時間的同時,降低了成本、部署空間和功耗。

寫在最后

盡管每次在英偉達展示其新品后,這些產品都會成為其他AI硬件公司拿來作為各種性能對比的參考,比如這次Groq就在GTC會后很快正面回應了英偉達,并發(fā)布了“Groq仍然更快”的聲明。然而,明眼人都能看出來,在當今的市場環(huán)境下,英偉達在AI行業(yè)的地位依舊不可撼動。

其中不僅有架構創(chuàng)新、CUDA的功勞,也少不了英偉達在半導體上下游多年來的經(jīng)營。臺積電優(yōu)先給英偉達CoWoS封裝產能,AI服務器廠商們在發(fā)布會后一呼百應,都佐證了英偉達已經(jīng)為這個新計算時代打造好了一條完整且已經(jīng)得到證實的AI生態(tài)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4591

    瀏覽量

    128144
  • 英偉達
    +關注

    關注

    22

    文章

    3637

    瀏覽量

    89855
收藏 人收藏

    評論

    相關推薦

    星曜半導體完成10億元B輪融資,中國移動產業(yè)鏈發(fā)展基金領投

    近日,國內射頻前端領域的領軍企業(yè)浙江星曜半導體有限公司(以下簡稱“星曜半導體”)宣布,已成功完成總額高達10億元的B輪融資,這融資額刷新了國內近年來射頻前端賽道最大單輪融資記錄。本輪融資由中國移動產業(yè)鏈
    的頭像 發(fā)表于 06-27 18:15 ?733次閱讀

    英偉達GPU新品規(guī)劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉達(NVIDIA)公布了其GPU產品的未來規(guī)劃。據(jù)英偉達透露,B100、B200和GB200系列GPU
    的頭像 發(fā)表于 06-13 09:44 ?601次閱讀

    特斯拉加碼AI布局:xAI將采購30萬塊英偉達B200芯片

    特斯拉CEO埃隆·馬斯克近日在社交平臺上公布了項重要消息,旗下的人工智能初創(chuàng)公司xAI計劃采購30萬塊英偉達B200 AI芯片。這大規(guī)模采購計劃標志著特斯拉在人工智能領域布局的進
    的頭像 發(fā)表于 06-05 09:21 ?504次閱讀

    會員風采!華秋電子——致力于“為電子產業(yè)增效降本”的數(shù)字化智造平臺

    ”、高可靠多層板制造平臺“華秋PCB”、電子元器件電商“華秋商城”、BOM鍵配單/SMT/PCBA服務的“華秋SMT”等電子產業(yè)站式服務平臺。全面打通產業(yè)上、中、下游,形成電子
    發(fā)表于 05-13 09:53

    英偉達發(fā)布新一代AI芯片B200

    在美國加州圣何塞舉辦的英偉達GTC生態(tài)大會上,英偉達CEO黃仁勛以場震撼人心的演講,正式推出了公司的新一代GPU——Blackwell。作為Blackwell家族的首款芯片,B200
    的頭像 發(fā)表于 03-20 10:07 ?787次閱讀

    英偉達發(fā)布性能大幅提升的新款B200 AI GPU

    英偉達宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上一代,運算能力飛躍性提升,甚至能使大語言模型的訓練速度翻番。
    的頭像 發(fā)表于 03-20 09:37 ?618次閱讀

    英偉達計劃拉大GB200B100/B200規(guī)格差異,以刺激用戶購買GB200

    早些時候,IT之家用張路線圖展示了英偉達計劃在2024年推出Hopper GH200 GPU,其后將依次推出基于Blackwell的GB200以及GX
    的頭像 發(fā)表于 03-14 16:36 ?2354次閱讀

    戴爾發(fā)布英偉達B200 AI GPU:高功耗達1000W,創(chuàng)新性冷卻工程設計必要

    市場傳言,這款B200雖然運算性能更強,卻又面臨著驚人的能耗,最高或可至1000W,同比H100增長超過40%。由于搭載Hopper架構及HBM3e高帶寬內存,英偉達B200被行業(yè)視為運行速度最高的AI芯片;
    的頭像 發(fā)表于 03-05 09:30 ?1730次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預計會在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1095次閱讀
    NVIDIA將在今年第二季度發(fā)布Blackwell架構的<b class='flag-5'>新一代</b><b class='flag-5'>GPU</b>加速器“<b class='flag-5'>B</b>100”

    陶瓷基板產業(yè)鏈分布及工藝制作流程

    陶瓷基板產業(yè)鏈上游主要為陶瓷粉體制備企業(yè),中游為陶瓷裸片及陶瓷基板生產企業(yè),下游則涵蓋汽車、衛(wèi)星、光伏、軍事等多個應用領域??v觀陶瓷基板產業(yè)鏈,鮮有企業(yè)能夠打通垂直產業(yè)鏈,形成粉體、裸片、基板的
    的頭像 發(fā)表于 12-26 11:43 ?1839次閱讀
    陶瓷基板<b class='flag-5'>產業(yè)鏈</b>分布及工藝制作流程

    智慧燈桿產業(yè)鏈企業(yè)圖譜

    智慧燈桿產業(yè)鏈企業(yè)圖譜智慧燈桿產業(yè)鏈企業(yè)圖譜智慧燈桿產業(yè)鏈企業(yè)圖譜智慧燈桿產業(yè)鏈企業(yè)圖譜智慧燈桿產業(yè)鏈企業(yè)圖譜智慧燈桿
    發(fā)表于 12-11 17:36 ?1次下載

    開放式耳機帶動產業(yè)鏈發(fā)展?可穿戴設備市場迎來拐點,未來有哪些趨勢

    今年上半年,可穿戴設備市場有哪些變化呢,哪些應用市場會有較大的發(fā)展機會呢? ? 開放式耳機成為“新寵” 根據(jù)IDC的數(shù)據(jù)顯示,智能手環(huán)、智能手表、無線耳機三大類別均在第二季度實現(xiàn)環(huán)比增長,及同比增長。這在定程度上帶動產業(yè)鏈廠商的業(yè)績增長。整體
    的頭像 發(fā)表于 11-05 07:14 ?2962次閱讀
    開放式耳機<b class='flag-5'>帶動產業(yè)鏈</b>發(fā)展?可穿戴設備市場迎來拐點,未來有哪些趨勢

    2015款奔馳B200車發(fā)動機故障燈異常點亮

    2015款奔馳B200車發(fā)動機故障燈異常點亮作者:杭州捷盛行汽車服務有限公司樂翔故障現(xiàn)象故障診斷故障排除輛2015款奔馳B200車,搭載270910發(fā)動機,累計行駛里程約為4.4萬km,車主
    的頭像 發(fā)表于 11-04 08:09 ?532次閱讀
    2015款奔馳<b class='flag-5'>B200</b>車發(fā)動機故障燈異常點亮

    跟隨華秋 走進新一代產業(yè)園電子電路主題展

    ,電子信息制造業(yè)規(guī)模以上企業(yè)營業(yè)收入突破24萬億元。為貫徹落實《方案》精神,深圳新一代產業(yè)園積極組織了園區(qū)企業(yè)-華秋,開展了電子電路主題展,并邀請黨內群眾學習。本次主題展也得到了相關領導的認可和肯定
    發(fā)表于 10-27 11:15

    華秋帶您走進新一代產業(yè)園電子電路主題展

    ,電子信息制造業(yè)規(guī)模以上企業(yè)營業(yè)收入突破24萬億元。為貫徹落實《方案》精神,深圳新一代產業(yè)園積極組織了園區(qū)企業(yè)-華秋,開展了電子電路主題展,并邀請黨內群眾學習。本次主題展也得到了相關領導的認可和肯定
    發(fā)表于 10-27 11:12