0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大家都在爭(zhēng)相超過A100,無人對(duì)標(biāo)的Grace Hopper性能幾何?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-09-06 01:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))作為英偉達(dá)CPUGPU技術(shù)開發(fā)上的集大成之作,Grace Hopper很大程度上象征著復(fù)雜計(jì)算領(lǐng)軍產(chǎn)品。盡管英偉達(dá)竭盡所能地去堆這一“超級(jí)芯片”的性能,但英偉達(dá)還是選擇將Grace Hopper(GH200)描述成了世界上最萬(wàn)能的計(jì)算平臺(tái),這也得益于它同時(shí)在AI計(jì)算和HPC計(jì)算領(lǐng)域展現(xiàn)的可怕性能。

AI計(jì)算性能

相信絕大多數(shù)人已經(jīng)從市場(chǎng)瘋搶A100、H100的現(xiàn)狀,對(duì)Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作為一個(gè)異構(gòu)計(jì)算平臺(tái),在與傳統(tǒng)的x86 CPU與H100對(duì)比上,也有著不小的性能差距。

首要區(qū)別自然就是連接Grace CPU和Hopper GPU的NVLink-C2C,這一高帶寬低延遲的互聯(lián)技術(shù)可謂是目前唯一能發(fā)揮H100近乎全部實(shí)力的方案。支持最高144TB內(nèi)存的同時(shí),提供900GB/s的帶寬。

英偉達(dá)官方也對(duì)部分AI計(jì)算負(fù)載進(jìn)行了測(cè)試,在終端應(yīng)用上對(duì)比x86+Hopper與Grace Hopper的一體化方案有何異同。其性能差距可以說是巨大的,就拿最常見的大語(yǔ)言模型推理來說,GH200可以做到x86平臺(tái)的4.5倍性能表現(xiàn),而DLRM(深度學(xué)習(xí)推薦模型)訓(xùn)練與圖神經(jīng)網(wǎng)絡(luò)(GNN)訓(xùn)練的性能也可以分別達(dá)到3.5倍和1.9倍。

其實(shí)這里的差異還是體現(xiàn)在互聯(lián)方案的帶寬上,例如x86+Hopper的方案還是在使用PCIe方案,該方案在batch size較小時(shí)性能落后還不算明顯,一旦到了更大的batch size,PCIe的帶寬就成了瓶頸,而不斷以高帶寬輸送數(shù)據(jù)給H100的NVLink-C2C則可以實(shí)現(xiàn)比PCIe高出數(shù)倍的性能。

HPC計(jì)算性能

Grace Hopper的另一大應(yīng)用領(lǐng)域自然就是HPC了。HPC主要集中在一些科學(xué)、工程的復(fù)雜計(jì)算上,比如天氣預(yù)測(cè)、生命科學(xué)、流體力學(xué)等。然而與此同時(shí),不少商業(yè)相關(guān)的HPC計(jì)算也在進(jìn)一步推動(dòng)HPC的發(fā)展,甚至更早用上最新芯片技術(shù),比如油藏模擬等。

著名油藏模擬軟件ECHELON的開發(fā)商Stone Ridge,在最近獲得了早期訪問權(quán),對(duì)英偉達(dá)的H100-PCIe、H100-NVL和Grace-Hopper來了場(chǎng)性能測(cè)試。早在Volta和Ampere架構(gòu)時(shí),Stone Ridge就對(duì)不同架構(gòu)的GPU進(jìn)行了測(cè)試,而如今的H100相較這些舊GPU已經(jīng)在CUDA核心、內(nèi)存容量和內(nèi)存帶寬上有了數(shù)倍的提升。

這些還只是表面上的變化,英偉達(dá)還引入了諸多架構(gòu)改進(jìn),提高了ML和HPC應(yīng)用程序的性能。而Grace Hopper相較傳統(tǒng)的x86+GPU方案就更具優(yōu)勢(shì)了,首先Grace本身就是一個(gè)強(qiáng)大的CPU,每個(gè)內(nèi)核都有四個(gè)128位適量單元,超高的內(nèi)存帶寬以及超大的L2+L3緩存。其次,NVLink的存在大大減少了CPU和GPU之間的通信時(shí)間。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架構(gòu)不同版本的英偉達(dá)GPU在ECHELON模型上的性能對(duì)比 / Stone Ridge


Stone Ridge選擇了不同細(xì)胞規(guī)模的模型,從83000個(gè)細(xì)胞到670萬(wàn)個(gè)細(xì)胞,其中Grace Hopper都展現(xiàn)出了不俗的性能,最高可達(dá)Volta架構(gòu)的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架構(gòu),所以ECHELON必須重新編譯才能在系統(tǒng)上運(yùn)行,不過對(duì)于ECHELON來說,重新編譯并不要花太多力氣,他們?cè)诓恍薷拇a的情況就成功重編譯在GH200上正常運(yùn)行。如果對(duì)代碼進(jìn)行進(jìn)一步優(yōu)化的話,還有機(jī)會(huì)獲得更高的性能表現(xiàn)。如此高的性能提升,意味著油藏勘探模擬的時(shí)間可以被大幅縮短,從而加快油藏評(píng)估的速度。

結(jié)語(yǔ)

可以說無論是A100還是H100,都只是英偉達(dá)在AI與HPC戰(zhàn)線擴(kuò)大戰(zhàn)果的第一步棋,明年Q2交付到各大系統(tǒng)中的GH200才是最大的殺手锏,也很可能會(huì)成為更搶手的數(shù)據(jù)中心與超算中心硬件產(chǎn)品。這也恰好證明了英偉達(dá)給它的定位,世界上最萬(wàn)能的計(jì)算平臺(tái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA AI Enterprise榮獲金獎(jiǎng)

    NVIDIA AI Enterprise、GH200 Grace Hopper 超級(jí)芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認(rèn)可。
    的頭像 發(fā)表于 05-29 09:27 ?402次閱讀
    NVIDIA AI Enterprise榮獲金獎(jiǎng)

    亞馬遜AWS暫緩訂購(gòu)英偉達(dá)Grace Hopper,等待新品Grace Blackwel

    今年 3 月,英偉達(dá)宣布了新款人工智能處理器Blackwell,比上一代Hopper提前不到一年面世。CEO黃仁勛表示,新產(chǎn)品在訓(xùn)練大規(guī)模語(yǔ)言模型方面的性能將提升一倍。
    的頭像 發(fā)表于 05-22 12:03 ?608次閱讀

    亞馬遜未中斷英偉達(dá)訂單,等待Grace Blackwell更強(qiáng)性能

    英國(guó)《金融時(shí)報(bào)》昨日?qǐng)?bào)道稱,亞馬遜AWS已暫停訂購(gòu)英偉達(dá)最新款“超級(jí)芯片”Grace Hopper,等待性能更強(qiáng)的新品Grace Blackwell(GH200)。此舉引發(fā)市場(chǎng)擔(dān)憂,認(rèn)
    的頭像 發(fā)表于 05-22 11:00 ?412次閱讀

    英偉達(dá)靜候新品來臨,亞馬遜暫緩購(gòu)買Grace Hopper

    今年3月,英偉達(dá)發(fā)布了全新的Blackwell處理器,距離前任產(chǎn)品Hopper的發(fā)布不過短短一年。英偉達(dá)首席執(zhí)行官黃仁勛表示,新款產(chǎn)品在訓(xùn)練大規(guī)模語(yǔ)言模型上的效率將提升至原來的兩倍。
    的頭像 發(fā)表于 05-22 09:07 ?263次閱讀

    NVIDIA Grace Hopper點(diǎn)亮AI超級(jí)計(jì)算新時(shí)代

    瑞士 Alps、法國(guó) EXA1-HE 等超級(jí)計(jì)算機(jī)將使用高能效的、基于 Grace 的系統(tǒng)為氣候和天氣、科學(xué)探索等領(lǐng)域提供 200 EFLOPS AI 算力,以支持突破性研究。
    的頭像 發(fā)表于 05-15 09:46 ?335次閱讀

    美國(guó)首個(gè)Grace Hopper架構(gòu)超算Venado落地:達(dá)10 exaFLOPS

    該超級(jí)計(jì)算機(jī)是由惠普企業(yè)集團(tuán)(Hewlett Packard Enterprise)打造,其運(yùn)算能力高達(dá) 10 exaFLOPS,它是美國(guó)第一款采用英偉達(dá)Grace Hopper芯片架構(gòu)的超級(jí)計(jì)算機(jī)系統(tǒng)。
    的頭像 發(fā)表于 04-18 14:37 ?370次閱讀

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場(chǎng)景等多個(gè)方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3248次閱讀

    英偉達(dá)H200和A100的差異

    英偉達(dá)H200和A100在多個(gè)方面存在差異。
    的頭像 發(fā)表于 03-07 16:18 ?2152次閱讀

    Arm架構(gòu)與Neoverse技術(shù)在基礎(chǔ)設(shè)施領(lǐng)域的應(yīng)用與發(fā)展

    Arm的Neoverse系列已有穩(wěn)定的立足點(diǎn)。例如,英偉達(dá)的超級(jí)芯片Grace-Hopper就是由兩片獨(dú)立的芯片組成,其中 Hopper負(fù)責(zé)處理所有AI任務(wù),如張量運(yùn)算,Grace則扮演 CPU角色,利用I/O與內(nèi)存管理功能與常
    的頭像 發(fā)表于 02-22 15:36 ?509次閱讀

    英偉達(dá)Grace-Hopper提供一個(gè)緊密集成的CPU + GPU解決方案

    英偉達(dá)Grace-Hopper提供了一個(gè)緊密集成的CPU + GPU解決方案,針對(duì)生成式人工智能逐漸成為主導(dǎo)的市場(chǎng)環(huán)境。
    的頭像 發(fā)表于 01-02 15:52 ?855次閱讀

    英偉達(dá)和華為/海思主流GPU型號(hào)性能參考

    一句話總結(jié),H100 vs. A100:3 倍性能,2 倍價(jià)格 值得注意的是,HCCS vs. NVLINK的GPU 間帶寬。 對(duì)于 8 卡 A800 和 910B 模塊而言,
    發(fā)表于 12-29 11:43 ?5187次閱讀
    英偉達(dá)和華為/海思主流GPU型號(hào)<b class='flag-5'>性能</b>參考

    AWS成為第一個(gè)提供NVIDIA GH200 Grace Hopper超級(jí)芯片的提供商

    2023年的AWS re:Invent大會(huì)上,AWS和NVIDIA宣布AWS將成為第一個(gè)提供NVIDIA GH200 Grace Hopper超級(jí)芯片的云服務(wù)提供商。
    的頭像 發(fā)表于 11-30 09:24 ?609次閱讀
    AWS成為第一個(gè)提供NVIDIA GH200 <b class='flag-5'>Grace</b> <b class='flag-5'>Hopper</b>超級(jí)芯片的提供商

    如何為 ADAS 處理器提供超過 100A 的電流

    如何為 ADAS 處理器提供超過 100A 的電流
    的頭像 發(fā)表于 11-24 14:54 ?347次閱讀
    如何為 ADAS 處理器提供<b class='flag-5'>超過</b> <b class='flag-5'>100A</b> 的電流

    SC23 | NVIDIA 為全球領(lǐng)先的 AI 計(jì)算平臺(tái) Hopper 再添新動(dòng)力

    ,NVIDIA H200 能夠提供傳輸速度達(dá) 4.8 TB /秒的 141GB 顯存。與上一代架構(gòu)的 NVIDIA A100 相比,其容量幾乎翻了一倍,帶寬也增加了 2.4 倍。 全球領(lǐng)先
    的頭像 發(fā)表于 11-14 20:05 ?423次閱讀
    SC23 | NVIDIA 為全球領(lǐng)先的 AI 計(jì)算平臺(tái) <b class='flag-5'>Hopper</b> 再添新動(dòng)力

    對(duì)英偉達(dá)A100芯片算力服務(wù)收費(fèi)價(jià)格上調(diào)100%,這家企業(yè)的硬氣來自哪里?

    半導(dǎo)體芯情了解到,A100是英偉達(dá)最新推出的一款高性能計(jì)算芯片,采用了全新的Ampere架構(gòu),Ampere架構(gòu)是NVIDIA于 GTC 2020發(fā)布的GPU架構(gòu),NVIDIA Ampere 由540億晶體管組成,是7nm芯片。
    的頭像 發(fā)表于 11-14 16:30 ?1161次閱讀
    對(duì)英偉達(dá)<b class='flag-5'>A100</b>芯片算力服務(wù)收費(fèi)價(jià)格上調(diào)<b class='flag-5'>100</b>%,這家企業(yè)的硬氣來自哪里?