0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

美國重奪超算霸主,GPU提供56%的總算力

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-06-28 15:59 ? 次閱讀

在近日舉行的ISC會議上,最新Top500榜單公布了。這次,榜單頂部的排名變化較大,美國Summit超級計算機摘得桂冠,中國的神威·太湖之光排名第二。這是自2012年11月以來,美國第一次宣布全球最強大超級計算機,重奪超算霸主地位。但在進入榜單的系統(tǒng)數(shù)量方面,中國仍然遠超美國。

TOP500是針對全球已知最強大的計算機系統(tǒng)做出排名與詳細介紹的項目。此項目始于1993年,今年已經(jīng)是第25年。TOP500每年公布兩次最新的超級計算機排名,一次是在6月份的國際超級計算機大會(ISC),第二次則是在11月份的全球超級計算大會(SC)。

近日舉行的ISC會議上,最新一期Top500榜單公布了。這次,榜單頂部的排名變化較大,美國Summit超級計算機摘得桂冠,兩個新系統(tǒng)進入前5。這是自2012年11月以來,美國第一次宣布全球最強大超級計算機,重奪超算霸主地位。

Summit超級計算機。來源:橡樹嶺國家實驗室

由IBM總包設計建設,目前在美國能源部(DOE)的橡樹嶺國家實驗室(ORNL)運行的Summit超級計算機,在作為TOP500榜單基準的高性能Linpack(HPL)基準測試中以122.3 petaflops(每秒12.23億億次)的性能問鼎榜首。Summit超算有4356個節(jié)點,每個節(jié)點配備2顆22核的Power9 CPU和6顆NVIDIA Tesla V100 GPU。節(jié)點與Mellanox雙軌EDR InfiniBand網(wǎng)絡連接在一起。

Summit的Linpack測試的理論峰值性能是187.7 petaflops。在Linpack測試中,Summit超算提供122.3 petaflops的性能,計算效率達到65.2% ——這對新機器來說并不差,而且顯然會隨著時間的推移而改善。

排名第二的是中國的神威·太湖之光,由國家并行計算機工程技術(shù)研究中心(NRCPC)開發(fā),安裝在國家超級計算無錫中心。該系統(tǒng)在過去兩年里一直名列榜首,自2016年6月上線以來,它的HPL成績一直保持不變,為93 petaflops。神威·太湖之光在Linpack性能測試中的計算效率達到74.2%,達到93 petaflops的性能的功耗為15.37百萬瓦(megawatts),而Summit系統(tǒng)達到122.3 petaflops性能的功耗僅8.81百萬瓦。

美國能源部勞倫斯利弗莫爾國家實驗室的新系統(tǒng)Sierra排名第三,它的HPL性能是71.6 petaflops。同樣由IBM打造的Sierra超算的架構(gòu)與Summit非常相似,有4320個節(jié)點,每個節(jié)點均由兩顆Power9 CPU和四顆NVIDIA Tesla V100 GPU驅(qū)動,并使用相同的Mellanox EDR InfiniBand作為系統(tǒng)互連。

天河二號盡管經(jīng)過了一次重大升級,用定制的Matrix-2000協(xié)處理器取代了5年前的Xeon Phi加速器,但它還是下降了兩名,由6個月前的第二名變成第四名。天河二號的新硬件將其HPL性能從33.9 petaflops提高到61.4 petaflops,同時將功耗略微提高了約4%。天河二號由中國國防科技大學(NUDT)開發(fā),部署在國家超級計算廣州中心。

AI Bridging Cloud Infrastructure (ABCI)是排名第五的系統(tǒng),由日本富士通公司制造,它的HPL性能達到19.9 petaflops。ABCI由20核的Xeon Gold處理器和NVIDIA Tesla V100 GPU驅(qū)動,安裝在日本國家先進工業(yè)科學技術(shù)研究所(AIST)。

瑞士的Piz Daint (19.6 petaflops)、美國的Titan (17.6 petaflops)、美國的Sequoia (17.2 petaflops)、美國的Trinity (14.1 petaflops),和美國的 Cori (14.0 petaflops) 分別排第6位至第10位。

TOP500的前10名

TOP500榜單中國超算數(shù)量超過美國

接下來我們看看TOP500的一些關(guān)鍵概況。

盡管美國在榜單上的排名靠前,但目前美國在榜單上的系統(tǒng)只有124套,創(chuàng)歷史新低。就在6個月前,美國在榜單上的系統(tǒng)還有145套。與此同時,中國進入榜單的系統(tǒng)達到206套,占比41%,6個月前是202套。接著是日本,有36套系統(tǒng),英國22套,德國21套,法國18套。這些數(shù)字與上次的榜單基本相同。

國家超算數(shù)量年度變化

不過,主要歸功于Summit和Sierra,美國在性能方面從中國手中奪回了領先地位。目前,美國的系統(tǒng)占TOP500系統(tǒng)性能總和的38.2%,中國排在第二位,占29.1%。

今年是第一次TOP500榜單的所有500套系統(tǒng)的總性能超過百億億次級別(exaflop),確切地說,已經(jīng)達到1.22 exaflops。這比去年11月時的 845 petaflops 要高。其中,有273套系統(tǒng)的HPL性能超過1 petaflops,而上次的榜單超過只有181套系統(tǒng)性能超過1 petaflops。

CPU架構(gòu)Intel Xeon占主導地位,56%的計算來自GPU

就處理器架構(gòu)而言,Intel Xeon在CPU架構(gòu)方面占據(jù)主導地位。

未來幾年,IBM和AMD可能會分別憑借Power和Epyc處理器迎來復興,而Arm服務器芯片也將從中分得一杯羹。但即便如此,Intel Xeon仍將繼續(xù)在CPU方面占據(jù)主導地位。

在加速器方面,TOP500系統(tǒng)中有110個使用加速器,相比2017年11月時的101個加速系統(tǒng)略有增加。TOP500超算的總體性能有一半來自某種形式的加速系統(tǒng)。這些使用加速器的系統(tǒng)中有96個使用NVIDIA GPU,其中前10名就有5個:Summit,Sierra,ABCI,Piz Daint和Titan。此外,使用加速器的系統(tǒng)中有7個配備了Xeon Phi協(xié)處理器,而PEZY加速器被用在4個系統(tǒng)中。另外20個系統(tǒng)使用Xeon Phi作為主處理器。

TOP500的幾乎所有超級計算機(97.8%)都由擁有8個或更多內(nèi)核的主處理器驅(qū)動,超過一半(53.2%)的主處理器有超過16個內(nèi)核。

10G或更快的以太網(wǎng)在247個系統(tǒng)中被使用,比6個月前榜單的228個多。此外,139個系統(tǒng)使用InfiniBand,比上次榜單的163個少。有38個系統(tǒng)使用英特爾的Omni-Path技術(shù),上次的榜單是35個。

TOP500榜單中,56%的計算來自GPU。越來越多的廠商開始談論“人工智能超級計算機”(AI supercomputers),因為可以加速傳統(tǒng)HPC工作負載的CPU-GPU混合架構(gòu)也可以用于機器學習訓練。

自1993年以來,TOP500的總性能、排名第一以及排名500的超算性能變化如下圖所示:

另一個變化是,榜單中學術(shù)、機密和研究類型的超算有所減少,而用于工業(yè)的超算比例增加了:

以下是按系統(tǒng)份額的廠商排名,聯(lián)系有122套系統(tǒng)上榜,占23.8%,其次是HPE,15.8%(79套系統(tǒng)),浪潮,13.6%(68套系統(tǒng)),Cray, 11.2%(56套系統(tǒng)),曙光, 11%(55套系統(tǒng))。

盡管IBM擁有前三名超級計算機中的兩款:Summit和Sierra,但它在整個榜單中只有19套系統(tǒng)。然而,由于這兩臺機器,IBM貢獻了TOP500總性能的19.9%。接著是Cray,性能份額為16.5%,聯(lián)想為12.0%,HPE為9.9%。

Green500榜單

最后,我們看一下Green500的榜單。Green500中排名前三的超算都來自日本,它們基于ZettaScaler-2.2架構(gòu),使用PEZY-SC2加速器。而前10名中的其他系統(tǒng)都使用NVIDIA GPU。

最高能效的超級計算機仍然日本理研的Shoubu(菖蒲) system B,能效為18.4 gigaflops/watt,在TOP500榜單中排名第362位。

能效排名第二的是位於日本高能加速器研究組織/KEK的Suiren2系統(tǒng),達到16.8 gigaflops/watt,在TOP500榜單中排名第388位。

Green500的第三名是美國的DGX SaturnV Volta系統(tǒng),接著是Summit(美國),TSUBAME 3.0(日本),AIST AI Cloud(日本),AI Bridging Cloud Infrastructure(日本),new IBM MareNostrum P9 cluster(西班牙),DOE’s Summit system(美國),以及Wilkes-2(英國)。

作為不依賴任何加速器的最高能效的超級計算機,神威·太湖之光在Green500榜單上排第22位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • 超級計算機
    +關(guān)注

    關(guān)注

    2

    文章

    452

    瀏覽量

    41819

原文標題:【GPU稱霸超算TOP500最新榜單】美國重奪全球超算霸主,總算力56%來自GPU

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AIGPU開始騰飛,背后是電源管理的持續(xù)支持

    為AI PC元年。 ? 不僅是AI PC,還包括AI服務器、AI手機、AI汽車等,眾多AI實際應用讓GPU的需求大增,也在不斷追求性能更高的GPU。而隨著
    的頭像 發(fā)表于 03-30 00:12 ?3847次閱讀
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>GPU</b>開始騰飛,背后是電源管理的持續(xù)支持

    【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    的應用需求。 12年前,我與本書作者相識時,他向我提出一個想法:建立中關(guān)村在線高性能計算頻道。該頻道隸屬于核心硬件事業(yè)部,聚焦芯片相關(guān)的產(chǎn)品技術(shù)分析、評測,并為企業(yè)客戶提供內(nèi)部參考。后來這個想法被否決
    發(fā)表于 09-02 10:09

    服務器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,需求日益增長。智中心的服務器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務器也進入了大眾的視野,成為高性能計算的首選。那
    的頭像 發(fā)表于 07-25 08:28 ?276次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服務器為什么選擇<b class='flag-5'>GPU</b>

    IaaS+on+DPU(IoD)+下一代高性能底座技術(shù)白皮書

    DPU 是當下基礎設施的核心創(chuàng)新之一。如果把 CPU 比做大腦,那么 GPU 就好比是肌肉,而 DPU 就是神經(jīng)中樞。CPU 承載了應用生態(tài),提供了通用型
    發(fā)表于 07-24 15:32

    壁仞科技為中國移動呼和浩特智中心提供強大

    ? 隨著人工智能技術(shù)的飛速發(fā)展,高性能計算中心成為推動AI創(chuàng)新和應用的關(guān)鍵基礎設施。近日,中國移動智中心(呼和浩特)成功上線運營。國內(nèi)領先的GPU企業(yè)壁仞科技的壁礪系列通用GPU
    的頭像 發(fā)表于 07-05 17:16 ?1068次閱讀

    十問:,通存比

    鄔賀銓指出,現(xiàn)有測算方法難以精準衡量。國內(nèi)企業(yè)服務器的出貨量并不等于國內(nèi)市場的使用量,而且進口國外的服務器未統(tǒng)計在內(nèi);服務器出貨量也不等于上架量,更不等于已經(jīng)加電使用量。通常服務器集群的
    的頭像 發(fā)表于 04-13 11:40 ?3607次閱讀

    “捷智”正式入駐國家互聯(lián)網(wǎng)平臺

    ABSTRACT摘要2024年4月2日,本公司旗下服務品牌“捷智”正式入駐國家互聯(lián)網(wǎng)平臺,開設云
    的頭像 發(fā)表于 04-12 08:26 ?314次閱讀
    “捷智<b class='flag-5'>算</b>”正式入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網(wǎng)平臺

    Sora需求引發(fā)業(yè)界對集結(jié)國內(nèi)AI企業(yè)的探討

    據(jù)周鴻祎觀察,Sora視頻分析所需恐遠超千億規(guī)模模型。因而,考慮到如今國內(nèi)芯片供應受限,問題至關(guān)重要。事實上,Meta已有約50萬臺 GPU
    的頭像 發(fā)表于 02-25 10:03 ?449次閱讀

    智能規(guī)模通用,大模型對智能提出高要求

    的縮寫,即每秒所能夠進行的浮點運算數(shù)目(每秒浮點運算量)。 ? 可以分為通用、智能
    的頭像 發(fā)表于 02-06 00:08 ?5457次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    上海電信攜手徐匯區(qū),發(fā)布人工智能公共服務產(chǎn)品,擬建平臺

    根據(jù)計劃,2024年上半年,上海市徐匯區(qū)將規(guī)劃建設總算超過四千五百PFLOPS(即每秒千萬億次)的15000卡智集群,該集群運用自主研發(fā)的AI
    的頭像 發(fā)表于 01-24 09:50 ?498次閱讀

    微軟超越蘋果,全球市值最高公司桂冠

    昨天,微軟超越蘋果,全球市值最高公司桂冠。本周四,該公司盤中交易中,該股曾短暫超越蘋果。
    的頭像 發(fā)表于 01-13 13:53 ?997次閱讀

    網(wǎng)絡面臨三大挑戰(zhàn)

    2024年,以AIGC為代表的人工智能技術(shù)將進一步激發(fā)需求,網(wǎng)絡、智中心、
    的頭像 發(fā)表于 01-12 10:39 ?785次閱讀

    GPU是顯卡嗎 cpu和gpu哪個

    很大的區(qū)別,因此它們的計算能力也不同。 首先,我們來看一下CPU(中央處理器)的。CPU是一種通用處理器,它被設計用于處理各種不同類型的任務,包括數(shù)據(jù)處理、指令執(zhí)行、邏輯控制等。CPU的核心數(shù)量和頻率是衡量其
    的頭像 發(fā)表于 01-10 15:45 ?4452次閱讀

    人工智能為什么需要GPU?

    GPU前面加一個“GP”,就變?yōu)镚eneral-Purpose Computing on Graphics Processing Units,即通用計算圖形處理器。我們?nèi)バg(shù)語化,可以直接說這是一種用于處理非特定需求(通用類型)計算目的的
    發(fā)表于 11-10 14:48 ?5414次閱讀
    人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b>為什么需要<b class='flag-5'>GPU</b>?