在意大利CINCA研究中心揭幕的Leonardo(萊昂納多)超算是用了14000個Nvidia GPU,Nvidia稱其為“世界上最強大的AI系統(tǒng)”,這個系統(tǒng)在某些半精度浮點(FP16)應用中提供10 exaflops的AI性能,在以Top500為基準進行測試時,可以提供大約200 petaflops算力。這一系統(tǒng)的推出,也將從今年底開始改變歐洲超算系統(tǒng)的格局。
對于那些從事超級計算已經(jīng)有幾年時間的人來說,對Bull系統(tǒng)應該十分熟悉,尤其是在歐洲。這家公司在2014年初被Atos收購,但從外界的角度,本質(zhì)沒有變化,直到HPC產(chǎn)品(包括“ Sequana”系列)使用Bull的名稱。
多年來,Bull一直是歐洲知名但規(guī)模不大的HPC集成商,取得了幾項重大成就,在研究和學術界只有相對少數(shù)的系統(tǒng)。但時代在改變,特別是在Bull重要的收購之后。
先是將IBM的x86服務器業(yè)務出售給聯(lián)想的交易,由于IBM在高性能計算市場關鍵的地位。歐洲HPC中心也別無選擇,因為聯(lián)想距離很遠。IBM具有足夠的本機資源,可以用于許多中心,因此多年來,許多歐洲研究機構、政府機構、氣象機構、甚至大企業(yè)的HPC都是用IBM的產(chǎn)品。
另一家公司Cray希望在歐洲獲得許多勝利,這種趨勢一直持續(xù)增長,直到最近收購HPE為止,尤其是在天氣和大型計算設備領域。盡管我們尚未看到這種供應商轉(zhuǎn)變對市場的影響,但我們預計在歐洲,變化會在未來幾年中顯現(xiàn)。這不是因為Cray或IBM不合適,也不是因為他們的技術已經(jīng)改變,是歐洲想要一直想要的東西——自己的HPC供應商生態(tài)系統(tǒng)。
作為獨立公司,Bull不可能像今天在意大利的CINECA那樣,我們稍后將討論。但有了這個系統(tǒng)的支持,以及其他許多將在明年進入超算Top 500的系統(tǒng),Atos至少在歐洲是絕對值得關注的HPC系統(tǒng)。
就超級計算機Top 500排名中的系統(tǒng)份額而言,即使被收購,Bull / Atos也沒有顯示出太大的增長。有人可能會認為,較大的母公司可以幫助Bull獲得一筆交易,但事實并非如此。從2012年到2014年,Bull保持3.6%的系統(tǒng)份額,2016年躍升至4%,在2018年又小幅提升至4.4%。
根據(jù)今年的最新數(shù)據(jù),他們上升到5.2%,榜單上共有26臺超算,其中最大的是排名20名的法國CEA的系統(tǒng)。補充說明一下,如果沒有CEA,作為超級計算公司的Bull可能不會存在,CEA需要一家法國本土公司來實現(xiàn)其最高價值的國家優(yōu)先事項。
總體而言,系統(tǒng)份額將有所變化,從即將在11月發(fā)布的全球500強榜單開始。
似乎Atos正在建立“ Baby Summit”超級計算機。所謂“高密度”,是指具有類似于美國橡樹嶺國家實驗室的GPU密集的系統(tǒng)。不同之處在于,他們沒有使用基于IBM Power的處理器,而是完全避開了Power,僅選擇了Intel和AMD(這并不令人感到意外)。但是話又說回來,當涉及即將面世的CINECA之類的系統(tǒng)時,浮點功能幾乎完全由Nvidia的Ampere A100 GPU提供。
在歐洲,Atos與配備GPU的超級計算機一起發(fā)展。上周,他們宣布將把他們的Bull Sequana XH2000 super引入芬蘭的CSC。在此之前,他們宣布了兩個大型系統(tǒng),其中包括瑞典和英國“最大的AI超級計算機”。
除了與瑞典和英國的大型系統(tǒng),他們還與Nvidia加強了合作關系,以向其他大學提供(可能是定制的)SuperPOD計算機。而且,有跡象表明他們準備在利潤豐厚的,至關重要的HPC市場(天氣預報)中分食Cray / HPE和IBM的市場。Bull今年還與ECMWF簽訂了四個系統(tǒng)(總計27 petaflops)和新系統(tǒng)的協(xié)議,是氣象機構的AI和量子研究中心。
如今,Atos在歐洲處于有史以來最強大的地位,這表明它可以提供與世界范圍內(nèi)的Cray / HPE和IBM相當強大的,用于多學科科學和技術計算的系統(tǒng)。實際上,有人可能會爭辯說,今天宣布的“LEONARDO”超級計算機將把Atos帶入高性能計算世界的真正“大時代”。
很難說LEONARDO超級計算機進入世界500強時將位列第幾,但有望達到200 petaflops的峰值半精度浮點性能(Nvdia稱其為前10 EB的AI超級計算機,它基于FP16)。
在與Nvidia的Ian Buck的一次電話會議中,這家GPU制造商表示這將是歐洲最強大的AI超級計算機,將擁有14,000多個A100 GPU,并在Atos Sequana節(jié)點上的四個A100 GPU上分解成一個單一的具有英特爾Rapids處理器和Nvidia Mellanox HDR 200Gb / s網(wǎng)絡。
LEONARDO由EuroHPC采購,EuroHPC是歐洲各國政府與歐盟之間的聯(lián)合合作,旨在在歐洲開發(fā)世界一流的超級計算生態(tài)系統(tǒng)和百億億次超級計算,并由歐洲委員會通過意大利大學和研究部資助。
NVIDIA解決方案架構和工程副總裁Marc Hamilton表示:“歐洲百億億歐元的EuroHPC技術路線圖為HPC和AI的快速增長和創(chuàng)新打開了大門。我們正在與CINECA和Atos合作,在廣泛的應用領域中加速科學探索,為迎接百億級計算時代提供了一個平臺。”
有趣的是,明年會有多少HPC中心選擇SuperPOD實現(xiàn)以AI為中心的計算,以及有多少采用Sequana中提供的更標準的HPC面向工作負載的架構?我們希望與AI / HPC世界中其他地方看到的情況相似,在這些地方AI和加速的科學計算應用程序都是GPU密集型的,并且有一些專注于AI的研發(fā)中心,需要完整的DGX或SuperPOD。
Nvidia與合作伙伴在歐洲范圍內(nèi)構建多個基于SuperPOD的系統(tǒng),同時保持其Sequana不僅僅涉及硬件。這些系統(tǒng)的軟件和支持生態(tài)系統(tǒng)非常龐大,因此,在重建SuperPOD時利潤可能微不足道,而它們在支持和牢固生態(tài)方面的構成將是無價的,尤其是歐洲在其中扮演的角色比以往任何時候都雄心勃勃。
責任編輯:YYX
-
NVIDIA
+關注
關注
14文章
4855瀏覽量
102711 -
gpu
+關注
關注
28文章
4673瀏覽量
128592 -
AI
+關注
關注
87文章
29806瀏覽量
268103
發(fā)布評論請先 登錄
相關推薦
評論