国产成人A∨激情视频厨房,少妇无码一区二区三区,免费无毒A网站在线观看

異構(gòu)超級計(jì)算機(jī)時(shí)代已經(jīng)到來。近日，日本筑波大學(xué)上線的Cygnus超算成為第一臺(tái)進(jìn)入超算top500榜單的GPU、FPGA混合加速超級計(jì)算機(jī)。在如何讓CPU、GPU、FPGA多硬件協(xié)調(diào)、高效、同步提供算力上邁出了重要一步。

如果說“異構(gòu)超級計(jì)算機(jī)”的時(shí)代已經(jīng)到來，那么本月早些時(shí)候在日本筑波大學(xué)上線的 CPU、GPU、FPGA混合硬件超算系統(tǒng)就是這個(gè)時(shí)代的首批探索者之一。

這臺(tái)超算名為Cygnus，由NEC制造，目前在日本筑波大計(jì)算科學(xué)中心（CCS）運(yùn)行，由Intel Xeon CPU，Nvidia Tesla GPU和Intel Stratix 10 FPGA共同提供硬件支持。

Cygnus系統(tǒng)架構(gòu)：所有80個(gè)Cygnus節(jié)點(diǎn)都配備了兩個(gè)Xeon“Skylake”黃金 CPU和四個(gè)Tesla V100 GPU，同時(shí)在32個(gè)節(jié)點(diǎn)中，還和GPU搭載了兩個(gè)Stratix 10 FPGA。48個(gè)CPU-GPU專用節(jié)點(diǎn)稱為“Deneb節(jié)點(diǎn)”（以最亮的Cygnus A星命名），而32個(gè)CPU-GPU-FPGA節(jié)點(diǎn)稱為Albireo節(jié)點(diǎn)（以Cygnus A雙星命名）。

FPGA型號(hào)為Bittware 520N PCIe卡，供應(yīng)商為Nallatech，這些“重型”FPGA卡可以提供10 teraflops的單精度性能，以及四組DDR4內(nèi)存。尤其是，該卡配備了四個(gè)100G光纖網(wǎng)絡(luò)端口，共提供400Gbps帶寬，可以通過自身結(jié)構(gòu)直接與其他520N FPGA進(jìn)行通信。在Cygnus中，可將8×8的2D環(huán)形網(wǎng)絡(luò)中的64個(gè)FPGA相互連接。Bittware包括一個(gè)板級支持包（BSP），可供OpenCL開發(fā)人員使用。

每個(gè)Cygnus節(jié)點(diǎn)的雙精度浮點(diǎn)性能為30 teraflops，其中28個(gè)節(jié)點(diǎn)算力由四個(gè)V100 GPU提供。由兩個(gè)Stratix 10器件在配備FPGA的節(jié)點(diǎn)上提供20個(gè)單精度teraflops。整機(jī)可提供算力為2.4 petaflop（64位浮點(diǎn)）或5.12 petaflop（32位浮點(diǎn)）算力。

目前，Cygnus正在取代該機(jī)構(gòu)之前使用的COMA，COMA是一款由Intel Xeon CPU和Xeon Phi協(xié)處理器驅(qū)動(dòng)的Cray CS300計(jì)算機(jī)集群。它于2014年組建，今年3月底退役，為Cygnus讓位。

Mellanox HDR InfiniBand負(fù)責(zé)Cygnus上的系統(tǒng)互連，與獨(dú)立的FPGA網(wǎng)絡(luò)一樣，系統(tǒng)設(shè)計(jì)人員確保了足夠的帶寬來進(jìn)行節(jié)點(diǎn)間通信。每個(gè)節(jié)點(diǎn)使用四個(gè)100Gbps HDR通道，連接為全二分fat樹網(wǎng)絡(luò)。InfiniBand網(wǎng)絡(luò)還用于訪問托管在DataDirect Networks ES14KX設(shè)備上的2.5 PB Lustre文件系統(tǒng)。

盡管“雙加速硬件”的設(shè)定很新潮，但其實(shí)Cygnus并不是試驗(yàn)機(jī)。其組建的主要用途是為宇宙學(xué)、粒子物理學(xué)、生命科學(xué)和人工智能等領(lǐng)域科學(xué)研究提供生產(chǎn)力。通過CPUGPUFPGA的組合，力求在實(shí)際科學(xué)研究中最有效地發(fā)揮這些硬件各自的計(jì)算優(yōu)勢。

具體來說，GPU負(fù)責(zé)提供粗粒度并行計(jì)算，主要擅長SIMD友好型計(jì)算，而FPGA提供細(xì)粒度并行計(jì)算，更適合應(yīng)用于非SIMD算法。而對于氣候模擬，生物信息學(xué)、分子動(dòng)力學(xué)、地球物理學(xué)和線性代數(shù)中使用的一些特定算法，F(xiàn)PGA已經(jīng)證明能夠?qū)崿F(xiàn)比CPU、GPU更快、更高效的運(yùn)算。不過，在科學(xué)上可以通過代碼同時(shí)高效利用這兩種架構(gòu)。

Cygnus系統(tǒng)架構(gòu)圖

Cygnus的目標(biāo)應(yīng)用之一是模擬早期宇宙，模擬光源的輻射傳輸。模擬過程是在一個(gè)套為ARGOT的代碼中實(shí)現(xiàn)的，其中名為“ART”（真實(shí)輻射傳輸）的光線追蹤算法是該模擬中的重要部分，ART部分更適合FPGA硬件平臺(tái)上的大規(guī)模運(yùn)行。

不過，ARGOT的其他部分在GPU上運(yùn)行更合適，因此利用“雙硬件加速”成為最佳解決方案。該應(yīng)用程序在GPU和FPGA之間使用基于PCIe的直接存儲(chǔ)器訪問來實(shí)現(xiàn)協(xié)調(diào)，避免了使CPU受到影響而出現(xiàn)延遲。

ART實(shí)現(xiàn)是使用相對較高級別的OpenCL實(shí)現(xiàn)的，這表明其他開發(fā)人員也可以這樣做。Bittware方面表示，使用OpenCL實(shí)現(xiàn)的用戶與嚴(yán)格使用硬件描述語言（HDL）實(shí)現(xiàn)的用戶進(jìn)行對比發(fā)現(xiàn)，在許多情況下，OpenCL實(shí)現(xiàn)在性能方面與后者“足夠接近”。

過去幾年來，F(xiàn)PGA軟件開發(fā)的進(jìn)展促使微軟、亞馬遜和百度等巨頭越來越廣泛地采用FPGA硬件，尤其是在機(jī)器學(xué)習(xí)和推理等應(yīng)用上。

但是，在高性能計(jì)算平臺(tái)中，使用FPGA的設(shè)備更少。筑波大學(xué)的這臺(tái)Cygnus將是唯一一個(gè)進(jìn)入超算TOP500榜單的采用FPGA加速的超級計(jì)算機(jī)。德國帕德博恩大學(xué)去年安裝了一臺(tái)使用FPGA的超算，Cray CS500超級計(jì)算機(jī)，配備了32塊Bittware 520N卡，不過該機(jī)沒有配備GPU。

還有一些其他FPGA式的HPC集群遍布世界各地，包括美國佛羅里達(dá)州的CHREC（現(xiàn)改稱SHREC）的Nova-G＃系統(tǒng)，英國Hartree中心的Maxeler HPC-X以及Catapult 1和TACC的HARP v2計(jì)算機(jī)集群。

未來是否會(huì)有更多更強(qiáng)大的異構(gòu)超級計(jì)算機(jī)誕生？這不僅取決于使用者的需求，更多還要取決于硬件廠商和開發(fā)者是否繼續(xù)從上到下推動(dòng)生態(tài)系統(tǒng)建設(shè)。

從Bittware的角度來看，關(guān)鍵的推動(dòng)力一定是來自中間層面的，同時(shí)有賴于對高級語言和更成熟的開發(fā)工具更充分的支持。目前的好消息是，業(yè)界最大的兩家FPGA制造商——英特爾和賽林思都在為開發(fā)人員提供更好的工具，并將這些工具與下一代FPGA產(chǎn)品整合在一起。

從這一點(diǎn)上看，我們似乎可以對異構(gòu)超算的未來保持一份謹(jǐn)慎的樂觀。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

FPGA

FPGA

+關(guān)注

關(guān)注
1620

文章
21510

瀏覽量
598938
gpu

gpu

+關(guān)注

關(guān)注
27

文章
4591

瀏覽量
128144
超級計(jì)算機(jī)

超級計(jì)算機(jī)

+關(guān)注

關(guān)注
2

文章
452

瀏覽量
41821

原文標(biāo)題：迎接“異構(gòu)超算”新時(shí)代：日本Cygnus超算GPU和FPGA雙硬件加持，TOP500榜單只此一臺(tái)

文章出處：【微信號(hào)：AI_era，微信公眾號(hào)：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

TOP500第二臺(tái)E級超算出現(xiàn)，AMD要在HPC上逆襲英特爾？

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）在今年的ISC2024上，新一期的TOP500全球超算榜單發(fā)布。除了瑞典超

發(fā)表于 05-15 09:11 ?2251次閱讀

【書籍評測活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

的G80到現(xiàn)在重金難求的H100；AMD的Zen系列CPU和RDNA系列GPU兩線作戰(zhàn)；中國的高性能計(jì)算芯片逐步獲得更多TOP500排名；華為Ascend 910 NPU芯片也成為AI

發(fā)表于 09-02 10:09

算力系列基礎(chǔ)篇——算力與計(jì)算機(jī)性能：解鎖超能力的神秘力量！

在《算力系列基礎(chǔ)篇——算力101：從零開始了解算力》中，相信各位粉絲初步了解到人工智能的“發(fā)動(dòng)機(jī)”和核心驅(qū)動(dòng)力：算力！算力！

發(fā)表于 07-11 08:04 ?104次閱讀

預(yù)定下代超算第一？富士通144核Arm處理器公開

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）相信對超算市場有過一定了解的朋友，都對曾經(jīng)的第一名富岳超算不陌生。

發(fā)表于 06-24 00:26 ?2563次閱讀

這個(gè)“六一”，一起組裝人生第一臺(tái)量子計(jì)算機(jī)

自主量子計(jì)算機(jī)群開放授課活動(dòng)”上30多名少先隊(duì)員在“本源悟空”硬件研制團(tuán)隊(duì)負(fù)責(zé)人孔偉成博士的指導(dǎo)下動(dòng)手組裝人生第一臺(tái)量子計(jì)算機(jī)與中國第三代自主超導(dǎo)量子計(jì)算機(jī)“本源悟

發(fā)表于 06-02 08:22 ?213次閱讀

QPU與GPU，經(jīng)典超算和量子計(jì)算的協(xié)同

真正應(yīng)用起來還有相當(dāng)遠(yuǎn)的距離，但量子計(jì)算方面的推進(jìn)一刻也沒有停下，國內(nèi)外不少企業(yè)和研究機(jī)構(gòu)都在推進(jìn)量子計(jì)算方面的研究。 ? 量子計(jì)算QPU ? ISC上，Nvidia表示正在

發(fā)表于 05-21 01:35 ?2232次閱讀

NVIDIA和Recursion利用AI超級計(jì)算機(jī)加快新藥研發(fā)

BioHive 由 NVIDIA AI 驅(qū)動(dòng)，用于加速醫(yī)療領(lǐng)域科學(xué)家的工作。在全球超級計(jì)算機(jī) TOP500 榜單中，它的排名上升了 100

發(fā)表于 05-16 09:46 ?1120次閱讀

最新Top500超算榜單公布：Frontier再奪魁首，Aurora破百億大關(guān)

此次Top500排行榜中只有一個(gè)顯著變動(dòng)：瑞士國家超級計(jì)算機(jī)中心的Alps超算憑借270 PFl

發(fā)表于 05-14 09:36 ?602次閱讀

中國第三代自主超導(dǎo)量子計(jì)算機(jī)“本源悟空”入駐國家超算互聯(lián)網(wǎng)

中國第三代自主超導(dǎo)量子計(jì)算機(jī)“本源悟空”日前正式入駐國家超算互聯(lián)網(wǎng)平臺(tái)，中國最先進(jìn)的量子算力、超級算

發(fā)表于 04-04 08:21 ?209次閱讀

Tesla 計(jì)劃斥資 5 億美元建造一臺(tái)由 NVIDIA 的 AI GPU 提供支持的 Dojo 超級計(jì)算機(jī)

ABSTRACT摘要Tesla計(jì)劃斥資5億美元建造一臺(tái)由NVIDIA的AIGPU提供支持的Dojo超級計(jì)算機(jī)，因此該公司正在加大基于AI的開發(fā)力度。JAEALOT2024年1月27日Tesla計(jì)劃

發(fā)表于 02-19 12:45 ?477次閱讀

埃尼集團(tuán)宣布啟動(dòng)HPC6超級計(jì)算機(jī)項(xiàng)目，預(yù)計(jì)最高算力達(dá)600 PFlop/s?

據(jù)了解，Eni 是全球知名石油巨頭之一，同時(shí)也是意大利規(guī)模最大的三家企業(yè)之一，其股權(quán)結(jié)構(gòu)中有約三分之一來自意大利政府。其目前已有兩臺(tái)超級

發(fā)表于 01-30 13:43 ?434次閱讀

歐盟首臺(tái)百億億次級超級計(jì)算機(jī)JUPITER建設(shè)成果顯著，進(jìn)入新階段

歐洲超級計(jì)算機(jī)聯(lián)盟 EuroHPC JU 曾于 2023 年 10 月宣布，將投資 2.73 億歐元打造歐洲第一臺(tái)超大規(guī)模超級計(jì)算機(jī)——JU

發(fā)表于 01-25 14:40 ?422次閱讀

詳細(xì)解讀GPU的起源及發(fā)展

最早的算力引擎。是人類的大腦，后來演變成草繩、石頭、算籌（一種用于計(jì)算的小棍子）、算盤。到了20世紀(jì)40年代，世界上第一臺(tái)數(shù)字式電子計(jì)算機(jī)E

發(fā)表于 12-25 10:07 ?1927次閱讀

超算連續(xù)霸榜，富士通推動(dòng)計(jì)算技術(shù)革新

主要高性能計(jì)算機(jī)排名中，連續(xù)第八次蟬聯(lián)全球榜首。與此同時(shí)，在TOP500和HPL-MxP榜單中，超級計(jì)算機(jī)“富岳”目前分別排名全球第四及

發(fā)表于 11-29 17:10 ?387次閱讀

TOP500新榜出爐，F(xiàn)rontier依舊牢坐榜首

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）在一年一度的國際超算大會(huì)上，新一輪的TOP500超

發(fā)表于 11-15 00:14 ?1538次閱讀