0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò)計算的未來打下堅實基礎(chǔ)

21克888 ? 來源:廠商供稿 ? 作者:NVIDIA ? 2022-05-31 14:58 ? 次閱讀

全球的超級計算中心都在紛紛利用NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上的NVIDIA BlueField DPU將加速計算提升到一個新的水平


在歐洲和美國,HPC開發(fā)者正在利用NVIDIA BlueField-2 DPU內(nèi)的Arm核和加速器的強大功能為超級計算機提供強大助力。

美國洛斯阿拉莫斯國家實驗室(LANL)正在與NVIDIA進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高30倍。

LANL研究人員預(yù)計,使用在NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上運行的DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用BlueField以及NVIDIA DOCA軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。

面向DPU的開放式API

這些努力還將有助于進一步定義OpenSNAPI,任何人都可通過該應(yīng)用接口來控制DPU。這是統(tǒng)計計算框架( Unified Communication Framework)的一個項目,Unified Communication Framework是一個旨在實現(xiàn)HPC應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括Arm、IBM、NVIDIA、美國國家實驗室和美國的一些大學(xué)。

LANL已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的DPU賦能的存儲系統(tǒng)。

加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與DPU和InfiniBand加速器相結(jié)合,可為Linux文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達同類存儲系統(tǒng)的30倍,并將成為LANL基礎(chǔ)架構(gòu)中的關(guān)鍵組件。

一位研究人員在近期的LANL博客中表示:“ABoF讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?br />
德克薩斯州打造出云原生超級計算平臺

德克薩斯高級計算中心(TACC)近期也開始在Dell PowerEdge服務(wù)器中采用BlueField-2。它將在InfiniBand網(wǎng)絡(luò)上使用DPU,使其Lonestar6系統(tǒng)成為云原生超級計算的開發(fā)平臺。

TACC的Lonestar6為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多HPC開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI獲得加速

在距TACC東北部1200英里的地方,俄亥俄州立大學(xué)的研究人員展示了DPU如何將一個HPC熱門編程模型的運行速度提高26%。

他們通過卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了P3DFFT,這是一個用于眾多大規(guī)模HPC仿真的數(shù)學(xué)庫。

俄亥俄州立大學(xué)計算機科學(xué)與工程專業(yè)的教授Dhabaleswar K. (DK) Panda在其帶領(lǐng)的MVAPICH開源軟件團隊推動DPU工作,他表示:“DPU就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載?!?br />
HPC中心和云中的DPU


對于運行藥物研發(fā)或飛機設(shè)計等HPC仿真應(yīng)用的超級計算機而言,高達兩位數(shù)的性能加速是驚人的。Panda表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個HPC中心的代碼請求。

Quantum InfiniBand網(wǎng)絡(luò)以及NVIDIA SHARP特性,助力他高效完成工作。

他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而InfiniBand已經(jīng)在為它提供支持?!?br />
達勒姆開發(fā)負載均衡


歐洲的多個研究團隊正利用BlueField DPU加速MPI和其他HPC工作負載。

例如,英格蘭北部的達勒姆大學(xué)正在開發(fā)一款軟件,用于在16個節(jié)點的Dell PowerEdge集群上使用BlueField DPU以實現(xiàn)MPI作業(yè)的負載均衡。該項目的首席調(diào)查員Tobias Weinzierl表示,該軟件將為全球各地的HPC設(shè)施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的DPU應(yīng)用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用DPU。

倫敦大學(xué)學(xué)院正在探索如何在BlueField-2 DPU上為主機系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。

Dell PowerEdge服務(wù)器內(nèi)的BlueField DPU可為Cambridge Service for Data Driven Discovery服務(wù)卸載主機CPU的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。

與此同時,慕尼黑工業(yè)大學(xué)計算機體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用DPU來卸載MPI和操作系統(tǒng)任務(wù),這是EuroHPC項目的一部分。

在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用BlueField-2 DPU加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達20%,且不會損失模擬的準(zhǔn)確性。

不斷擴展的網(wǎng)絡(luò)


本月早些時候,日本研究人員宣布將推出一款采用新版NVIDIA H100 Tensor Core GPU的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)平臺。

NEC將使用H100的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為6 PFLOPS超級計算機。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI和更多方面的研究。

與此同時,Panda等研究人員已經(jīng)開始考慮如何使用BlueField-3 DPU的核心功能。

他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    790

    瀏覽量

    37674
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    309

    瀏覽量

    23650
  • 網(wǎng)絡(luò)計算機

    關(guān)注

    0

    文章

    3

    瀏覽量

    6560
收藏 人收藏

    評論

    相關(guān)推薦

    HPC計算前景

    高性能計算HPC)與云計算的結(jié)合,正逐步成為推動科技創(chuàng)新和產(chǎn)業(yè)升級的重要引擎。隨著數(shù)據(jù)規(guī)模的不斷擴大和計算需求的日益復(fù)雜,HPC
    的頭像 發(fā)表于 10-16 10:17 ?146次閱讀

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?475次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    AWS 與阿里云在 DPU 的應(yīng)用方面也有成功案例,借助其軟硬件全棧自研的優(yōu)勢,快速完成了云計算系統(tǒng)的改造工作,實現(xiàn)了 DPU 大規(guī)模落地部署,在降低自身運營成本的同時
    發(fā)表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率

    、位置和外形尺寸的應(yīng)用程序工作負載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,將企業(yè)的安全性和運營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現(xiàn)在還擴展到NVIDIA
    的頭像 發(fā)表于 06-27 17:31 ?704次閱讀

    借助NVIDIA DOCA 2.7增強AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便 NVIDIA BlueField DPU 和 SuperNI
    的頭像 發(fā)表于 05-29 09:22 ?445次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?370次閱讀
    助力科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> AI加速<b class='flag-5'>HPC</b><b class='flag-5'>研究</b>

    基于NVIDIA開源CUDA-Q量子計算平臺發(fā)布

    NVIDIA 于太平洋時間 3 月 18 日推出一項云服務(wù),旨在幫助研究人員和開發(fā)人員在化學(xué)、生物學(xué)、材料科學(xué)等關(guān)鍵科學(xué)領(lǐng)域的量子計算研究
    的頭像 發(fā)表于 03-21 09:54 ?390次閱讀

    NVIDIA推出6G研究云平臺,以AI推動無線通信的發(fā)展

    NVIDIA 于今日宣布推出一個 6G 研究平臺,該平臺研究人員提供了一種開發(fā)下一階段無線技術(shù)的新方法。
    的頭像 發(fā)表于 03-20 09:50 ?387次閱讀

    NVIDIA 推出云量子計算機模擬微服務(wù)

    —— 太平洋時間 2024 年 3 月 18 日 —— NVIDIA 于今日推出一項云服務(wù),旨在幫助研究人員和開發(fā)人員在化學(xué)、生物學(xué)、材料科學(xué)等關(guān)鍵科學(xué)領(lǐng)域的量子計算
    發(fā)表于 03-19 11:27 ?389次閱讀
    <b class='flag-5'>NVIDIA</b> 推出云量子<b class='flag-5'>計算</b>機模擬微服務(wù)

    基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設(shè)計

    網(wǎng)絡(luò)平臺上快速創(chuàng)建應(yīng)用程序和服務(wù),并啟用 NVIDIA BlueField DPUNVIDIA
    的頭像 發(fā)表于 02-23 10:02 ?415次閱讀

    什么是HPC高性能計算

    高性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機技術(shù),通過合理地組織計算機資源以及運用適合的算法和程序,提高
    的頭像 發(fā)表于 02-19 13:27 ?769次閱讀
    什么是<b class='flag-5'>HPC</b>高性能<b class='flag-5'>計算</b>

    《數(shù)據(jù)處理器:DPU編程入門》DPU計算入門書籍測評

    實踐 最后一部分是數(shù)據(jù)加速應(yīng)用的落地: 基于各個平臺的算力解決方案 推薦的存儲解決方案 邊緣計算方案 網(wǎng)絡(luò)平臺與融合加速技術(shù) 本書不能幫你完全入門DOCA和相關(guān)的DPU開發(fā)技術(shù),但是能夠幫讀者建立起一
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    AI、機器學(xué)習(xí)、安全、電信和存儲等應(yīng)用,并提升性能,減輕虛擬化Hypervisor的工作負載。同時,它還具備開放性集成功能,未來支持更多功能集成。NVIDIADPU還提供統(tǒng)一的面向各種應(yīng)用的編程接口
    發(fā)表于 12-21 10:47

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    、BlueField-3 DPU 的關(guān)鍵軟件定義、硬件加速應(yīng)用包括: 1.云網(wǎng)絡(luò):云覆蓋、SDN 加速、NAT、負載均衡等。 NVIDIA Blue
    發(fā)表于 12-08 18:03

    SC23 | 研究人員競相使用 NVIDIA CUDA Quantum 大力推進研究工作

    眾多企業(yè)機構(gòu)正通過 NVIDIA 軟件和 GPU 上的混合量子計算獲得洞察,全球最大的化工企業(yè)巴斯夫就是其中之一。 巴斯夫的兩位研究人員 Michael Kuehn 和 Davide Vodola
    的頭像 發(fā)表于 11-14 20:05 ?567次閱讀
    SC23 | <b class='flag-5'>研究人員</b>競相使用 <b class='flag-5'>NVIDIA</b> CUDA Quantum 大力推進<b class='flag-5'>研究</b>工作