0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA BlueField DPU提高HPC應(yīng)用程序性能和可擴(kuò)展性

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-10-12 10:01 ? 次閱讀

超級(jí)計(jì)算機(jī)用于建模和模擬科學(xué)計(jì)算中最復(fù)雜的過程,通常是為了洞察新發(fā)現(xiàn),否則這些新發(fā)現(xiàn)在物理上是不切實(shí)際的或不可能演示的。

NVIDIA BlueField DPU(數(shù)據(jù)處理器)正在將高性能計(jì)算(HPC)資源轉(zhuǎn)化為更高效的系統(tǒng),同時(shí)在從數(shù)學(xué)建模和分子動(dòng)力學(xué)到天氣預(yù)報(bào)、氣候研究,甚至可再生能源的廣泛科學(xué)研究中加速解決問題。

8d4e536e-4966-11ed-a3b6-dac502259ad0.jpg

BlueField 已經(jīng)在云網(wǎng)絡(luò)、網(wǎng)絡(luò)安全、通信和邊緣計(jì)算領(lǐng)域產(chǎn)生了顯著影響。此外,在高性能計(jì)算的多個(gè)領(lǐng)域引發(fā)了應(yīng)用程序性能和系統(tǒng)效率方面的創(chuàng)新。

NVIDIA BlueField-3 提供了強(qiáng)大的計(jì)算能力,其基于多個(gè) Arm AArch64 內(nèi)核、多線程數(shù)據(jù)路徑加速器、集成的 NVIDIA ConnectX-7 400Gb/s 網(wǎng)絡(luò) ,以及 I/O 路徑中的各種可編程加速引擎。它配備了雙 DDR 6500MT / s DRAM 控制器,并配有高達(dá) 32 GB 的板載內(nèi)存。BlueField-3 是第三代片上數(shù)據(jù)中心基礎(chǔ)設(shè)施,可實(shí)現(xiàn)從云到核心數(shù)據(jù)中心再到邊緣的、高效且強(qiáng)大的軟件定義、硬件加速基礎(chǔ)設(shè)施。

那么,這一切對(duì)高性能計(jì)算意味著什么呢?

提高 HPC 應(yīng)用程序性能和可擴(kuò)展性

HPC 就是為了提高性能和可擴(kuò)展性。近二十年來,InfiniBand 網(wǎng)絡(luò)在性能和應(yīng)用程序可擴(kuò)展性方面一直處于領(lǐng)先地位,這有幾個(gè)原因。

從高層次來看,InfiniBand 只是最有效的數(shù)據(jù)移動(dòng)方式:直接數(shù)據(jù)放置。在數(shù)據(jù)從網(wǎng)絡(luò)接口通過系統(tǒng)到達(dá)需要它的實(shí)際應(yīng)用程序時(shí),無需涉及 CPU操作系統(tǒng),也無需制作數(shù)據(jù)的多個(gè)副本。

如果 InfiniBand 已經(jīng)如此高效,BlueField 會(huì)帶來什么好處?

InfiniBand 多年來一直在解決的關(guān)鍵挑戰(zhàn)之一是將網(wǎng)絡(luò)通信開銷從 CPU 移開,使其能夠?qū)r(shí)間集中在最擅長(zhǎng)的事情上:應(yīng)用程序計(jì)算和分支代碼。

當(dāng)今主流服務(wù)器中的 CPU 過于通用,在數(shù)百或數(shù)千個(gè)與實(shí)際計(jì)算幾乎無關(guān)的進(jìn)程中共享其計(jì)算周期、時(shí)間和資源。

BlueField 通過卸載、加速和隔離廣泛的高級(jí)網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù),為超級(jí)計(jì)算帶來了前所未有的創(chuàng)新和效率。

為什么人工智能時(shí)代帶來了

對(duì) BlueField DPU 的需求

人工智能研究領(lǐng)域作為一門學(xué)科于 1956 年成立。甚至在那之前的十年,科學(xué)家們就開始討論創(chuàng)造人工大腦的可能性。隨著現(xiàn)代計(jì)算機(jī)硬件和軟件的發(fā)展,這些概念很晚才成為現(xiàn)實(shí)。

2006 年,NVIDIA 推出了業(yè)界首個(gè)針對(duì) GPU 的 C 編譯器開發(fā)環(huán)境 CUDA ,解決復(fù)雜計(jì)算問題的速度比傳統(tǒng)方法快 100 倍。今天,人工智能成果豐碩,幾乎推動(dòng)了科學(xué)研究的每個(gè)領(lǐng)域,改變了我們的生活,塑造了工業(yè)格局。

同樣, 2006 年年中推出了用于非阻塞集合操作的首個(gè)提案。為消息傳遞接口(MPI)的集合組通信功能而提出的非阻塞接口在理論上肯定是成效斐然的。然而,它并沒有在許多應(yīng)用程序中實(shí)現(xiàn)。也許這是因?yàn)?,在引?DPU 之前,無法實(shí)現(xiàn)全部好處。

今天,隨著 BlueField-3 的問世,這項(xiàng)技術(shù)已經(jīng)提供了創(chuàng)新、性能和效率所需的基本要素。為了提高應(yīng)用程序性能和可伸縮性,并消除操作系統(tǒng)抖動(dòng)的影響,非阻塞集合操作重新引起了人們的興趣。

科學(xué)計(jì)算還有幾個(gè)領(lǐng)域,包括早期的例子,BlueField 正在展示其如何將 HPC 轉(zhuǎn)化為高效和可持續(xù)的計(jì)算。

通過網(wǎng)絡(luò)計(jì)算節(jié)省 CPU 周期

NVIDIA 的 Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)技術(shù)通過將許多阻塞集體操作從 CPU 卸載到交換網(wǎng)絡(luò),且無需在端點(diǎn)之間多次發(fā)送數(shù)據(jù),從而提高了 MPI 操作的性能。這種創(chuàng)新的方法減少了到達(dá)聚合節(jié)點(diǎn)時(shí)穿越網(wǎng)絡(luò)的數(shù)據(jù)量,并大大減少了 MPI 操作時(shí)間。

BlueField 通過利用其 Arm 內(nèi)核實(shí)現(xiàn)非阻塞操作,擴(kuò)展了額外的網(wǎng)絡(luò)計(jì)算能力。這使系統(tǒng)主機(jī) CPU 能夠執(zhí)行峰值重疊計(jì)算。

圖 2 顯示了一個(gè)使用 MVAPICH2- DPU 庫的示例,該庫正在進(jìn)行優(yōu)化,以充分利用 BlueField 的全部潛力。它顯示了提取主機(jī)上發(fā)生的計(jì)算與 MPI_Ialltoall 通信之間的峰值重疊的能力。

8d74dd40-4966-11ed-a3b6-dac502259ad0.jpg

適用于 HPC 工作負(fù)載的計(jì)算存儲(chǔ)

計(jì)算存儲(chǔ)(或稱為存儲(chǔ)計(jì)算)為傳統(tǒng)存儲(chǔ)設(shè)備帶來了 HPC 功能。在計(jì)算存儲(chǔ)中,您可以在存儲(chǔ)設(shè)備內(nèi)或旁邊執(zhí)行選定的計(jì)算任務(wù),從而減輕主機(jī)處理負(fù)擔(dān)并減少數(shù)據(jù)移動(dòng)。BlueField 提供在單卡上結(jié)合存儲(chǔ)和網(wǎng)絡(luò)計(jì)算的能力。

BlueField 使存儲(chǔ)軟件堆棧能夠從計(jì)算節(jié)點(diǎn)卸載,同時(shí)還可作為網(wǎng)絡(luò)架構(gòu)附加 NVMe 控制器,能夠加速關(guān)鍵存儲(chǔ)功能,如壓縮、校驗(yàn)和計(jì)算以及奇偶校驗(yàn)生成。此類服務(wù)在并行文件系統(tǒng)中提供。

整個(gè)存儲(chǔ)系統(tǒng)堆棧在 Linux 內(nèi)核中透明卸載,同時(shí)在 NVMe 目標(biāo)端由 NVIDIA DOCA 簡(jiǎn)單實(shí)現(xiàn)標(biāo)準(zhǔn)存儲(chǔ)功能。

新一代開放存儲(chǔ)架構(gòu)為加速、隔離和保護(hù)高性能存儲(chǔ)系統(tǒng)提供了一種新的范例。該系統(tǒng)采用硬件和軟件協(xié)同設(shè)計(jì),使 DPU 對(duì)用戶來說非常高效和透明。

文件系統(tǒng)的加速意味著提高存儲(chǔ)系統(tǒng)中關(guān)鍵功能的性能,而存儲(chǔ)系統(tǒng)性能是基于深入學(xué)習(xí)的科學(xué)探究的關(guān)鍵促成因素。

將存儲(chǔ)客戶端和服務(wù)器完全卸載到 DPU 的能力帶來以前無法實(shí)現(xiàn)的安全和性能隔離級(jí)別。關(guān)鍵數(shù)據(jù)平面和控制平面功能移動(dòng)到 DPU 上的單獨(dú)域。這樣可以免除服務(wù)器 CPU 的工作負(fù)擔(dān),并在 CPU 或其軟件受損的情況下保護(hù)功能。

NVIDIA DOCA 軟件框架

NVIDIA DOCA SDK 是釋放 BlueField 潛力的關(guān)鍵。NVIDIA DOCA 和 BlueField DPU 通過一個(gè)全面、開放的開發(fā)平臺(tái),共同實(shí)現(xiàn)了應(yīng)用程序的開發(fā),這些應(yīng)用程序可以提供突破性的網(wǎng)絡(luò)、安全、存儲(chǔ)和應(yīng)用程序性能。

NVIDIA DOCA 支持一系列操作系統(tǒng)和發(fā)行版,包括驅(qū)動(dòng)程序、庫、工具、文檔和示例應(yīng)用程序。即將發(fā)布的 NVIDIA DOCA 1.5 和 2.0 版本引入了廣泛的網(wǎng)絡(luò)、存儲(chǔ)、安全功能和增強(qiáng)功能,為 HPC 開發(fā)人員提供突破性的性能和高級(jí)編程能力:

全新的通信通道庫

快速訪問主機(jī)內(nèi)存以實(shí)現(xiàn) UCX 加速

存儲(chǔ)仿真(SNAP),包括存儲(chǔ)加密

全新的 NVIDIA DOCA 服務(wù),包括 UCC 卸載服務(wù)和遙測(cè)服務(wù)

NVIDIA DOCA 安全 SDK

改變 HPC 領(lǐng)域的今天和明天

許多創(chuàng)新領(lǐng)域已經(jīng)初露端倪,BlueField DPU 、NVIDIA DOCA 以及社區(qū)將繼續(xù)為 HPC 領(lǐng)域帶來改變。

有些想法已經(jīng)實(shí)現(xiàn)了,例如在數(shù)據(jù)中心范圍內(nèi)增強(qiáng)性能隔離,或增強(qiáng)作業(yè)調(diào)度程序以實(shí)現(xiàn)更智能的作業(yè)安排。

由于科學(xué)應(yīng)用程序通常是高度同步的,因此系統(tǒng)噪聲對(duì)大型 HPC 系統(tǒng)的負(fù)面影響可能會(huì)對(duì)性能產(chǎn)生更大的影響。減少存儲(chǔ)等其他過程引起的系統(tǒng)噪音至關(guān)重要。

遙測(cè)信息功能強(qiáng)大。它不僅僅是收集有關(guān)路由器、交換機(jī)和網(wǎng)絡(luò)流量的信息。相反,可以通過工作負(fù)載和 I/O 特性收集和共享信息。

AI 框架精確地調(diào)整了 NVIDIA Quantum-2 InfiniBand 平臺(tái)中的性能隔離算法。共享公共數(shù)據(jù)中心資源(如網(wǎng)絡(luò)和存儲(chǔ))的多應(yīng)用程序環(huán)境可以確保能實(shí)現(xiàn)的最佳性能,就像應(yīng)用程序作為單個(gè)實(shí)例在裸機(jī)上運(yùn)行一樣。

BlueField DPU 完全有能力應(yīng)對(duì)大規(guī)模計(jì)算帶來的挑戰(zhàn)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102429
  • 超級(jí)計(jì)算機(jī)

    關(guān)注

    2

    文章

    452

    瀏覽量

    41820
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    343

    瀏覽量

    24044
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    使用低成本MSPM0 MCU在無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)擴(kuò)展性

    電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU在無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)擴(kuò)展性.pdf》資料免費(fèi)下載
    發(fā)表于 09-02 11:47 ?0次下載
    使用低成本MSPM0 MCU在無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)<b class='flag-5'>可</b><b class='flag-5'>擴(kuò)展性</b>

    NVIDIA BlueField-3 DPU助力思科提高工作負(fù)載安全性和運(yùn)營(yíng)效率

    、位置和外形尺寸的應(yīng)用程序工作負(fù)載。 思科最近發(fā)布了Cisco Secure Workload 3.9 版,將企業(yè)的安全性和運(yùn)營(yíng)效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現(xiàn)在還擴(kuò)展
    的頭像 發(fā)表于 06-27 17:31 ?607次閱讀

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動(dòng)和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高
    的頭像 發(fā)表于 05-29 09:22 ?331次閱讀

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計(jì)

    網(wǎng)絡(luò)平臺(tái)上快速創(chuàng)建應(yīng)用程序和服務(wù),并啟用 NVIDIA BlueField DPUNVIDIA
    的頭像 發(fā)表于 02-23 10:02 ?366次閱讀

    分布式大屏控制系統(tǒng)的擴(kuò)展性設(shè)計(jì)

    分布式大屏控制系統(tǒng)的擴(kuò)展性設(shè)計(jì)是確保系統(tǒng)能夠適應(yīng)不斷增長(zhǎng)的需求和未來發(fā)展的關(guān)鍵因素。以下是擴(kuò)展性設(shè)計(jì)的幾個(gè)方面: 模塊化設(shè)計(jì):將系統(tǒng)劃分為多個(gè)模塊,每個(gè)模塊具有獨(dú)立的功能和接口。這
    的頭像 發(fā)表于 01-29 14:46 ?431次閱讀

    《數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    浪費(fèi)等問題。DPU將數(shù)據(jù)處理和網(wǎng)絡(luò)功能集成到同一塊硬件中,可以實(shí)現(xiàn)更高效的數(shù)據(jù)處理和傳輸,同時(shí)減少系統(tǒng)復(fù)雜性和資源開銷。這種集成可以提供更低的延遲和更高的吞吐量,從而改善應(yīng)用程序性能和用戶體驗(yàn)。 2
    發(fā)表于 12-08 18:03

    什么是DPU?

    。 DPU:專注于數(shù)據(jù)處理 如果想通過蠻力在性能上擊敗傳統(tǒng)的x86 CPU,結(jié)果注定會(huì)失敗,這樣做既沒有競(jìng)爭(zhēng)力,也無法擴(kuò)展。如果說一個(gè)x86 CPU尚且無法以每秒100 Gbit的速度處理數(shù)據(jù)包,如何能
    發(fā)表于 11-03 10:55

    解碼 DPU 編程,投稿贏取好禮!

    十余位資深系統(tǒng)架構(gòu)師歷經(jīng)數(shù)月編寫而成,定位為 NVIDIA BlueField 系列 DPUNVIDIA DOCA 開發(fā)環(huán)境
    的頭像 發(fā)表于 11-01 20:25 ?334次閱讀
    解碼 <b class='flag-5'>DPU</b> 編程,投稿贏取好禮!

    很好的書籍,學(xué)以致用

    BlueField系列DPUNVIDIA DOCA的實(shí)用指南,使開發(fā)人員和數(shù)據(jù)科學(xué)家能走近DPU的應(yīng)用和編程,是一本非常好的DPU入門書
    發(fā)表于 10-31 08:45

    PGO到底是什么?PGO如何提高應(yīng)用程序性能呢?

    PGO到底是什么?PGO如何提高應(yīng)用程序性能呢? PGO,全稱為Profile Guided Optimization,譯為“基于特征優(yōu)化”的技術(shù),是一種通過利用應(yīng)用程序的運(yùn)行特征數(shù)據(jù)來優(yōu)化
    的頭像 發(fā)表于 10-26 17:37 ?1881次閱讀

    【書籍評(píng)測(cè)活動(dòng)NO.23】數(shù)據(jù)處理器:DPU編程入門

    ? BlueField? 系列 DPU以及搭建 NVIDIA DOCA? 軟件開發(fā)環(huán)境,并通過深入了解 NVIDIA DOCA? 應(yīng)用程序
    發(fā)表于 10-24 15:21

    NVIDIA發(fā)布首部DPU和DOCA編程入門書籍

    NVIDIA DOCA 是一個(gè)為 NVIDIA BlueField 系列 DPU 量身定做的軟件開發(fā)環(huán)境,通過打造一個(gè)全面、開放的開發(fā)環(huán)境,可以讓開發(fā)者快速創(chuàng)建基于
    的頭像 發(fā)表于 10-20 15:45 ?549次閱讀

    NVIDIA 發(fā)布首部 DPU 和 DOCA 編程入門書籍(互動(dòng)有禮)

    為使用 NVIDIA BlueField 系列 DPUNVIDIA DOCA 開發(fā)環(huán)境的開發(fā)者提供實(shí)用指南 NVIDIA 今日宣布,由
    的頭像 發(fā)表于 10-18 16:05 ?354次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布首部 <b class='flag-5'>DPU</b> 和 DOCA 編程入門書籍(互動(dòng)有禮)

    NVIDIA 發(fā)布首部 DPU 和 DOCA 編程入門書籍

    為使用NVIDIA? BlueField? 系列? DPUNVIDIA DOCA? 開發(fā)環(huán)境的開發(fā)者提供實(shí)用指南 ? 北京時(shí)間 2023 年 10 月 17 日,
    發(fā)表于 10-18 11:34 ?298次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布首部 <b class='flag-5'>DPU</b> 和 DOCA 編程入門書籍

    擴(kuò)展性對(duì)物聯(lián)網(wǎng)管理系統(tǒng)有哪些影響?

    擴(kuò)展性對(duì)于物聯(lián)網(wǎng)管理系統(tǒng)的設(shè)計(jì)和開發(fā)非常重要,它直接影響著系統(tǒng)的性能、可靠性和能耗等方面,是評(píng)估一個(gè)系統(tǒng)優(yōu)劣的重要因素之一。擴(kuò)展性對(duì)物聯(lián)
    的頭像 發(fā)表于 10-11 15:15 ?381次閱讀