0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首個(gè)采用NVIDIA M2050 GPU的實(shí)例 開啟GPU云計(jì)算下個(gè)十年

454398 ? 來源:人工智能學(xué)習(xí)網(wǎng) ? 作者:云水禪心 ? 2021-02-24 12:08 ? 次閱讀

十年前,AWS(Amazon Web Services)發(fā)布了首個(gè)采用 NVIDIA M2050 GPU 的實(shí)例。當(dāng)時(shí),基于 CUDA 的應(yīng)用主要專注于加速科學(xué)模擬,AI深度學(xué)習(xí)還遙遙無期。

自那時(shí)起,AW 就不斷擴(kuò)充云端 GPU 實(shí)例陣容,包括 K80(p2)、K520(g3)、M60(g4)、V100(p3 / p3dn)和 T4(g4)。

現(xiàn)在,已全面上市的全新 AWS P4d 實(shí)例采用最新 NVIDIA A100 Tensor Core GPU,開啟了加速計(jì)算的下一個(gè)十年。

全新的 P4d 實(shí)例,為機(jī)器學(xué)習(xí)訓(xùn)練和高性能計(jì)算應(yīng)用提供 AWS 上性能與成本效益最高的 GPU 平臺(tái)。與默認(rèn)的 FP32 精度相比,全新實(shí)例將 FP16 機(jī)器學(xué)習(xí)模型的訓(xùn)練時(shí)間減少多達(dá) 3 倍,將 TF32 機(jī)器學(xué)習(xí)模型的訓(xùn)練的時(shí)間減少多達(dá) 6 倍。

這些實(shí)例還提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基準(zhǔn)測(cè)試中一騎絕塵,實(shí)現(xiàn)了比 CPU 快 237 倍的性能。

pIYBAF-ha8qAbYI-AACa8sem2nU309.png

每個(gè) P4d 實(shí)例均內(nèi)置八個(gè) NVIDIA A100 GPU,通過 AWS UltraClusters,客戶可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可擴(kuò)展高性能存儲(chǔ),按需、可擴(kuò)展地同時(shí)訪問多達(dá) 4,000 多個(gè) GPU。P4d 提供 400Gbps 網(wǎng)絡(luò),通過使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技術(shù),進(jìn)一步加速深度學(xué)習(xí)訓(xùn)練的工作負(fù)載。EFA 上的 NVIDIA GPUDirect RDMA 在服務(wù)器之間可通過 GPU 傳輸數(shù)據(jù),無需通過 CPU 和系統(tǒng)內(nèi)存,從而確保網(wǎng)絡(luò)的低延遲。

此外,許多 AWS 服務(wù)都支持 P4d 實(shí)例,包括 Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster 和 Amazon SageMaker。P4d 還可使用所有 NGC 提供的經(jīng)過優(yōu)化的容器化軟件,包括 HPC 應(yīng)用、AI 框架、預(yù)訓(xùn)練模型、Helm 圖表以及 TensorRT 和 Triton Inference Server 等推理軟件。

目前,P4d 實(shí)例已在美國東部和西部上市,并將很快擴(kuò)展到其他地區(qū)。用戶可以通過按需實(shí)例(On-Demand)、Savings Plans、預(yù)留實(shí)例(Reserved Instances)或競(jìng)價(jià)型實(shí)例(Spot Instances)幾種不同的方式進(jìn)行購買。

GPU 云計(jì)算發(fā)展最初的十年,已為市場(chǎng)帶來超過 100 exaflops 的 AI 計(jì)算。隨著基于 NVIDIA A100 GPU 的 Amazon EC2 P4d 實(shí)例的問世,GPU 云計(jì)算的下一個(gè)十年將迎來一個(gè)美好的開端。

NVIDIA 和 AWS 不斷幫助各種應(yīng)用突破 AI 的界限,以便了解客戶將如何運(yùn)用 AI 強(qiáng)大的性能。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102432
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128146
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266239
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131846
  • AWS
    AWS
    +關(guān)注

    關(guān)注

    0

    文章

    418

    瀏覽量

    24184
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    亞馬遜科技宣布Amazon EC2 P5e實(shí)例正式可用 由英偉達(dá)H200 GPU提供支持

    北京20249月18日?/美通社/ -- 亞馬遜科技宣布由英偉達(dá)H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)
    的頭像 發(fā)表于 09-19 16:16 ?206次閱讀

    GPU服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢(shì)

    GPU服務(wù)器作為一種高性能計(jì)算資源,近年來在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了計(jì)算的靈活性與
    的頭像 發(fā)表于 08-14 09:43 ?198次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    借助 R515 驅(qū)動(dòng)程序,NVIDIA 于 2022 5 月發(fā)布了一套開源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中
    的頭像 發(fā)表于 07-25 09:56 ?268次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開源<b class='flag-5'>GPU</b>內(nèi)核模塊

    恒訊科技的GPU解決方案有什么特點(diǎn)和優(yōu)勢(shì)?

    GPU解決方案通常指的是服務(wù)提供商提供的、基于圖形處理單元(GPU)的計(jì)算服務(wù)。這些服務(wù)利用GPU
    的頭像 發(fā)表于 06-12 17:24 ?290次閱讀

    新手小白怎么學(xué)GPU服務(wù)器跑深度學(xué)習(xí)?

    新手小白想用GPU服務(wù)器跑深度學(xué)習(xí)應(yīng)該怎么做? 用個(gè)人主機(jī)通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動(dòng),如何實(shí)現(xiàn)更經(jīng)濟(jì)便捷的實(shí)現(xiàn)GPU服務(wù)器深度學(xué)習(xí)?
    發(fā)表于 06-11 17:09

    RTX 5880 Ada Generation GPU與RTX? A6000 GPU對(duì)比

    NVIDIA RTX? 5880 Ada Generation GPU 是目前國內(nèi)重量級(jí) GPU,基于全新 NVIDIA Ada Lovelace 架構(gòu)構(gòu)建,
    的頭像 發(fā)表于 04-19 10:20 ?1133次閱讀
    RTX 5880 Ada Generation <b class='flag-5'>GPU</b>與RTX? A6000 <b class='flag-5'>GPU</b>對(duì)比

    GPU:量化理論計(jì)算的新引擎

    在過去的幾十年里,量化理論計(jì)算一直是化學(xué)研究的關(guān)鍵工具。密度泛函理論(DFT)、分子力學(xué)(MM)、耦合簇(CC)等方法在預(yù)測(cè)分子結(jié)構(gòu)、能量、光譜性質(zhì)等方面具有重要意義。然而,這些計(jì)算通常需要大量
    的頭像 發(fā)表于 04-16 08:27 ?295次閱讀
    <b class='flag-5'>GPU</b>:量化理論<b class='flag-5'>計(jì)算</b>的新引擎

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    現(xiàn)場(chǎng)可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時(shí)面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅
    發(fā)表于 03-21 15:19

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計(jì)算,大幅提升了 AI、數(shù)據(jù)處理、高性能計(jì)算
    發(fā)表于 03-19 10:05 ?261次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級(jí) <b class='flag-5'>GPU</b> <b class='flag-5'>計(jì)算</b>和 AI 基礎(chǔ)設(shè)施

    亞馬遜科技與 NVIDIA 宣布開展戰(zhàn)略合作,為生成式 AI 提供全新超級(jí)計(jì)算基礎(chǔ)架構(gòu)、軟件和服務(wù)

    亞馬遜科技將提供首款搭載 NVIDIA Grace Hopper 超級(jí)芯片 和亞馬遜科技可擴(kuò)展性 UltraCluster 的? AI 超級(jí)計(jì)
    的頭像 發(fā)表于 11-29 21:00 ?538次閱讀
    亞馬遜<b class='flag-5'>云</b>科技與 <b class='flag-5'>NVIDIA</b> 宣布開展戰(zhàn)略合作,為生成式 AI 提供全新超級(jí)<b class='flag-5'>計(jì)算</b>基礎(chǔ)架構(gòu)、軟件和服務(wù)

    NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來了解一些相關(guān)的基本知識(shí)。GPU 的概念,是由 NVIDIA 公司在 1999 發(fā)布 Gef
    發(fā)表于 11-21 09:40 ?1157次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架構(gòu)及架構(gòu)演進(jìn)

    開發(fā)者活動(dòng) | 即刻報(bào)名 AI for Science GPU Hackathon 2023

    阿里聯(lián)合 NVIDIA,與 OpenACC 等機(jī)構(gòu)合作,將于 2023 12 月舉辦 AI for Science 為主題的 GPU Hackathon。 本屆 Hackatho
    的頭像 發(fā)表于 11-09 19:25 ?357次閱讀
    開發(fā)者活動(dòng) | 即刻報(bào)名 AI for Science <b class='flag-5'>GPU</b> Hackathon 2023

    NVIDIA與NTT DOCOMO聯(lián)手打造全球首個(gè)GPU加速5G網(wǎng)絡(luò),歐盟要求蘋果開放生態(tài)

    大家好,歡迎收看河套IT WALK第113期。 NVIDIA與NTT DOCOMO合作推出了全球首個(gè)GPU加速的5G網(wǎng)絡(luò),這一突破性技術(shù)將改變我們對(duì)5G網(wǎng)絡(luò)的認(rèn)知和使用方式。歐盟對(duì)蘋果提出了一個(gè)靈魂
    的頭像 發(fā)表于 09-27 21:20 ?620次閱讀
    <b class='flag-5'>NVIDIA</b>與NTT DOCOMO聯(lián)手打造全球<b class='flag-5'>首個(gè)</b><b class='flag-5'>GPU</b>加速5G網(wǎng)絡(luò),歐盟要求蘋果開放生態(tài)

    Oracle 基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

    。為了幫助滿足這一需求,Oracle 基礎(chǔ)設(shè)施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU ,同時(shí) NVIDIA
    的頭像 發(fā)表于 09-25 20:40 ?470次閱讀
    Oracle <b class='flag-5'>云</b>基礎(chǔ)設(shè)施提供新的 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b> 加速<b class='flag-5'>計(jì)算</b><b class='flag-5'>實(shí)例</b>