0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA介紹NVIDIA Ampere架構的NVIDIA A100 GPU技術

454398 ? 來源:搜狐 ? 作者:鼎湖影像 ? 2020-10-08 00:56 ? 次閱讀

NVIDIA發(fā)布重磅最新軟件應用、硬件系統(tǒng)以及與寶馬集團合作

NVIDIA提出了下一代計算的愿景,該愿景將全球信息經(jīng)濟的重心從服務器轉移到了新型的強大且靈活的數(shù)據(jù)中心

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在其加州住宅的廚房中錄制的六集同時發(fā)布的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基于NVIDIA Ampere GPU架構的新產(chǎn)品以及重要的最新軟件技術。

這場主題演講原計劃于3月底在圣何塞舉行的NVIDIA GPU技術大會上現(xiàn)場直播,但因冠狀病毒疫情而受到影響。

“我要感謝正前線抗擊COVID-19所有勇敢的戰(zhàn)士們。”黃仁勛在開場時說到,“NVIDIA正在與研究人員和科學家合作,使用GPU和AI計算來治療、緩解、控制和追蹤這種大規(guī)模傳染性疾病。”

NVIDIA也宣布了其NVIDIA Clara醫(yī)療平臺的更新,旨在對抗COVID-19新型冠狀病毒。

“研究人員和科學家們正在使用NVIDIA加速計算來挽救生命——這完美地詮釋了我們公司的宗旨:通過制造計算機,解決普通計算機不能解決的問題?!秉S仁勛說。

演講主要圍繞作為現(xiàn)代全球信息經(jīng)濟機房的數(shù)據(jù)中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的愿景。

“數(shù)據(jù)中心是新的計算單元,NVIDIA正在加速從芯片CPU和GPU的連接方式,再到整個軟件堆棧,以及最終跨整個數(shù)據(jù)中心的性能提升?!?/p>

數(shù)據(jù)中心規(guī)模計算的系統(tǒng)優(yōu)化

首先,NVIDIA為這種新型的數(shù)據(jù)中心規(guī)模計算優(yōu)化了新的GPU架構,集AI訓練和推理于一身,并實現(xiàn)了靈活且彈性的加速。

NVIDIA A100是第一個基于NVIDIA Ampere架構的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數(shù)據(jù)分析,科學計算和云圖形,并已全面投產(chǎn)并交付給全球客戶。

全球18家領先的服務提供商和系統(tǒng)構建商正在將NVIDIA A100整合到他們的服務和產(chǎn)品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。

相比上一代,NVIDIA Ampere架構的A100將性能提升了20倍。A100的五大關鍵特性包括:

超過540億個晶體管,使其成為世界上最大的7納米處理器

帶有TF32的第三代Tensor Core核心,這是一種新的數(shù)值格式,可加速開箱即用的單精度AI訓練。NVIDIA廣泛使用的Tensor Core現(xiàn)在更加靈活,快速,且更易于使用

結構稀疏性(Structural sparsity)加速,這是一種新的高效技術,可以利用AI數(shù)學固有的稀疏性來獲得更高的性能

多實例GPU(Multi-instance GPU或MIG),允許將一個A100分割為多達七個獨立的GPU,每個GPU都有自己的資源

第三代NVLink技術,使GPU之間的高速聯(lián)接能力加倍,從而可以使多個A100服務器充當一個巨型GPU

以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構相比,訓練性能提高了6倍,推理性能提高了7倍。

NVIDIA DGX A100具備5 Petaflops的性能

NVIDIA還將發(fā)售第三代NVIDIA DGX AI系統(tǒng)—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺5 petaflops服務器。每臺DGX A100可以分割為多達56個獨立運行的實例。

這使得單個服務器可以“縱向擴展”以完成諸如AI訓練之類的計算密集型任務,或者“橫向擴展”以進行AI部署或推理。

該系統(tǒng)的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該集群的AI和計算能力更好地理解和對抗COVID-19。此外,還有佛羅里達大學和德國人工智能研究中心。

美國能源部阿貢國家實驗室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19

A100也將作為HGX A100提供給云合作伙伴和服務器制造商。

一套由五臺DGX A100系統(tǒng)提供動力的數(shù)據(jù)中心,其成本僅為100萬美元,功耗僅為28千瓦,但其性能足以媲美一套典型數(shù)據(jù)中心(由50臺用于AI訓練的DGX-1系統(tǒng)和600個總功耗高達630千瓦的CPU系統(tǒng)構成,成本超過1100萬美元)。

NVIDIA還宣布了下一代DGX SuperPOD。它由140臺DGX A100系統(tǒng)和Mellanox網(wǎng)絡技術搭建而成,可提供700 petaflops的AI性能,堪比全球20臺最快的計算機中的任何一臺。

新一代DGX SuperPOD實現(xiàn)了強達每秒70 petaflops的AI算力

NVIDIA正在用四個DGX SuperPOD來擴展自己的數(shù)據(jù)中心,為其內(nèi)部超級計算機SATURNV,增加了2.8 exaflops的AI計算能力(總計4.6 exaflops),使其成為世界上最快的AI超級計算機。

NVIDIA同時也發(fā)布了NVIDIA EGX A100,將強大的實時云計算功能帶到了邊緣。其NVIDIA Ampere架構GPU提供了第三代Tensor Core和新的安全功能。得益于其NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯(lián)網(wǎng)功能。

當今世界上最重要的應用軟件

NVIDIA GPU將為主要軟件應用程序提供動力,以加速三個關鍵用途:管理大數(shù)據(jù),創(chuàng)建推薦系統(tǒng)和構建實時會話式AI。

隨著機器學習的有效性推動公司收集了越來越多的數(shù)據(jù),這些新工具應運而生。積極的反饋使我們體驗到的數(shù)據(jù)收集量呈指數(shù)級增長。

為了幫助各類組織順應潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數(shù)據(jù)分析將成為當今世界上最重要的應用程序之一。

基于RAPIDS的Spark 3.0,打破了提取,轉換和加載數(shù)據(jù)的性能基準。它已經(jīng)幫助Adobe Intelligent Services將計算成本降低了90%。

關鍵的云分析平臺(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。

黃仁勛還宣布推出了NVIDIA Merlin,這是一個用于構建下一代推薦系統(tǒng)的端到端框架,該系統(tǒng)正迅速成為更加個性化互聯(lián)網(wǎng)的引擎。Merlin將創(chuàng)建一個100 TB數(shù)據(jù)集推薦系統(tǒng)所需的時間從四天減少到20分鐘。

他還詳細介紹了NVIDIA Jarvis,這是一個新的端到端平臺,可以充分發(fā)揮NVIDIA AI平臺的強大功能,創(chuàng)建實時多模態(tài)對話式AI。

他通過一個演示來展示了與名為Misty的AI進行交互的過程,Misty可實時理解并回答一系列有關天氣的復雜問題。

自2018年在SIGGRAPH上發(fā)布NVIDIA RTX以來,NVIDIA在實時光線追蹤方面取得了迅猛發(fā)展,當時宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設計師,在同個設計的不同部分同時工作。現(xiàn)在已經(jīng)可供搶先體驗客戶使用。

自動駕駛汽車

自動駕駛汽車是我們這個時代最大的計算挑戰(zhàn)之一,NVIDIA將持續(xù)通過NVIDIA DRIVE推動整個行業(yè)發(fā)展。

NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實現(xiàn)能效和性能,入門級ADAS系統(tǒng)開發(fā)所需功率僅需5瓦,并為L5級別robotaxi系統(tǒng)提供2,000 TOPS的性能。

現(xiàn)在,汽車制造商僅需單一計算架構和軟件堆棧,即可將AI集成到每一輛車中。汽車制造商可以利用一種架構來開發(fā)整個車隊,并利用整個車隊來進行軟件開發(fā)。

NVIDIA DRIVE生態(tài)系統(tǒng)現(xiàn)已覆蓋汽車、卡車、一級汽車供應商、下一代出行服務、初創(chuàng)公司、地圖服務和仿真。NVIDIA將在NVIDIA DRIVE技術套件中增加用于管理整個自動駕駛車隊的NVIDIA DRIVE RC。

機器人技術

NVIDIA還將繼續(xù)推進其NVIDIA Isaac軟件定義的機器人平臺,宣布寶馬集團已選擇NVIDIA Isaac機器人技術為其下一代工廠提供動力。

每56秒鐘,寶馬集團在全球的30家工廠就會生產(chǎn)一輛汽車:40種不同型號的汽車,每種都有數(shù)百種不同的選擇,3000萬個零件來自全球近2,000家供應商。

寶馬集團加入了一個龐大的NVIDIA機器人技術全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)涵蓋配送、零售、自主移動機器人、農(nóng)業(yè)、服務業(yè)、物流、制造和醫(yī)療保健。

未來,工廠實際上將成為巨大的機器人?!袄锩娴乃羞\動部件都會由AI驅動。”黃仁勛說。“將來,每個批量生產(chǎn)的產(chǎn)品都將被逐一量身定制?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4855

    瀏覽量

    102711
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4673

    瀏覽量

    128593
  • 服務器
    +關注

    關注

    12

    文章

    8959

    瀏覽量

    85085
  • 數(shù)據(jù)中心

    關注

    16

    文章

    4630

    瀏覽量

    71888
  • Ampere
    +關注

    關注

    1

    文章

    61

    瀏覽量

    4529
收藏 人收藏

    評論

    相關推薦

    AMD與NVIDIA GPU優(yōu)缺點

    NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗,而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近,但在光線追蹤
    的頭像 發(fā)表于 10-27 11:15 ?371次閱讀

    NVIDIA推出兩款基于NVIDIA Ampere架構的全新臺式機GPU

    兩款 NVIDIA Ampere 架構 GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?559次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源大語言模型采用 NVIDIA 技術構建,其經(jīng)過優(yōu)化后可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA GPU 上運行。
    的頭像 發(fā)表于 04-23 09:52 ?411次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

    NVIDIA今天發(fā)布了兩款新的專業(yè)顯卡RTX A1000、RTX A400,從編號就能看出來定位入門級,而且架構并非最新的Ada Lovelace,還是上一代的
    的頭像 發(fā)表于 04-18 11:35 ?1890次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布兩款新的專業(yè)顯卡RTX <b class='flag-5'>A</b>1000、RTX <b class='flag-5'>A</b>400

    全新NVIDIA RTX A400和A1000 GPU全面加強AI設計與生產(chǎn)力工作流

    兩款 NVIDIA Ampere 架構 GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-18 10:29 ?440次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100

    根據(jù)各方信息和路線圖,NVIDIA預計會在今年第二季度發(fā)布Blackwell架構的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1215次閱讀
    <b class='flag-5'>NVIDIA</b>將在今年第二季度發(fā)布Blackwell<b class='flag-5'>架構</b>的新一代<b class='flag-5'>GPU</b>加速器“B<b class='flag-5'>100</b>”

    NVIDIA的Maxwell GPU架構功耗不可思議

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架構,它有著極高的能效,出場方式也非常特別。
    的頭像 發(fā)表于 02-19 16:39 ?931次閱讀
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b><b class='flag-5'>架構</b>功耗不可思議

    巨頭豪購35萬塊NVIDIA最強GPU H100

    NVIDIA AI GPU無疑是當下的硬通貨,從科技巨頭到小型企業(yè)都在搶。
    的頭像 發(fā)表于 01-29 09:58 ?993次閱讀
    巨頭豪購35萬塊<b class='flag-5'>NVIDIA</b>最強<b class='flag-5'>GPU</b> H<b class='flag-5'>100</b>

    如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢?

    NVIDIA vGPU 解決方案能夠將 NVIDIA GPU 的強大功能帶入虛擬桌面、應用程序和工作站,加速圖形和計算,使在家辦公或在任何地方工作的創(chuàng)意和技術專業(yè)人員能夠訪問虛擬化工作
    的頭像 發(fā)表于 01-12 09:26 ?967次閱讀
    如何選擇<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虛擬化軟件的組合方案呢?

    NVIDIA Jetson 的嵌入式系統(tǒng)AI應用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個Arm內(nèi)核和NVIDIA Ampere
    發(fā)表于 12-11 17:37 ?520次閱讀

    NVIDIA GPU的核心架構架構演進

    在探討 NVIDIA GPU 架構之前,我們先來了解一些相關的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Gef
    發(fā)表于 11-21 09:40 ?1415次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心<b class='flag-5'>架構</b>及<b class='flag-5'>架構</b>演進

    SC23 | NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

    ,NVIDIA H200 能夠提供傳輸速度達 4.8 TB /秒的 141GB 顯存。與上一代架構NVIDIA A100 相比,其容量幾乎翻了一倍,帶寬也增加了 2.4 倍。 全球
    的頭像 發(fā)表于 11-14 20:05 ?423次閱讀
    SC23 | <b class='flag-5'>NVIDIA</b> 為全球領先的 AI 計算平臺 Hopper 再添新動力

    對英偉達A100芯片算力服務收費價格上調(diào)100%,這家企業(yè)的硬氣來自哪里?

    半導體芯情了解到,A100是英偉達最新推出的一款高性能計算芯片,采用了全新的Ampere架構Ampere架構
    的頭像 發(fā)表于 11-14 16:30 ?1161次閱讀
    對英偉達<b class='flag-5'>A100</b>芯片算力服務收費價格上調(diào)<b class='flag-5'>100</b>%,這家企業(yè)的硬氣來自哪里?

    揭秘:英偉達H100最強替代者

    目前,用于高端推理的 GPU 主要有三種:NVIDIA A100NVIDIA H100 和新的 NVI
    的頭像 發(fā)表于 11-13 16:13 ?1525次閱讀
    揭秘:英偉達H<b class='flag-5'>100</b>最強替代者