0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA推出A100 80GB GPU,助力實現(xiàn)新一輪AI和科學(xué)技術(shù)突破

我快閉嘴 ? 來源:通信世界網(wǎng) ? 作者:通信世界網(wǎng) ? 2020-11-17 09:59 ? 次閱讀

NVIDIA于今日發(fā)布NVIDIA A100 80GB GPU,這一創(chuàng)新將支持NVIDIA HGX AI超級計算平臺。該GPU內(nèi)存比上一代提升一倍,能夠為研究人員和工程師們提供空前的速度和性能,助力實現(xiàn)新一輪AI和科學(xué)技術(shù)突破。

全新A100采用HBM2e技術(shù),可將A100 40GB GPU的高帶寬內(nèi)存增加一倍至80GB,提供每秒超過2TB的內(nèi)存帶寬。這使得數(shù)據(jù)可以快速傳輸?shù)饺蜃羁斓臄?shù)據(jù)中心GPU A100上,使研究人員能夠更快地加速其應(yīng)用,處理最大規(guī)模的模型和數(shù)據(jù)集。

NVIDIA應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro表示:“若想獲得HPC和AI的最新研究成果,則需要構(gòu)建最大的模型,而這需要比以往更大的內(nèi)存容量和更高的帶寬。A100 80GB GPU所提供的內(nèi)存是六個月前推出的前代產(chǎn)品的兩倍,突破了每秒2TB的限制,使研究人員可以應(yīng)對全球科學(xué)及大數(shù)據(jù)方面最嚴(yán)峻的挑戰(zhàn)?!?/p>

用于NVIDIA DGXTM A100和NVIDIA DGX StationTM A100系統(tǒng)的NVIDIA A100 80GB GPU也于今日發(fā)布,預(yù)計將于本季度發(fā)貨。

領(lǐng)先的系統(tǒng)提供商源訊、戴爾科技富士通、技嘉科技、慧與、浪潮、聯(lián)想、云達(dá)科技、超微預(yù)計將于2021年上半年,提供基于HGX A100集成底板的系統(tǒng),該集成底板搭載4-8個A100 80GB GPU。

滿足大流量數(shù)據(jù)工作負(fù)載需求

A100 80GB版本基于A100 40GB的多樣化功能,成為需要大量數(shù)據(jù)存儲空間的各類應(yīng)用的理想選擇。

DLRM等推薦系統(tǒng)模型為AI訓(xùn)練提供了涵蓋數(shù)十億用戶和產(chǎn)品信息的海量表單。A100 80GB可實現(xiàn)高達(dá)3倍加速,使企業(yè)可以重新快速訓(xùn)練這些模型,從而提供更加精確的推薦。

HGX服務(wù)器中搭載的A100 80GB還可訓(xùn)練具有更多參數(shù)的最大模型,如GPT-2。GPT-2是具有超常生成文本能力的自然語言處理模型。這就消除了對數(shù)據(jù)或模型并行架構(gòu)的需求,因為實現(xiàn)并行架構(gòu)需要花費大量時間,而且跨多個節(jié)點運行緩慢。

憑借其多實例GPU(MIG)技術(shù),A100可分割為多達(dá)7個GPU實例,每個實例具有10GB內(nèi)存。該技術(shù)是一種安全的硬件隔離方法,在處理各類較小的工作負(fù)載時,可實現(xiàn)GPU最佳利用率。對于如RNN-T等自動語言識別模型的AI推理,單個A100 80GB MIG實例可處理更大規(guī)模的批量數(shù)據(jù),將生產(chǎn)中的推理吞吐量提高1.25倍。

在TB級零售大數(shù)據(jù)分析基準(zhǔn)上,A100 80GB將其性能提高了2倍,使其成為可對最大規(guī)模數(shù)據(jù)集進(jìn)行快速分析的理想平臺。隨著數(shù)據(jù)的動態(tài)更新,企業(yè)可以實時做出關(guān)鍵決策。

對于科學(xué)應(yīng)用,A100 80GB可為天氣預(yù)報和量子化學(xué)等領(lǐng)域提供巨大的加速。材料模擬軟件Quantum Espresso采用單節(jié)點A100 80GB實現(xiàn)了近2倍的吞吐量提升。

RIKEN計算科學(xué)中心負(fù)責(zé)人Satoshi Matsuoka表示:“快速、充足的內(nèi)存帶寬和容量對實現(xiàn)高性能超級計算應(yīng)用來說至關(guān)重要。具有80GB HBM2e GPU內(nèi)存的NVIDIA A100提供2TB/s的全球最快帶寬,可幫助我們大幅提高應(yīng)用性能?!?/p>

A100 80GB的關(guān)鍵特性

A100 80GB具備NVIDIA Ampere架構(gòu)突破性特性:

·第三代Tensor Core核心:通過全新TF32,將上一代Volta架構(gòu)的AI吞吐量提高多達(dá)20倍。通過FP64,將HPC性能提高多達(dá)2.5倍。通過 INT8,將AI推理性能提高多達(dá)20倍,并且支持BF16數(shù)據(jù)格式。

·更大、更快的HBM2e GPU內(nèi)存:使內(nèi)存容量增加一倍,在業(yè)內(nèi)率先實現(xiàn)2TB/s以上的內(nèi)存帶寬。

·MIG技術(shù):將單個獨立實例的內(nèi)存增加一倍,可最多提供七個MIG,每個實例具備10GB內(nèi)存。

·結(jié)構(gòu)化稀疏:將推理稀疏模型的速度提高2倍。

·第三代NVLink和NVSwitch,相較于上一代互連技術(shù),可使GPU之間的帶寬增加至原來的兩倍,將數(shù)據(jù)密集型工作負(fù)載的GPU數(shù)據(jù)傳輸速度提高至每秒600 gigabytes。

NVIDIA HGX AI 超級計算平臺

A100 80GB GPU是NVIDIA HGX AI超級計算平臺的關(guān)鍵組件。該平臺將NVIDIA GPU、NVIDIA NVLink? 、NVIDIA InfiniBand網(wǎng)絡(luò)以及全面優(yōu)化的NVIDIA AI和HPC軟件堆棧的全部功能整合在一起,以提供最優(yōu)越的應(yīng)用性能。該平臺使研究人員和科學(xué)家能夠?qū)PC、數(shù)據(jù)分析和深度學(xué)習(xí)計算技術(shù)結(jié)合起來,共同推動科學(xué)進(jìn)步。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102711
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128592
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
收藏 人收藏

    評論

    相關(guān)推薦

    字節(jié)跳動開啟新一輪股權(quán)回購

    字節(jié)跳動近日向員工發(fā)布了新一輪股權(quán)回購的郵件通知。此次回購中,在職員工的稅前回購價定為每股180.7美元,而離職員工的回購價則為153.6美元。
    的頭像 發(fā)表于 10-11 15:46 ?227次閱讀

    OpenAI新一輪融資66億美元,鞏固AI領(lǐng)先地位

    近日,美國人工智能領(lǐng)域的佼佼者OpenAI宣布,在最新一輪融資中成功籌集了高達(dá)66億美元的資金。此次融資后,OpenAI的估值飆升至1570億美元,再次彰顯了其在全球AI領(lǐng)域的強(qiáng)勁實力。
    的頭像 發(fā)表于 10-08 14:44 ?300次閱讀

    Anthropic擬進(jìn)行新一輪融資

    人工智能領(lǐng)域再掀波瀾,初創(chuàng)公司Anthropic正緊鑼密鼓地籌備新一輪融資,市場預(yù)計其估值將躍升至400億美元大關(guān)。此次融資吸引了包括谷歌、亞馬遜等科技巨頭的青睞,彰顯了Anthropic在AI賽道上的強(qiáng)勁競爭力和市場潛力。目前,融資談判尚處于初級階段,但已足夠引發(fā)業(yè)界廣
    的頭像 發(fā)表于 09-24 15:19 ?286次閱讀

    武漢敏聲再獲新一輪融資

    近日,武漢敏聲新技術(shù)有限公司(簡稱“武漢敏聲”)宣布成功完成新一輪融資,此次融資由中國互聯(lián)網(wǎng)投資基金、長江產(chǎn)業(yè)集團(tuán)、駱駝基金等知名投資機(jī)構(gòu)共同參與。這是自2019年成立以來,武漢敏聲獲得的第4融資,累計融資金額已接近10億元,
    的頭像 發(fā)表于 09-24 14:52 ?603次閱讀

    喆塔科技完成新一輪戰(zhàn)略融資

    喆塔科技近日宣布圓滿完成新一輪戰(zhàn)略融資,此融資由光谷金控、張科垚坤及合肥產(chǎn)投三大國有及產(chǎn)業(yè)資本巨頭攜手完成。此次融資不僅彰顯了市場對喆塔科技的高度認(rèn)可,更為其未來發(fā)展注入了強(qiáng)勁動力。
    的頭像 發(fā)表于 09-06 17:37 ?528次閱讀

    NVIDIA為新工業(yè)革命打造 AI 工廠和數(shù)據(jù)中心

    搭載 Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施,助力于企業(yè)建立 AI 工廠和數(shù)據(jù)中心,推動新一輪生成式 AI
    的頭像 發(fā)表于 06-03 18:14 ?932次閱讀

    計算機(jī)行業(yè)攜手 NVIDIA 為新工業(yè)革命打造 AI 工廠和數(shù)據(jù)中心

    NVIDIA Blackwell 架構(gòu)的系統(tǒng),這些系統(tǒng)搭載 Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施,助力于企業(yè)建立 AI 工廠和數(shù)據(jù)中心,推動
    發(fā)表于 06-03 09:14 ?211次閱讀
    計算機(jī)行業(yè)攜手 <b class='flag-5'>NVIDIA</b> 為新工業(yè)革命打造 <b class='flag-5'>AI</b> 工廠和數(shù)據(jù)中心

    銀河水滴科技完成新一輪股權(quán)融資

    近日,步態(tài)身份識別系統(tǒng)研發(fā)商銀河水滴科技完成新一輪股權(quán)融資,融資額未披露,本輪投資方為蘇高新金控。
    的頭像 發(fā)表于 05-28 11:24 ?1115次閱讀
    銀河水滴科技完成<b class='flag-5'>新一輪</b>股權(quán)融資

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    冷卻技術(shù),提高計算密度,減少占地面積,并通過高帶寬、低延遲的GPU通信,有效減少數(shù)據(jù)中心的碳足跡和能源消耗。相較于傳統(tǒng)的NVIDIA H100風(fēng)冷基礎(chǔ)設(shè)施,
    發(fā)表于 05-13 17:16

    瀜礦科技完成最新一輪A融資 青桐資本擔(dān)任財務(wù)顧問

    近日,瀜礦科技控股平臺公司完成最新一輪A融資,由Amperex Technology Limited(ATL)獨家領(lǐng)投,老股東上海源晗能源持續(xù)加注,青桐資本擔(dān)任財務(wù)顧問。本
    的頭像 發(fā)表于 02-21 10:25 ?632次閱讀

    澎峰科技完成新一輪數(shù)千萬人民幣融資

    近日,澎峰科技(PerfXLab)成功完成了新一輪數(shù)千萬人民幣的融資。本輪融資將主要用于研發(fā)應(yīng)用于大模型AI、科學(xué)計算和工程計算的軟硬融合算力解決方案產(chǎn)品。這解決方案旨在為我國數(shù)字化
    的頭像 發(fā)表于 01-31 13:49 ?745次閱讀

    英偉達(dá)vs.華為/海思:GPU性能

    NVIDIA NVLink采用全網(wǎng)狀拓?fù)?,如下所示,(雙向)GPU-to-GPU 最大帶寬可達(dá)到400GB/s (需要注意的是,下方展示的是8*A100模塊時的600
    的頭像 發(fā)表于 12-27 16:49 ?1705次閱讀
    英偉達(dá)vs.華為/海思:<b class='flag-5'>GPU</b>性能<b class='flag-5'>一</b>覽

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學(xué)研究領(lǐng)域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! AI For Science (亦稱 “
    的頭像 發(fā)表于 12-25 18:30 ?919次閱讀
    <b class='flag-5'>NVIDIA</b> 人工智能開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> <b class='flag-5'>助力</b><b class='flag-5'>科學(xué)</b>研究領(lǐng)域的新<b class='flag-5'>突破</b>

    SC23 | NVIDIA 為全球領(lǐng)先的 AI 計算平臺 Hopper 再添新動力

    ,NVIDIA H200 能夠提供傳輸速度達(dá) 4.8 TB /秒的 141GB 顯存。與上代架構(gòu)的 NVIDIA A100 相比,其容量幾
    的頭像 發(fā)表于 11-14 20:05 ?423次閱讀
    SC23 | <b class='flag-5'>NVIDIA</b> 為全球領(lǐng)先的 <b class='flag-5'>AI</b> 計算平臺 Hopper 再添新動力

    對英偉達(dá)A100芯片算力服務(wù)收費價格上調(diào)100%,這家企業(yè)的硬氣來自哪里?

    半導(dǎo)體芯情了解到,A100是英偉達(dá)最新推出款高性能計算芯片,采用了全新的Ampere架構(gòu),Ampere架構(gòu)是NVIDIA于 GTC 2020發(fā)布的
    的頭像 發(fā)表于 11-14 16:30 ?1160次閱讀
    對英偉達(dá)<b class='flag-5'>A100</b>芯片算力服務(wù)收費價格上調(diào)<b class='flag-5'>100</b>%,這家企業(yè)的硬氣來自哪里?