0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)GPU有史以來最大性能飛躍!加速計(jì)算更加無(wú)所不在!

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2020-05-15 00:38 ? 次閱讀

疫情所致,英偉達(dá)今年的GTC(GPU Technology Conference)改為線上舉辦,日期也由原來的3月下旬推遲到5月中旬。于是,就有了北京時(shí)間5月14日晚,英偉達(dá)創(chuàng)始人兼CEO黃仁勛人生中首次的“Kitchen Keynote”。嗯,或許這篇也可以取名為《疫情當(dāng)前,GPU大佬廚房帶貨忙》。

當(dāng)然,姍姍來遲的GTC并沒有讓人失望,豪橫的硬菜有:全球最大的7nm處理器 A100 GPU、可用于對(duì)抗COVID-19的最新AI系統(tǒng)DGX A100、收購(gòu)Mellanox以來的首個(gè)成果SmartNIC,這些創(chuàng)新直接彰顯了這位GPU霸主對(duì)于未來數(shù)據(jù)中心的理解,以及堅(jiān)決捍衛(wèi)既有地位的決心。同時(shí),還有對(duì)于邊緣市場(chǎng)、自動(dòng)駕駛、醫(yī)療、AI機(jī)器人、對(duì)話式AI等領(lǐng)域的無(wú)限擴(kuò)張。

第八代GPU A100成全球最大7nm處理器,堪稱英偉達(dá)史上最大性能飛躍

過去的一年內(nèi),英偉達(dá)的第八代GPU曾引發(fā)了業(yè)界的諸多猜測(cè)。也正如他早先放風(fēng)出來“你不會(huì)失望的”,這款基于英偉達(dá)Ampere架構(gòu)的NVIDIA A100,將AI訓(xùn)練和推理性能提高20倍,可以說是英偉達(dá)GPU迄今為止最大的性能飛躍。作為一款通用型工作負(fù)載加速器,A100還被設(shè)計(jì)用于數(shù)據(jù)分析、科學(xué)計(jì)算和云圖形。

云計(jì)算和AI的強(qiáng)大趨勢(shì)正在推動(dòng)數(shù)據(jù)中心設(shè)計(jì)的結(jié)構(gòu)性轉(zhuǎn)變,高效的加速計(jì)算基礎(chǔ)架構(gòu)正在取代傳統(tǒng)的服務(wù)器架構(gòu)。黃仁勛對(duì)A100 GPU寄予厚望,認(rèn)為它“作為一個(gè)端到端的機(jī)器學(xué)習(xí)加速器,有史以來首次在一個(gè)平臺(tái)上實(shí)現(xiàn)橫向擴(kuò)展以及縱向擴(kuò)展的負(fù)載的加速。在提高吞吐量的同時(shí),能夠降低數(shù)據(jù)中心的成本?!?br />
A100 GPU的突破來源于五大關(guān)鍵性創(chuàng)新:

NVIDIA Ampere架構(gòu):這是A100的核心,該架構(gòu)包含超過540億個(gè)晶體管,這使其成為全球最大的7nm處理器;

具有TF32的第三代TensorCore核心:TensorCore被英偉達(dá)廣泛采用,現(xiàn)在變得更加靈活且易于使用,使FP32精度下的AI性能提高多達(dá)20倍。此外,TensorCore核心現(xiàn)在支持FP64精度,相比前代,它為HPC應(yīng)用所提供的算力提高了2.5倍。

多實(shí)例GPU: MIG,這是一種全新的技術(shù)功能,可將單個(gè)A100 GPU分割為七個(gè)獨(dú)立的GPU,為不同規(guī)模的工作提供不同的算力,將利用率和效率最大化。

第三代NVIDIA NVLink:使GPU之間的高速聯(lián)結(jié)增加至原來的兩倍,實(shí)現(xiàn)服務(wù)器的高效擴(kuò)展。

結(jié)構(gòu)化稀疏:這種全新的效率技術(shù)利用AI數(shù)學(xué)固有的稀疏性,使性能提升了一倍。

憑借這些新功能,A100可成為AI訓(xùn)練和推理以及科學(xué)模擬、對(duì)話式AI、推薦系統(tǒng)、基因組學(xué)、高性能數(shù)據(jù)分析、地震建模和金融預(yù)測(cè)等各種高要求工作負(fù)載的理想選擇。

據(jù)了解,A100已全面投產(chǎn)并已向全球客戶交付。眾多全球云服務(wù)供應(yīng)商和系統(tǒng)構(gòu)建商計(jì)劃將A100 GPU集成到其產(chǎn)品中,其中包括:阿里云、AWS、百度智能云、思科、Dell Technologies、富士通、Google Cloud、新華三、HPE、浪潮、聯(lián)想、Microsoft Azure、甲骨文、騰訊云等等。

新系統(tǒng)已搭載A100,首批訂單用于對(duì)抗COVID-19

同時(shí)發(fā)布的還有NVIDIA DGX A100系統(tǒng),內(nèi)置8個(gè)由NVLink 互聯(lián)的A100 GPU,具有5Petaflops的AI性能。利用AI00的多實(shí)例GPU功能,每臺(tái)DGX A100能夠被分割為56個(gè)實(shí)例,用于加速多個(gè)小型工作負(fù)載的處理速度。憑借這些功能,用戶可在一個(gè)完全集成的軟件定義平臺(tái)上根據(jù)自身需求優(yōu)化算力和資源,加快數(shù)據(jù)分析、訓(xùn)練和推理等各種工作負(fù)載的速度。

針對(duì)端到端的機(jī)器學(xué)習(xí)工作流,從數(shù)據(jù)分析到訓(xùn)練再到推理構(gòu)建的AI系統(tǒng),DGX A100提供的性能,能夠幫助機(jī)器學(xué)習(xí)工程師應(yīng)對(duì)指數(shù)級(jí)增長(zhǎng)的AI模型和數(shù)據(jù)。

據(jù)了解,多家全球大型企業(yè)、服務(wù)供應(yīng)商和政府機(jī)構(gòu)以及訂購(gòu)了前幾批DGX A100。首批系統(tǒng)已于本月早些時(shí)候交付給了美國(guó)能源部(U.S. Department of Energy, DOE)的阿貢國(guó)家實(shí)驗(yàn)室(Argonne National Laboratory),該實(shí)驗(yàn)室將運(yùn)用該集群的AI和算力來更好地研究和應(yīng)對(duì)COVID-19。

阿貢國(guó)家實(shí)驗(yàn)室計(jì)算機(jī)、環(huán)境和生命科學(xué)實(shí)驗(yàn)室副主任Rick Stevens表示,全新DGX A100提供的算力,將幫助研究人員探索治療方法和研發(fā)疫苗、研究病毒的傳播方式,使科學(xué)家能夠利用AI加速工作,在數(shù)月甚至數(shù)日內(nèi)完成以前需要數(shù)年才能完成的工作。

英偉達(dá)還展示了由140臺(tái)DGX A100系統(tǒng)組成的DGX SuperPOD AI超級(jí)計(jì)算機(jī),用于公司內(nèi)部對(duì)話式AI、基因組學(xué)和自動(dòng)駕駛等領(lǐng)域的研究。該集群是全球速度最快的AI超級(jí)計(jì)算機(jī)之一,其性能相當(dāng)于此前數(shù)千臺(tái)服務(wù)器的性能,AI計(jì)算能力高達(dá)700 Petaflops。

面向新一代數(shù)據(jù)中心的安全加速智能網(wǎng)卡

根據(jù)市場(chǎng)研究機(jī)構(gòu)Dell’Oro的數(shù)據(jù)顯示,預(yù)計(jì)到2024年,智能網(wǎng)卡(SmartNIC)市場(chǎng)規(guī)模將超過6億美元,占全球以太網(wǎng)適配器市場(chǎng)的23%。而整體控制器和適配器市場(chǎng)將以7%的年復(fù)合增長(zhǎng)率增長(zhǎng),其中25Gbps和100Gbps的銷售將是主要增長(zhǎng)驅(qū)動(dòng)力。

英偉達(dá)顯然早已看到這一巨大的機(jī)會(huì),收購(gòu)Mellanox以來首個(gè)發(fā)布就是25G安全智能網(wǎng)卡(SmartNIC)。據(jù)了解,全新發(fā)布的ConnectX-6 Lx SmartNIC就是面向新一代解耦式的、可重組的數(shù)據(jù)中心的經(jīng)濟(jì)高效、可加速應(yīng)用的和安全的智能網(wǎng)卡,是ConnectX系列網(wǎng)卡的第11代產(chǎn)品。

這款產(chǎn)品專為滿足現(xiàn)代化數(shù)據(jù)中心的需求而設(shè)計(jì),在這個(gè)市場(chǎng),25Gb/s網(wǎng)絡(luò)已成為各種主流應(yīng)用的標(biāo)準(zhǔn),例如企業(yè)級(jí)應(yīng)用、AI和實(shí)時(shí)分析等。這款全新的SmartNIC充分利用了軟件定義和硬件加速等先進(jìn)技術(shù),將更多的安全和網(wǎng)絡(luò)處理工作從CPU卸載到網(wǎng)卡上來。

就在今年3月份,賽靈思推出了一體化SmartNIC Alveo U25,通過將SmartNIC平臺(tái)與FPGA引擎相結(jié)合,實(shí)現(xiàn)全可編程與一站式加速應(yīng)用。賽靈思的這款產(chǎn)品賣點(diǎn)之一就是實(shí)現(xiàn)了網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算加速能力的全集成。

而英偉達(dá)的這款ConnectX-6 Lx更強(qiáng)調(diào)的是安全加速功能。包括IPsec在線加密和硬件信任根(Hardware Root of Trust),可提升10倍性能的連接追蹤(Connection Tracking)功能等,實(shí)現(xiàn)了整個(gè)數(shù)據(jù)中心的在零信任下的安全保障(Zero Trust security)。RoCE(RDMA over converged Ethernet)技術(shù)、虛擬化和容器化技術(shù),以及NVMe over Fabrics存儲(chǔ)卸載技術(shù)等,都成為高性能可擴(kuò)展網(wǎng)絡(luò)的保障。

SmartNIC正在成為加速計(jì)算的下一個(gè)必爭(zhēng)之地。

云原生技術(shù)支持的EGX邊緣AI平臺(tái)

巨大的邊緣計(jì)算市場(chǎng)自然也是英偉達(dá)的重點(diǎn)。

本次發(fā)布的兩款EGX邊緣AI 平臺(tái)產(chǎn)品分別是:適用于較大型商業(yè)通用服務(wù)器上的 EGX A100聚合加速器,和適用于微型邊緣服務(wù)器的微型EGX Jetson Xavier NX。這兩款產(chǎn)品能夠在邊緣提供安全、高性能的AI處理能力。

EGX A100是首個(gè)基于NVIDIA Ampere架構(gòu)的邊緣AI產(chǎn)品,結(jié)合了NVIDIA Ampere架構(gòu)所具有的突破性計(jì)算性能與ConnectX-6 Dx SmartNIC所具備的網(wǎng)絡(luò)加速和關(guān)鍵性安全功能,能將標(biāo)準(zhǔn)型和專用型的邊緣服務(wù)器轉(zhuǎn)變?yōu)榘踩脑圃鶤I超級(jí)計(jì)算機(jī)。隨著AI日益向邊緣發(fā)展,企業(yè)機(jī)構(gòu)可將EGX A100添加到其服務(wù)器中,從而實(shí)時(shí)處理和保護(hù)來自邊緣傳感器的海量流式數(shù)據(jù)。

EGX Jetson Xavier NX則號(hào)稱是全球體積最小、性能最強(qiáng)大的AI超級(jí)計(jì)算機(jī),適用于微型服務(wù)器和邊緣智能物聯(lián)網(wǎng)盒。目前,生態(tài)圈內(nèi)的合作伙伴已提供了超過20種解決方案。該產(chǎn)品將NVIDIA Xavier SoC的性能整合到了一個(gè)信用卡大小的模塊中。運(yùn)行EGX云原生軟件堆棧的EGX Jetson Xavier NX可以快速處理來自多個(gè)高分辨率傳感器的流式數(shù)據(jù)。

這兩款產(chǎn)品可滿足不同尺寸、成本和性能方面的需求。例如搭載了EGX A100的服務(wù)器可以管理機(jī)場(chǎng)中的數(shù)百臺(tái)攝像頭,而EGX Jetson Xavier NX則可用于管理便利店中的少量攝像頭。但是,云原生技術(shù)支持能夠確保整個(gè)EGX產(chǎn)品家族都可以使用同一經(jīng)過優(yōu)化的AI軟件構(gòu)建和部署AI應(yīng)用。

黃仁勛表示:“物聯(lián)網(wǎng)和AI的融合已開啟了“萬(wàn)物智能”革命。就像手機(jī)行業(yè)通過智能手機(jī)為用戶提供智能服務(wù)一樣,大型行業(yè)現(xiàn)在也可以為用戶提供智能互聯(lián)的產(chǎn)品和服務(wù)。EGX邊緣AI平臺(tái)能夠?qū)?biāo)準(zhǔn)服務(wù)器轉(zhuǎn)變?yōu)橐粋€(gè)小型的云原生、安全型AI數(shù)據(jù)中心。借助于我們的AI應(yīng)用框架,企業(yè)可以構(gòu)建從智能零售到機(jī)器人工廠再到自動(dòng)化呼叫中心等各類AI服務(wù)。”

結(jié)語(yǔ)

英偉達(dá)1999年發(fā)明GPU后激發(fā)了PC游戲市場(chǎng)的增長(zhǎng),重新定義了現(xiàn)代計(jì)算機(jī)顯卡,并且對(duì)并行計(jì)算進(jìn)行了革新。加速計(jì)算迅猛發(fā)展的25年,也是計(jì)算架構(gòu)、計(jì)算系統(tǒng)與軟件堆棧風(fēng)馳電掣般演進(jìn)的25年。

以GPU深度學(xué)習(xí)為代表的技術(shù)已經(jīng)點(diǎn)燃了全新的計(jì)算時(shí)代——現(xiàn)代人工智能,同時(shí)也帶動(dòng)了CUDA軟件生態(tài)的繁榮和開發(fā)者數(shù)量的迅猛增長(zhǎng)。

世界總在前行中,科技也在不斷創(chuàng)新。但科技總是為了讓生活更美好,正如黃仁勛在今年的Keynote中首先致敬疫情期間堅(jiān)守在各自工作崗位的普通人,平凡背后蘊(yùn)藏的巨大能量。黃仁勛仍在挖掘GPU背后的強(qiáng)大潛力。



本文由電子發(fā)燒友網(wǎng)原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。如需轉(zhuǎn)載,請(qǐng)?zhí)砑游?a target="_blank">信號(hào)elecfans999.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • AI2020
    +關(guān)注

    關(guān)注

    1

    文章

    22

    瀏覽量

    5921
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    挑戰(zhàn)英偉達(dá):聚焦本土GPU領(lǐng)軍企業(yè)崛起

    近年來,美國(guó)對(duì)中國(guó)半導(dǎo)體行業(yè)的制裁舉措,無(wú)疑加速了中國(guó)在本土芯片產(chǎn)業(yè)上的自主發(fā)展步伐,特別是隨著人工智能和基礎(chǔ)模型技術(shù)的蓬勃興起,更加堅(jiān)定了中國(guó)在全球芯片領(lǐng)域扮演領(lǐng)導(dǎo)角色的決心。   面對(duì)英偉
    的頭像 發(fā)表于 09-18 15:24 ?320次閱讀

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也能無(wú)縫適配CUDA了

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達(dá)GPU領(lǐng)域最大的護(hù)城河,尤其是隨著目前AI領(lǐng)域的發(fā)展
    的頭像 發(fā)表于 07-19 00:16 ?4093次閱讀

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫遷移與運(yùn)行,標(biāo)志著在
    的頭像 發(fā)表于 07-18 14:40 ?455次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場(chǎng)展望

    在COMPUTEX 2024主題演講中,英偉達(dá)(NVIDIA)公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)英偉達(dá)透露,B100、B200和GB200系列
    的頭像 發(fā)表于 06-13 09:44 ?601次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    計(jì)算工作負(fù)載、釋放百億億次計(jì)算能力和萬(wàn)億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬(wàn)億參數(shù)AI模型的加速性能,顯著提升大型多GPU
    發(fā)表于 05-13 17:16

    英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場(chǎng)規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場(chǎng)主要由英偉達(dá)、AMD和英特爾等幾家大公司主導(dǎo)。其中,
    的頭像 發(fā)表于 05-10 00:59 ?3838次閱讀

    國(guó)內(nèi)GPU新勢(shì)力:能否成為英偉達(dá)的“終結(jié)者”?

    在當(dāng)今的信息技術(shù)時(shí)代,圖形處理器(GPU)和人工智能(AI)加速卡在計(jì)算領(lǐng)域中扮演著至關(guān)重要的角色。英偉達(dá)(NVIDIA),作為全球
    的頭像 發(fā)表于 04-24 11:07 ?321次閱讀
    國(guó)內(nèi)<b class='flag-5'>GPU</b>新勢(shì)力:能否成為<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>的“終結(jié)者”?

    英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

    英偉達(dá)宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構(gòu)成的服務(wù)器集群相比上一代,運(yùn)算能力飛躍性提升,甚至能使大語(yǔ)言模型的訓(xùn)練速度
    的頭像 發(fā)表于 03-20 09:37 ?618次閱讀

    英偉達(dá)H200性能怎么樣

    英偉達(dá)H200性能卓越,集成了高性能CPU和GPU,通過高速NVLink連接,消除了傳統(tǒng)計(jì)算瓶頸
    的頭像 發(fā)表于 03-07 16:39 ?784次閱讀

    AMD將推新GPU,效能媲美英偉達(dá)RTX 4080

    據(jù)悉,AMD正努力研制新品級(jí)GPU性能堪比英偉達(dá)的RTX 4080,而售價(jià)卻只有后者的一半。據(jù)多個(gè)在線社區(qū)反映,AMD即將發(fā)布的Radeon RX 8000系列
    的頭像 發(fā)表于 01-31 10:00 ?2001次閱讀

    盤點(diǎn)英偉達(dá)24年來最差的五款GPU

    英偉達(dá)GPU也可能失敗。
    的頭像 發(fā)表于 01-04 17:06 ?1324次閱讀

    英偉達(dá)用AI設(shè)計(jì)GPU算術(shù)電路有何優(yōu)勢(shì)

    大量的算術(shù)電路陣列為英偉達(dá)GPU提供了動(dòng)力,以實(shí)現(xiàn)前所未有的AI、高性能計(jì)算計(jì)算機(jī)圖形
    發(fā)表于 12-05 11:05 ?354次閱讀

    英偉達(dá)特供版芯片性能降80%!

    報(bào)道中提到,英偉達(dá)的這三款A(yù)I芯片并非“改良版”,而是“縮水版”,其分別是HGX H20、L20 PCle和L2 PCle。用于AI模型訓(xùn)練的HGX H20在帶寬、計(jì)算速度等方面均有所限制,理論上,整體算力要比
    的頭像 發(fā)表于 11-14 17:09 ?816次閱讀

    探秘英偉達(dá)顯卡的制造之路 | 英偉達(dá)斷供GPU,中國(guó)大模型何去何從?

    在當(dāng)今時(shí)代,人工智能技術(shù)正以前所未有的速度發(fā)展,推動(dòng)著各個(gè)領(lǐng)域的創(chuàng)新與變革。作為人工智能技術(shù)的核心引擎之一,高性能GPU扮演著至關(guān)重要的角色。在這個(gè)領(lǐng)域,英偉達(dá)的H100無(wú)疑是一款備受
    的頭像 發(fā)表于 11-03 11:23 ?1026次閱讀
    探秘<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>顯卡的制造之路 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>斷供<b class='flag-5'>GPU</b>,中國(guó)大模型何去何從?