NVIDIA發(fā)布重磅最新軟件應(yīng)用、硬件系統(tǒng)以及與寶馬集團合作
就在剛剛,NVIDIA提出了下一代計算的愿景,該愿景將全球信息經(jīng)濟的重心從服務(wù)器轉(zhuǎn)移到了新型的強大且靈活的數(shù)據(jù)中心。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在其加州住宅的廚房中錄制的六集同時發(fā)布的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基于NVIDIA Ampere GPU架構(gòu)的新產(chǎn)品以及重要的最新軟件技術(shù)。
這場主題演講原計劃于3月底在圣何塞舉行的NVIDIA GPU技術(shù)大會上現(xiàn)場直播,但因冠狀病毒疫情而受到影響。
“我要感謝正前線抗擊COVID-19所有勇敢的戰(zhàn)士們。”黃仁勛在開場時說到,“NVIDIA正在與研究人員和科學家合作,使用GPU和AI計算來治療、緩解、控制和追蹤這種大規(guī)模傳染性疾病?!?/p>
NVIDIA也宣布了其NVIDIA Clara醫(yī)療平臺的更新,旨在對抗COVID-19新型冠狀病毒。
“研究人員和科學家們正在使用NVIDIA加速計算來挽救生命——這完美地詮釋了我們公司的宗旨:通過制造計算機,解決普通計算機不能解決的問題?!秉S仁勛說。
演講主要圍繞作為現(xiàn)代全球信息經(jīng)濟機房的數(shù)據(jù)中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的愿景。
“數(shù)據(jù)中心是新的計算單元,NVIDIA正在加速從芯片到CPU和GPU的連接方式,再到整個軟件堆棧,以及最終跨整個數(shù)據(jù)中心的性能提升?!?/p>
數(shù)據(jù)中心規(guī)模計算的系統(tǒng)優(yōu)化
首先,NVIDIA為這種新型的數(shù)據(jù)中心規(guī)模計算優(yōu)化了新的GPU架構(gòu),集AI訓練和推理于一身,并實現(xiàn)了靈活且彈性的加速。
NVIDIA A100是第一個基于NVIDIA Ampere架構(gòu)的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數(shù)據(jù)分析,科學計算和云圖形,并已全面投產(chǎn)并交付給全球客戶。
全球18家領(lǐng)先的服務(wù)提供商和系統(tǒng)構(gòu)建商正在將NVIDIA A100整合到他們的服務(wù)和產(chǎn)品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
相比上一代,NVIDIA Ampere架構(gòu)的A100將性能提升了20倍。A100的五大關(guān)鍵特性包括:
帶有TF32的第三代Tensor Core核心,這是一種新的數(shù)值格式,可加速開箱即用的單精度AI訓練。NVIDIA廣泛使用的Tensor Core現(xiàn)在更加靈活,快速,且更易于使用
結(jié)構(gòu)稀疏性(Structural sparsity)加速,這是一種新的高效技術(shù),可以利用AI數(shù)學固有的稀疏性來獲得更高的性能
多實例GPU(Multi-instance GPU或MIG),允許將一個A100分割為多達七個獨立的GPU,每個GPU都有自己的資源
第三代NVLink技術(shù),使GPU之間的高速聯(lián)接能力加倍,從而可以使多個A100服務(wù)器充當一個巨型GPU
以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構(gòu)相比,訓練性能提高了6倍,推理性能提高了7倍。
NVIDIA DGX A100具備5 Petaflops的性能
NVIDIA還將發(fā)售第三代NVIDIA DGX AI系統(tǒng)—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺5 petaflops服務(wù)器。每臺DGX A100可以分割為多達56個獨立運行的實例。
這使得單個服務(wù)器可以“縱向擴展”以完成諸如AI訓練之類的計算密集型任務(wù),或者“橫向擴展”以進行AI部署或推理。
該系統(tǒng)的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該集群的AI和計算能力更好地理解和對抗COVID-19。此外,還有佛羅里達大學和德國人工智能研究中心。
美國能源部阿貢國家實驗室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19
A100也將作為HGX A100提供給云合作伙伴和服務(wù)器制造商。
一套由五臺DGX A100系統(tǒng)提供動力的數(shù)據(jù)中心,其成本僅為100萬美元,功耗僅為28千瓦,但其性能足以媲美一套典型數(shù)據(jù)中心(由50臺用于AI訓練的DGX-1系統(tǒng)和600個總功耗高達630千瓦的CPU系統(tǒng)構(gòu)成,成本超過1100萬美元)。
NVIDIA還宣布了下一代DGX SuperPOD。它由140臺DGX A100系統(tǒng)和Mellanox網(wǎng)絡(luò)技術(shù)搭建而成,可提供700 petaflops的AI性能,堪比全球20臺最快的計算機中的任何一臺。
新一代DGX SuperPOD實現(xiàn)了強達每秒70 petaflops的AI算力
NVIDIA正在用四個DGX SuperPOD來擴展自己的數(shù)據(jù)中心,為其內(nèi)部超級計算機SATURNV,增加了2.8 exaflops的AI計算能力(總計4.6 exaflops),使其成為世界上最快的AI超級計算機。
NVIDIA同時也發(fā)布了NVIDIA EGX A100,將強大的實時云計算功能帶到了邊緣。其NVIDIA Ampere架構(gòu)GPU提供了第三代Tensor Core和新的安全功能。得益于其NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯(lián)網(wǎng)功能。
當今世界上最重要的應(yīng)用軟件
NVIDIA GPU將為主要軟件應(yīng)用程序提供動力,以加速三個關(guān)鍵用途:管理大數(shù)據(jù),創(chuàng)建推薦系統(tǒng)和構(gòu)建實時會話式AI。
隨著機器學習的有效性推動公司收集了越來越多的數(shù)據(jù),這些新工具應(yīng)運而生。積極的反饋使我們體驗到的數(shù)據(jù)收集量呈指數(shù)級增長。
為了幫助各類組織順應(yīng)潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數(shù)據(jù)分析將成為當今世界上最重要的應(yīng)用程序之一。
基于RAPIDS的Spark 3.0,打破了提取,轉(zhuǎn)換和加載數(shù)據(jù)的性能基準。它已經(jīng)幫助Adobe Intelligent Services將計算成本降低了90%。
關(guān)鍵的云分析平臺(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。
黃仁勛還宣布推出了NVIDIA Merlin,這是一個用于構(gòu)建下一代推薦系統(tǒng)的端到端框架,該系統(tǒng)正迅速成為更加個性化互聯(lián)網(wǎng)的引擎。Merlin將創(chuàng)建一個100 TB數(shù)據(jù)集推薦系統(tǒng)所需的時間從四天減少到20分鐘。
他還詳細介紹了NVIDIA Jarvis,這是一個新的端到端平臺,可以充分發(fā)揮NVIDIA AI平臺的強大功能,創(chuàng)建實時多模態(tài)對話式AI。
他通過一個演示來展示了與名為Misty的AI進行交互的過程,Misty可實時理解并回答一系列有關(guān)天氣的復(fù)雜問題。
自2018年在SIGGRAPH上發(fā)布NVIDIA RTX以來,NVIDIA在實時光線追蹤方面取得了迅猛發(fā)展,當時宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設(shè)計師,在同個設(shè)計的不同部分同時工作?,F(xiàn)在已經(jīng)可供搶先體驗客戶使用。
自動駕駛汽車
自動駕駛汽車是我們這個時代最大的計算挑戰(zhàn)之一,NVIDIA將持續(xù)通過NVIDIA DRIVE推動整個行業(yè)發(fā)展。
NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實現(xiàn)能效和性能,入門級ADAS系統(tǒng)開發(fā)所需功率僅需5瓦,并為L5級別robotaxi系統(tǒng)提供2,000 TOPS的性能。
現(xiàn)在,汽車制造商僅需單一計算架構(gòu)和軟件堆棧,即可將AI集成到每一輛車中。汽車制造商可以利用一種架構(gòu)來開發(fā)整個車隊,并利用整個車隊來進行軟件開發(fā)。
NVIDIA DRIVE生態(tài)系統(tǒng)現(xiàn)已覆蓋汽車、卡車、一級汽車供應(yīng)商、下一代出行服務(wù)、初創(chuàng)公司、地圖服務(wù)和仿真。NVIDIA將在NVIDIA DRIVE技術(shù)套件中增加用于管理整個自動駕駛車隊的NVIDIA DRIVE RC。
機器人技術(shù)
NVIDIA還將繼續(xù)推進其NVIDIA Isaac軟件定義的機器人平臺,宣布寶馬集團已選擇NVIDIA Isaac機器人技術(shù)為其下一代工廠提供動力。
每56秒鐘,寶馬集團在全球的30家工廠就會生產(chǎn)一輛汽車:40種不同型號的汽車,每種都有數(shù)百種不同的選擇,3000萬個零件來自全球近2,000家供應(yīng)商。
寶馬集團加入了一個龐大的NVIDIA機器人技術(shù)全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)涵蓋配送、零售、自主移動機器人、農(nóng)業(yè)、服務(wù)業(yè)、物流、制造和醫(yī)療保健。
未來,工廠實際上將成為巨大的機器人。“里面的所有運動部件都會由AI驅(qū)動?!秉S仁勛說?!皩?,每個批量生產(chǎn)的產(chǎn)品都將被逐一量身定制?!?/p>
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4862瀏覽量
102722 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8979瀏覽量
85100 -
硬件系統(tǒng)
+關(guān)注
關(guān)注
0文章
48瀏覽量
11339
原文標題:廚房演講干貨滿滿 | 黃仁勛介紹基于NVIDIA Ampere架構(gòu)首支NVIDIA A100 GPU
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論