0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)CEO黃仁勛發(fā)布十年技術(shù)成果:全球最大GPU,超算級(jí)逆天算力

DPVg_AI_era ? 來源:未知 ? 作者:伍文輝 ? 2018-03-30 09:47 ? 次閱讀

在剛剛結(jié)束的GTC 2018上,英偉達(dá)CEO黃仁勛說兩件大事,一是發(fā)布了迄今最大的GPU,二是暫定自動(dòng)駕駛暫停研發(fā)。隨后英偉達(dá)股價(jià)下跌3.8%。GPU正在成為一種計(jì)算范式,但本質(zhì)性突破乏善可陳,教主一路回顧過去創(chuàng)下的紀(jì)錄,而鼎盛之下,衰退的跡象,似乎已經(jīng)潛藏。

黃仁勛在熟悉的背景音樂中上場(chǎng),GTC今年已經(jīng)是第十年了。

稱不上激昂,但顯然迫不及待要分享。不是首先揭幕萬眾期待的新品,而是回歸初心——黃仁勛說,圖形技術(shù)是GPU的核心驅(qū)動(dòng)力,是虛擬現(xiàn)實(shí)的根本,在各種各樣的領(lǐng)域,我們想將信息和數(shù)據(jù)可視化,形成了R&D預(yù)算,由此也構(gòu)建了巨大的市場(chǎng)。

重現(xiàn)逼真圖像是計(jì)算機(jī)圖形學(xué)一直以來的追求,要呈現(xiàn)一幅美麗的圖像,40年來,GPU渲染一幅圖的時(shí)間,從幾小時(shí)降到了幾秒,而且圖像的清晰度增加到了4K。

接著,黃仁勛回顧了各種技術(shù),光的反射、散射、漫射、陰影……以及要渲染出種種質(zhì)感相應(yīng)的技術(shù)。

接著,展示了一段《星球大戰(zhàn)》視頻的演示,重點(diǎn)是逼真效果的實(shí)時(shí)RayTracing,各種表面的光線反射,每當(dāng)一束光線遇到一個(gè)表面,都要決定要反射還是被吸收,什么角度反射,被吸收多少程度,整個(gè)環(huán)境中到處都是表面,每一個(gè)都需要渲染……這些需要龐大的計(jì)算量,因此動(dòng)畫公司才需要超級(jí)計(jì)算機(jī)來計(jì)算這些效果。

十年技術(shù)成果,首次將實(shí)時(shí)光線跟蹤技術(shù)推向商業(yè)市場(chǎng)

而英偉達(dá)一臺(tái)DGX-Station就夠了。

于是,第一個(gè)宣布——RTX Technolgy,這是英偉達(dá)十年技術(shù)成果,也是RayTracing首次在這種規(guī)格上,全部實(shí)時(shí)實(shí)現(xiàn)。黃仁勛說,這是首次將實(shí)時(shí)RayTracing帶向商業(yè)市場(chǎng)。感謝GPU,感謝深度學(xué)習(xí)

英偉達(dá)推出的Quadro GV100 GPU將該公司最近發(fā)布的RTX光線跟蹤技術(shù)引入工作站。英偉達(dá)的RTX光線追蹤技術(shù)是軟件和硬件的組合,允許應(yīng)用程序生成實(shí)時(shí)光線追蹤效果。

Quadro GV100配備32GB內(nèi)存,與Tesla V100有相同的底層設(shè)計(jì)。GV100可以提供高達(dá)7.4 TeraFLOPS的雙精度和14.8 TeraFLOPS的單精度計(jì)算。英偉達(dá)表示這個(gè)顯卡還可以提供高達(dá)118.5 TeraFLOPS的深度學(xué)習(xí)性能。

Quadro GV100還支持NVLink 2互連技術(shù),可以將這兩個(gè)設(shè)備配對(duì)在一起??偣?4GB的HBM2內(nèi)存,10,240個(gè)CUDA內(nèi)核和236個(gè)張量?jī)?nèi)核整合到一個(gè)工作站中。

電影大片完成后,要得到逼真效果,“CPU渲染一幀10小時(shí),”黃仁勛說:“使用GPU要快很多,而且更重要的是,能省錢——大家都知道了,你買的GPU越多,你省的錢越多?!爆F(xiàn)在這已經(jīng)是常識(shí)了。

全球最大GPU,核彈轟炸?。?!

接著,也是全場(chǎng)最重要揭幕了全球最大GPU——Quadro GV100,這是一個(gè)GPU工作站,2個(gè)GV100,使用NVLink相連,形成一個(gè)完整的工作站,軟件感覺不到切換。

VIDIA TESLA V100 32GB,SXM3

雙板總計(jì)16塊GPU,總計(jì)512GB HBM2 存儲(chǔ)

每塊GPU板由8塊NVIDIA Tesla V100組成

總計(jì)12 NVSwitch 連接

高速互連,2.4 TB/秒對(duì)分帶寬。

8 EDR 無線帶寬 / 100 GbE 以太網(wǎng)

1600 Gb/秒雙向帶寬和低延遲。

PCIE Switch Complex

2個(gè)英特爾Xeon Platinum CPUs

1.5 TB系統(tǒng)內(nèi)存

雙10/25 GbE 以太網(wǎng)

30 TB NVME SSDS內(nèi)部存儲(chǔ)

這個(gè)全球最大的GPU有多大?感受一下:

普通GPU(你能看出型號(hào)嗎?是N粉就說?。?/p>

這是最大GPU:

相比龐大繁重的CPU機(jī)架,使用英偉達(dá)RTX Quadro GV100,14-Quad-GPU服務(wù)器,“省下成千萬上億美元”。

新系統(tǒng)旨在允許開發(fā)人員擴(kuò)大其神經(jīng)網(wǎng)絡(luò)的規(guī)模。DGX-2具有12個(gè)NVSwitch,每個(gè)NVSwitch的特點(diǎn)是在臺(tái)積電12nm FinFET工藝上制造了120億個(gè)晶體管。每個(gè)交換機(jī)都具有18個(gè)8位NVLink連接。IBM已經(jīng)宣布將于2019年推出采用NVLink 3.0的Power9系統(tǒng),因此我們預(yù)計(jì)NVSwitch將利用這種互補(bǔ)互連。

太美了,太性感了,太美了。

黃仁勛掩飾不住沉醉。

DGX-2專門為深度學(xué)習(xí),而生一天半就完成了。

如今AI研究員使用AI設(shè)計(jì)/發(fā)現(xiàn)AI,實(shí)驗(yàn)的規(guī)模和數(shù)量都不斷增長(zhǎng)。更多的實(shí)驗(yàn)、更多的數(shù)據(jù),DGX-2推出的時(shí)機(jī)不能在好了。

價(jià)格?

39.9萬美元。

加倍Tesla V100內(nèi)存

下面簡(jiǎn)單介紹其他宣布。

特斯拉V100采用了迄今為止生產(chǎn)量最大的單模芯片。采用臺(tái)積電12納米FFN工藝制造的815毫米2伏特晶體管,使用了210億個(gè)晶體管,幾乎是全分劃板的尺寸。GPU包裝了5120個(gè)用于AI工作負(fù)載的CUDA核心,雖然它具有足夠的處理能力,但英偉達(dá)已經(jīng)使用額外的16GB HBM2內(nèi)存支持該卡。英偉達(dá)表示,更強(qiáng)大的32GB內(nèi)存可以在內(nèi)存受限的HPC工作負(fù)載中實(shí)現(xiàn)雙倍的性能。

NVSwitch拓?fù)鋵?6個(gè)GPU連接在一起,形成一個(gè)具有統(tǒng)一內(nèi)存空間的統(tǒng)一內(nèi)核單元,從而創(chuàng)建Jensen吹捧為“世界上最大的GPU”的內(nèi)容。該系統(tǒng)共有512GB HBM2內(nèi)存,可提供高達(dá)14.4TB / s的吞吐量。它共有81,920個(gè)CUDA內(nèi)核。

GPU接受程度前所未有,形成全球計(jì)算范式

接著,黃仁勛表示,英偉達(dá)做的最好決定之一,是這些年來,讓GPU越來越通用,在不損失計(jì)算機(jī)圖形學(xué)性能的前提下,將GPU導(dǎo)向深度學(xué)習(xí)。然后,引爆點(diǎn)到來,現(xiàn)在,GPU已經(jīng)成為廣為接受的一種計(jì)算范式,全世界有100萬GPU工程師,GTC成為全球會(huì)議,cuDNN 800萬次下載,一大半都發(fā)生在去年一年,而英偉達(dá)10年前就開始提供。

GPU接受程度前所未有,然而,這還不夠。

我們還需要更大的計(jì)算機(jī),更快的計(jì)算機(jī)。加州理工大學(xué)要模擬一個(gè)項(xiàng)目,需要7天;要模擬一個(gè)艾滋病模型,需要3個(gè)月。過去5年,GPU增速25倍,遠(yuǎn)遠(yuǎn)超出摩爾定律。我們正處于超級(jí)摩爾定律時(shí)代,而這一趨勢(shì)也將持續(xù)。

接著是教主的自豪/自傲?xí)r間,英偉達(dá)基本上每年都推出新架構(gòu),與軟件工程師合作保持套件更新??傊f道這里,教主表示,祝賀John Hennessy和David Patterson獲得2017年的圖靈獎(jiǎng),“John的體系結(jié)構(gòu)演講精彩非凡——但是,我的演講很簡(jiǎn)單,”黃仁勛說,沒錯(cuò),英偉達(dá)在高性能計(jì)算(HPC)方面,也(買越多越)省錢!

要讓醫(yī)生/醫(yī)院更換現(xiàn)有基礎(chǔ)設(shè)施,需要30年。等不了這么久,怎么辦?有沒有辦法利用現(xiàn)有技術(shù),在改動(dòng)不大的前提下,給予醫(yī)生更大的智能能力。

英偉達(dá)醫(yī)療圖像超級(jí)計(jì)算機(jī)Clara應(yīng)運(yùn)而生。接入現(xiàn)有的醫(yī)療設(shè)備,比如超聲波檢測(cè)儀,就能將整套流程全部升級(jí)——使用深度學(xué)習(xí),在原來的黑白圖像上實(shí)時(shí)渲染出顏色,分層、分區(qū)域,并且變?yōu)?D圖像,后期各種計(jì)算機(jī)技術(shù),提升圖像質(zhì)量,醫(yī)生的檢測(cè)能夠變得更加敏銳清晰。

目前,英偉達(dá)的Clara計(jì)劃已經(jīng)與數(shù)十家公司,初創(chuàng)企業(yè)為主,構(gòu)建了生態(tài)。可以想象,將英偉達(dá)的超級(jí)醫(yī)療圖像計(jì)算機(jī)部署到醫(yī)院,又打開了一大市場(chǎng)。

推理很難:公布TensorRT 4.0,以及Kubernetes on GPU

講到這里,黃教主已經(jīng)一個(gè)人說了1個(gè)多小時(shí)。

“Plaster?!闭f完這個(gè)詞,他停了一會(huì),歇一口氣。

這也是教主自己發(fā)明的詞,希望向世人傳達(dá)的GTC第二大要點(diǎn)。

這個(gè)詞是關(guān)于推理(inference)。推理很難,精度、通量……各種變量要考慮。如何讓推理變得更好?這里,當(dāng)然是英偉達(dá)的高性能神經(jīng)網(wǎng)絡(luò)推理引擎TensorRT的更新——TensorRT 4.0發(fā)布,用于在生產(chǎn)環(huán)境中部署深度學(xué)習(xí)應(yīng)用程序,應(yīng)用有圖像分類、分割和目標(biāo)檢測(cè)等,可提供最大的推理吞吐量和效率。TensorRT是第一款可編程推理加速器,能加速現(xiàn)有和未來的網(wǎng)絡(luò)架。TensorRT 4.0實(shí)現(xiàn)全棧連接。

與CPU相比,NVIDIA TensorRT 4 現(xiàn)在可以將AI任務(wù)的參數(shù)加速200倍,適用于圖像分類、分割、物體檢測(cè)、語音識(shí)別、機(jī)器翻譯等應(yīng)用。

此外,還有英偉達(dá)GPU Kubernets。

Kubernetes借助NVIDIA GPU,開發(fā)人員現(xiàn)在可以即時(shí)地將GPU加速的深度學(xué)習(xí)和HPC應(yīng)用程序部署到multi-cloud GPU群集中。

“人生完整了?!秉S仁勛說。

暫停無人車研發(fā),英偉達(dá)股價(jià)下跌3.8%

一口氣發(fā)布這么多款產(chǎn)品,黃教主可謂是蠻拼的,但其實(shí)這樣做也是英偉達(dá)不得不為之的事情。

值得一提,在黃仁勛演講接近尾聲的時(shí)候,英偉達(dá)股票下跌了3.8%。

“我們要暫定無人駕駛的研發(fā)?!秉S仁勛說。

Uber自動(dòng)駕駛致死事故顯然對(duì)英偉達(dá)造成了巨大的影響。根據(jù)公開資料,Uber從2016年首次部署沃爾沃SC90 SUVS測(cè)試車隊(duì)以來,一直使用英偉達(dá)的計(jì)算技術(shù)。

這讓人想起了當(dāng)年特斯拉車禍時(shí),與特斯拉分手的Moibleye——但不同的是,Mobileye并沒有要停止研發(fā),而是迅速搭上了其他公司,而后被英特爾以153億美元的高價(jià)收歸旗下。

英偉達(dá)目前沒有表示具體研發(fā)計(jì)劃暫定的時(shí)間。

雖然現(xiàn)實(shí)世界中停止路測(cè),但英偉達(dá)還推出了一個(gè)測(cè)試自動(dòng)駕駛汽車的新系統(tǒng)DRIVE Con stellation,這是一款基于云計(jì)算的平臺(tái),將使用逼真模擬測(cè)試駕駛場(chǎng)景。

系統(tǒng)在兩臺(tái)服務(wù)器上運(yùn)行。第一臺(tái)服務(wù)器支持Nvidia DRIVE Sim,它一款模擬自動(dòng)駕駛汽車各種傳感器(包括其攝像頭,激光雷達(dá)和雷達(dá))的軟件。第二臺(tái)服務(wù)器包含Nvidia DRIVE Pegasus AI,它將處理收集的數(shù)據(jù),就好像它來自道路上自駕車的傳感器。

前壓后趕,英偉達(dá)衰相已現(xiàn)?

其次,也不要忘記英偉達(dá)面臨的眾多對(duì)手。

首先是英特爾。英特爾去年宣布發(fā)布Nervana神經(jīng)網(wǎng)絡(luò)處理器(NNP)系列芯片,代號(hào)為L(zhǎng)ake Crest。這款芯片的強(qiáng)大之處在于,它由“處理集群”陣列構(gòu)成,處理“活動(dòng)點(diǎn)(flexpoint)”的簡(jiǎn)化數(shù)學(xué)運(yùn)算。這種運(yùn)算相對(duì)于浮點(diǎn)運(yùn)算所需的數(shù)據(jù)量更少,性能號(hào)稱提升10倍。

不過,Nervana系列芯片宣稱2017年年底量產(chǎn),但直到現(xiàn)在還一直跳票;而且,英偉達(dá)已經(jīng)在游戲、深度學(xué)習(xí)、自動(dòng)駕駛等領(lǐng)域建立起自己的芯片生態(tài)圈,“護(hù)城河”相當(dāng)寬。但是,就像黃教主經(jīng)常揶揄CPU的摩爾定律一樣,反過來看,GPU并沒有本質(zhì)上的突破,GPU的現(xiàn)在優(yōu)勢(shì)可能很容易就被性能一日千里的神經(jīng)網(wǎng)絡(luò)芯片超越,英偉達(dá)的護(hù)城河很快就會(huì)被攻破。

跟英特爾一起攻城的還有賽靈思。

今年3月20日,賽靈思推出ACAP(Adaptive Compute Acceleration Platform,自適應(yīng)計(jì)算加速平臺(tái)),ACAP是一個(gè)高度集成的多核異構(gòu)計(jì)算平臺(tái),它的核心是新一代FPGA架構(gòu),能根據(jù)各種應(yīng)用與工作負(fù)載的需求從硬件層對(duì)其進(jìn)行靈活變化。ACAP的靈活應(yīng)變能力可在工作過程中進(jìn)行動(dòng)態(tài)調(diào)節(jié),它的功能將遠(yuǎn)超F(xiàn)PGA的極限。

賽靈思新任CEO Victor Peng在接受新智元采訪時(shí)表示,GPU雖然在某些方面比CPU能處理的更好,但也不能適應(yīng)所有的情況,因此現(xiàn)在更多需要的是異構(gòu)計(jì)算。尤其是在人工智能時(shí)代,賽靈思也想通過自身在異構(gòu)計(jì)算方面優(yōu)勢(shì)來實(shí)現(xiàn)對(duì)英偉達(dá)以及英特爾的趕超。

除了前面兩個(gè)大塊頭,AI芯片創(chuàng)業(yè)公司也讓這片市場(chǎng)從藍(lán)海變成紅海。中國(guó)有寒武紀(jì)、地平線、深鑒科技,英國(guó)有哈薩比斯投資的Graphcore,美國(guó)也有多家AI芯片初創(chuàng)公司。這些公司針對(duì)的是不同的應(yīng)用場(chǎng)景,每一家都有可能搶走英偉達(dá)的細(xì)分市場(chǎng)。

不過,最能給英偉達(dá)造成威脅的,還應(yīng)當(dāng)是帶頭大哥谷歌。

雖然谷歌的TPU只是用在谷歌內(nèi)部,但單從硬件性能看,TPU已經(jīng)超越英偉達(dá)GPU。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128161
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3637

    瀏覽量

    89867
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    781

    文章

    13449

    瀏覽量

    165278

原文標(biāo)題:剛剛,黃仁勛發(fā)布全球最大GPU,超算級(jí)逆天算力,僅售39.9萬美元

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    減持英偉達(dá)股票

    全球科技巨頭市值競(jìng)爭(zhēng)激烈的背景下,英偉達(dá)CEO
    的頭像 發(fā)表于 06-19 11:25 ?474次閱讀

    英偉達(dá):堅(jiān)守法規(guī)服務(wù)中國(guó),展望人形機(jī)器人未來

    在科技飛速發(fā)展的今天,英偉達(dá)作為圖形處理器(GPU)領(lǐng)域的佼佼者,其一舉一動(dòng)都牽動(dòng)著全球科技界的目光。近日,英偉
    的頭像 發(fā)表于 06-17 14:52 ?424次閱讀

    英偉達(dá)Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉達(dá)創(chuàng)始人兼CEO近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是
    的頭像 發(fā)表于 06-04 09:23 ?1808次閱讀

    英偉達(dá)CEO展望AI與機(jī)器人新時(shí)代

    在COMPUTEX 2024大會(huì)上,英偉達(dá)CEO發(fā)表了激動(dòng)人心的演講,他看好機(jī)器人即將跨入
    的頭像 發(fā)表于 06-03 11:30 ?637次閱讀

    有望超越馬斯克成全球首富 最快有望在2025前實(shí)現(xiàn)

    得益于人工智能(AI)處理器需求持續(xù)旺盛,英偉達(dá)第1季度銷售額連續(xù)第3個(gè)季度增長(zhǎng)200%。英偉達(dá)公司的股價(jià)在業(yè)績(jī)
    的頭像 發(fā)表于 05-28 11:53 ?431次閱讀

    英偉達(dá)CEO薪酬大漲60%,高達(dá)2.47億元

    據(jù)英偉達(dá)在5月15日發(fā)布的最新報(bào)告顯示,在2024財(cái)年的薪酬高達(dá)2.47億元,較前一財(cái)年的
    的頭像 發(fā)表于 05-16 15:08 ?273次閱讀

    工資多少錢?薪酬大漲到3420萬美元

    工資多少錢?薪酬大漲到3420萬美元 作為人工智能世代最賺錢的
    的頭像 發(fā)表于 05-15 16:59 ?491次閱讀

    回應(yīng)中國(guó)市場(chǎng)問題

    英偉達(dá)CEO近日在接受媒體采訪時(shí),深入探討了公司在全球
    的頭像 發(fā)表于 03-20 14:47 ?632次閱讀

    闡述英偉達(dá)與臺(tái)積電的深度合作

    18日當(dāng)天的英偉達(dá)GTC全球圖形計(jì)算大會(huì)上,公布了他們新研發(fā)的人工智能(AI)芯片Blac
    的頭像 發(fā)表于 03-20 09:39 ?687次閱讀

    英偉達(dá)GTC大會(huì)將開幕 將帶你《見證AI的變革時(shí)刻》

    英偉達(dá)GTC大會(huì)將開幕 將帶你《見證AI的變革時(shí)刻》 全球都在關(guān)注的
    的頭像 發(fā)表于 03-18 18:25 ?1246次閱讀

    英偉達(dá)CEO表示華為好公司 英偉達(dá)將華為認(rèn)定為最大競(jìng)爭(zhēng)對(duì)手

    本周提交給美國(guó)證券交易委員會(huì)的文件中列舉了競(jìng)爭(zhēng)對(duì)手包括有英特爾、微、博通、高通、亞馬遜和微軟等;而且首度將華為認(rèn)定為“最大競(jìng)爭(zhēng)對(duì)手”。 英偉達(dá)CE
    的頭像 發(fā)表于 02-25 15:18 ?718次閱讀

    借Sora東風(fēng)身家中國(guó)首富鐘睒睒

    借Sora東風(fēng)身家中國(guó)首富鐘睒睒 憑借超級(jí)亮眼的財(cái)報(bào),英偉達(dá)股價(jià)一
    的頭像 發(fā)表于 02-24 15:48 ?820次閱讀

    對(duì)話張忠謀

    來源:EETOP,謝謝 編輯:感知芯視界 Link 參加完中國(guó)大陸的年會(huì)之后,英偉達(dá)(NVIDIA)CEO
    的頭像 發(fā)表于 01-29 09:14 ?571次閱讀

    英偉達(dá)創(chuàng)始人榮獲“2023最佳CEO”獎(jiǎng)

    英偉達(dá)接任以來,公司股價(jià)漲幅巨大,2023全年股東回報(bào)率達(dá)到驚人的172.9%;且高達(dá)
    的頭像 發(fā)表于 01-08 11:17 ?462次閱讀

    英偉達(dá):AI將在5內(nèi)超越人類!

    美國(guó)對(duì)華半導(dǎo)體出口的限制,也進(jìn)一步刺激了中國(guó)努力發(fā)展自主半導(dǎo)體產(chǎn)業(yè)的決心。也還表示,中國(guó)大陸目前已有數(shù)公司正在開發(fā)可與英偉達(dá)產(chǎn)品競(jìng)爭(zhēng)
    的頭像 發(fā)表于 12-05 09:38 ?491次閱讀