0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

黃教主“真身”引爆黑科技,超強GPU、DPU、最快網(wǎng)卡芯片,打造未來“虛擬世界”

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2021-11-10 09:30 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)11月9日,黃仁勛在NVIDIA GTC上發(fā)表主題演講,發(fā)布了一系列新品,包括ReOpt、cuQuantum、cuNumeric,以及Quantum-2平臺、Modulus、Omniverse、Maxine、Clara Holoscan等等。

ReOpt

ReOpt,一款針對運籌優(yōu)化問題(比如車輛路線安排和倉庫揀選與包裝)的加速求解器,配送14個披薩的路徑有870億種,因此對于達美樂來說,要在30分鐘內(nèi)將披薩送達并非易事,運籌優(yōu)化對于最后一公里配送來說是必需的,對于倉儲及制造物流而言也是如此。

路線規(guī)劃是一個極其棘手的物流問題,應(yīng)用到行業(yè)里,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元,示例,使用NVIDIA Omniverse中的虛擬倉庫,來展示優(yōu)化路線在自動訂單揀選場景中帶來的影響,優(yōu)化后的規(guī)劃能夠使訂單揀選節(jié)省一半的時間和路程,當前路線優(yōu)化求解器在收到新的訂單后,需要數(shù)小時來重新運行和響應(yīng),NVIDIA ReOpt能夠持續(xù)運行并實時動態(tài)地進行重新優(yōu)化。

cuQuantum

量子計算依靠的是,疊加和糾纏的自然量子物理現(xiàn)象,因此有潛力解決伴隨組合復(fù)雜性增加而出現(xiàn)的問題,在世界各地的大學(xué)、科學(xué)實驗室、企業(yè)和初創(chuàng)公司中,有近100個團隊正在致力于量子處理器、系統(tǒng)、模擬器和算法的研究,但預(yù)計還需要十到二十年才能制造出一臺實用的量子計算機。同時,該行業(yè)還需要一個超高速的量子模擬器來驗證其研究。

NVIDIA創(chuàng)建了cuQuantum DGX設(shè)備,該設(shè)備配備有針對量子計算工作流的加速庫,可以使用態(tài)矢量和張量網(wǎng)絡(luò)的方法,來加速量子電路模擬。曾經(jīng)需要耗費幾個月時間的模擬現(xiàn)在只需要幾天就可以完成,,NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。


通過DGX上的cuQuantum,量子計算機和算法研究人員可以使用當今速度最快的計算機來發(fā)明未來的計算機,NVIDIA將在第1季度推出cuQuantum DGX設(shè)備。

cuNumeric


Python是科學(xué)家、機器學(xué)習AI研究人員使用的編程語言,Python擁有豐富的庫生態(tài)系統(tǒng),包括用于DataFrame進行數(shù)據(jù)分析的Pandas,用于n維數(shù)組與矩陣運算的NumPy,用于機器學(xué)習的Scikit-Learn,用于科學(xué)計算的SciPy,用于深度學(xué)習的PyTorch。Python擁有近2000萬名用戶。

在會上還宣布推出NumPy的插入式加速庫cuNumeric,cuNumeric加速了NumPy從單一GPU擴展到多GPU,擴展到多節(jié)點集群,進而擴展到世界上最大的超級計算機,其并行性以隱含的方式自動完成。


cuNumeric具有很好的可擴展性,在著名的CFD Python教學(xué)代碼中,cuNumeric能夠擴展至1000個GPU,而擴展效率僅比線性擴展效率損失了20%。


黃仁勛表示,ReOpt、cuQuantum、cuNumeric,三個極佳的新庫。

Quantum-2平臺

在分布式計算中,網(wǎng)絡(luò)是計算機的重要中樞神經(jīng)系統(tǒng),網(wǎng)絡(luò)將數(shù)以千計的GPU連接成一個巨型的超級計算機,是其擴展能力和最終性能的決定因素。

Quantum-2是一個400Gbps的InfiniBand平臺,由Quantum-2交換機,ConnectX-7網(wǎng)卡、BlueField-3 DPU以及一整套面向這種新架構(gòu)的軟件組成,Quantum-2是首個集超級計算機的性能和云計算的多租戶共享能力于一身的網(wǎng)絡(luò)平臺。


黃仁勛表示,在Quantum-2之前,我們只能在裸機的高性能或安全的多租戶之間選其一,無法兩者兼得,Quantum-2平臺的出現(xiàn),使超級計算機擁有了原生云的能力,并得到更好的優(yōu)化。如果NVIDIA 的Selene DGX超級計算機,如今也配備Quantum-2,則總帶寬將達到每秒224000GB/s,大約是互聯(lián)網(wǎng)總流量的1.5倍。

Quantum-2平臺的InfiniBand交換機芯片,共計570億個晶體管,采用臺積電7nm制程,和NVIDIA的A100 GPU相近,支持64個400Gbps端口或128個200Gbps端口,一個基于Quantum-2的系統(tǒng)可連接多達2048個端口,相較于800個端口的Quantum-1的交換容量多了5倍。


采用Dragonfly拓撲,基于Quantum-2的網(wǎng)絡(luò)可以僅用3個hop就擴展到100萬個節(jié)點,這比當前一代增加了6.5倍,這種網(wǎng)絡(luò)速度、交換容量和可擴展性對于需要構(gòu)建的巨型HPC系統(tǒng)來說來得正是時候,目前Quantum-2交換機正處于樣機階段。

Quantum-2平臺在主機端提供兩個選項:ConnectX-7和BlueFied-3。黃仁勛稱,ConnectX-7將是速度最快的網(wǎng)卡,包含80億個晶體管,采用臺積電7nm制程,是目前世界上速度最快的網(wǎng)絡(luò)芯片,比上一代ConnectX-6快兩倍。ConnectX-7樣品將于明年1月問世。

Quantum-2平臺還提供BlueFied-3 InfiniBand系列方案,通過16個64位Arm CPU來卸載和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施棧操作,BlueFied-3采用臺積電7nm制程,包含220億個晶體管,BlueFied-3樣品將于明年5月問世。

黃仁勛說:“Quantum-2是迄今為止構(gòu)建的非常先進的網(wǎng)絡(luò)平臺,將由頂級計算機制造商提供,這將大大推動高性能計算。”

Modulus

NVIDIA Modulus是一種開發(fā)Physics-ML模型的框架,它使用物理原理以及源自原理型模型和觀測結(jié)構(gòu)的數(shù)據(jù)訓(xùn)練Physics-ML模型,Modulus已經(jīng)過優(yōu)化,可以在多個GPU和多個節(jié)點上進行訓(xùn)練,由此生成的模型,其物理仿真的速度比模擬快1000到10萬倍。


借助Modulus,科學(xué)家能夠創(chuàng)建數(shù)字孿生模型,以前所未有的方式更好地理解大型系統(tǒng),Modulus可以用來解決的一個重要問題,即是氣候科學(xué)。黃仁勛介紹:“我們可以創(chuàng)造地球的數(shù)字孿生模型,它可以持續(xù)運行以預(yù)測未來,用觀測到的數(shù)據(jù)進行校準并改進預(yù)測,然后再預(yù)測。”

研究人員利用歐洲中期天氣預(yù)報中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個A100 GPU上訓(xùn)練需要4個小時,訓(xùn)練后的模型能以30公里的空間分辨率,預(yù)測颶風的嚴重程度和路徑,原本需要7天才能完成的預(yù)測,如今在一個GPU上只需四分之一秒。

虛擬世界模擬引擎Omniverse

Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計,Omniverse的門戶是USD(通用場景描述),本質(zhì)上是一個數(shù)字蟲洞,將人和計算機鏈接到Omniverse,并將一個Omniverse世界鏈接到另一個世界,公司可以在Omniverse中建立虛擬工廠,并使用虛擬機器人進行運營。虛擬工廠和機器人是其物理復(fù)制品的數(shù)字孿生。

自去年年底推出以來,Omniverse已被500家公司的設(shè)計師下載了70000次,社區(qū)、公司和工具供應(yīng)商與NVIDIA一起構(gòu)建Omniverse連接器,14個已經(jīng)投入運行,還有15個即將推出,Bentley宣布帶有Omniverse的iTwin現(xiàn)在正處于搶先體驗階段,另外還有寶馬和愛立信。

Clara Holoscan

NVIDIA Clara Holoscan,一款軟件定義的可編程影響平臺,以及全新的高速傳感器處理機器人芯片Orin。


基礎(chǔ)Holoscan平臺由Orin和ConnectX-7組成,Orin可以在單個芯片中處理整個機器人流水線,即傳感器、物理、AI、成像和圖形,12個Arm CPU,5.2TFLOPS(FP32),用于AI的250TOPS,740Gbps高速IO用于連接傳感器,使用者可以選擇添加A6000 Ampere GPU獲得另外39TFLOPS(FP32)和超過500TOPS的AI推理性能。


Holoscan平臺是開放的,第三方可以在Holoscan的界面和API的基礎(chǔ)上進行構(gòu)建,研究人員可以從事重要的新科學(xué)研究、儀器制造商可以將Holoscan集成到他們的解決方案中,Holoscan應(yīng)用程序可以完整部署在設(shè)備內(nèi)、醫(yī)院的數(shù)據(jù)中心或者兩者結(jié)合,這使得公司可以開放比設(shè)備本身需要更多算力的應(yīng)用程序,或者升級部署多年的已安裝基礎(chǔ)設(shè)備。

黃仁勛在演講的最后表示還有一項公告要發(fā)布,“我們將構(gòu)建一個數(shù)字孿生模型來模擬和預(yù)測氣候變化,上一臺超級計算機名為Cambridge 1,即C-1,這臺新的超級計算機將名為E-2。Earth Two ,地球的數(shù)字孿生,能夠在Omniverse中以Million-X百萬倍的速度運行,目前發(fā)明的所有技術(shù),均是實現(xiàn)Earth Two必不可少的,我想象不出筆者更宏偉、更重要的用途。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102429
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266232
收藏 人收藏

    評論

    相關(guān)推薦

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    DPU 是當下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一。如果把 CPU 比做大腦,那么 GPU 就好比是肌肉,而 DPU 就是神經(jīng)中樞。CPU 承載了應(yīng)用生態(tài),提供了通用型算力;GPU 提供了高密
    發(fā)表于 07-24 15:32

    rt-thread如何解決添加虛擬網(wǎng)卡?

    rt-thread在初始化一個(物理網(wǎng)卡只有一個)網(wǎng)卡之后,還想要再次添加一張虛擬網(wǎng)卡,調(diào)用netif_add沒有效果,應(yīng)該如何解決添加虛擬
    發(fā)表于 07-10 08:18

    基于芯啟源NFP3800DPU芯片的深信服安全加速卡XSX40FNN網(wǎng)卡

    近日,國內(nèi)DPU領(lǐng)域的領(lǐng)軍企業(yè)芯啟源宣布,基于芯啟源NFP3800DPU芯片定制的深信服安全加速卡XSX40FNN網(wǎng)卡已成功應(yīng)用于其防火墻產(chǎn)品,并已批量推向市場。
    的頭像 發(fā)表于 05-29 14:06 ?542次閱讀
    基于芯啟源NFP3800<b class='flag-5'>DPU</b><b class='flag-5'>芯片</b>的深信服安全加速卡XSX40FNN<b class='flag-5'>網(wǎng)卡</b>

    一文看懂DPU與CPU、GPU的關(guān)系

    獨立供電的智能網(wǎng)卡,需要考慮網(wǎng)卡狀態(tài)與計算服務(wù)之間低層信號識 別,在計算系統(tǒng)啟動的過程中或者啟動之后,智能網(wǎng)卡是否已經(jīng)是進入服務(wù)狀 態(tài),這些都需要探索和解決。
    發(fā)表于 04-26 10:35 ?1.1w次閱讀
    一文看懂<b class='flag-5'>DPU</b>與CPU、<b class='flag-5'>GPU</b>的關(guān)系

    交換芯片網(wǎng)卡的區(qū)別是什么

    交換芯片網(wǎng)卡是兩種不同的網(wǎng)絡(luò)硬件組件,它們在網(wǎng)絡(luò)系統(tǒng)中承擔著不同的角色和功能。
    的頭像 發(fā)表于 03-22 16:42 ?1218次閱讀

    FPGA-Based DPU網(wǎng)卡的發(fā)展和應(yīng)用

    采用單芯片的SoC形態(tài),兼顧性能和功耗。FPGA-Based DPU在硬件設(shè)計上的挑戰(zhàn)主要來自芯片面積和功耗。
    發(fā)表于 02-23 14:40 ?1598次閱讀
    FPGA-Based <b class='flag-5'>DPU</b><b class='flag-5'>網(wǎng)卡</b>的發(fā)展和應(yīng)用

    《數(shù)據(jù)處理器:DPU編程入門》DPU計算入門書籍測評

    一、DPU計算框架 通過一周多的時間翻閱這本書,基本上這本書是一本比較全面的,面向架構(gòu)的新手指導(dǎo)數(shù)據(jù)。它在書中詳盡介紹了關(guān)于DPU在計算機架構(gòu)中的應(yīng)用。 對于DPU來說,是一種平行于CPU和
    發(fā)表于 12-24 10:54

    《數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    AI、機器學(xué)習、安全、電信和存儲等應(yīng)用,并提升性能,減輕虛擬化Hypervisor的工作負載。同時,它還具備開放性集成功能,未來支持更多功能集成。NVIDIA的DPU還提供統(tǒng)一的面向各種應(yīng)用的編程接口
    發(fā)表于 12-21 10:47

    淺談DPU和CPU、GPU的關(guān)系

    把CPU的一大部分算力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網(wǎng)卡,或者叫做DPU。
    發(fā)表于 12-14 11:44 ?664次閱讀
    淺談<b class='flag-5'>DPU</b>和CPU、<b class='flag-5'>GPU</b>的關(guān)系

    揭秘GPUGPU未來發(fā)展趨勢

    技術(shù)仍有差距,但這種差距正逐漸縮小。因此,面對外部的制裁和打壓,我國完全有能力自主研發(fā)和生產(chǎn)出類似的高性能芯片。在當今數(shù)字化世界中,圖形處理單元(GPU)技術(shù)正經(jīng)歷
    的頭像 發(fā)表于 11-28 08:27 ?560次閱讀
    揭秘<b class='flag-5'>GPU</b>:<b class='flag-5'>GPU</b>的<b class='flag-5'>未來</b>發(fā)展趨勢

    panabit加載virtio網(wǎng)卡驅(qū)動

    引言:Panabit網(wǎng)絡(luò)流量管理系統(tǒng)是一款強大的企業(yè)級網(wǎng)絡(luò)管理軟件,它提供了豐富的功能和靈活的配置選項。而virtio網(wǎng)卡作為一種高性能的虛擬網(wǎng)絡(luò)設(shè)備,被廣泛應(yīng)用于各種虛擬化平臺。本文將詳細介紹
    的頭像 發(fā)表于 11-17 11:13 ?920次閱讀

    什么是虛擬GPU?虛擬GPU的優(yōu)勢有哪些?

    虛擬 GPU,也稱為 vGPU,是通過將數(shù)據(jù)中心 GPU 進行虛擬化,用戶可在多個虛擬機中共享該 GPU
    的頭像 發(fā)表于 11-10 09:48 ?1569次閱讀
    什么是<b class='flag-5'>虛擬</b><b class='flag-5'>GPU</b>?<b class='flag-5'>虛擬</b><b class='flag-5'>GPU</b>的優(yōu)勢有哪些?

    什么是DPU?

    什么是DPU? 相信很多人對于CPU(中央處理器)已經(jīng)非常熟悉了。靈活、響應(yīng)迅速的CPU多年來一直是大多數(shù)計算機中唯一的可編程元件。 近年來,GPU(圖形處理單元)逐漸成為了計算的中心。最初GPU
    發(fā)表于 11-03 10:55

    【書籍評測活動NO.23】數(shù)據(jù)處理器:DPU編程入門

    資格! “DPU將是未來計算的三大支柱之一。CPU用于通用計算,GPU用于加速計算,而DPU在數(shù)據(jù)中心移動數(shù)據(jù),進行數(shù)據(jù)處理?!? ——NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛于 GT
    發(fā)表于 10-24 15:21

    「探索」我國康復(fù)需求巨大,如何引爆外骨骼機器人賽道?

    未來能夠引爆整個市場的一定是這樣的團隊:一是具備技術(shù)和應(yīng)用場景創(chuàng)新的能力;二是擁有打造高性能產(chǎn)品的能力。
    的頭像 發(fā)表于 10-20 14:45 ?551次閱讀
    「探索」我國康復(fù)需求巨大,如何<b class='flag-5'>引爆</b>外骨骼機器人賽道?