全新 Blackwell GPU、NVLink 和可靠性技術(shù)賦能萬億參數(shù)規(guī)模的 AI 模型
全新 Tensor Core 與 TensorRT- LLM 編譯器將 LLM 推理運(yùn)行成本和能耗降低多達(dá) 25 倍
全新加速器助推數(shù)據(jù)處理、工程模擬、電子設(shè)計(jì)自動(dòng)化、計(jì)算機(jī)輔助藥物設(shè)計(jì)和量子計(jì)算領(lǐng)域?qū)崿F(xiàn)突破
各大云提供商、服務(wù)器制造商和頭部 AI 企業(yè)紛紛采用
NVIDIA 于太平洋時(shí)間3 月 18 日宣布推出 NVIDIA Blackwell 平臺(tái)以賦能計(jì)算新時(shí)代。該平臺(tái)可使世界各地的機(jī)構(gòu)都能夠在萬億參數(shù)的大語言模型(LLM)上構(gòu)建和運(yùn)行實(shí)時(shí)生成式 AI,其成本和能耗較上一代產(chǎn)品降低多達(dá) 25 倍。
Blackwell GPU 架構(gòu)搭載六項(xiàng)變革性的加速計(jì)算技術(shù),這些技術(shù)將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計(jì)自動(dòng)化、計(jì)算機(jī)輔助藥物設(shè)計(jì)、量子計(jì)算和生成式 AI 等領(lǐng)域?qū)崿F(xiàn)突破,這些都是 NVIDIA 眼中的新興行業(yè)機(jī)遇。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“三十年來,我們一直深耕加速計(jì)算領(lǐng)域,力求實(shí)現(xiàn)像深度學(xué)習(xí)和 AI 這樣的變革性突破。生成式 AI 是我們這個(gè)時(shí)代的決定性技術(shù),Blackwell GPU 是推動(dòng)新一輪工業(yè)革命的引擎。通過與全球最具活力的企業(yè)合作,我們將實(shí)現(xiàn) AI 賦能各行各業(yè)的承諾。”
許多企業(yè)都在計(jì)劃采用 Blackwell,其中包括亞馬遜云科技、戴爾科技、谷歌、Meta、微軟、OpenAI、Oracle、特斯拉和 xAI。
Alphabet 和谷歌首席執(zhí)行官 Sundar Pichai表示:“通過擴(kuò)展谷歌搜索和 Gmail 等服務(wù)以服務(wù)于數(shù)十億用戶,我們對(duì)于如何管理計(jì)算基礎(chǔ)設(shè)施有了更加深入的了解。隨著公司業(yè)務(wù)進(jìn)入 AI 平臺(tái)轉(zhuǎn)型期,我們將繼續(xù)為自身產(chǎn)品和服務(wù)以及云客戶擴(kuò)大基礎(chǔ)設(shè)施投資。我們有幸與 NVIDIA 建立了長(zhǎng)期合作伙伴關(guān)系,并期待著將 Blackwell GPU 的突破性功能帶給我們的云客戶以及包括 Google DeepMind 在內(nèi)的谷歌團(tuán)隊(duì),以加速未來的探索進(jìn)程?!?/p>
亞馬遜總裁兼首席執(zhí)行官 Andy Jassy表示:“我們與 NVIDIA 的深度合作可以追溯到13 年前,當(dāng)時(shí)我們?cè)?AWS 上推出了全球首個(gè) GPU 云實(shí)例。如今,我們?cè)谠贫颂峁┝俗顬閺V泛的 GPU 解決方案,以支持全球那些技術(shù)上最先進(jìn)的加速工作負(fù)載。正因如此,NVIDIA Blackwell GPU 能夠在 AWS 上運(yùn)行得如此出色,NVIDIA也選擇與 AWS 共同開發(fā) Project Ceiba,將 NVIDIA 新一代 Grace Blackwell 超級(jí)芯片與 AWS Nitro System 的高級(jí)虛擬化和超快速的 Elastic Fabric Adapter 網(wǎng)絡(luò)結(jié)合,以用于 NVIDIA 自身的 AI 研發(fā)。通過 AWS 與 NVIDIA 工程師的共同努力,我們將持續(xù)創(chuàng)新,使 AWS 成為每一個(gè)想要在云端運(yùn)行 NVIDIA GPU 的用戶的最佳選擇?!?/p>
戴爾科技董事會(huì)主席兼首席執(zhí)行官 Michael Dell表示:“生成式 AI 對(duì)于創(chuàng)建更智能、更可靠和更高效的系統(tǒng)至關(guān)重要。戴爾科技與 NVIDIA 將攜手塑造未來科技。隨著 Blackwell 的發(fā)布, 我們將繼續(xù)為用戶提供新一代加速產(chǎn)品和服務(wù),以提供推動(dòng)跨行業(yè)創(chuàng)新所需的工具?!?/p>
谷歌 DeepMind 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis表示:“AI 的變革潛力令人難以置信,它將幫助我們解決世界上那些最重要的科學(xué)問題。Blackwell 突破性的技術(shù)性能將提供所需的關(guān)鍵算力,從而幫助那些世界上最聰明的大腦繪制新的科學(xué)藍(lán)圖?!?/p>
Meta 公司創(chuàng)始人兼首席執(zhí)行官 Mark Zuckerberg表示:“從我們的大語言模型到內(nèi)容推薦、廣告和安全系統(tǒng),AI 已經(jīng)在賦能一切,而且 AI 在未來將會(huì)日益重要。我們期待通過 NVIDIA Blackwell 幫助訓(xùn)練我們的開源 Llama 模型,打造下一代 Meta AI 和消費(fèi)產(chǎn)品?!?/p>
微軟執(zhí)行董事長(zhǎng)兼首席執(zhí)行官 Satya Nadella表示:“我們致力于為客戶提供最先進(jìn)的基礎(chǔ)設(shè)施,以賦能其 AI 工作負(fù)載。一直以來,我們致力于為云端優(yōu)化 NVIDIA GPU,通過在我們的全球數(shù)據(jù)中心采用 GB200 Grace Blackwell 處理器,我們得以在這一進(jìn)程中再進(jìn)一步,助力世界各地的組織實(shí)現(xiàn) AI 落地。”
OpenAI 首席執(zhí)行官 Sam Altman表示:“Blackwell 實(shí)現(xiàn)了巨大的性能飛躍,并將加速我們提供尖端模型的能力。我們很高興能繼續(xù)與 NVIDIA 合作,共同提升 AI 計(jì)算。”
Oracle 董事長(zhǎng)兼首席技術(shù)官 Larry Ellison表示:“Oracle 與 NVIDIA 的緊密合作將推動(dòng) AI、機(jī)器學(xué)習(xí)和數(shù)據(jù)分析領(lǐng)域?qū)崿F(xiàn)質(zhì)和量的突破。為了讓用戶能夠獲取更多具有可操作性的洞察,正需要像 Blackwell 這樣專為加速計(jì)算和生成式 AI 而打造的、更強(qiáng)大的引擎?!?/p>
特斯拉及 xAI 首席執(zhí)行官 Elon Musk表示:“當(dāng)下的 AI 領(lǐng)域,NVIDIA 硬件無可比擬?!?/p>
新架構(gòu)以紀(jì)念 David Harold Blackwell 命名,他不僅是一位專門研究博弈論和統(tǒng)計(jì)學(xué)的數(shù)學(xué)家,也是第一位入選美國(guó)國(guó)家科學(xué)院的黑人學(xué)者。這一新架構(gòu)是繼兩年前推出的 NVIDIA Hopper 架構(gòu)以來的全新架構(gòu)。
Blackwell 的多項(xiàng)創(chuàng)新技術(shù)
為加速計(jì)算和生成式 AI 提供助力
憑借六項(xiàng)變革性的技術(shù),Blackwell 能夠在擁有高達(dá) 10 萬億參數(shù)的模型上實(shí)現(xiàn) AI 訓(xùn)練和實(shí)時(shí) LLM 推理,這些技術(shù)包括:
全球最強(qiáng)大的芯片:Blackwell 架構(gòu) GPU 具有 2080 億個(gè)晶體管,采用專門定制的雙倍光刻極限尺寸 4NP TSMC 工藝制造,通過 10 TB/s 的片間互聯(lián),將 GPU 裸片連接成一塊統(tǒng)一的 GPU。
第二代 Transformer 引擎:得益于全新微張量縮放支持,以及集成于 NVIDIA TensorRT-LLM 和 NeMo Megatron 框架中的 NVIDIA 先進(jìn)動(dòng)態(tài)范圍管理算法,Blackwell 將在新型 4 位浮點(diǎn) AI 推理能力下實(shí)現(xiàn)算力和模型大小翻倍。
第五代 NVLink:為了提升萬億級(jí)參數(shù)模型和混合專家 AI 模型的性能,最新一代 NVIDIA NVLink 為每塊 GPU 提供突破性的 1.8TB/s 雙向吞吐量,確保多達(dá) 576 塊 GPU 之間的無縫高速通信,滿足了當(dāng)今最復(fù)雜 LLM 的需求。
RAS 引擎:采用 Blackwell 架構(gòu)的 GPU 包含一個(gè)用于保障可靠性、可用性和可維護(hù)性的專用引擎。此外,Blackwell 架構(gòu)還增加了多項(xiàng)芯片級(jí)功能,能夠利用 AI 預(yù)防性維護(hù)來運(yùn)行診斷并預(yù)測(cè)可靠性相關(guān)的問題。這將最大程度地延長(zhǎng)系統(tǒng)正常運(yùn)行時(shí)間,提高大規(guī)模 AI 部署的彈性,使其能夠連續(xù)不間斷運(yùn)行數(shù)周乃至數(shù)月,同時(shí)降低運(yùn)營(yíng)成本。
安全 AI:先進(jìn)的機(jī)密計(jì)算功能可以在不影響性能的情況下保護(hù) AI 模型和客戶數(shù)據(jù),并且支持全新本地接口加密協(xié)議,這對(duì)于醫(yī)療、金融服務(wù)等高度重視隱私問題的行業(yè)至關(guān)重要。
解壓縮引擎:專用的解壓縮引擎支持最新格式,通過加速數(shù)據(jù)庫(kù)查詢提供極其強(qiáng)大的數(shù)據(jù)分析和數(shù)據(jù)科學(xué)性能。未來幾年,每年需要企業(yè)花費(fèi)數(shù)百億美元的數(shù)據(jù)處理將越來越多地由 GPU 加速。
一個(gè)超大規(guī)模的超級(jí)芯片
NVIDIA GB200 Grace Blackwell 超級(jí)芯片通過 900GB/s 超低功耗的片間互聯(lián),將兩個(gè) NVIDIA B200 Tensor Core GPU 與 NVIDIA Grace CPU 相連。
為了實(shí)現(xiàn)超高的 AI 性能,搭載 GB200 的系統(tǒng)可與同在今天發(fā)布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太網(wǎng)平臺(tái)連接。這兩個(gè)平臺(tái)均可提供速度高達(dá) 800Gb/s 的高性能網(wǎng)絡(luò)。
GB200 是 NVIDIA GB200 NVL72 的關(guān)鍵組件。NVIDIA GB200 NVL72 是一套多節(jié)點(diǎn)液冷機(jī)架級(jí)擴(kuò)展系統(tǒng),適用于高度計(jì)算密集型的工作負(fù)載。它將 36 個(gè) Grace Blackwell 超級(jí)芯片組合在一起,其中包含通過第五代 NVLink 相互連接的 72 個(gè) Blackwell GPU 和 36 個(gè) Grace CPU。
此外,GB200 NVL72 還內(nèi)置 NVIDIA BlueField-3 數(shù)據(jù)處理器,可在超大規(guī)模 AI 云中實(shí)現(xiàn)云網(wǎng)絡(luò)加速、組合式存儲(chǔ)、零信任安全和 GPU 計(jì)算彈性。對(duì)于 LLM 推理工作負(fù)載,相較于同樣數(shù)量的 NVIDIA H100 Tensor Core GPU,GB200 NVL72 最高可提供 30 倍的性能提升以及多達(dá) 25 倍的成本和能耗降低。
該平臺(tái)可作為一個(gè)單 GPU,具有 1.4 exaflops 的 AI 性能和 30TB 的快速內(nèi)存,是組成最新一代 DGX SuperPOD 的基礎(chǔ)模塊。
NVIDIA 提供的 HGX B200 是一個(gè)通過 NVLink 連接 8 塊 B200 GPU 的服務(wù)器主板,支持基于 x86 的生成式 AI 平臺(tái)?;?NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),HGX B200 支持高達(dá) 400Gb/s 的網(wǎng)絡(luò)速度。
Blackwell的全球合作伙伴網(wǎng)絡(luò)
合作伙伴將從今年晚些時(shí)候開始供應(yīng)采用 Blackwell 架構(gòu)的產(chǎn)品。
AWS、Google Cloud、Microsoft Azure、Oracle CloudInfrastructure 將成為首批提供 Blackwell 驅(qū)動(dòng)實(shí)例的云服務(wù)提供商。同時(shí) NVIDIA 云合作伙伴計(jì)劃的公司 Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda 也將提供上述服務(wù)。Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle EUSovereign Cloud、Oracle US, UK,and Australian Government Clouds、Scaleway、新加坡電信、NorthernData Group 的 Taiga Cloud、Yotta Data Services 的 Shakti Cloud 和 YTL Power International 等主權(quán) AI 云也將提供基于 Blackwell 架構(gòu)的云服務(wù)和基礎(chǔ)設(shè)施。
GB200 還將通過 NVIDIADGX Cloud 提供,NVIDIA DGX Cloud 是一個(gè)與領(lǐng)先的云服務(wù)提供商共同設(shè)計(jì)的 AI 平臺(tái),可為企業(yè)開發(fā)人員提供專門的基礎(chǔ)設(shè)施和軟件訪問權(quán)限,使他們能夠構(gòu)建并部署先進(jìn)的生成式 AI 模型。AWS、Google Cloud 和 Oracle Cloud Infrastructure 計(jì)劃在今年晚些時(shí)候托管采用 NVIDIA Grace Blackwell 的新實(shí)例。
Cisco、戴爾科技、慧與、聯(lián)想和 Supermicro 預(yù)計(jì)將提供基于 Blackwell 產(chǎn)品打造的各種服務(wù)器。Aivres、永擎電子、華碩、Eviden、Foxconn、技嘉、Inventec、和碩、QCT、Wistron、緯穎和 ZT Systems 也將提供基于 Blackwell 的服務(wù)器。
此外,越來越多的軟件制造商網(wǎng)絡(luò),包括工程仿真領(lǐng)域的全球領(lǐng)導(dǎo)者 Ansys、Cadence 和 Synopsys,將使用基于 Blackwell 的處理器來加速其用于設(shè)計(jì)和仿真電氣、機(jī)械和制造系統(tǒng)及零件的軟件。他們的客戶可以更低成本、更高能效地使用生成式 AI 和加速計(jì)算,來加速產(chǎn)品上市。
NVIDIA 軟件支持
Blackwell 產(chǎn)品組合由生產(chǎn)級(jí) AI 端到端操作系統(tǒng) NVIDIA AI Enterprise 支持。NVIDIA AI Enterprise 中包含同日發(fā)布的 NVIDIA NIM 推理微服務(wù)以及 AI 框架、程序庫(kù)和工具,企業(yè)可以部署在由 NVIDIA 提供加速的云、數(shù)據(jù)中心及工作站上。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
19100瀏覽量
228814 -
TSMC
+關(guān)注
關(guān)注
3文章
177瀏覽量
84429 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102709 -
晶體管
+關(guān)注
關(guān)注
77文章
9609瀏覽量
137653 -
GPU芯片
+關(guān)注
關(guān)注
1文章
303瀏覽量
5770
原文標(biāo)題:GTC24 | NVIDIA Blackwell 平臺(tái)發(fā)布,賦能計(jì)算新時(shí)代
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論