0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力xAI打造全球最大AI超級(jí)計(jì)算機(jī)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-10-30 11:38 ? 次閱讀

NVIDIA Spectrum-X 使基于 NVIDIA Hopper 十萬(wàn)卡 GPU 的巨型系統(tǒng)成為可能

NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬(wàn)顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)是專為多租戶、超大規(guī)模的 AI 工廠提供卓越性能而設(shè)計(jì)的 RDMA(Remote Direct Memory Access)網(wǎng)絡(luò)。

Colossus 是世界上最大的 AI 超級(jí)計(jì)算機(jī),目前正被用于訓(xùn)練 xAI 的 Grok 系列大語(yǔ)言模型,以及作為 X Premium 用戶功能之一的聊天機(jī)器人(Chatbot)。xAI 正在將 Colossus 的規(guī)模進(jìn)一步擴(kuò)大一倍至 20 萬(wàn)顆 NVIDIA Hopper GPU。

xAI 和 NVIDIA 僅用了 122 天就建成了所有配套設(shè)施和這臺(tái)最先進(jìn)的超級(jí)計(jì)算機(jī),從第一個(gè)機(jī)架落地到開始訓(xùn)練任務(wù),只用了 19 天。而建造這種規(guī)模的系統(tǒng)通常需要數(shù)月乃至數(shù)年的時(shí)間。

在訓(xùn)練 Grok 這種超大型模型時(shí),Colossus 實(shí)現(xiàn)了空前的網(wǎng)絡(luò)性能,在三層網(wǎng)絡(luò)架構(gòu)下,整個(gè)系統(tǒng)未出現(xiàn)任何因流量沖突而造成的應(yīng)用延遲增加或數(shù)據(jù)包丟失的情況。憑借 Spectrum-X 先進(jìn)的擁塞控制功能,系統(tǒng)數(shù)據(jù)吞吐量一直保持在 95%。

這一性能水平是傳統(tǒng)以太網(wǎng)在大規(guī)模的情況下根本無(wú)法實(shí)現(xiàn)的,傳統(tǒng)以太網(wǎng)在數(shù)千條流發(fā)生沖突時(shí),只能提供 60% 的數(shù)據(jù)吞吐量。

NVIDIA 網(wǎng)絡(luò)高級(jí)副總裁 Gilad Shainer表示:“AI 正變得至關(guān)重要,對(duì)性能、安全性、可擴(kuò)展性和成本效益提出了更高的要求。NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)專為那些如 xAI 一樣的創(chuàng)新企業(yè)提供更快的處理、分析和執(zhí)行 AI 工作負(fù)載的速度,進(jìn)而加速 AI 解決方案的開發(fā)、部署和上市?!?/p>

埃隆·馬斯克在 X 上表示:“Colossus 是世界上最強(qiáng)大的訓(xùn)練系統(tǒng)。xAI 團(tuán)隊(duì)、NVIDIA 和我們的眾多合作伙伴及供應(yīng)商干得漂亮?!?/p>

xAI 發(fā)言人表示:“xAI 構(gòu)建了全球規(guī)模最大、性能最強(qiáng)的超級(jí)計(jì)算機(jī)。借助 NVIDIA Hopper GPU 和 Spectrum-X,我們得以突破大規(guī)模 AI 模型訓(xùn)練的邊界,打造基于以太網(wǎng)標(biāo)準(zhǔn)并經(jīng)過(guò)超級(jí)加速和優(yōu)化的 AI 工廠?!?/p>

Spectrum-X 平臺(tái)的核心是 Spectrum SN5600 以太網(wǎng)交換機(jī),它支持高達(dá) 800Gb/s 的端口速度,采用了 Spectrum-4 交換機(jī) ASIC。xAI 采用了Spectrum-X SN5600 交換機(jī)與NVIDIA BlueField-3 SuperNIC的端到端解決方案,實(shí)現(xiàn)了前所未有的性能。

專門面向 AI 的 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)具有先進(jìn)的功能,可在提供高效、可擴(kuò)展的帶寬的同時(shí),實(shí)現(xiàn)低延遲和短尾延遲,而這些功能之前是 InfiniBand 網(wǎng)絡(luò)所獨(dú)有的。Spectrum-X 的功能包括基于 NVIDIA DDP(Direct Data Placement)技術(shù)的動(dòng)態(tài)路由、擁塞控制計(jì)算,以及增強(qiáng)了 AI 網(wǎng)絡(luò)的可視性和性能隔離,所有這些功能都是多租戶生成式 AI 云和大型企業(yè)應(yīng)用環(huán)境的關(guān)鍵要求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4846

    瀏覽量

    102698
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4669

    瀏覽量

    128550
  • 超級(jí)計(jì)算機(jī)

    關(guān)注

    2

    文章

    459

    瀏覽量

    41901
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29707

    瀏覽量

    268022

原文標(biāo)題:NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA Colossus超級(jí)計(jì)算機(jī)集群突破10萬(wàn)顆Hopper GPU

    NVIDIA近日宣布,其位于田納西州孟菲斯市的xAI Colossus超級(jí)計(jì)算機(jī)集群規(guī)模已壯大至10萬(wàn)顆NVIDIA Hopper GPU。
    的頭像 發(fā)表于 10-30 10:29 ?199次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    、超大規(guī)模的 AI 工廠提供卓越性能而設(shè)計(jì)的 RDMA(Remote Direct Memory Access)網(wǎng)絡(luò)。 ? Colossus 是世界上最大AI 超級(jí)
    發(fā)表于 10-30 09:33 ?93次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 <b class='flag-5'>xAI</b> 構(gòu)建的<b class='flag-5'>全球</b><b class='flag-5'>最大</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD
    的頭像 發(fā)表于 10-27 09:42 ?327次閱讀

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過(guò)使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?469次閱讀

    馬斯克人工智能初創(chuàng)公司xAI打造超級(jí)計(jì)算機(jī),引領(lǐng)AI新紀(jì)元

    在科技發(fā)展的浪潮中,人工智能(AI)無(wú)疑是當(dāng)今最引人注目的領(lǐng)域之一。近日,馬斯克的人工智能初創(chuàng)公司xAI再次成為了全球關(guān)注的焦點(diǎn)。據(jù)悉,該公司計(jì)劃在不久的將來(lái)打造一臺(tái)裝備有最多10萬(wàn)塊
    的頭像 發(fā)表于 06-22 16:37 ?571次閱讀

    xAI將在孟菲斯打造全球最大超算

    馬斯克的人工智能初創(chuàng)企業(yè)xAI近日宣布,將在美國(guó)孟菲斯市建設(shè)一座全新的設(shè)施,以容納一臺(tái)前所未有的巨型超級(jí)計(jì)算機(jī)。此舉標(biāo)志著xAI在人工智能領(lǐng)域的雄心壯志,也為其在制造和提供聊天機(jī)器人及
    的頭像 發(fā)表于 06-07 09:32 ?344次閱讀

    計(jì)算機(jī)行業(yè)攜手 NVIDIA 為新工業(yè)革命打造 AI 工廠和數(shù)據(jù)中心

    領(lǐng)先的計(jì)算機(jī)制造商推出一系列 Blackwell 賦能的系統(tǒng),搭載 Grace CPU、NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施 豐富的產(chǎn)品組合覆蓋云、專用系統(tǒng)、嵌入式和邊緣 AI 系統(tǒng)等 產(chǎn)品配置豐富,從單
    發(fā)表于 06-03 09:14 ?207次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b>行業(yè)攜手 <b class='flag-5'>NVIDIA</b> 為新工業(yè)革命<b class='flag-5'>打造</b> <b class='flag-5'>AI</b> 工廠和數(shù)據(jù)中心

    馬斯克計(jì)劃打造超級(jí)計(jì)算機(jī)推動(dòng)AI發(fā)展

    科技巨頭埃隆·馬斯克近日在投資者會(huì)議上透露,其人工智能初創(chuàng)公司xAI正全力籌備打造一臺(tái)超級(jí)計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)將作為下一版人工智能聊天機(jī)器人G
    的頭像 發(fā)表于 05-28 09:18 ?494次閱讀

    馬斯克欲建xAI超級(jí)算力工廠

    在最近的一次投資者演講中,人工智能創(chuàng)業(yè)公司xAI的創(chuàng)始人馬斯克公布了公司的最新宏大計(jì)劃。他宣布,xAI計(jì)劃打造一個(gè)由數(shù)萬(wàn)個(gè)專用算力芯片組成的超級(jí)計(jì)算
    的頭像 發(fā)表于 05-27 10:29 ?535次閱讀

    Green500全球最節(jié)能超級(jí)計(jì)算機(jī)榜單:采用NVIDIA技術(shù)包攬前三

    NVIDIA 系統(tǒng)在 Green500 榜單上的強(qiáng)勢(shì)表現(xiàn)進(jìn)一步驗(yàn)證了 NVIDIA 平臺(tái)為節(jié)能型計(jì)算機(jī)打造
    的頭像 發(fā)表于 05-24 10:59 ?490次閱讀

    NVIDIA和Recursion利用AI超級(jí)計(jì)算機(jī)加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅(qū)動(dòng),用于加速醫(yī)療領(lǐng)域科學(xué)家的工作。在全球超級(jí)計(jì)算機(jī) TOP500 榜單中,它的排名上升了 100
    的頭像 發(fā)表于 05-16 09:46 ?1196次閱讀
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>加快新藥研發(fā)

    諾和諾德基金會(huì)將聯(lián)手英偉達(dá)打造丹麥AI超級(jí)計(jì)算機(jī)

    諾和諾德基金會(huì)攜手英偉達(dá),共同宣布在丹麥打造一臺(tái)領(lǐng)先的AI超級(jí)計(jì)算機(jī)。這臺(tái)超級(jí)計(jì)算機(jī)將致力于推動(dòng)
    的頭像 發(fā)表于 03-21 13:43 ?528次閱讀

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    ——? NVIDIA 于今日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell
    發(fā)表于 03-19 10:56 ?348次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算</b>

    Tesla 計(jì)劃斥資 5 億美元建造一臺(tái)由 NVIDIAAI GPU 提供支持的 Dojo 超級(jí)計(jì)算機(jī)

    ABSTRACT摘要Tesla計(jì)劃斥資5億美元建造一臺(tái)由NVIDIA的AIGPU提供支持的Dojo超級(jí)計(jì)算機(jī),因此該公司正在加大基于AI的開發(fā)力度。JAEALOT2024年1月27日T
    的頭像 發(fā)表于 02-19 12:45 ?526次閱讀
    Tesla 計(jì)劃斥資 5 億美元建造一臺(tái)由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>

    亞馬遜云科技與 NVIDIA 宣布開展戰(zhàn)略合作,為生成式 AI 提供全新超級(jí)計(jì)算基礎(chǔ)架構(gòu)、軟件和服務(wù)

    NVL32 的 NVIDIA DGX 云 即將登陸亞馬遜云科技。 兩家公司聯(lián)合開展“Project Ceiba”合作項(xiàng)目,即全球最快的 GPU 驅(qū)動(dòng) AI 超級(jí)
    的頭像 發(fā)表于 11-29 21:00 ?590次閱讀
    亞馬遜云科技與 <b class='flag-5'>NVIDIA</b> 宣布開展戰(zhàn)略合作,為生成式 <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算</b>基礎(chǔ)架構(gòu)、軟件和服務(wù)