0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA最新GPU帶動,液冷服務器市占有望從1%提升到15%

花茶晶晶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2024-06-14 09:11 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)數(shù)據(jù)中心向來是耗電大戶,過去出于更經(jīng)濟的考慮氣冷型服務器占據(jù)主流,如今隨著大語言模型的快速發(fā)展以及Meta的Llama-3和Mistral的Mixtral 8x22B等開源模型不斷推出,采用液冷技術的總擁有成本效益更加突出。未來液冷服務器的比重將顯著上升。

液冷產(chǎn)品簡化AI基礎設施


最近,Supermicro推出可立即部署式液冷型AI數(shù)據(jù)中心,此數(shù)據(jù)中心專為云原生解決方案而設計,通過SuperCluster加速各界企業(yè)對生成式AI的運用,并針對NVIDIA AI Enterprise軟件平臺優(yōu)化,適用于生成式AI的開發(fā)與部署。

Supermicro的SuperCluster解決方案針對LLM訓練、深度學習以及大規(guī)模與大批量推理優(yōu)化Supermicro的SuperCluster支持NVIDIA AI Enterprise,其中包括NVIDIA NIM微服務和NVIDIA NeMo平臺,能實現(xiàn)端對端生成式AI客制,并針對NVIDIA Quantum-2 InfiniBand以及具有每GPU 400Gb/s網(wǎng)速的新型NVIDIA Spectrum-X以太網(wǎng)絡平臺優(yōu)化,可擴展到具有數(shù)萬個GPU的大型計算叢集。

通過Supermicro的4U液冷技術,NVIDIA近期推出的Blackwell GPU能在單一GPU上充分發(fā)揮20 PetaFLOPS的AI性能,且與較早的GPU相比,能提供4倍的AI訓練性能與30倍的推理性能,并節(jié)省額外成本。

Supermicro總裁兼首席執(zhí)行官梁見后表示,我們的解決方案針對NVIDIA AI Enterprise軟件優(yōu)化,滿足各行各業(yè)的客戶需求,并提供世界規(guī)模級效率的全球制造產(chǎn)能。因此我們得以縮短交付時間,更快提供搭配NVIDIA HGX H100和H200,以及即將推出的B100、B200和GB200解決方案的可立即使用型液冷或氣冷計算叢集。



液冷型被越來越多的采用


Supermicro提供的數(shù)據(jù)中心的液冷配置設計可幾近免費,并通過能持續(xù)降低用電量的優(yōu)勢為客戶提供額外價值。采用液冷方案的整體擁有成本將非??捎^,例如來自于后期運營過程當中的電力消耗的減少,5年可以節(jié)省高達6000萬美元的電費支出。Supermicro從液冷板到CDU乃至冷卻塔,其機柜級全方位液冷解決方案最大可以降低數(shù)據(jù)中心40%的持續(xù)用電量。

液冷并非新的技術,它存在已經(jīng)超過30年,不過在采訪中,梁見后表示,之前液冷方案需求量小,并且交期長約4-12個月,以小型OEM為主。如今,Supermicro與客戶重新進行子系統(tǒng)和組件設計來提升數(shù)據(jù)中心的性能,并改善了交期,滿足更快的交付要求。

今年以來,客戶要求新建數(shù)據(jù)中心時直接采用液冷方案,也希望將舊有的氣冷數(shù)據(jù)中心部分轉(zhuǎn)換成液冷配置。在此需求刺激下,公司液冷業(yè)務的增長非???,產(chǎn)能處于供不應求的狀態(tài)。

公司在荷蘭、美國和馬來西亞等全球各地擴大生產(chǎn)規(guī)模,預計2-3個月內(nèi)馬來西亞新廠區(qū)即可投產(chǎn)。產(chǎn)能爬坡,供應能力增加,令客戶享受更低成本的初始投資方案以及更低的總擁有成本。

隨著大語言模型的服務器集群的需求增長,液冷方案有望成為主流。過去三十年液冷的市場份額估計都不到1%,但數(shù)據(jù)中心對液冷方案的采用逐漸增多,這一市占有望提高到15%以上。

不斷拓展液冷型產(chǎn)品線


NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛對于Supermicro的設計給出高度評價,他表示生成式AI正在推動整個計算堆棧的重置,新的數(shù)據(jù)中心將會通過GPU進行計算加速,并針對AI優(yōu)化。Supermicro設計了頂尖的NVIDIA加速計算和網(wǎng)絡解決方案,使價值數(shù)兆美元的全球數(shù)據(jù)中心能夠針對AI時代優(yōu)化。

Supermicro目前的生成式AI SuperCluster液冷型產(chǎn)品包括Supermicro NVIDIA HGX H100/H200 SuperCluster,具有256個H100/H200 GPU,為5個機柜規(guī)模的可擴展計算單元(包括1 個專用網(wǎng)絡機柜)。即將推出的SuperCluster液冷型產(chǎn)品包括Supermicro NVIDIA HGX B200 SuperCluster液冷型,Supermicro NVIDIA GB200 NVL72 或NVL36 SuperCluster液冷型。

當然除了液冷型之外,也推出了氣冷型產(chǎn)品,例如氣冷型Supermicro NVIDIA HGX H100/H200 SuperCluster,具有256個HGX H100/H200 GPU,為9個機柜規(guī)模的可擴展計算單元(包括1個專用網(wǎng)絡機柜),以及后續(xù)將推出的Supermicro NVIDIA HGX B100/B200 SuperCluster氣冷型。

Supermicro是主流的AI 服務器制造商之一。受益于 ChatGPT 引發(fā)的人工智能熱潮,再加上與英偉達的密切合作,這兩年Supermicro業(yè)績飆升,并受到資本市場的追捧。如今,Supermicro的液冷服務器技術直擊 AI 處理器功耗高的痛點,技術創(chuàng)新和產(chǎn)能提升下,公司的液冷服務器業(yè)務將成為強勁的成長動力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4855

    瀏覽量

    102711
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4673

    瀏覽量

    128592
  • Supermicro
    +關注

    關注

    0

    文章

    28

    瀏覽量

    9257
  • 液冷
    +關注

    關注

    4

    文章

    92

    瀏覽量

    4953
收藏 人收藏

    評論

    相關推薦

    GPU服務器和傳統(tǒng)的服務器有什么區(qū)別

    GPU服務器與傳統(tǒng)的服務器在多個方面存在顯著差異,主機推薦小編為您整理發(fā)布GPU服務器和傳統(tǒng)的服務器
    的頭像 發(fā)表于 11-07 11:05 ?84次閱讀

    GPU服務器AI網(wǎng)絡架構設計

    眾所周知,在大型模型訓練中,通常采用每臺服務器配備多個GPU的集群架構。在上一篇文章《高性能GPU服務器AI網(wǎng)絡架構(上篇)》中,我們對GPU
    的頭像 發(fā)表于 11-05 16:20 ?124次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>服務器</b>AI網(wǎng)絡架構設計

    GPU高性能服務器配置

    GPU高性能服務器作為提升計算速度和效率的關鍵設備,在各大應用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能
    的頭像 發(fā)表于 10-21 10:42 ?135次閱讀

    gpu服務器與cpu服務器的區(qū)別對比,終于知道怎么選了!

    gpu服務器與cpu服務器的區(qū)別主要體現(xiàn)在架構設計、性能特點、能耗效率、應用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務器更適合數(shù)據(jù)庫管理和企業(yè)應用,而
    的頭像 發(fā)表于 08-01 11:41 ?419次閱讀

    算力服務器為什么選擇GPU

    隨著人工智能技術的快速普及,算力需求日益增長。智算中心的服務器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設備,其性能優(yōu)化顯得尤為關鍵。而GPU服務器也進入了大眾的視野,成為高性能計算的首選。那么,為什么算力
    的頭像 發(fā)表于 07-25 08:28 ?464次閱讀
    算力<b class='flag-5'>服務器</b>為什么選擇<b class='flag-5'>GPU</b>

    基于ESP32S進行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0?

    1.現(xiàn)在基于ESP32S進行BLE MESH開發(fā),基于的是BLE4.2,是否可以提升到BLE5.0? 2.BLE4.2是否可以接收到BLE5.0 Beacon?Code: Select all
    發(fā)表于 06-12 07:49

    PUE的拯救者,液冷服務器

    下,要想借助GPU密集的計算集群打造智算網(wǎng)絡,是肯定不能在散熱上馬虎的。為此,自19年起組建開展商業(yè)化應用的液冷服務器,開始慢慢搶占更多的市場份額。 ? 液冷的必要性 ? 隨著英偉達B
    的頭像 發(fā)表于 06-06 00:23 ?2514次閱讀
    PUE的拯救者,<b class='flag-5'>液冷</b><b class='flag-5'>服務器</b>

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    gpu服務器是干什么的 gpu服務器與cpu服務器的區(qū)別有哪些

    gpu服務器是干什么的 gpu服務器與cpu服務器的區(qū)別 GPU
    的頭像 發(fā)表于 01-30 15:31 ?786次閱讀

    浪潮信息與英特爾聯(lián)合發(fā)布全球首個全液冷冷板服務器參考設計

    北京2024年1月19日?/美通社/ -- 1月18日,浪潮信息與英特爾聯(lián)合發(fā)布全球首個全液冷冷板服務器參考設計,并面向業(yè)界開放,為全球液冷
    的頭像 發(fā)表于 01-19 16:52 ?486次閱讀
    浪潮信息與英特爾聯(lián)合發(fā)布全球首個全<b class='flag-5'>液冷</b>冷板<b class='flag-5'>服務器</b>參考設計

    利用NVIDIA產(chǎn)品技術組合提升用戶體驗

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型,并借助NVIDIA Triton推理服務器NVIDIA V100 G
    的頭像 發(fā)表于 01-17 09:30 ?633次閱讀

    超微gpu服務器評測

    GPU服務器進行評測。 一、超微GPU服務器概述 超微GPU服務器是一種基于超微
    的頭像 發(fā)表于 01-10 10:37 ?1218次閱讀

    液冷服務器行業(yè)分類及產(chǎn)業(yè)鏈分析

    中國液冷服務器行業(yè)市場規(guī)模將持續(xù)高速增長,其原因在于:1. 國家綠色能源和可持續(xù)發(fā)展扶持政策,推動液冷服務器廣泛應用。2. 數(shù)字化轉(zhuǎn)型促進
    的頭像 發(fā)表于 12-18 14:13 ?2738次閱讀
    <b class='flag-5'>液冷</b><b class='flag-5'>服務器</b>行業(yè)分類及產(chǎn)業(yè)鏈分析

    液冷服務器發(fā)展歷程及產(chǎn)業(yè)鏈分析

    根據(jù)散熱方法,可以將液冷服務器分為直接液冷和間接液冷兩類。其中直接液冷包括噴淋式液冷系統(tǒng)和浸沒式
    的頭像 發(fā)表于 12-04 11:24 ?3457次閱讀
    <b class='flag-5'>液冷</b><b class='flag-5'>服務器</b>發(fā)展歷程及產(chǎn)業(yè)鏈分析

    gpu服務器是干什么的 gpu服務器與cpu服務器的區(qū)別

     相比于傳統(tǒng)的CPU服務器,GPU服務器支持同時計算大量相似的計算操作,可以實現(xiàn)更強的并行計算性能。GPU服務器通常配備多個高性能的
    的頭像 發(fā)表于 12-02 17:20 ?1840次閱讀