液冷NVIDIA A100 PCIe GPU能夠滿足客戶對高性能綠色數(shù)據(jù)中心的需求,在主流服務(wù)器GPU中尚屬首例。
為了遏制氣候變化,全球企業(yè)正在加快構(gòu)建高性能、高能效的數(shù)據(jù)中心,Equinix邊緣基礎(chǔ)設(shè)施主管Zac Smith也參與其中。
他所效力的Equinix是一家全球服務(wù)提供商,旗下管理的數(shù)據(jù)中心超過240個,致力于在業(yè)內(nèi)率先實現(xiàn)氣候中和。
“一萬家客戶依賴Equinix達成氣候中和的目標。他們需要更大量的數(shù)據(jù)以及更高水平的智能,而這通常有賴于AI,且他們希望能夠以一種具有可持續(xù)性的方式來實現(xiàn)?!盨mith說道。2000年代初還在茱莉亞音樂學院讀研的他,為紐約的音樂家同僚們搭建了網(wǎng)站,由此與技術(shù)結(jié)下不解之緣。
能效穩(wěn)步提升
截至4月,Equinix已發(fā)行49億美元的綠色債券。Equinix將通過這些投資工具來優(yōu)化電源使用效率(PUE),以期減少對環(huán)境的影響。PUE是一種行業(yè)指標,用于衡量數(shù)據(jù)中心使用的能源有多少直接用于計算任務(wù)。
數(shù)據(jù)中心運營商正試圖將PUE降至接近1.0的理想水平。Equinix設(shè)施目前的平均PUE為1.48,而其旗下新數(shù)據(jù)中心的PUE最低可低于1.2。
從PUE來看,Equinix正在穩(wěn)步提升數(shù)據(jù)中心的能效
Equinix于1月新啟動了一個專門用于提升能效的設(shè)施,在此方向上更進一步。其中一部分工作側(cè)重于液冷技術(shù)。
液冷技術(shù)誕生于大型機時代,在AI時代日臻成熟。如今,液冷技術(shù)已經(jīng)以直接芯片(Direct-to-Chip)冷卻的形式廣泛應(yīng)用于全球高速超級計算機。
NVIDIA GPU在AI推理和高性能計算方面的能效已比CPU高出20倍,而加速計算也順理成章地將采用液冷技術(shù)。
通過加速提高效率
如果將全球所有運行AI和HPC的CPU服務(wù)器切換為GPU加速系統(tǒng),每年可節(jié)省高達11萬億瓦時的能源。節(jié)約的能源量可供150多萬套房屋使用一年。
今日,NVIDIA發(fā)布了率先采用直接芯片(Direct-to-Chip)冷卻技術(shù)的數(shù)據(jù)中心PCIe GPU,為可持續(xù)發(fā)展貢獻了自己的力量。
Equinix正在驗證A100 80GB PCIe液冷GPU在其數(shù)據(jù)中心的應(yīng)用,這也是該公司為實現(xiàn)可持續(xù)性冷卻和熱量捕獲的綜合性方案中的一部分。GPU現(xiàn)已進入試用階段,預(yù)計將于今年夏季正式發(fā)布。
節(jié)約用水和用電
“這是我們實驗室中引入的首款液冷GPU,我們倍感興奮,因為客戶迫切希望通過可持續(xù)的方式來利用AI,”Smith說道。
數(shù)據(jù)中心運營商旨在淘汰用于冷卻數(shù)據(jù)中心內(nèi)部氣體的冷水機組,因其每年會蒸發(fā)數(shù)百萬加侖的水量。而借助液冷技術(shù),系統(tǒng)僅需對封閉系統(tǒng)中的少量液體進行循環(huán)利用,并能夠著重于主要的發(fā)熱點。
Smith說:“我們將變廢為寶?!?br />
同等性能,更少耗電
在單獨的測試中,Equinix和NVIDIA均發(fā)現(xiàn):采用液冷技術(shù)的數(shù)據(jù)中心工作負載可與風冷設(shè)施持平,同時消耗的能源減少了約30%。NVIDIA估計,液冷數(shù)據(jù)中心的PUE可能達到1.15,遠低于風冷的PUE 1.6。
在空間相同的條件下,液冷數(shù)據(jù)中心可以實現(xiàn)雙倍的計算量。這是由于A100 GPU僅使用一個PCIe插槽,而風冷A100 GPU需使用兩個PCIe插槽。
NVIDIA借助液冷技術(shù)達到了節(jié)省電力和增加密度的效果
至少有十幾家系統(tǒng)制造商計劃于今年晚些時候在其產(chǎn)品中使用液冷GPU,包括華碩(ASUS)、永擎電子(ASRock Rack)、富士康工業(yè)互聯(lián)網(wǎng)(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新華三(H3C)、浪潮(Inspur)、英業(yè)達(Inventec)、寧暢(Nettrix)、云達科技(QCT)、超微(Supermicro)、緯穎科技(Wiwynn)和超聚變(xFusion)。
全球趨勢
在亞洲、歐洲和美國,制定能效標準的法規(guī)尚未確定。這也推動了銀行和其他大型數(shù)據(jù)中心運營商紛紛加入液冷技術(shù)評估的隊伍。
液冷技術(shù)的使用范圍并不局限于數(shù)據(jù)中心,汽車和其他系統(tǒng)也需要利用該項技術(shù)來冷卻封閉空間內(nèi)的高性能系統(tǒng)。
可持續(xù)發(fā)展之路
“我們即將開啟新的旅程,”Smith談及這一采用液冷技術(shù)的主流加速器首次亮相時如是說。
事實上,NVIDIA計劃于明年推出的一版A100 PCIe卡中搭載基于NVIDIA Hopper架構(gòu)的H100 Tensor Core GPU。近期內(nèi),NVIDIA計劃將液冷技術(shù)應(yīng)用于自有高性能數(shù)據(jù)中心GPU和NVIDIA HGX平臺。
為推動快速采用,今日發(fā)布的液冷GPU可在減少能耗的同時維持性能不變。未來,我們期望這些卡在使用同等能源的條件下,展現(xiàn)更出色的性能,滿足用戶所需。
“僅僅測量功率沒有意義,降低碳排放的同時提升性能才是我們努力的方向,” Smith說道。
詳細了解NVIDIA全新發(fā)布的A100 PCIe液冷GPU。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4862瀏覽量
102722 -
gpu
+關(guān)注
關(guān)注
28文章
4678瀏覽量
128613 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8979瀏覽量
85100
發(fā)布評論請先 登錄
相關(guān)推薦
評論