0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片成為耗電大戶(hù),負(fù)載功耗接近一個(gè)小國(guó)家?

手機(jī)技術(shù)資訊 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 2023-11-25 17:10 ? 次閱讀

如今,對(duì)人工智能的需求巨大。法國(guó)施耐德電氣公司估計(jì),2023年人工智能工作負(fù)載的功耗總計(jì)約為4.3吉瓦(GW),略低于塞浦路斯國(guó)家2021年的功耗( 4.7吉瓦)。該公司預(yù)計(jì),人工智能工作負(fù)載的功耗將以26%至36%的復(fù)合年增長(zhǎng)率(CAGR)增長(zhǎng),這意味著到2028年,人工智能工作負(fù)載的功耗將從13.5吉瓦增至20吉瓦,這比冰島2021年消費(fèi)的電力消耗還要多。

巨大的電力需求

據(jù)施耐德電氣稱(chēng),到 2023 年,所有數(shù)據(jù)中心的總功耗預(yù)計(jì)將達(dá)到 54 GW,其中人工智能工作負(fù)載將占到 4.3 GW。在這些人工智能工作負(fù)載中,訓(xùn)練和推理之間的分配特點(diǎn)是 20% 的功耗用于訓(xùn)練目的,80% 分配給推理任務(wù)。這意味著人工智能工作負(fù)載將占今年數(shù)據(jù)中心總功耗的約8%。

展望 2028 年,施耐德預(yù)計(jì)數(shù)據(jù)中心的總能耗將增至 90 吉瓦,其中人工智能工作負(fù)載的能耗將達(dá)到 13.5 吉瓦至 20 吉瓦。這表明,到 2028 年,人工智能可能消耗數(shù)據(jù)中心總用電量的 15% 至 20% 左右,這表明數(shù)據(jù)中心人工智能工作負(fù)載的功耗比例在五年內(nèi)顯著增加。根據(jù)施耐德電氣的估計(jì),訓(xùn)練和推理之間的分布預(yù)計(jì)將略有變化,訓(xùn)練消耗 15% 的電力,推理則占 85%。

AI GPU 變得更加“饑餓”

人工智能數(shù)據(jù)中心功耗不斷上升的主要原因是人工智能工作負(fù)載的加劇、人工智能GPU和人工智能處理器的進(jìn)步以及其他數(shù)據(jù)中心硬件的要求不斷增加。例如,Nvidia 2020 年的 A100 功耗高達(dá) 400W,而 2022 年的 H100 功耗高達(dá) 700W。除了 GPU 之外,AI 服務(wù)器還運(yùn)行耗電的 CPU 和網(wǎng)卡。

AI 工作負(fù)載,尤其是與訓(xùn)練相關(guān)的工作負(fù)載,需要大量計(jì)算資源,包括配備 AI GPU、專(zhuān)用 ASIC 或 CPU 的專(zhuān)用服務(wù)器。人工智能集群的規(guī)模受人工智能模型的復(fù)雜性和規(guī)模的影響,是功耗的主要決定因素。更大的人工智能模型需要更多數(shù)量的 GPU,從而增加總體能源需求。例如,擁有 22,000 個(gè) H100 GPU 的集群使用大約 700 個(gè)機(jī)架?;?H100 的機(jī)架在安裝八臺(tái) HPE Cray XD670 GPU 加速服務(wù)器時(shí),機(jī)架總密度為 80 kW。施耐德電氣指出,因此,整個(gè)集群需要大約 31 兆瓦的電力,這還不包括冷卻等額外基礎(chǔ)設(shè)施需求所需的能源。

這些集群和 GPU 在整個(gè)訓(xùn)練過(guò)程中通常幾乎滿(mǎn)負(fù)荷運(yùn)行,確保平均能耗幾乎與峰值功耗相同。該文件指出,大量AI集群的機(jī)架密度在30kW到100kW之間,具體取決于GPU的數(shù)量和型號(hào)。

網(wǎng)絡(luò)延遲在人工智能數(shù)據(jù)中心的功耗中也起著至關(guān)重要的作用。復(fù)雜的網(wǎng)絡(luò)基礎(chǔ)設(shè)施對(duì)于支持分布式訓(xùn)練過(guò)程中強(qiáng)大的 GPU 所需的高速數(shù)據(jù)通信至關(guān)重要。對(duì)高速網(wǎng)絡(luò)電纜和基礎(chǔ)設(shè)施(例如能夠支持高達(dá) 800 Gb/s 速度的電纜和基礎(chǔ)設(shè)施)的需求進(jìn)一步增加了總體能耗。

鑒于人工智能工作負(fù)載需要高耗電的 ASIC、GPU、CPU、網(wǎng)卡和 SSD,冷卻構(gòu)成了重大挑戰(zhàn)。鑒于高機(jī)架密度和計(jì)算過(guò)程中產(chǎn)生的巨大熱量,有效的冷卻解決方案對(duì)于保持最佳性能并防止硬件故障或失效至關(guān)重要。與此同時(shí),空氣和液體冷卻方法在功耗方面也“昂貴”,這就是為什么它們也對(duì)用于人工智能工作負(fù)載的數(shù)據(jù)中心的功耗造成很大影響。

一些建議

施耐德電氣預(yù)計(jì)AI硬件的功耗不會(huì)很快降低,公司充分預(yù)計(jì)AI機(jī)架的功耗將達(dá)到100kW或更高。因此,施耐德電氣對(duì)專(zhuān)門(mén)處理人工智能工作負(fù)載的數(shù)據(jù)中心提出了一些建議。

施耐德電氣特別建議從傳統(tǒng)的120/208V過(guò)渡到240/415V配電,以更好地適應(yīng)人工智能工作負(fù)載的高功率密度。對(duì)于冷卻,建議從空氣冷卻轉(zhuǎn)向液體冷卻,以提高處理器的可靠性和能源效率,盡管沉浸式冷卻可能會(huì)產(chǎn)生更好的效果。使用的貨架應(yīng)更寬敞,其規(guī)格例如寬度至少為 750 毫米,靜態(tài)承重能力大于 1,800 公斤。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1175

    瀏覽量

    119995
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2794

    瀏覽量

    116686
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46077

    瀏覽量

    235222
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5749
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1829

    瀏覽量

    34674

原文標(biāo)題:AI芯片成為耗電大戶(hù),負(fù)載功耗接近一個(gè)小國(guó)家

文章出處:【微信號(hào):Mobile-Info,微信公眾號(hào):手機(jī)技術(shù)資訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    款4644芯片功耗設(shè)計(jì)思路解析

    ASP4644芯片個(gè)4通道輸出的DCDC轉(zhuǎn)換器,它內(nèi)置功率MOSFET和電感,適用于4-15V的寬輸入電壓范圍,每通道可輸出0.6~5V電壓,最大可驅(qū)動(dòng)5A的負(fù)載。對(duì)于更大的
    發(fā)表于 08-16 14:44

    THP210單端轉(zhuǎn)差分輸出異常的原因?

    THP210的測(cè)試電路如上。輸入的信號(hào)是DC 1V信號(hào),測(cè)THP210的pin4腳是接近+15V,pin5腳是接近-15V。即差分輸出接近電源軌。上電后芯片
    發(fā)表于 07-30 06:15

    功耗BLE Mesh耗電量很大的原因?

    開(kāi)發(fā)板電流90mA,成功連接后LED燈熄滅電流為80mA。但是這個(gè)電流距離低功耗相差的太遠(yuǎn),比如使用power_save?;畹膚ifi上電后電流也才20mA,為何這個(gè)低功耗BLE Mesh耗電量這么大,想請(qǐng)教
    發(fā)表于 06-18 08:12

    日本EdgeCortix推出省電AI芯片,耗電量大幅降低

    日本半導(dǎo)體芯片設(shè)計(jì)領(lǐng)域的創(chuàng)新者EdgeCortix最近宣布,他們已經(jīng)成功研發(fā)出款專(zhuān)為生成式AI運(yùn)算處理設(shè)計(jì)的新型半導(dǎo)體芯片。這款芯片不僅采
    的頭像 發(fā)表于 06-17 15:09 ?494次閱讀

    芯片功耗提升,散熱面臨挑戰(zhàn)!

    所有個(gè)人電腦出貨量的60%,AI有望提振消費(fèi)者需求。2023年10月,高通正式發(fā)布驍龍8Gen3處理器,該處理器將會(huì)成為2024年安卓旗艦的標(biāo)配處理器,包含個(gè)基于
    的頭像 發(fā)表于 06-05 08:10 ?566次閱讀
    <b class='flag-5'>芯片</b><b class='flag-5'>功耗</b>提升,散熱面臨挑戰(zhàn)!

    AI芯片哪里買(mǎi)?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    大模型為何成耗能大戶(hù)

    除了耗電,另有研究顯示,AI大語(yǔ)言模型GPT-3在訓(xùn)練期間耗水近700噸,每回答20個(gè)至50個(gè)問(wèn)題就要消耗500毫升水。弗吉尼亞理工大學(xué)研究指出,Meta公司在2022年使用了超過(guò)26
    的頭像 發(fā)表于 04-29 17:25 ?537次閱讀

    risc-v多核芯片AI方面的應(yīng)用

    RISC-V多核芯片AI方面的應(yīng)用主要體現(xiàn)在其低功耗、低成本、靈活可擴(kuò)展以及能夠更好地適應(yīng)AI算法的不同需求等特點(diǎn)上。 首先,RISC-V適合用于高效設(shè)計(jì)實(shí)現(xiàn),其內(nèi)核面積更小,
    發(fā)表于 04-28 09:20

    適用于電力載波通信的低功耗電力線(xiàn)過(guò)零檢芯片CN71102

    適用于電力載波通信的低功耗電力線(xiàn)過(guò)零檢芯片CN71102
    的頭像 發(fā)表于 04-18 09:39 ?559次閱讀
    適用于電力載波通信的低<b class='flag-5'>功耗電</b>力線(xiàn)過(guò)零檢<b class='flag-5'>芯片</b>CN71102

    功耗 高性能M0芯片亮點(diǎn)(1~3): 低功耗 寬電壓 PWM (無(wú)須擔(dān)心耗電問(wèn)題!)

    M0芯片(MG32F02V032), 極適合用在對(duì)功耗敏感的應(yīng)用, 如: 戶(hù)外儲(chǔ)能/鋰電池管理, 智能手環(huán), 智能電子鎖, 無(wú)線(xiàn)充電, 小家電(咖啡機(jī)), …等, 無(wú)須擔(dān)心老是耗電問(wèn)題! #笙泉科技MG32F02V032
    發(fā)表于 03-15 16:53

    功耗設(shè)計(jì)的幾個(gè)誤區(qū)分享

    FPGA功耗的根本方法。 誤區(qū)五:這些小芯片功耗都很低,不用考慮 點(diǎn) 評(píng):對(duì)于內(nèi)部不太復(fù)雜的芯片功耗是很難確定的,它主要由引腳上的電
    發(fā)表于 01-09 08:04

    一個(gè)芯片不同封裝的原因

    一個(gè)芯片的不同封裝可能是為了滿(mǎn)足不同的應(yīng)用需求和設(shè)計(jì)要求。不同的封裝可以影響芯片功耗、散熱性能、引腳數(shù)量和布局等方面。
    的頭像 發(fā)表于 12-18 18:15 ?935次閱讀

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37

    在物聯(lián)網(wǎng)里GPRS模塊耗電是很高的,怎么控制功耗

    在物聯(lián)網(wǎng)里GPRS模塊耗電是很高的,那般都是怎么控制功耗的。
    發(fā)表于 11-06 06:39

    功耗電路電池電壓測(cè)量pcb設(shè)計(jì)

    相信大家都遇到過(guò)低功耗電路電池電量檢測(cè)的PCB設(shè)計(jì)。如何測(cè)量電池的電壓呢?采用運(yùn)放來(lái)進(jìn)行測(cè)量肯定不考慮,因?yàn)檫\(yùn)放也是耗電單元。
    的頭像 發(fā)表于 10-15 15:18 ?1654次閱讀
    低<b class='flag-5'>功耗電</b>路電池電壓測(cè)量pcb設(shè)計(jì)