0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助電源完整性測試提高人工智能數(shù)據(jù)中心的能效

泰克科技 ? 來源:泰克科技 ? 2024-07-30 09:36 ? 次閱讀

數(shù)據(jù)中心

數(shù)據(jù)中心正在部署基于人工智能 (AI) 的技術(shù),處理器密集型服務(wù)器正在推動(dòng)能源需求的增長,下表說明了這種發(fā)展趨勢所帶來的巨大影響。國際能源署 (IEA) 預(yù)測,到2030年,數(shù)據(jù)中心的耗電量將占全球耗電量的7%,相當(dāng)于印度全國的耗電量。

99d595f6-4e10-11ef-b8af-92fbcf53809c.png

圖1:數(shù)據(jù)中心CPUGPU技術(shù)的功耗

由于電力需求不斷增長,關(guān)注能源效率至關(guān)重要。泰克知名電源完整性專家 Steve Sandler 合作,開發(fā)了出色的測量技術(shù),旨在改進(jìn)下一代人工智能數(shù)據(jù)中心的運(yùn)營效率/能效。

提高電源分配網(wǎng)絡(luò)(PDN)的能效提高供電網(wǎng)絡(luò)(PDN)的能源效率

PDN必須為驅(qū)動(dòng)服務(wù)器機(jī)架中的GPU敏感負(fù)載提供許多低噪聲直流電源軌。追求更高速度和更高密度意味著,需要在更低電壓水平和更大電流下實(shí)現(xiàn)更快邊緣速率、更高頻率和更多軌道。這突顯了良好電源完整性的重要性。PDN必須為驅(qū)動(dòng)這些服務(wù)器機(jī)架中GPU的敏感負(fù)載提供許多低噪聲直流電源軌。追求更高的速度和更高的密度意味著更快的邊沿速率、更高的頻率和更多的電源軌,但電壓水平更低,電流更高,如上圖所示。這強(qiáng)調(diào)了良好的電源完整性。

進(jìn)行電源完整性測試的目的是,驗(yàn)證到達(dá)負(fù)載點(diǎn) (POL)的電壓和電流在所有預(yù)期運(yùn)行條件下是否滿足負(fù)載的電源軌規(guī)格要求。要在千兆赫頻率下準(zhǔn)確測量毫伏級(jí)電源軌噪聲,尤其需要注意。進(jìn)行電源完整性測量的目的是驗(yàn)證在所有預(yù)期工作條件下到達(dá)負(fù)載點(diǎn)(POL)的電壓和電流是否符合負(fù)載的電源軌規(guī)格。在GHz頻率下,需要特別注意精確測量電源軌噪聲的毫伏。

前所未有的低噪聲測量體驗(yàn)

讓我們通過基于的服務(wù)器系統(tǒng)的電源分配網(wǎng)絡(luò)高能級(jí)結(jié)構(gòu)圖,了解如何評估PDN性能。

如圖所示,典型數(shù)據(jù)中心通過12V、24V或48V直流電源為其基于AI的服務(wù)器供電,然后在主板上將電壓轉(zhuǎn)換為其他電源電壓。工程師能夠查看從電源輸出到FPGA、處理器和其他復(fù)雜IC的鏈路中的每個(gè)環(huán)節(jié),因此可以將電源軌阻抗控制在非常低的水平,以便輸送由GPU技術(shù)驅(qū)動(dòng)的AI服務(wù)器所需的高電流。阻抗管理的棘手之處在于配電網(wǎng)絡(luò)由許多阻抗組成,包括電壓調(diào)節(jié)器、去耦電容器和PCB走線。高速交換和熱插拔服務(wù)器卡會(huì)引入意外的阻抗變化,這可能導(dǎo)致過多的瞬變或噪聲。如圖所示,典型的數(shù)據(jù)中心通過12、24或48V DC電源為其基于AI的服務(wù)器供電,然后將其轉(zhuǎn)換為主板上的其他電源電壓。工程師能夠查看從電源輸出到FPGA、處理器和其他復(fù)雜IC的鏈條中的每個(gè)環(huán)節(jié),因此必須將電源軌阻抗管理在非常低的水平,以便提供由GPU技術(shù)驅(qū)動(dòng)的以AI為中心的服務(wù)器中的高電流。使阻抗管理復(fù)雜化的是,網(wǎng)絡(luò)由許多阻抗組成,包括穩(wěn)壓器、去耦電容器和PCB走線。高速交換和熱插拔服務(wù)器卡會(huì)帶來意想不到的阻抗變化,從而導(dǎo)致過多的瞬變或噪聲。

要確保穩(wěn)定節(jié)能的設(shè)計(jì),首先要最大限度地減少PDN中的噪聲。電源軌噪聲規(guī)格可以達(dá)到數(shù)百兆赫或數(shù)千兆赫的頻率范圍,其幅度達(dá)到毫伏級(jí)。要確保穩(wěn)定、節(jié)能的設(shè)計(jì),首先要將PDN中的噪聲降至最低。電源軌上的噪聲規(guī)格可以上升到MHz或GHz頻率范圍,幅度以毫伏為單位。

評估能效首先要對交流線路輸入和輸出進(jìn)行電能質(zhì)量測量,以確保線電壓和線電流符合要求。

用于評估質(zhì)量的測量值如下所示:

? 頻率

?有效電壓和電流

?有效值

? 阻抗阻抗

? 波峰因數(shù)(電壓和電流)波峰因數(shù)(電壓和電流

? 有功功率、無功功率和視在功率真實(shí)功率、無功功率和視在功率

? 功率因數(shù)和相位功率因數(shù)和相位

為了確保準(zhǔn)確進(jìn)行這些測量,示波器探頭的選擇非常重要;使用差分探頭測量系統(tǒng)的線電壓,使用電流探頭測量系統(tǒng)的線電流。確保這些測量準(zhǔn)確無誤;示波器探頭的選擇很重要;使用差分探頭測量系統(tǒng)的線路電壓,使用電流探頭測量系統(tǒng)的線路電流。

另一個(gè)關(guān)鍵測量是對PDN控制環(huán)路響應(yīng)進(jìn)行頻率響應(yīng)分析。這將提供有關(guān)控制環(huán)路速度和電源穩(wěn)定性的重要信息。借助波特圖查看分析結(jié)果,圖3中是示例設(shè)置。

9f2b3f1a-4e10-11ef-b8af-92fbcf53809c.png

圖3:電源分配網(wǎng)絡(luò)阻抗的測量設(shè)置

電源完整性探測系統(tǒng)應(yīng)受重視電源完整性探測系統(tǒng)值得關(guān)注

當(dāng)今示波器配備的高阻抗10X無源探頭可能具有足夠的帶寬,但會(huì)使您想要測量的噪聲信號(hào)發(fā)生衰減。1X探頭可無衰減地傳遞噪聲信號(hào),但其帶寬僅為幾百兆赫。具有50?輸入阻抗的傳輸線探頭或電纜具有出色的高頻性能,但在直流情況下會(huì)產(chǎn)生顯著負(fù)載,除非增加直流隔離器。 衰減傳輸線探頭產(chǎn)生的負(fù)載較小,同時(shí)保持低噪聲和高帶寬。當(dāng)今示波器附帶的高阻抗10X無源探頭可能具有足夠的帶寬,但它們會(huì)衰減您嘗試測量的噪聲信號(hào)。1X探頭通過噪聲信號(hào)而不衰減,但它們被限制在幾個(gè)MHz帶寬內(nèi)。輸入阻抗為50Ω的傳輸線探頭或電纜具有出色的高頻性能,但在直流時(shí)會(huì)造成很大的負(fù)載,除非添加直流模塊。衰減傳輸線探頭提供更少的負(fù)載,同時(shí)保持低噪聲和高帶寬。

電源軌探頭是另一類低噪聲探頭,偏移范圍高達(dá)4GHz,直流偏移范圍為-60至+60Vdc。在識(shí)別噪聲源方面,電源軌探頭是一種比傳統(tǒng)無源探頭更準(zhǔn)確的替代工具,如下圖4所示。根據(jù)電源軌的電壓,可能需要直流阻斷器。如果需要,請確保直流阻斷器為示波器提供浪涌保護(hù),并且不受直流或交流偏置的影響。電源軌探頭雖然能夠測量很小的噪聲,但也是單端測量。 因此,需要使用能夠進(jìn)一步減少測量接地環(huán)路誤差的同軸隔離器。Picotest提供多種直流阻斷器和同軸隔離器來滿足此類需求。詳細(xì)了解終極電源軌噪聲測量。

9f52904c-4e10-11ef-b8af-92fbcf53809c.jpg

圖4:使用無源探頭(下方跡線)和電源軌探頭(上方跡線)的電源線紋波測量比較

快速低噪聲采集與超快速邊緣負(fù)載相結(jié)合,可模擬AI級(jí)處理器工作負(fù)載,從而可以準(zhǔn)確評估PDN設(shè)計(jì)中的電源軌噪聲電壓以及電源軌與電源軌之間的串?dāng)_。在結(jié)合使用泰克5B系列MSO或6B系列MSO示波器的情況下,Picotest提供了完整的負(fù)載設(shè)備系列,最高為2,000安培、1納秒的邊緣負(fù)載,并支持高達(dá)65Ms/s的采樣率,以進(jìn)行精確的模擬實(shí)驗(yàn)。(見圖5)

9f73e670-4e10-11ef-b8af-92fbcf53809c.png

圖5:顯示了對AI級(jí)處理器進(jìn)行偽隨機(jī)高幅度負(fù)載的特性分析

使用Picotest負(fù)載設(shè)備進(jìn)行特性分析,并通過泰克6系列B MSO示波器進(jìn)行測量,可以確保特性分析的準(zhǔn)確性。泰克6系列B MSO示波器是捕獲低噪聲、高分辨率信號(hào)的理想儀器。

示波器測量分析有助于節(jié)省時(shí)間并減少錯(cuò)誤

識(shí)別和分析PDN中的故障點(diǎn)可能耗費(fèi)時(shí)間。在電源分配網(wǎng)絡(luò)中尋找紋波、過沖、欠沖、開啟、關(guān)閉、時(shí)間趨勢、穩(wěn)定時(shí)間和抖動(dòng)信號(hào)是一項(xiàng)復(fù)雜的任務(wù)。值得慶幸的是,當(dāng)今大多數(shù)現(xiàn)代示波器都提供了內(nèi)置分析軟件,用于設(shè)置儀器和自動(dòng)執(zhí)行信號(hào)采集和顯示。下方為波紋自動(dòng)測量示例。將這些特性內(nèi)置到儀器中,再加上具備通過遠(yuǎn)程PC進(jìn)行自動(dòng)化的功能,可以簡化大型團(tuán)隊(duì)的AI性能評估工作,同時(shí),還可以評估AI支持性能隨時(shí)間和溫度的變化情況,以測試服務(wù)器的效率和耐久性。

9ffdb9b8-4e10-11ef-b8af-92fbcf53809c.jpg

圖6:自動(dòng)紋波測量,并在5系列B MSO示波器顯示屏的右側(cè)顯示注釋結(jié)果

總結(jié)

由于人工智能(AI)推動(dòng)下一代數(shù)據(jù)中心的能源需求增長,評估電源分配網(wǎng)絡(luò)(PDN)的性能和效率變得比以往任何時(shí)候都更加重要。隨著人工智能(AI)推高下一代數(shù)據(jù)中心的能源需求;評估供電網(wǎng)絡(luò)的性能和效率變得比以往任何時(shí)候都更加重要。采用良好的PDN測試和測量策略,將會(huì)使AI就緒數(shù)據(jù)中心達(dá)到最佳運(yùn)行性能、可靠性和能效。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4630

    瀏覽量

    71888
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237085
  • 電源完整性
    +關(guān)注

    關(guān)注

    8

    文章

    207

    瀏覽量

    20697

原文標(biāo)題:借助電源完整性測試提高人工智能數(shù)據(jù)中心的能效

文章出處:【微信號(hào):泰克科技,微信公眾號(hào):泰克科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能會(huì)把人類從勞動(dòng)中解放出來嗎

    件事情里特別核心的一件就是大數(shù)據(jù)中心人工智能算法的整合。讓我們一起來引領(lǐng)人工智能和大數(shù)據(jù)時(shí)代的來臨。 在未來大量數(shù)據(jù)的融入、
    發(fā)表于 09-15 14:09

    數(shù)據(jù)人工智能發(fā)展的重要

    件事情里特別核心的一件就是大數(shù)據(jù)中心人工智能算法的整合。讓我們一起來引領(lǐng)人工智能和大數(shù)據(jù)時(shí)代的來臨。 在未來大量數(shù)據(jù)的融入、
    發(fā)表于 10-09 15:26

    人工智能:超越炒作

    如果有一個(gè)真正的指標(biāo)可以衡量新技術(shù)的破壞,那肯定是公眾對恐懼和懷疑的滔滔不絕。如果我們以社會(huì)焦慮作為衡量標(biāo)準(zhǔn),那么目前人工智能(AI)的復(fù)興是開創(chuàng)技術(shù)破壞的良好候選者。人工智能將改
    發(fā)表于 05-29 10:46

    PUE指標(biāo)準(zhǔn)確衡量數(shù)據(jù)中心嗎?

    PUE指標(biāo)準(zhǔn)確衡量數(shù)據(jù)中心嗎?孫長青,注冊暖通工程師,高級(jí)工程師,規(guī)劃設(shè)計(jì)部總工程師,IDC單位設(shè)計(jì)總監(jiān)等,有多年從事數(shù)據(jù)中心規(guī)劃設(shè)計(jì)
    發(fā)表于 07-12 08:06

    PUE指標(biāo)準(zhǔn)確衡量數(shù)據(jù)中心嗎?

    PUE指標(biāo)準(zhǔn)確衡量數(shù)據(jù)中心嗎?數(shù)據(jù)中心PUE的局限有哪些?
    發(fā)表于 07-15 09:09

    什么叫嵌入式人工智能

    是說在云端通過聯(lián)網(wǎng),在數(shù)據(jù)中心的大規(guī)模的計(jì)算去實(shí)現(xiàn)人工智能,而是說在本地計(jì)算,在不聯(lián)網(wǎng)的情況下面實(shí)時(shí)的做環(huán)境感知,做人機(jī)交互,做決策控制。大家想想看,尤其是在自動(dòng)駕駛這樣一個(gè)場景下面,如果突然一個(gè)
    發(fā)表于 10-28 08:43

    綜合管理系統(tǒng)在大型數(shù)據(jù)中心的應(yīng)用

    介紹AcrelEMS-IDC綜合管理系統(tǒng)在某大型數(shù)據(jù)中心的應(yīng)用情況,分析了AcrelEMS-IDC綜合管理系統(tǒng)在各類
    發(fā)表于 02-08 16:26 ?377次閱讀

    NVIDIA 人工智能開講 | BlueField DPU 如何幫助企業(yè)提升數(shù)據(jù)中心

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! 近期,NVIDIA 發(fā)布了 《NVIDIA BlueField DPU 白皮書》。白皮書指出,由于成
    的頭像 發(fā)表于 03-14 10:25 ?503次閱讀

    如何利用全新互連系統(tǒng)提高電源完整性和信號(hào)完整性?

    一種新的連接器系統(tǒng)通過改善電源完整性提高信號(hào)完整性。優(yōu)化電源完整性可提供更大的信號(hào)
    的頭像 發(fā)表于 08-30 10:37 ?1143次閱讀
    如何利用全新互連系統(tǒng)<b class='flag-5'>提高</b><b class='flag-5'>電源</b><b class='flag-5'>完整性</b>和信號(hào)<b class='flag-5'>完整性</b>?

    數(shù)據(jù)中心短缺:人工智能未來的致命阻礙?

    影響人工智能未來的4個(gè)數(shù)據(jù)中心存儲(chǔ)挑戰(zhàn) ● 建設(shè)新數(shù)據(jù)中心的成本 ● 建設(shè)新數(shù)據(jù)中心需要時(shí)間 ● 現(xiàn)有數(shù)據(jù)中心空間不足 ● 功率限制 訓(xùn)練
    的頭像 發(fā)表于 10-20 10:32 ?501次閱讀

    安科瑞數(shù)據(jù)中心管理系統(tǒng):提升,降低運(yùn)營成本

    數(shù)據(jù)中心管理系統(tǒng)是一套功能強(qiáng)大、應(yīng)用廣泛、優(yōu)勢明顯的管理解決方案。通過該系統(tǒng),數(shù)據(jù)中心
    的頭像 發(fā)表于 11-07 15:57 ?544次閱讀
    安科瑞<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統(tǒng):提升<b class='flag-5'>能</b><b class='flag-5'>效</b>,降低運(yùn)營成本

    臺(tái)達(dá)推出提高人工智能服務(wù)器和數(shù)據(jù)中心的下一代電源解決方案

    臺(tái)達(dá)電子(Delta)是電源與散熱管理解決方案的領(lǐng)導(dǎo)廠商,在IEEE應(yīng)用電力電子會(huì)議暨博覽會(huì)(APEC)2024上,推出了提高人工智能(AI)服務(wù)器和數(shù)據(jù)中心
    的頭像 發(fā)表于 04-10 15:06 ?904次閱讀

    安森美新一代技術(shù)助力數(shù)據(jù)中心提升

    人工智能飛速發(fā)展的當(dāng)下,數(shù)據(jù)中心為了滿足日益增長的計(jì)算需求,正面臨巨大的電力挑戰(zhàn)。提高成為行業(yè)關(guān)注的焦點(diǎn),而安森美作為半導(dǎo)體技術(shù)的領(lǐng)
    的頭像 發(fā)表于 06-11 09:56 ?362次閱讀

    安森美推出提高數(shù)據(jù)中心完整電源解決方案

    隨著數(shù)據(jù)中心為了滿足人工智能計(jì)算的龐大處理需求而變得越來越耗電,提高變得至關(guān)重要。安森美(onsemi,美國納斯達(dá)克股票代號(hào):ON)最新一代T10 PowerTrench系列和El
    的頭像 發(fā)表于 06-13 11:01 ?492次閱讀

    安森美引領(lǐng)數(shù)據(jù)中心革命

    在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,數(shù)據(jù)中心作為支撐人工智能、云計(jì)算等關(guān)鍵技術(shù)的基礎(chǔ)設(shè)施,其能耗問題日益凸顯。特別是隨著AI計(jì)算的蓬勃發(fā)展,數(shù)據(jù)中心對電力的需求急劇增加,傳統(tǒng)搜索引擎請求相比,AI引擎的電力消耗更是高達(dá)十倍以上。因此,提升
    的頭像 發(fā)表于 08-12 11:13 ?430次閱讀