0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為高性能計算應(yīng)用構(gòu)建更節(jié)能的SoC

新思科技 ? 來源:新思科技 ? 2024-09-13 13:19 ? 次閱讀

今天是世界環(huán)境日,一個提醒我們關(guān)注我們的土地,我們的未來的日子。能源利用效率是可持續(xù)發(fā)展的關(guān)鍵所在。萬物智能時代,海量數(shù)據(jù)的處理和人工智能技術(shù)的快速發(fā)展,給全球能源供給帶來前所未有的壓力。

據(jù)統(tǒng)計,數(shù)據(jù)中心和數(shù)據(jù)傳輸網(wǎng)絡(luò)消耗了全球約1%的電力。人工智能日益普及,神經(jīng)網(wǎng)絡(luò)和大語言模型對底層硬件和軟件基礎(chǔ)架構(gòu)的需求將急劇攀升。對于未來幾年的電力影響,各方預(yù)測不盡相同。極端的預(yù)測是:能源消耗最終將超過全球電力供應(yīng)。

無論哪種預(yù)測是正確的,超大規(guī)模數(shù)據(jù)中心的能耗都是必須要立即處理的迫切問題。那么,如何在不影響性能目標(biāo)的前提下,為高性能計算(HPC)應(yīng)用構(gòu)建更節(jié)能的SoC呢?

本文將重點介紹為什么在一開始就解決設(shè)計的能效問題至關(guān)重要。我們還將進一步討論有關(guān)低功耗設(shè)計的工具和技術(shù)。

追求優(yōu)異的性能功耗比

云計算AI模型正日益占據(jù)主導(dǎo)地位,實時數(shù)據(jù)處理和分析已成為許多應(yīng)用不可或缺的功能。以配備高級駕駛輔助系統(tǒng)(ADAS)的車輛為例,它們需要依賴實時處理和分析來確保關(guān)鍵安全功能可以正常發(fā)揮作用,比如盲點檢測和自動制動。海量數(shù)據(jù)(更不用說更大的AI模型)需要強大的算力,這已成為一個不可回避的事實。

一直以來,HPC應(yīng)用非??粗匦阅鼙憩F(xiàn)。然而,隨著對電網(wǎng)停電等不利事件的擔(dān)憂與日俱增,人們越來越關(guān)注性能功耗比。正因為如此,我們開始注意到大家對全面提升能效的興趣愈發(fā)濃厚。在某些情況下,性能會受到功耗或能耗的限制。有時,系統(tǒng)無法以目標(biāo)速度運行,原因就在于其功耗太大。鑒于此,如果可以降低設(shè)計的能耗,并確保系統(tǒng)處于其功耗限制范圍內(nèi),那么就有機會提高系統(tǒng)的運行速度,使其接近其性能極限。

但問題是,若是等到設(shè)計過程的最后階段才考慮解決能效問題,往往已經(jīng)來不及,因為到那時,架構(gòu)已經(jīng)定義好,許多設(shè)計決策已做出,其間的每一個決策都會對功耗產(chǎn)生影響。在物理實現(xiàn)過程中,有時確實可以從設(shè)計中壓榨出一些功耗,但收效甚微。

我們需要的是一種整體左移思維,即設(shè)計團隊首先要定義:高能效的架構(gòu)應(yīng)該是什么樣子?需要什么類型的IP,應(yīng)選擇數(shù)字信號處理(DSP)內(nèi)核,還是用于特定功能的硬件加速器?系統(tǒng)應(yīng)該運行多快?能否在適當(dāng)?shù)臅r候關(guān)閉設(shè)計的某些部分?是否可以降低時鐘頻率來節(jié)省功耗?內(nèi)存子系統(tǒng)應(yīng)采用怎樣的架構(gòu)?芯片應(yīng)該采用什么樣的工藝技術(shù)來設(shè)計?以上僅列舉了與設(shè)計功耗相關(guān)的一小部分關(guān)鍵問題。

現(xiàn)在許多開發(fā)者會根據(jù)實際應(yīng)用的工作負載來評估能耗,這確實是一種明智的方法。分析功耗曲線可以捕獲降低功耗的相關(guān)線索,比如修改微架構(gòu)、優(yōu)化軟件/硬件等等。幸運的是,現(xiàn)在有很多工具可以實現(xiàn)這一點。以AI初創(chuàng)公司SiMa.ai為例,該公司開發(fā)了一個專門的軟件優(yōu)先平臺,可以在嵌入式邊緣擴展機器學(xué)習(xí)(ML)。在2023年SNUG硅谷大會上,SiMa.ai重點介紹了如何使用硬件加速驅(qū)動型功耗分析來優(yōu)化其設(shè)計的硬件架構(gòu)、軟件和編譯器,從而將性能功耗比提高2.5倍。

在AI/ML設(shè)計和那些需要大量數(shù)據(jù)處理的設(shè)計中,毛刺功耗,即由于不必要的轉(zhuǎn)換或冗余活動而浪費的功耗,可能占到設(shè)計總功耗的25%。RTL到門級毛刺功耗分析和優(yōu)化解決方案可以協(xié)助識別毛刺功耗的源頭,讓開發(fā)者了解這些源頭產(chǎn)生了多少毛刺功耗。雖然AI應(yīng)用對功耗提出了更高的需求,但AI驅(qū)動型電子設(shè)計自動化(EDA)解決方案可以協(xié)助優(yōu)化功耗、性能和面積。將來,也許可以應(yīng)用AI來創(chuàng)建更節(jié)能的RTL代碼,或是協(xié)助定義/改進設(shè)計的架構(gòu)。

低功耗芯片設(shè)計之路

一直以來,開發(fā)者往往需要通過更先進的工藝技術(shù)來改善功耗。但隨著摩爾定律趨近極限,開發(fā)者把注意力轉(zhuǎn)向了新材料。光子IC利用了光的特性,諸多實踐已證明其能夠提高帶寬和速度,同時降低功耗和延遲。對于AI聊天機器人和其他HPC應(yīng)用,光子IC有望成為未來的前進方向。與此同時,對氮化鎵、碳化硅等半導(dǎo)體替代材料的探索也將帶來一些選擇。

總的來說,每一個看似微小的決定都會對芯片的整體功耗產(chǎn)生深遠影響。從探索新材料和設(shè)計技術(shù),到改善設(shè)計和驗證工具,研發(fā)工作還有著非常大的發(fā)展空間。在設(shè)計之初就將能效考慮在內(nèi)是一個良好的開端。為了幫助開發(fā)者實現(xiàn)更節(jié)能的SoC,新思科技提供了面向低功耗設(shè)計的端到端解決方案,其中涵蓋設(shè)計、驗證和IP等多個方面。

現(xiàn)代精英人才不斷引領(lǐng)創(chuàng)新,為我們帶來了ChatGPT、自動駕駛汽車和工業(yè)機器人等前沿技術(shù)。然而,全球電力需求正迅猛增長,我們?nèi)云惹幸蕾囉陂_發(fā)者的智慧與才能,探索更多降低芯片功耗的有效方法。節(jié)能SoC將在今后的世界中變得越來越重要。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4021

    瀏覽量

    217042
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266240
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    775

    瀏覽量

    50191
  • 高性能計算
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    13350

原文標(biāo)題:降低高性能計算SoC設(shè)計能耗的最佳時機是什么?

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    使用超聲波發(fā)送器和接收器構(gòu)建高性能NDT系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《使用超聲波發(fā)送器和接收器構(gòu)建高性能NDT系統(tǒng).pdf》資料免費下載
    發(fā)表于 08-28 11:00 ?0次下載
    使用超聲波發(fā)送器和接收器<b class='flag-5'>構(gòu)建</b><b class='flag-5'>高性能</b>NDT系統(tǒng)

    帶你了解什么是高性能計算(HPC)

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進入HPC大周期,高性能計算的發(fā)展水平已經(jīng)成為衡量一個國家綜合實力和高科技發(fā)展水平的重要標(biāo)志,美國、歐盟、日本、英國都高度重視高性能計算
    的頭像 發(fā)表于 07-20 08:28 ?309次閱讀
    帶你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>(HPC)

    何為ESP8266構(gòu)建自定義盾牌?

    我正在尋找某種如何為ESP8266構(gòu)建自定義盾牌的指南。 到目前為止,我已經(jīng)使用 NODEMCU 構(gòu)建了功能原型,但我現(xiàn)在想簡化事情并使其更小。 1. 是否有一些書面的、開放的硬件指南 (很好
    發(fā)表于 07-08 07:17

    芯品# 高性能計算芯片

    (LSE:AWE)是全球技術(shù)基礎(chǔ)設(shè)施高速連接和計算芯片的全球領(lǐng)導(dǎo)者,與Arm合作開發(fā)基于Arm ? Neoverse?計算子系統(tǒng)(CSS)的高級計算芯片,用于人工智能/機器學(xué)習(xí)(AI/ML),
    的頭像 發(fā)表于 06-27 10:28 ?2244次閱讀

    高性能計算集群的能耗優(yōu)化

    高性能計算(HighPerformanceComputing,HPC)是指利用大規(guī)模并行計算機集群來解決復(fù)雜的科學(xué)和工程問題的技術(shù)。高性能計算
    的頭像 發(fā)表于 05-25 08:27 ?231次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群的能耗優(yōu)化

    高性能計算的原理與實踐:從基本概念到架構(gòu)解析

    高性能計算的概念最早可以追溯到上世紀(jì)40年代,當(dāng)時為了進行原子彈的設(shè)計和模擬,美國建造了第一臺電子數(shù)字計算機[ENIAC],它可以每秒執(zhí)行約5000次運算,相當(dāng)于當(dāng)時最快的機械計算器的
    的頭像 發(fā)表于 05-11 08:27 ?329次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>的原理與實踐:從基本概念到架構(gòu)解析

    構(gòu)建高性能計算芯片

    計算的異構(gòu)多核架構(gòu),對整個芯片行業(yè)的高性能 CPU 開發(fā)產(chǎn)生了影響。 這些芯片都不太可能進行商業(yè)銷售。它們針對特定的數(shù)據(jù)類型和工作負載進行了優(yōu)化,設(shè)計預(yù)算龐大,但可以通過提高性能和降低功耗來實現(xiàn)合理化。目標(biāo)是在更小的面積上容納更
    的頭像 發(fā)表于 04-25 10:23 ?1189次閱讀
    <b class='flag-5'>構(gòu)建</b><b class='flag-5'>高性能</b><b class='flag-5'>計算</b>芯片

    介紹一款高性能低功耗的SOC集成無線收發(fā)芯片—XL2409

    XL2409是一款高性能低功耗的SOC集成無線收發(fā)芯片,集成M0核MCU,工作在2.400~2.483GHz世界通用ISM頻段。
    的頭像 發(fā)表于 03-01 16:28 ?1120次閱讀
    介紹一款<b class='flag-5'>高性能</b>低功耗的<b class='flag-5'>SOC</b>集成無線收發(fā)芯片—XL2409

    什么是HPC高性能計算

    高性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機技術(shù),通過合理地組織計算機資源以及運用適合的算法和程序,提高
    的頭像 發(fā)表于 02-19 13:27 ?651次閱讀
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>

    異構(gòu)眾核系統(tǒng)高性能計算架構(gòu)

    隨著計算機技術(shù)的發(fā)展,單核處理器已經(jīng)難以滿足高性能計算的需求,眾核處理器成為了一種有效的解決方案。眾核處理器是指在一個芯片上集成多個處理器核心,通過并行計算
    的頭像 發(fā)表于 11-30 08:27 ?618次閱讀
    異構(gòu)眾核系統(tǒng)<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>架構(gòu)

    高性能計算創(chuàng)客板助您拓展垂直市場

    研揚科技的UPSquared6000是一款高性能工業(yè)計算創(chuàng)客板,具有小巧的外形尺寸(101.6mmx101.6mm),由IntelAtomx6000E/RE、Pentium或CeleronN/J系列
    的頭像 發(fā)表于 11-18 08:05 ?255次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>創(chuàng)客板助您拓展垂直市場

    高性能SoC的“雙引擎”—DDR與PCIe

    SoC是一種集成電路設(shè)計,將計算機系統(tǒng)的各個功能組件集成在一塊芯片上。傳統(tǒng)的FPGA和MCU單片機也是集成電路,但SoC在功能上更加復(fù)雜、完整。
    的頭像 發(fā)表于 11-15 12:36 ?1368次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>SoC</b>的“雙引擎”—DDR與PCIe

    為什么LED會比白熾燈節(jié)能?

    為什么LED會比白熾燈節(jié)能
    發(fā)表于 10-30 06:14

    SoC中實現(xiàn)的計算單元

    SoC中實現(xiàn)的計算單元 當(dāng)前的自動駕駛/先進駕駛輔助系統(tǒng)片上系統(tǒng)(SoC)通過集成不同計算特性的計算元件
    的頭像 發(fā)表于 10-04 10:34 ?415次閱讀
    在<b class='flag-5'>SoC</b>中實現(xiàn)的<b class='flag-5'>計算</b>單元

    【昉·星光 2 高性能RISC-V單板計算機體驗】星光 2 功耗測評

    ,具有更強大的圖像處理能力,如能進行3D圖像渲染。憑借其高性能和對OpenCL、OpenGL ES、Vulkan的支持,昉·驚鴻7110智能,更高效。昉·驚鴻7110既能完成一系列復(fù)雜的圖像/視頻
    發(fā)表于 09-28 10:34