0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過并行處理和異構(gòu)SoC超越摩爾定律

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Brandon Lewis ? 2022-07-10 10:24 ? 次閱讀

2021 年嵌入式處理器報告:隨著晶體管擴展的可靠每瓦性能增益接近尾聲,未來幾代處理器將如何訪問有效執(zhí)行要求苛刻的工作負(fù)載所需的計算?我的答案來自異構(gòu) SoC 上的并行處理。

“我們已經(jīng)在 7 nm 上工作了很長時間,在那段時間里,我們不僅看到了摩爾定律的終結(jié),而且還看到了阿姆達(dá)爾定律和丹納德縮放的終結(jié),”硅營銷總監(jiān) Manuel Uhm 說在賽靈思?!斑@意味著,如果我們所做的只是采用 FPGA 并將這些晶體管從我們之前的節(jié)點(即 16 納米)縮小到 7 納米,然后收工,許多試圖遷移完全相同的設(shè)計的客戶可能很可能最終得到的設(shè)計坦率地說沒有任何性能提升,實際上可能會增加功耗。

“很明顯,這是完全錯誤的方式?!?/p>

需要明確的是,將硅晶體管縮小到 7 nm 以下并非不可能;5nm 器件已經(jīng)投入生產(chǎn)。這是因為底層金屬沒有更快地運行,并且電流泄漏正在上升。

同時,在另一個方向上,傳統(tǒng)的多核設(shè)備自身也遇到了擴展限制。當(dāng)然,這些并行處理器在歷史上一直是同質(zhì)的,“而現(xiàn)實情況是,沒有一個處理器架構(gòu)可以優(yōu)化地完成每項任務(wù),”Uhm 爭辯道。“不是 FPGA,不是 CPU,不是 GPU?!?/p>

這并不是說并行性在處理現(xiàn)代應(yīng)用程序呈現(xiàn)的復(fù)雜處理任務(wù)方面沒有優(yōu)勢。事實上,除了摩爾定律和丹納德定標(biāo)之外,并行計算可能是我們在高性能計算 (HPC) 和其他要求苛刻的用例中的最佳選擇。

是的,我們?nèi)匀恍枰⑿刑幚怼5珜儆诋愵悺?/p>

異構(gòu)處理:不僅適用于數(shù)據(jù)中心

如前所述,異構(gòu)并行處理技術(shù)的前沿是對高端應(yīng)用中性能壁壘的回應(yīng)。但這些架構(gòu)在嵌入式計算環(huán)境中也變得越來越普遍。

VDC Research 高級分析師 Dan Mandell 指出,雖然“許多異構(gòu)處理架構(gòu)確實專注于高端應(yīng)用,特別是數(shù)據(jù)中心和 HPC……FPGA SoC 和其他異構(gòu)加速芯片的小型化是最重要的。讓 Microsemi 和 Xilinx 等公司將更多此類設(shè)備帶入智能邊緣基礎(chǔ)設(shè)施,如邊緣/工業(yè)服務(wù)器和物聯(lián)網(wǎng)網(wǎng)關(guān)。”

根據(jù) Mandell 的說法,嵌入式市場中通用異構(gòu)計算平臺的一個關(guān)鍵驅(qū)動因素“是當(dāng)今 OEM 和其他廠商硬件架構(gòu)的承諾猶豫不決?!?他說,這種猶豫是專用加速芯片快速發(fā)展的產(chǎn)物,以及未來幾年邊緣軟件和人工智能生態(tài)系統(tǒng)將產(chǎn)生的框架和工作負(fù)載的不確定性。

他預(yù)計所有這些情況都會“對未來的半導(dǎo)體采購產(chǎn)生重大影響”,以及芯片供應(yīng)商如何處理他們的處理器路線圖。

“當(dāng)今大多數(shù) FPGA SoC 的價格和功率范圍將迫使供應(yīng)商最初專注于相對高端、資源豐富的嵌入式和邊緣應(yīng)用,”Mandell 假設(shè)。“然而,正在積極努力使 FPGA SoC ‘尺寸不可知’,最終甚至支持電池供電的連接設(shè)備。”

因此,隨著異構(gòu)并行處理變得越來越多常見的問題是,嵌入式工程師是否應(yīng)該為系統(tǒng)設(shè)計的范式轉(zhuǎn)變做好準(zhǔn)備?英偉達(dá)副總裁兼嵌入式與邊緣計算總經(jīng)理 Deepu Talla 不這么認(rèn)為。

“如果你仔細(xì)想想,嵌入式處理器總是使用加速器,”Talla 說?!凹词乖?20 年前,也有 Arm CPU,有 DSP,然后在特定硬件中完成視頻編碼/解碼,對吧?它們在某種意義上是固定功能的,但它們都在并行處理事物。

“你需要這樣做的原因是成本、功率、尺寸,”他繼續(xù)說道?!安⑿刑幚砥鞯男时?CPU 高出幾個數(shù)量級?!?/p>

Nvidia 的 Xavier SoC 是其 Jetson Xavier 嵌入式平臺的核心設(shè)備,以及公司將于 2021 年底或 2022 年推出的下一代 Orin 架構(gòu),均配備 GPU、Arm CPU、深度學(xué)習(xí)加速器、視覺加速器、編碼器/解碼器和其他專門的處理模塊(圖 3)。

【圖3 | Nvidia Xavier SoC 配備了基于 Arm 的 Carmel CPU、Volta GPU、深度學(xué)習(xí)和視覺加速器以及其他可以并行處理工作負(fù)載的固定功能計算模塊。]

然而,隨著高級異構(gòu) SoC 變得越來越普遍,嵌入式開發(fā)人員可以期待的一個變化是使用片上網(wǎng)絡(luò) (NoC) 互連,在過去十年中,這種互連從傳統(tǒng)的片上總線(如 AMBA 接口)發(fā)展而來。這提供了“控制如何連接 CPU、GPU、視頻編碼器、深度學(xué)習(xí)加速器、顯示處理器、相機處理器、安全處理器,所有這些東西,”Talla 說。

NoC 有助于加速和優(yōu)化跨 SoC 的塊到塊的數(shù)據(jù)流,這有助于盡可能高效地執(zhí)行工作負(fù)載。例如,NXP 在其多功能 i.MX SoC 系列中利用了 NoC 和傳統(tǒng)總線架構(gòu)。

“異構(gòu)計算是我們多年來一直在實施的東西。NXP Semiconductors, Inc. 邊緣處理業(yè)務(wù)和技術(shù)戰(zhàn)略主管 Gowrishankar Chindalore 博士說,我相信現(xiàn)在是我們真正開始達(dá)到最佳使用點的地方。機器學(xué)習(xí),因為我們今天使用的是 CPU、GPU、DSP 和神經(jīng)處理單元 (NPU)。

“但優(yōu)化的一部分,不僅僅是計算元素。系統(tǒng)周圍的一切都需要發(fā)生,”他繼續(xù)說道?!耙虼耍水悩?gòu)計算之外,我們專注于提高效率的地方,正在關(guān)注芯片分割流水線、視頻流水線、圖形流水線中整個流程的浪費。

“因為我們做得越多,我們在性能方面獲得的效率就越高,顯然,用于執(zhí)行相同功能的能量就越少,”他補充道。

(編者按:閱讀《異構(gòu)多核實現(xiàn)十倍嵌入式內(nèi)存性能的三種方法》)

走向異質(zhì)世界

Mandell引用 VDC Research 的 2020 年物聯(lián)網(wǎng)、嵌入式和移動處理器技術(shù)報告,預(yù)計嵌入式 SoC 的全球市場將“在未來幾年繼續(xù)超過 MPU、MCU、GPU 等分立半導(dǎo)體的商業(yè)市場”,因為 OEM 看起來整合計算資源和多芯片實現(xiàn)。他說,從長遠(yuǎn)來看,對工作負(fù)載加速和處理器優(yōu)化的需求只會“推動進(jìn)一步增長”。

與此同時,我們衡量性能和功耗的方式將不得不改變。正如 The Linley Group 的高級分析師 Mike Demler 在其公司的《深度學(xué)習(xí)處理器指南》中所說,即使是像 TOPS/W 這樣的以 AI 為中心的新基準(zhǔn)測試也“具有誤導(dǎo)性,因為真正的 AI 工作負(fù)載從未達(dá)到接近 100% 的利用率?!?/p>

他說,我們將不得不用“一個真實的工作負(fù)載,比如 Bert NLP 模型,而不是一個基于理論的、基于架構(gòu)的規(guī)范”來衡量諸如電源效率之類的東西。

但是,孤立地測量處理器復(fù)合體是否有意義?它真的很重要嗎?一如既往,重點將放在它在您的系統(tǒng)環(huán)境中提供的內(nèi)容上。

“在使用每個流程節(jié)點之前,就像‘哦,太好了。我得到兩倍的性能,一半的功耗!‘”Uhm 說?!澳切┤兆右呀?jīng)一去不復(fù)返了。那些日子對每個人來說都已經(jīng)一去不復(fù)返了。在 7 nm 時,這些晶體管現(xiàn)在開始泄漏。你只會遇到其他類型的問題在許多情況下,我們認(rèn)為這是無法克服的。

“因此,在意識到這一點后,我們現(xiàn)在正在研究系統(tǒng)級問題,”他繼續(xù)說道,“我們將所有這些東西放在一起,了解所有這些權(quán)衡,并確保我們能夠涵蓋以允許滿足性能和功率預(yù)算的方式進(jìn)行盡可能多的處理。再說一次,這些不再是容易的事情了。我們意識到我們將能夠提供更高的性能或降低功耗,在某些情況下它是非此即彼的。你會得到兩者并不總是給定的。

“再說一次,沒有任何處理器是最適合所有事情的。您不能總是提高性能并降低功耗,”Uhm 繼續(xù)說道?!暗珜W⒂谶@種新架構(gòu),一種異構(gòu)處理器,基本上可以讓他們做到這一點。”

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19118

    瀏覽量

    228864
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9613

    瀏覽量

    137684
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268152
收藏 人收藏

    評論

    相關(guān)推薦

    擊碎摩爾定律!英偉達(dá)和AMD將一年一款新品,均提及HBM和先進(jìn)封裝

    增加一倍,性能也將提升一倍。過去很長一段時間,摩爾定律被認(rèn)為是全球半導(dǎo)體產(chǎn)業(yè)進(jìn)步的基石。如今,這一定律已經(jīng)逐漸失效,延續(xù)摩爾超越摩爾路線紛
    的頭像 發(fā)表于 06-04 00:06 ?3954次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達(dá)和AMD將一年一款新品,均提及HBM和先進(jìn)封裝

    異構(gòu)集成封裝類型詳解

    隨著摩爾定律的放緩,半導(dǎo)體行業(yè)越來越多地采用芯片設(shè)計和異構(gòu)集成封裝來繼續(xù)推動性能的提高。這種方法是將大型硅芯片分割成多個較小的芯片,分別進(jìn)行設(shè)計、制造和優(yōu)化,然后再集成到單個封裝中。
    的頭像 發(fā)表于 11-05 11:00 ?221次閱讀
    <b class='flag-5'>異構(gòu)</b>集成封裝類型詳解

    高算力AI芯片主張“超越摩爾”,Chiplet與先進(jìn)封裝技術(shù)迎百家爭鳴時代

    越來越差。在這種情況下,超越摩爾逐漸成為打造高算力芯片的主流技術(shù)。 ? 超越摩爾是后摩爾定律時代三大技術(shù)路線之一,強調(diào)利用層堆疊和高速接口技
    的頭像 發(fā)表于 09-04 01:16 ?3011次閱讀
    高算力AI芯片主張“<b class='flag-5'>超越</b><b class='flag-5'>摩爾</b>”,Chiplet與先進(jìn)封裝技術(shù)迎百家爭鳴時代

    “自我實現(xiàn)的預(yù)言”摩爾定律,如何繼續(xù)引領(lǐng)創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應(yīng)邀在《電子》雜志上發(fā)表了一篇四頁短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?233次閱讀

    封裝技術(shù)會成為摩爾定律的未來嗎?

    你可聽說過摩爾定律?在半導(dǎo)體這一領(lǐng)域,摩爾定律幾乎成了預(yù)測未來的神話。這條定律,最早是由英特爾聯(lián)合創(chuàng)始人戈登·摩爾于1965年提出,簡單地說就是這樣的:集成電路上可容納的晶體管數(shù)量大約
    的頭像 發(fā)表于 04-19 13:55 ?293次閱讀
    封裝技術(shù)會成為<b class='flag-5'>摩爾定律</b>的未來嗎?

    功能密度定律是否能替代摩爾定律?摩爾定律和功能密度定律比較

    眾所周知,隨著IC工藝的特征尺寸向5nm、3nm邁進(jìn),摩爾定律已經(jīng)要走到盡頭了,那么,有什么定律能接替摩爾定律呢?
    的頭像 發(fā)表于 02-21 09:46 ?621次閱讀
    功能密度<b class='flag-5'>定律</b>是否能替代<b class='flag-5'>摩爾定律</b>?<b class='flag-5'>摩爾定律</b>和功能密度<b class='flag-5'>定律</b>比較

    摩爾定律的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    在動態(tài)的半導(dǎo)體技術(shù)領(lǐng)域,圍繞摩爾定律的持續(xù)討論經(jīng)歷了顯著的演變,其中最突出的是 MonolithIC 3D 首席執(zhí)行官Zvi Or-Bach于2014 年的主張。
    的頭像 發(fā)表于 01-25 14:45 ?1029次閱讀
    <b class='flag-5'>摩爾定律</b>的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    中國團(tuán)隊公開“Big Chip”架構(gòu)能終結(jié)摩爾定律?

    摩爾定律的終結(jié)——真正的摩爾定律,即晶體管隨著工藝的每次縮小而變得更便宜、更快——正在讓芯片制造商瘋狂。
    的頭像 發(fā)表于 01-09 10:16 ?755次閱讀
    中國團(tuán)隊公開“Big Chip”架構(gòu)能終結(jié)<b class='flag-5'>摩爾定律</b>?

    英特爾CEO基辛格:摩爾定律放緩,仍能制造萬億晶體

    帕特·基辛格進(jìn)一步預(yù)測,盡管摩爾定律顯著放緩,到2030年英特爾依然可以生產(chǎn)出包含1萬億個晶體管的芯片。這將主要依靠新 RibbonFET晶體管、PowerVIA電源傳輸、下一代工藝節(jié)點以及3D芯片堆疊等技術(shù)實現(xiàn)。目前單個封裝的最大芯片含有約1000億個晶體管。
    的頭像 發(fā)表于 12-26 15:07 ?615次閱讀

    英特爾CEO基辛格:摩爾定律仍具生命力,且仍在推動創(chuàng)新

    摩爾定律概念最早由英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1970年提出,明確指出芯片晶體管數(shù)量每兩年翻一番。得益于新節(jié)點密度提升及大規(guī)模生產(chǎn)芯片的能力。
    的頭像 發(fā)表于 12-25 14:54 ?560次閱讀

    摩爾定律時代,Chiplet落地進(jìn)展和重點企業(yè)布局

    如何超越摩爾定律,時代的定義也從摩爾定律時代過渡到了后摩爾定律時代。 后摩爾定律時代,先進(jìn)封裝和Chiplet技術(shù)被寄予厚望。近日,由博聞創(chuàng)
    的頭像 發(fā)表于 12-21 00:30 ?1453次閱讀

    超越摩爾”新進(jìn)展,2023 SITRI DAY發(fā)布“MEMS標(biāo)準(zhǔn)工藝模塊”和“90nm硅光集成工藝”

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)隨著摩爾定律的進(jìn)一步發(fā)展,近些年半導(dǎo)體產(chǎn)業(yè)界一直都在探尋新路徑,以求在芯片設(shè)計上繼續(xù)保持高效、高速的發(fā)展。在后摩爾定律時代,“超越摩爾”(More tha
    的頭像 發(fā)表于 12-06 01:04 ?1947次閱讀
    “<b class='flag-5'>超越</b><b class='flag-5'>摩爾</b>”新進(jìn)展,2023 SITRI DAY發(fā)布“MEMS標(biāo)準(zhǔn)工藝模塊”和“90nm硅光集成工藝”

    應(yīng)對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法

    應(yīng)對傳統(tǒng)摩爾定律微縮挑戰(zhàn)需要芯片布線和集成的新方法
    的頭像 發(fā)表于 12-05 15:32 ?525次閱讀
    應(yīng)對傳統(tǒng)<b class='flag-5'>摩爾定律</b>微縮挑戰(zhàn)需要芯片布線和集成的新方法

    奇異摩爾與潤欣科技加深戰(zhàn)略合作開創(chuàng)Chiplet及互聯(lián)芯粒未來

    模式的創(chuàng)新,就多種 Chiplet 互聯(lián)產(chǎn)品和互聯(lián)芯粒的應(yīng)用領(lǐng)域拓展合作空間。 在摩爾定律持續(xù)放緩與最大化計算資源需求的矛盾下,Chiplet 已成為當(dāng)今克服摩爾定律與硅物理極限挑戰(zhàn)的核心戰(zhàn)術(shù)。Chiplet 作為一種互連技術(shù),其核心是對?
    的頭像 發(fā)表于 11-30 11:06 ?3760次閱讀

    異構(gòu)集成 (HI) 與系統(tǒng)級芯片 (SoC) 有何區(qū)別?

    異構(gòu)集成 (HI) 與系統(tǒng)級芯片 (SoC) 有何區(qū)別?
    的頭像 發(fā)表于 11-29 15:39 ?1924次閱讀
    <b class='flag-5'>異構(gòu)</b>集成 (HI) 與系統(tǒng)級芯片 (<b class='flag-5'>SoC</b>) 有何區(qū)別?