0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

嵌入式性能面臨的挑戰(zhàn)及下一代嵌入式處理器架構(gòu)

454398 ? 來(lái)源:EDN ? 作者:Michael Thompson ? 2021-03-24 11:54 ? 次閱讀

作者:Michael Thompson, 新思科技高級(jí)產(chǎn)品營(yíng)銷經(jīng)理

由于工藝節(jié)點(diǎn)從云端拓展到互聯(lián)網(wǎng)邊緣與端點(diǎn),高端嵌入式應(yīng)用也隨之發(fā)生轉(zhuǎn)變。性能需求迅速演進(jìn),并改變了處理器架構(gòu)及其在設(shè)計(jì)中的實(shí)現(xiàn)方式。這是增加多核處理器的應(yīng)用以提供更高性能的背后原因。目前大多數(shù)高端處理器都支持雙核和四核配置。有些處理器最多支持8個(gè)CPU核心,但即便如此無(wú)法滿足存儲(chǔ)、汽車、網(wǎng)絡(luò)5G等新興應(yīng)用的性能需求。下一代嵌入式應(yīng)用需要對(duì)大型CPU集群和專用硬件加速器提供可擴(kuò)展的支持,以實(shí)現(xiàn)所需的性能。大型多核處理器需要新的架構(gòu)方法來(lái)提供更高的性能,并且不會(huì)給嵌入式設(shè)計(jì)者帶來(lái)其他實(shí)現(xiàn)和時(shí)序收斂問(wèn)題。

嵌入式性能面臨的挑戰(zhàn)

毋庸諱言,先進(jìn)工藝節(jié)點(diǎn)已無(wú)法像從前那樣提供更高時(shí)鐘頻率和更低功耗。各代工藝節(jié)點(diǎn)的邏輯速度在持續(xù)增長(zhǎng),但內(nèi)存訪問(wèn)時(shí)間卻沒(méi)有變化(圖1)。處理器中的限速路徑幾乎總是經(jīng)過(guò)內(nèi)存。由于半導(dǎo)體物理學(xué)的真正局限性,這類情況在未來(lái)工藝節(jié)點(diǎn)上也不太可能發(fā)生轉(zhuǎn)變。

圖1:嵌入式存儲(chǔ)器性能差距

同時(shí),嵌入式應(yīng)用的最高時(shí)鐘頻率已達(dá)到1GHz–2GHz范圍(圖2)。誠(chéng)然,有些時(shí)鐘頻率高于2GHz,但這是例外。對(duì)于多數(shù)應(yīng)用而言,這是無(wú)法實(shí)現(xiàn)的。功耗和面積都是有限的,這兩者都會(huì)隨著時(shí)鐘頻率迅速增加。大多數(shù)嵌入式設(shè)計(jì)的時(shí)鐘頻率都低于1GHz。未來(lái)這一趨勢(shì)不會(huì)改變。就多數(shù)嵌入式設(shè)計(jì)而言,通過(guò)增加時(shí)鐘頻率來(lái)提高性能是不現(xiàn)實(shí)的。

問(wèn)題在于針對(duì)嵌入式應(yīng)用的性能需求在不斷增多。這是由競(jìng)爭(zhēng)、新特性的添加和應(yīng)用空間需求的變化所造成的。例如,更大容量和更高訪問(wèn)速度的需求使得SSD驅(qū)動(dòng)器的尺寸迅速增大。此外,計(jì)算機(jī)儲(chǔ)存和AI功能也被添加至嵌入式應(yīng)用中,以延長(zhǎng)驅(qū)動(dòng)器壽命和提升數(shù)據(jù)訪問(wèn)性能。因此上述綜合因素都對(duì)SSD控制器以及用于實(shí)現(xiàn)新功能的處理器提出了更高的性能需求。

提高處理器性能

許多方法已經(jīng)用于提高處理器性能。多年來(lái),增加流水線級(jí)數(shù)一直被用于解決內(nèi)存限速問(wèn)題。例如,DesignWare? ARC? HS處理器具有10級(jí)流水線,兩個(gè)周期的內(nèi)存訪問(wèn),能夠在16FFC工藝中提供1.8GHz的時(shí)鐘頻率(最差情況下)。嵌入式設(shè)計(jì)的時(shí)鐘頻率是有限制的,因此在處理器的流水線上增加更多的處理級(jí)別并不會(huì)帶來(lái)什么改善。今后這一情況可能會(huì)改變,但現(xiàn)如今10級(jí)流水線是嵌入式設(shè)計(jì)的最佳選擇。

就性能增益與增加的面積和功耗對(duì)比而言,超標(biāo)量實(shí)現(xiàn)是一個(gè)很好的折衷方案。從單一發(fā)射架構(gòu)轉(zhuǎn)變至雙發(fā)射架構(gòu)能夠在面積和功耗有限增加的情況下將RISC性能提升40%。對(duì)于嵌入式處理器來(lái)說(shuō),這是一個(gè)很好的折衷方案。采用三發(fā)射或四發(fā)射架構(gòu)將會(huì)進(jìn)一步增加CPU面積與功耗,且性能提升幅度較小。以任何代價(jià)提高性能從來(lái)都不是嵌入式處理器的目標(biāo)。

添加亂序(OoO)執(zhí)行可以提高嵌入式應(yīng)用的性能,且不會(huì)增加時(shí)鐘頻率。通常,支持完整亂序的CPU會(huì)給嵌入式應(yīng)用帶來(lái)適得其反的效果。而采用有限亂序的方法可以在不增加處理器面積的情況下獲得最佳性能提升。有限亂序通常用于高端嵌入式處理器。

緩存的目的是為了讓內(nèi)存更加靠近處理器,從而提高性能。緩存支持處理器的單周期數(shù)據(jù)存取。將處理器所需信息存放于緩存中能夠提升性能。經(jīng)常使用的代碼和數(shù)據(jù)保存在一級(jí)緩存中。使用較少的代碼和數(shù)據(jù)保存在訪問(wèn)速度較慢的二級(jí)緩存或外部?jī)?nèi)存中,并在需要時(shí)進(jìn)行讀取。對(duì)于多核處理器來(lái)說(shuō),保持一級(jí)數(shù)據(jù)緩存之間的一致性也可以提高性能。一級(jí)緩存和一致性在嵌入式處理器中很常見(jiàn),而二級(jí)緩存(和三級(jí)緩存)僅用于高端應(yīng)用。

在嵌入式設(shè)計(jì)中采用多個(gè)處理器的趨勢(shì)正不斷演進(jìn)。幾年前,一個(gè)典型的片上系統(tǒng)(SoC)只包含一到兩個(gè)處理器。如今,即便是低端設(shè)計(jì),處理器數(shù)量也超過(guò)5個(gè),而且還在不斷增加。為了支撐這一轉(zhuǎn)變,中高端嵌入式應(yīng)用的處理器提供了多核實(shí)現(xiàn)方式。支持兩個(gè)、四個(gè)和八個(gè)CPU核心的處理器已經(jīng)推出。程序員可以使用Linux或其他操作系統(tǒng)在CPU內(nèi)核之間順暢地進(jìn)行操作,同時(shí)平衡執(zhí)行以提高性能。

硬件加速器正越來(lái)越多地應(yīng)用于嵌入式設(shè)計(jì)。它們以最小的功耗和面積提供高性能,同時(shí)減輕處理器的負(fù)擔(dān)。硬件加速器的主要缺點(diǎn)是它們的不可編程性。添加加速器使之與處理器并行工作可以緩解這種情況。然而,現(xiàn)有處理器只能有限度地支持硬件加速器,有的甚至無(wú)法提供支持。有些處理器(如ARC處理器)支持自定義指令,允許用戶向處理器流水線添加硬件。盡管自定義指令很誘人,但硬件加速器也帶來(lái)了其他好處,與處理器并行使用時(shí),可以顯著提高性能。

嵌入式應(yīng)用的處理器性能提升存在許多挑戰(zhàn)。處理器已經(jīng)支持更深層次的流水線技術(shù),超標(biāo)量實(shí)現(xiàn)和亂序功能能夠有所幫助,但也只能到此為止。緩存技術(shù)已經(jīng)非常豐富,一致性也是如此,因此不太可能取得進(jìn)一步的進(jìn)展。在設(shè)計(jì)中采用更多的CPU核心數(shù)與硬件加速器是嵌入式設(shè)計(jì)人員正采取的更高性能實(shí)現(xiàn)途徑。

下一代嵌入式處理器架構(gòu)

下一代處理器將支持大型多核實(shí)現(xiàn)和硬件加速(圖3)。處理器供應(yīng)商要做的不僅僅是向現(xiàn)有處理器添加接口。支持4個(gè)或8個(gè)CPU內(nèi)核的處理器已經(jīng)達(dá)到了最大頻率限制,并且在時(shí)序收斂方面可能會(huì)出現(xiàn)重大問(wèn)題。增加更多的內(nèi)核只會(huì)讓這一問(wèn)題變得更糟糕。下一代處理器必須從內(nèi)部處理器互連的完全重構(gòu)開(kāi)始,改進(jìn)時(shí)序收斂,解決速度限制,并增加內(nèi)部帶寬。外部接口的帶寬也必須增加,以支持?jǐn)?shù)據(jù)進(jìn)出處理器。

圖3:下一代嵌入式處理器架構(gòu)

服務(wù)質(zhì)量(QoS)技術(shù)在片上網(wǎng)絡(luò)(NOC)中得到了廣泛的應(yīng)用,但在多核處理器中的應(yīng)用卻很有限。這種情況將在下一代處理器中發(fā)生改變,讓程序員能夠管理每個(gè)CPU核心和加速器的內(nèi)部帶寬,從而最大限度地提高性能。這取決于應(yīng)用,雖然并非每個(gè)設(shè)計(jì)都需要服務(wù)質(zhì)量技術(shù),但在其他設(shè)計(jì)中,它對(duì)于確??深A(yù)測(cè)性能至關(guān)重要。

大型處理器集群的優(yōu)勢(shì)

大型多核處理器比小型多核處理器具有優(yōu)勢(shì)。采用一個(gè)具有12個(gè)CPU核心的處理器,而不是使用具有4個(gè)CPU核心的三個(gè)處理器集群,將減少CPU核心之間的延遲,并支持對(duì)內(nèi)核的直接窺探。大型處理器集群的另一個(gè)優(yōu)勢(shì)是能提供更優(yōu)越的軟件擴(kuò)展性。具有12個(gè)CPU核心的處理器為程序員提供了更大的軟件分區(qū)靈活性,用于處理任務(wù)的核心數(shù)量可以根據(jù)需要的性能動(dòng)態(tài)進(jìn)行分配。在多個(gè)處理器集群中,由于缺乏CPU內(nèi)核之間的統(tǒng)一訪問(wèn),因此很難獲得這種級(jí)別的軟件性能控制。

大型多核處理器也將從與硬件加速器的緊密耦合中獲得優(yōu)勢(shì)。將硬件加速器接口移動(dòng)到處理器內(nèi)部,而不是通過(guò)SoC總線連接它們,將減少SoC總線上的延遲和流量,同時(shí)提高數(shù)據(jù)共享和系統(tǒng)性能。采用共享用戶寄存器也可以提高加速器上可編程控制的效率。

ARC HS5x/HS6x

新思科技公司(Synopsys)下一代DesignWare ARC HS5x和ARC HS6x處理器IP利用前面描述的許多方法來(lái)提高處理器性能。這些處理器具有高速10級(jí)、雙發(fā)射流水線,在功耗和面積有限的情況下提高了功能單元的利用率。ARC 64位 HS6x處理器具有完整的64位流水線和寄存器文件,支持64位虛擬地址空間和52位物理地址空間,可以直接尋址當(dāng)前和未來(lái)的大內(nèi)存,并支持128位加載和存儲(chǔ),以實(shí)現(xiàn)高效的數(shù)據(jù)移動(dòng)。

圖4:DesignWare ARC HS5x/HS6x處理器IP框圖

32位ARC HS5x和64位HS6x處理器的多核版本都包含一個(gè)先進(jìn)的高帶寬內(nèi)部處理器互連結(jié)構(gòu),其設(shè)計(jì)旨在通過(guò)異步時(shí)鐘和高達(dá)800 GB/s的內(nèi)部聚合帶寬來(lái)簡(jiǎn)化時(shí)序收斂。新款A(yù)RC HS處理器的多核版本包括一個(gè)創(chuàng)新的互連結(jié)構(gòu),可連接多達(dá)12個(gè)核心,支持多達(dá)16個(gè)硬件加速器的接口。為了進(jìn)一步簡(jiǎn)化時(shí)序收斂,每個(gè)核位于自己的功率域中,并且與其他核具有異步時(shí)鐘關(guān)系。跟所有ARC處理器一樣,HS5x和HS6x處理器都高度可配置,并采用ARC Processor Extension(APEX)技術(shù),支持自定義指令,可滿足每個(gè)嵌入式應(yīng)用的獨(dú)特性能、功耗和面積要求。

為了加速軟件開(kāi)發(fā),ARC HS5x和HS6x處理器由ARC MetaWare開(kāi)發(fā)工具套件提供支持,可生成高效代碼。處理器的開(kāi)源軟件支持包括Zephyr實(shí)時(shí)操作系統(tǒng)、優(yōu)化的Linux內(nèi)核、GNU編譯器集合(GCC)、GNU調(diào)試器(GDB)和相關(guān)的GNU編程實(shí)用程序(二進(jìn)制工具)。

總結(jié)

由于嵌入式應(yīng)用的性能需求將日益增多,嵌入式應(yīng)用中所采用的處理器也必須隨之提高性能。鑒于面積與功耗的有限性,以及處理器性能簡(jiǎn)易提升已取得進(jìn)展,這將面臨挑戰(zhàn)。先進(jìn)工藝節(jié)點(diǎn)不再像以前那樣帶來(lái)性能提升,嵌入式處理器的速度也受到了限制。超標(biāo)量和亂序功能在高端處理器中很常見(jiàn),但64位(盡管必要)提供的性能提升有限。新一代多核處理器需要支持8個(gè)以上的CPU核心數(shù),并需要采用硬件加速器內(nèi)部互連結(jié)構(gòu)。新處理器如DesignWare ARC HS5x和HS6x處理器IP將提供可擴(kuò)展的性能和功能,并讓設(shè)計(jì)師能夠解決其嵌入式應(yīng)用的功耗和面積需求。新款處理器采用先進(jìn)的架構(gòu)與高速內(nèi)部互連結(jié)構(gòu),不僅滿足了當(dāng)今高端嵌入式應(yīng)用的性能需求,同時(shí)也為未來(lái)設(shè)計(jì)留下了足夠空間。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19124

    瀏覽量

    228875
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10813

    瀏覽量

    210906
  • 嵌入式處理器
    +關(guān)注

    關(guān)注

    0

    文章

    253

    瀏覽量

    30706
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD 面向嵌入式系統(tǒng)推出高能效 EPYC 嵌入式 8004 系列

    AMD 憑借其 EPYC? 嵌入式處理器不斷樹(shù)立行業(yè)標(biāo)準(zhǔn),為網(wǎng)絡(luò)、存儲(chǔ)和工業(yè)應(yīng)用提供卓越的性能、效率、連接與創(chuàng)新。今天,我們正以第四 AMD EPYC
    發(fā)表于 10-11 13:58 ?664次閱讀

    嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用 閱讀體驗(yàn) +Hypervisor基礎(chǔ)概念

    解決嵌入式系統(tǒng)資源有限但應(yīng)用場(chǎng)景日益復(fù)雜的難題。單核處理器計(jì)算性能的提高和多核處理器的引入為嵌入式Hypervisor的發(fā)展提供了硬件基礎(chǔ)。
    的頭像 發(fā)表于 10-08 15:08 ?363次閱讀
    <b class='flag-5'>嵌入式</b>Hypervisor:<b class='flag-5'>架構(gòu)</b>、原理與應(yīng)用 閱讀體驗(yàn) +Hypervisor基礎(chǔ)概念

    嵌入式linux開(kāi)發(fā)的基本步驟有哪些?

    之前,首先需要選擇合適的硬件平臺(tái)。硬件選擇需要考慮以下幾個(gè)方面: 1.1 處理器 嵌入式Linux開(kāi)發(fā)需要個(gè)處理器,常見(jiàn)的處理器有ARM、
    的頭像 發(fā)表于 09-02 09:11 ?357次閱讀

    嵌入式微處理器的分類 嵌入式微處理器的種類和型號(hào)

    的分類可以從多個(gè)角度進(jìn)行劃分,比如架構(gòu)、指令集、用途等。下面將從這些角度詳細(xì)介紹嵌入式微處理器的種類和型號(hào)。 、架構(gòu)分類 嵌入式微處理器
    的頭像 發(fā)表于 05-04 16:31 ?2046次閱讀

    嵌入式微處理器種類 舉例介紹嵌入式微處理器有哪幾類?

    嵌入式微處理器的各種類型。 ARM體系結(jié)構(gòu) ARM(Advanced RISC Machine)體系結(jié)構(gòu)是種廣泛應(yīng)用于嵌入式系統(tǒng)中的指令集架構(gòu)
    的頭像 發(fā)表于 05-04 16:27 ?1965次閱讀

    嵌入式微處理器的類型與特點(diǎn) 嵌入式微處理器技術(shù)的優(yōu)缺點(diǎn)

    嵌入式微處理器種專門設(shè)計(jì)和應(yīng)用于嵌入式系統(tǒng)的微處理器。相比于常規(guī)計(jì)算機(jī)系統(tǒng),嵌入式系統(tǒng)通常具有更高的實(shí)時(shí)性、更低的功耗、較小的尺寸和成本
    的頭像 發(fā)表于 05-04 15:10 ?2553次閱讀

    什么是嵌入式微處理器? 嵌入式微處理器的區(qū)別

    嵌入式微處理器(Embedded Microprocessor)是種被用于控制和操作特定嵌入式系統(tǒng)的微處理器。嵌入式系統(tǒng)是指內(nèi)部集成了特定
    的頭像 發(fā)表于 04-21 15:44 ?1446次閱讀

    嵌入式微處理器的分類特點(diǎn) 嵌入式微處理器作用

    嵌入式微處理器種專門設(shè)計(jì)用于控制和執(zhí)行嵌入式系統(tǒng)任務(wù)的微處理器。與通用微處理器相比,嵌入式微處理器
    的頭像 發(fā)表于 04-21 14:52 ?1202次閱讀

    嵌入式微處理器架構(gòu)可分為

    性能、功耗和可靠性都有重要影響。 目前,主流的嵌入式微處理器架構(gòu)主要有ARM架構(gòu)、x86架構(gòu)和MIPS
    的頭像 發(fā)表于 04-21 14:39 ?1134次閱讀

    dsp是嵌入式微處理器種設(shè)備嗎 ARM嵌入式微處理器有何特點(diǎn)?

    的微處理器,它通常具有低功耗、小尺寸和低成本的特點(diǎn)。 ARM嵌入式微處理器是由ARM公司設(shè)計(jì)的系列低功耗、高性能嵌入式
    的頭像 發(fā)表于 04-21 09:37 ?890次閱讀

    什么是嵌入式微處理器嵌入式微處理器有哪些?

    嵌入式微處理器是指嵌入到特定應(yīng)用系統(tǒng)中的微處理器,它是整個(gè)嵌入式系統(tǒng)的核心,由通用處理器演變而來(lái),具有體積小、重量輕、成本低、可靠性高等優(yōu)點(diǎn)
    的頭像 發(fā)表于 03-29 11:39 ?917次閱讀

    嵌入式微處理器的原理和應(yīng)用

    嵌入式微處理器是專為嵌入式系統(tǒng)設(shè)計(jì)的微處理器,它們是嵌入式系統(tǒng)的核心組件,負(fù)責(zé)執(zhí)行程序指令、處理數(shù)據(jù)和控制其他硬件設(shè)備。與通用微
    的頭像 發(fā)表于 03-28 15:51 ?795次閱讀

    嵌入式fpga是什么意思

    嵌入式FPGA是指將FPGA技術(shù)集成到嵌入式系統(tǒng)中的種解決方案。嵌入式系統(tǒng)是種為特定應(yīng)用而設(shè)計(jì)的計(jì)算機(jī)系統(tǒng),它通常包括
    的頭像 發(fā)表于 03-15 14:29 ?1170次閱讀

    嵌入式處理器簡(jiǎn)介和種類

    嵌入式處理器嵌入式系統(tǒng)的核心,是控制、輔助系統(tǒng)運(yùn)行的硬件單元。范圍極其廣闊,從最初的4位處理器,目前仍在大規(guī)模應(yīng)用的8位單片機(jī),到最新的受到廣泛青睞的32位,64位
    的頭像 發(fā)表于 12-26 12:26 ?959次閱讀

    低功耗嵌入式計(jì)算解決方案:選擇處理器的幾個(gè)關(guān)鍵因素

    在低功耗嵌入式計(jì)算解決方案(例如無(wú)風(fēng)扇工業(yè)計(jì)算機(jī))領(lǐng)域,理想的處理器應(yīng)在性能、功效和與嵌入式系統(tǒng)特定要求的兼容性之間取得平衡。英特爾或AMD等領(lǐng)先的半導(dǎo)體公司將為高
    的頭像 發(fā)表于 12-04 16:45 ?478次閱讀
    低功耗<b class='flag-5'>嵌入式</b>計(jì)算解決方案:選擇<b class='flag-5'>處理器</b>的幾個(gè)關(guān)鍵因素