0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RPP「六邊形戰(zhàn)士」處理器:融合NPU與GPU優(yōu)勢(shì),兼具高效與實(shí)時(shí)性的AI新星

科技數(shù)碼 ? 來(lái)源:科技數(shù)碼 ? 作者:科技數(shù)碼 ? 2023-08-31 13:38 ? 次閱讀


wKgaomTwJzqAS8zxAArV3UPMPQA166.png

科技江湖中,處理器家族群英薈萃,各展神通,從DSP到NPU再到GPGPU,每款處理器優(yōu)劣各異,各有所長(zhǎng)。正是這些處理器的優(yōu)點(diǎn),使它們?cè)谔囟ǖ氖袌?chǎng)領(lǐng)域中占有一席之地;也是它們的缺點(diǎn),限制了它們進(jìn)入其他市場(chǎng)領(lǐng)域發(fā)展。然而,在這個(gè)競(jìng)爭(zhēng)激烈的市場(chǎng)中,有一款處理器被譽(yù)為“六邊形戰(zhàn)士處理器”,它就是RPP,憑借其獨(dú)特的底層架構(gòu),

RPP成功實(shí)現(xiàn)了NPU的高效率和GPU的高通用性相結(jié)合,在AI市場(chǎng)中游刃有余,成為了AI領(lǐng)域的后起之秀。

這種

結(jié)合令RPP具有廣泛的應(yīng)用場(chǎng)景和高效的處理能力,使其在市場(chǎng)上具有強(qiáng)大的競(jìng)爭(zhēng)力。

wKgZomTwJzqAYXGDAADnVLoMs9A479.png

(DSP & RPP 性能對(duì)比)

接下來(lái),讓我們深入分析一下RPP是如何成為「六邊形戰(zhàn)士」處理器的。首先,我們來(lái)回顧一下DSP(數(shù)字信號(hào)處理器)的獨(dú)特優(yōu)勢(shì)——低延遲。這一特性,使得DSP在4G5G無(wú)線通信、雷達(dá)信號(hào)處理等領(lǐng)域脫穎而出,成為不可或缺的關(guān)鍵技術(shù)。在需要即時(shí)、高效信號(hào)分析與處理的應(yīng)用場(chǎng)景中,DSP無(wú)疑是最佳的選擇。然而,正如硬幣的兩面一樣,DSP也有其局限性,尤其在高性能人工智能(AI)領(lǐng)域。

雖然DSP在特定領(lǐng)域表現(xiàn)出色,但對(duì)于涉及大規(guī)模并行計(jì)算和復(fù)雜矩陣運(yùn)算的AI任務(wù),它可能會(huì)顯露出性能瓶頸。

AI任務(wù)通常要求高度優(yōu)化的計(jì)算能力,而這恰恰是DSP的傳統(tǒng)應(yīng)用所未涉及的。

此外,DSP的匯編語(yǔ)言暴露性使得編程變得困難,軟件難以遷移和迭代。

wKgaomTwJzuANVRlAADrzDfLvPc104.png

(NPU& RPP 性能對(duì)比)正因如此,專(zhuān)門(mén)的處理器類(lèi)型如NPU(神經(jīng)網(wǎng)絡(luò)處理器)和GPU(圖形處理器)應(yīng)運(yùn)而生,以滿(mǎn)足AI領(lǐng)域的需求。NPU專(zhuān)注于高效執(zhí)行神經(jīng)網(wǎng)絡(luò)計(jì)算,而GPU則以其卓越的并行處理能力,成為訓(xùn)練和推斷復(fù)雜神經(jīng)網(wǎng)絡(luò)模型的不二之選。這種針對(duì)性的架構(gòu)設(shè)計(jì)使得它們能夠在AI領(lǐng)域展現(xiàn)出更卓越的性能。任何技術(shù)都有其兩面性一樣,GPU和NPU也不例外。

它們?cè)谀承┓矫婵赡艽嬖诰窒扌?,使得它們無(wú)法廣泛地應(yīng)用于所有領(lǐng)域。

例如,盡管NPU優(yōu)勢(shì)非常明顯,低功耗,低成本,高性能都達(dá)到極致。然而,NPU的缺點(diǎn)也是顯而易見(jiàn)的,首先,

部署相對(duì)較慢

,用戶(hù)需要使用NPU特有的SDK接口將其訓(xùn)練好的模型部署到芯片上,這需要用戶(hù)重新學(xué)習(xí)NPU的編程語(yǔ)言,大大增加了部署時(shí)間(這與GPU不同,GPU使用通用的CUDA語(yǔ)言進(jìn)行編程)。其次,

NPU屬于定制化的硬件,這在一定程度上限制了其適用范圍。

盡管在

AI領(lǐng)域具備廣泛的應(yīng)用前景,但在其他領(lǐng)域如圖像處理、科學(xué)計(jì)算以及信號(hào)處理等方面,其應(yīng)用可能會(huì)受到限制。此外,即便在AI領(lǐng)域,隨著新的AI算子不斷涌現(xiàn),很多神經(jīng)網(wǎng)絡(luò)模型可能難以在既有的定制化NPU上得到充分支持。這種定制化的特性使得NPU在處理特定類(lèi)型的任務(wù)時(shí)能夠?qū)崿F(xiàn)卓越性能,但同時(shí)也可能在其他領(lǐng)域的應(yīng)用上顯得相對(duì)不足。由于技術(shù)的快速發(fā)展和多樣化需求,

NPU在適應(yīng)不斷變化的場(chǎng)景時(shí)可能面臨一些挑戰(zhàn)。

wKgZomTwJzuAdaTwAAD7Zw3gdMg140.png

(GPU& RPP 性能對(duì)比)下面來(lái)說(shuō)一下GPU,盡管在功耗、成本和性能方面不如NPU,但GPU依然是AI領(lǐng)域使用最多的處理器。

這歸功于GPU強(qiáng)大的CUDA生態(tài)。

CUDA是一種由NVIDIA開(kāi)發(fā)的并行計(jì)算平臺(tái)和應(yīng)用程序編程接口,它讓開(kāi)發(fā)者能夠使用NVIDIA的GPU進(jìn)行高性能計(jì)算。正是這種強(qiáng)大的生態(tài),使得GPU在AI領(lǐng)域占據(jù)了主導(dǎo)地位,可以廣泛應(yīng)用。然而,需要指出的是,

GPU的處理時(shí)延通常較大,這使得它不適用于實(shí)時(shí)操作系統(tǒng),

而僅限于在Linux或Windows操作系統(tǒng)上使用。正因如此,GPU在無(wú)線通信、雷達(dá)處理

等信號(hào)處理領(lǐng)域的應(yīng)用受到了一定的限制。GPU在AI領(lǐng)域的主導(dǎo)地位源于其卓越的并行計(jì)算能力和廣泛支持的軟硬件生態(tài)系統(tǒng)。這種并行計(jì)算能力使得GPU能夠在處理大規(guī)模數(shù)據(jù)和復(fù)雜神經(jīng)網(wǎng)絡(luò)模型時(shí)發(fā)揮優(yōu)勢(shì),從而在訓(xùn)練和推理中取得出色的性能。盡管在功耗和成本方面存在一些局限,但其在性能方面的優(yōu)勢(shì)往往能夠彌補(bǔ)這些不足。不過(guò),在追求GPU強(qiáng)大性能的同時(shí),人們也不能忽視其功耗和成本帶來(lái)的挑戰(zhàn)。

特別是在移動(dòng)設(shè)備和嵌入式系統(tǒng)等資源受限的場(chǎng)景中,選擇適當(dāng)?shù)奶幚砥魇且粋€(gè)需要深思熟慮的決策。例如,大模型之所以難以商用化,很大程度上是因?yàn)槠渚薮蟮墓某杀荆?/p>

因此,在性能、功耗和成本之間尋求平衡也變得至關(guān)重要

wKgaomTwJzyAPIqOAADqRq9Rpak207.png

FPGA& RPP 性能對(duì)比)當(dāng)然,F(xiàn)PGA(現(xiàn)場(chǎng)可編程邏輯門(mén)陣列)確實(shí)在某些方面提供了一種獨(dú)特的解決方案,它能夠?qū)崿F(xiàn)高性能和低時(shí)延的操作。不同于一般的中央處理單元(CPU)和圖形處理單元(GPU),F(xiàn)PGA可針對(duì)特定任務(wù)進(jìn)行硬件級(jí)別的編程,從而實(shí)現(xiàn)極高的運(yùn)算速度和響應(yīng)能力。然而,這種高度專(zhuān)用的能力也帶來(lái)了一些挑戰(zhàn)和限制。首先,成本是一個(gè)重要的考量因素。由于其專(zhuān)用硬件和定制設(shè)計(jì),

FPGA往往具有相對(duì)較高的成本,這限制了其在大規(guī)?;虺杀久舾械膽?yīng)用場(chǎng)景中的使用。其次,F(xiàn)PGA的部署和配置通常需要專(zhuān)業(yè)知識(shí)和時(shí)間投資。

與通用硬件相比,

FPGA需要獨(dú)特的開(kāi)發(fā)環(huán)境和工具鏈,這增加了開(kāi)發(fā)周期和復(fù)雜性。因此,部署速度相對(duì)較慢,這可能會(huì)影響其在快速發(fā)展和變化的市場(chǎng)環(huán)境中的適應(yīng)性。由于這些因素,F(xiàn)PGA主要用于某些特定領(lǐng)域,其中對(duì)高性能和低延遲有嚴(yán)格要求。例如,在信號(hào)處理、數(shù)據(jù)采集、實(shí)時(shí)分析和仿真等其他需要高度可定制和實(shí)時(shí)響應(yīng)的應(yīng)用場(chǎng)景中,F(xiàn)PGA有著不可替代的地位。

wKgZomTwJzyAPpfGAAJLPUNdNxY438.png

當(dāng)然也有一款產(chǎn)品,珠海市芯動(dòng)力科技有限公司自主研發(fā)的全球首款針對(duì)并行計(jì)算設(shè)計(jì)的芯片架構(gòu)-RPP,

則成功實(shí)現(xiàn)了低成本、低功耗、低延時(shí)、高性能、快速部署和廣泛應(yīng)用的全方位平衡。

憑借其獨(dú)特的底層架構(gòu),成功地結(jié)合了NPU的高效率與GPU的高通用性,為AI計(jì)算提供了全新的解決方案。與傳統(tǒng)的NPU和GPU相比,它成功地橋接了兩者之間的性能差距,使得應(yīng)用程序能夠在一個(gè)平臺(tái)上享受到兩者的優(yōu)點(diǎn)。同時(shí)RPP還可以支持實(shí)時(shí)操作系統(tǒng)(RTOS,它具有DSP的低延遲特性,這將大大提高系統(tǒng)的實(shí)時(shí)性和響應(yīng)速度,對(duì)于需要迅速做出決策的應(yīng)用程序來(lái)說(shuō),這一點(diǎn)至關(guān)重要。RPP的這一特性使其在許多領(lǐng)域都有廣泛的應(yīng)用前景。例如,在自動(dòng)駕駛領(lǐng)域,RPP可以實(shí)時(shí)處理大量的傳感器數(shù)據(jù),迅速做出駕駛決策,提高駕駛安全性。在醫(yī)療領(lǐng)域,RPP可以幫助醫(yī)生進(jìn)行快速的醫(yī)學(xué)圖像處理和數(shù)據(jù)分析,提高診斷的準(zhǔn)確性和效率等等。除此之外,RPP的高效率和低功耗特性還可以應(yīng)用大數(shù)據(jù)分析、工業(yè)自動(dòng)化、泛安防等領(lǐng)域。它的通用性使其能夠適應(yīng)各種不同的應(yīng)用場(chǎng)景,從而實(shí)現(xiàn)了高度的可移植性和靈活性。RPP架構(gòu)與其他產(chǎn)品相比,堪稱(chēng)「六邊形戰(zhàn)士」。相較于CPU、GPU、DSP、NPU、FPGA這些產(chǎn)品,它們某些領(lǐng)域存在明顯劣勢(shì),而

RPP則成功實(shí)現(xiàn)了低成本、低功耗、低延時(shí)、高性能、快速部署和廣泛應(yīng)用的全方位平衡。

RPP架構(gòu)具備通用性和高效性,

能夠幫助人工智能用戶(hù)以最短的時(shí)間實(shí)現(xiàn)產(chǎn)品Time to Market

。它在自動(dòng)駕駛、醫(yī)療、大數(shù)據(jù)分析、工業(yè)自動(dòng)化、泛安防等領(lǐng)域具有廣泛的應(yīng)用前景,為AI計(jì)算提供了全新的解決方案。隨著科技的不斷進(jìn)步和發(fā)展,RPP將在更多領(lǐng)域展現(xiàn)出其強(qiáng)大的應(yīng)用潛力,為推動(dòng)科技發(fā)展和提升社會(huì)效益做出更大的貢獻(xiàn)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19100

    瀏覽量

    228814
  • FPGA
    +關(guān)注

    關(guān)注

    1625

    文章

    21620

    瀏覽量

    601234
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128592
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    256

    瀏覽量

    18511
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    四芯軸壓接PK六邊形壓接:大家覺(jué)得傳統(tǒng)六邊形壓接和四芯軸壓接方式哪個(gè)比較好呢?

    與端子直接減少位移,封閉更高,減少氧化污染等情況發(fā)生。六邊形壓接也具有一定的優(yōu)勢(shì),但在加工過(guò)程容易產(chǎn)生飛(毛刺),需要專(zhuān)門(mén)組織去毛刺,工時(shí)損耗很大,以及容易對(duì)人員造成傷害以及對(duì)連接
    發(fā)表于 03-27 15:05

    請(qǐng)問(wèn)PADS logic頁(yè)面連接符圖中的六邊形是什么符號(hào)?

    圖中的六邊形是什么符號(hào)?PADS中怎么輸出對(duì)應(yīng)符號(hào)?應(yīng)該是頁(yè)面連接符雙向的意思 可就是不知道輸出該符號(hào)
    發(fā)表于 06-19 04:36

    淺析開(kāi)關(guān)電源半六邊形法則

    開(kāi)關(guān)電源半六邊形法則
    發(fā)表于 10-28 06:47

    新型有序分布正六邊形小區(qū)結(jié)構(gòu)的設(shè)計(jì)

    分布式通信系統(tǒng)可以抑制干擾,增大容量。為了在現(xiàn)有的系統(tǒng)中引入分布式處理的增益,該文提出了有序分布的正六邊形小區(qū)通信系統(tǒng)。該系統(tǒng)可兼容現(xiàn)有的120o 定向天線覆蓋的蜂窩
    發(fā)表于 11-18 13:39 ?9次下載

    一種改進(jìn)的六角形細(xì)分方法

    研究了六角形網(wǎng)格上的曲面細(xì)分算法,改進(jìn)了六角形網(wǎng)格砍細(xì)分算法。在六邊形網(wǎng)格的砍細(xì)分過(guò)程中,利用對(duì)偶砍角法對(duì)非
    發(fā)表于 01-15 16:22 ?6次下載

    一種基于正六邊形網(wǎng)格的LEACH協(xié)議改進(jìn)

    一種基于正六邊形網(wǎng)格的LEACH協(xié)議改進(jìn)_嚴(yán)斌亨
    發(fā)表于 01-07 20:32 ?0次下載

    基于正六邊形DGS單元的微帶低通濾波設(shè)計(jì)方案

    本文采用正六邊形缺陷地面結(jié)構(gòu)單元設(shè)計(jì)了一款新穎的微帶低通濾波, 并提出了該濾波的原型RLC等效電路。通過(guò)對(duì)其S參數(shù)的仿真分析提取出了相應(yīng)的等效電路元件值。設(shè)計(jì)了一款由五個(gè)正六邊形
    發(fā)表于 11-09 16:55 ?6次下載

    六邊形元胞自動(dòng)機(jī)的行人疏散

    在分析、比較現(xiàn)有疏散仿真模型的基礎(chǔ)上,提出一種基于正六邊形元胞自動(dòng)機(jī)的行人疏散模型。該模型中疏散空間被分成相等的正六邊形,每個(gè)行人有包括靜止在內(nèi)的7個(gè)運(yùn)動(dòng)方向。給出速度等級(jí)的概念用來(lái)描述行人的疏散
    發(fā)表于 01-31 16:02 ?0次下載
    正<b class='flag-5'>六邊形</b>元胞自動(dòng)機(jī)的行人疏散

    六邊形LED燈的制作

     由于在某些布局中設(shè)計(jì)了這種形狀,六邊形在任何時(shí)候都可以有多個(gè)輸入。..。..基本上這對(duì)于LED是不好的。我最好的解決方案是一個(gè)簡(jiǎn)單的Attiny85電路,它讀取每個(gè)輸入并打開(kāi)或關(guān)閉晶體管,基本上打開(kāi)和關(guān)閉晶體管,只為下一個(gè)LED條帶留下一個(gè)信號(hào)。
    的頭像 發(fā)表于 08-23 09:27 ?6273次閱讀
    <b class='flag-5'>六邊形</b>LED燈的制作

    堪稱(chēng)六邊形戰(zhàn)士的aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro表現(xiàn)如何?

    堪稱(chēng)六邊形戰(zhàn)士的aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro表現(xiàn)如何? 在很多人的印象當(dāng)中,都認(rèn)為硬盤(pán)是一種比較厚重的儲(chǔ)存設(shè)備。放在以往硬盤(pán)確實(shí)比較厚重,但是隨著科學(xué)技術(shù)的不斷發(fā)展,硬盤(pán)也隨之進(jìn)行了升級(jí)
    的頭像 發(fā)表于 08-13 11:03 ?984次閱讀
    堪稱(chēng)<b class='flag-5'>六邊形</b><b class='flag-5'>戰(zhàn)士</b>的aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro表現(xiàn)如何?

    aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro評(píng)測(cè):移動(dòng)儲(chǔ)存界的六邊形戰(zhàn)士

    aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro評(píng)測(cè):移動(dòng)儲(chǔ)存界的六邊形戰(zhàn)士 隨著科技的進(jìn)步,儲(chǔ)存設(shè)備也不斷地進(jìn)步,從最初U盤(pán)到移動(dòng)機(jī)械硬盤(pán)以及現(xiàn)在的移動(dòng)固態(tài)硬盤(pán)都是當(dāng)代職場(chǎng)人最佳選擇之一。新一代的移動(dòng)儲(chǔ)存
    的頭像 發(fā)表于 08-16 11:19 ?1308次閱讀
    aigo國(guó)民好物移動(dòng)固態(tài)硬盤(pán)S7 Pro評(píng)測(cè):移動(dòng)儲(chǔ)存界的<b class='flag-5'>六邊形</b><b class='flag-5'>戰(zhàn)士</b>

    開(kāi)關(guān)電源半六邊形法則

    開(kāi)關(guān)電源半六邊形法則
    發(fā)表于 10-21 19:35 ?10次下載
    開(kāi)關(guān)電源半<b class='flag-5'>六邊形</b>法則

    訊飛翻譯機(jī)4.0發(fā)布,曾在消博會(huì)亮相的黑科技有多厲害?

    六邊形戰(zhàn)士,網(wǎng)絡(luò)流行語(yǔ),源于日本媒體《東京乒乓球新聞》。該媒體從速度、力量等個(gè)方面,分析各大乒乓選手實(shí)力。中國(guó)選手馬龍的邊框顯示全滿(mǎn),能力撐爆"六邊形",被稱(chēng)為"
    的頭像 發(fā)表于 08-08 15:05 ?1503次閱讀
    訊飛翻譯機(jī)4.0發(fā)布,曾在消博會(huì)亮相的黑科技有多厲害?

    壓線鉗四邊形六邊形的特征、性質(zhì)以及應(yīng)用

    在幾何學(xué)中,四邊形六邊形是兩個(gè)常見(jiàn)的多邊形狀。它們?cè)诓煌姆矫婢哂胁煌奶攸c(diǎn)和用途。本文將比較壓線鉗四邊形六邊形的特征、性質(zhì)以及應(yīng)用,
    的頭像 發(fā)表于 12-28 17:05 ?5224次閱讀

    六邊形壓接 VS B型壓接

    在柔性電纜的線束制造過(guò)程中,選擇適當(dāng)?shù)膲航臃椒ㄖ陵P(guān)重要,因?yàn)樗苯雨P(guān)系到連接的可靠和性能。六邊形壓接和B型壓接是兩種常用的壓接技術(shù),但它們各有特點(diǎn),適用于不同的應(yīng)用需求。在壓接連接和剛性電纜情況下
    的頭像 發(fā)表于 05-16 08:26 ?881次閱讀
    <b class='flag-5'>六邊形</b>壓接 VS B型壓接