0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種讓AI更快的可重構(gòu)處理器

芯長征科技 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-12-09 10:27 ? 次閱讀

深度學(xué)習(xí)是一種關(guān)鍵的計(jì)算方法,它正在推動(dòng)技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進(jìn)行計(jì)算的可重構(gòu)處理器是關(guān)鍵。

在最近的一項(xiàng)研究中,香港的研究人員報(bào)告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計(jì)算平臺(tái),深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計(jì)算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們在 10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對(duì)其進(jìn)行了描述。

在他們的研究中,研究人員將他們在 ReAAP 中提出的軟件編譯器與 Nvidia GPUARM CPU 上的其他三個(gè)基線軟件編譯器進(jìn)行了比較。結(jié)果表明,它的執(zhí)行速度是運(yùn)行在GPU并且是運(yùn)行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.

此外,Zheng 指出,ReAAP 為各種不同的計(jì)算密集層實(shí)現(xiàn)了硬件資源的持續(xù)高利用率。

雖然 ReAAP 擅長處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時(shí)支持 DNN。鄭說他的團(tuán)隊(duì)希望在未來解決這個(gè)問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計(jì)算成本的方式)。

“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴(kuò)展完成和評(píng)估后,我們將考慮將其與其他幾個(gè)人工智能計(jì)算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺(tái),例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。

而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進(jìn)行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。

“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢,”參與該研究的香港科技大學(xué)電子與計(jì)算機(jī)工程系博士后研究員鄭建偉解釋道。

這些優(yōu)勢促使他的團(tuán)隊(duì)創(chuàng)建了 ReAAP,這是一個(gè)集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評(píng)估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會(huì)發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進(jìn)行并行計(jì)算?!白鳛槎说蕉讼到y(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個(gè)應(yīng)用程序定制一個(gè) Python 腳本,”Zheng 解釋說。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18926

    瀏覽量

    227222
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24538

原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器

文章出處:【微信號(hào):芯長征科技,微信公眾號(hào):芯長征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ARM處理器的結(jié)構(gòu)和特點(diǎn)

    ARM處理器,全稱Advanced RISC Machines,是一種基于精簡指令集(RISC)架構(gòu)的微處理器。其結(jié)構(gòu)和特點(diǎn)在嵌入式系統(tǒng)、移動(dòng)設(shè)備、物聯(lián)網(wǎng)等多個(gè)領(lǐng)域具有顯著優(yōu)勢。以下將詳細(xì)闡述ARM
    的頭像 發(fā)表于 09-10 11:09 ?175次閱讀

    代高功能新AI加速(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下代高功能新AI加速(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)
    發(fā)表于 08-15 11:06 ?0次下載
    下<b class='flag-5'>一</b>代高功能新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>加速<b class='flag-5'>器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b>中<b class='flag-5'>更快</b>的嵌入<b class='flag-5'>處理</b>

    國產(chǎn)新型AI PC處理器亮相上海

    處理器
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年08月01日 09:21:01

    英特爾酷睿Ultra處理器突破500個(gè)AI模型優(yōu)化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500款AI模型已得到優(yōu)化運(yùn)行。這款處理器無疑是市場上領(lǐng)先的AI PC處理器
    的頭像 發(fā)表于 05-09 11:18 ?621次閱讀

    嵌入式微處理器般可分為哪四類型

    嵌入式微處理器一種專門設(shè)計(jì)用于嵌入式系統(tǒng)中的微處理器。它們通常用于控制和管理電子設(shè)備的各種任務(wù),例如自動(dòng)化系統(tǒng)、家電、電子設(shè)備以及工業(yè)機(jī)械等。嵌入式微處理器可以根據(jù)應(yīng)用的需求分為四
    的頭像 發(fā)表于 04-21 09:45 ?1063次閱讀

    dsp是嵌入式微處理器一種設(shè)備嗎 ARM嵌入式微處理器有何特點(diǎn)?

    DSP(Digital Signal Processor)不是一種嵌入式微處理器的設(shè)備。DSP是一種專門用于數(shù)字信號(hào)處理的微處理器,它具有高
    的頭像 發(fā)表于 04-21 09:37 ?697次閱讀

    dsp和嵌入式微處理器的區(qū)別和聯(lián)系

    一種專門用于數(shù)字信號(hào)處理(Digital Signal Processing)的處理器。數(shù)字信號(hào)處理一種通過對(duì)數(shù)字信號(hào)進(jìn)行算法運(yùn)算來
    的頭像 發(fā)表于 04-21 09:35 ?666次閱讀

    瑞薩發(fā)布下代動(dòng)態(tài)重構(gòu)人工智能處理器加速

    瑞薩最新發(fā)布的動(dòng)態(tài)重構(gòu)人工智能處理器(DRP-AI)加速,在業(yè)界引起了廣泛關(guān)注。這款加速
    的頭像 發(fā)表于 03-08 13:45 ?591次閱讀

    英特爾酷睿Ultra處理器開售:引領(lǐng)AI與高性能的未來

     該處理器大亮點(diǎn)是其強(qiáng)大的AI功能。內(nèi)置的NPU(神經(jīng)網(wǎng)絡(luò)處理器)為AI應(yīng)用提供了強(qiáng)大的加速能力,使得大型語言模型的本地運(yùn)行成為可能。
    的頭像 發(fā)表于 12-27 16:57 ?874次閱讀

    英特爾專家為您揭秘第五代英特爾? 至強(qiáng)? 擴(kuò)展處理器如何為AI加速

    近日,英特爾發(fā)布了第五代至強(qiáng) 擴(kuò)展處理器,尤其是其“為 AI 加速”的口號(hào)引起了廣泛關(guān)注。 在 AI 快速發(fā)展的今天,第五代英特爾 至強(qiáng)
    的頭像 發(fā)表于 12-23 12:20 ?629次閱讀

    一種重構(gòu)的莫爾相干納米激光陣列

    ,展示了納米激光能夠以“P”“K”“U”和“中”“國”等圖形生成重構(gòu)的陣列化相干激射。研究成果以《相位同步重構(gòu)莫爾納米激光陣列》(“Reconfigurable moiré nan
    的頭像 發(fā)表于 12-16 11:42 ?536次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>的莫爾相干納米激光陣列

    英特爾放大招:AI芯片和服務(wù)齊登場

    與此同時(shí),英特爾用于筆記本電腦和臺(tái)式電腦的酷睿Ultra處理器個(gè)人電腦擁有直接運(yùn)行人工智能應(yīng)用的功能??犷ltra內(nèi)置AI加速引擎,即被稱為NPU的神經(jīng)網(wǎng)絡(luò)處理單元,
    的頭像 發(fā)表于 12-15 17:10 ?740次閱讀
    英特爾放大招:<b class='flag-5'>AI</b>芯片和服務(wù)<b class='flag-5'>器</b>齊登場

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來,英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai
    的頭像 發(fā)表于 12-11 11:26 ?817次閱讀

    x86處理器也有AI智能,解讀AMD Ryzen AI引擎

    在完成收購賽靈思不久之后,AMD就成功地將賽靈思的AI模塊集成到銳龍處理器中,也就是我們今天看到的銳龍7040系列移動(dòng)處理器中的Ryzen AI引擎。這樣的改變,其實(shí)和AMD對(duì)
    的頭像 發(fā)表于 11-13 16:30 ?660次閱讀
    <b class='flag-5'>讓</b>x86<b class='flag-5'>處理器</b>也有<b class='flag-5'>AI</b>智能,解讀AMD Ryzen <b class='flag-5'>AI</b>引擎

    一種基于DSP的人工耳蝸語音處理器設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《一種基于DSP的人工耳蝸語音處理器設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 10-20 11:45 ?0次下載
    <b class='flag-5'>一種</b>基于DSP的人工耳蝸語音<b class='flag-5'>處理器</b>設(shè)計(jì)