0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華大學(xué)的存算一體化架構(gòu)和并行加速方法專利

汽車玩家 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-03-14 11:41 ? 次閱讀

清華大學(xué)基于多個憶阻器陣列的全硬件完整存算一體系統(tǒng),能夠高效的運行卷積神經(jīng)網(wǎng)絡(luò)算法,證明了存算一體架構(gòu)全硬件實現(xiàn)的可行性,對今后AI算力瓶頸的突破有著極大意義。

集微網(wǎng)消息,近日來,清華大學(xué)微電子學(xué)研究所、未來芯片技術(shù)高精尖創(chuàng)新中心的錢鶴、吳華強教授團隊與合作者在《自然》在線發(fā)表了題為“Fully hardware-implemented memristor convolutional neural network”的研究論文,報道了基于憶阻器陣列芯片卷積網(wǎng)絡(luò)的完整硬件實現(xiàn)。該成果所研發(fā)的基于多個憶阻器陣列的存算一體系統(tǒng),在處理卷積神經(jīng)網(wǎng)絡(luò)時的能效遠高于GPU,大幅提升了計算設(shè)備的算力,成功實現(xiàn)了以更小的功耗和更低的硬件成本完成復(fù)雜的計算。

隨著以人工智能為代表的信息技術(shù)革命興起,基于各種深度神經(jīng)網(wǎng)絡(luò)的算法可以實現(xiàn)圖像識別與分割、物體探測以及完成對語音和文本的翻譯、生成等處理。然而深度神經(jīng)網(wǎng)絡(luò)算法是一類以數(shù)據(jù)為中心的計算,實現(xiàn)該算法的硬件平臺需要具有高性能、低功耗的處理能力,這就對集成電路芯片技術(shù)提出了的更高要求。目前傳統(tǒng)實現(xiàn)該算法的硬件平臺是基于存儲和計算分離的馮諾依曼架構(gòu),這種架構(gòu)在計算時需要將數(shù)據(jù)在存儲器件和計算器件之間來回搬移,因此在包含大量參數(shù)的深度神經(jīng)網(wǎng)絡(luò)的計算過程中,該架構(gòu)的能效較低。為此,開發(fā)一種新型計算硬件來運行深度神經(jīng)網(wǎng)絡(luò)算法成為當前亟需解決的問題。

基于這種情況,清華大學(xué)團隊于2019年11月7日提出一項名為“基于憶阻器的神經(jīng)網(wǎng)絡(luò)的并行加速方法及處理器、裝置”的發(fā)明專利(申請?zhí)枺?01911082236.3),申請人為清華大學(xué)。此專利針對復(fù)雜神經(jīng)網(wǎng)絡(luò)的運算,提供了一種基于憶阻器的存算一體化架構(gòu)和并行加速方法,并在該系統(tǒng)架構(gòu)上高效運行了卷積神經(jīng)網(wǎng)絡(luò)。

清華大學(xué)的存算一體化架構(gòu)和并行加速方法專利

圖1 憶阻器單元及陣列示意圖

圖一展示了憶阻器單元及陣列,是此專利所用的核心硬件結(jié)構(gòu)。憶阻器是一種可以通過施加外部激勵,調(diào)節(jié)其電導(dǎo)狀態(tài)的非易失型器件。由憶阻器構(gòu)成的陣列可以并行的完成乘累加計算,并同時進行計算和存儲,因此基于這種特性可以對大量數(shù)據(jù)實現(xiàn)存算一體計算。由于乘累加是運行神經(jīng)網(wǎng)絡(luò)需要的核心計算任務(wù)。將憶阻器的的電導(dǎo)表示為權(quán)重值,可以實現(xiàn)高能效的神經(jīng)網(wǎng)絡(luò)運算,圖1右側(cè)展示的憶阻器陣列即為一個m行n列的神經(jīng)網(wǎng)絡(luò)權(quán)重矩陣。

清華大學(xué)的存算一體化架構(gòu)和并行加速方法專利

圖2 基于憶阻器陣列的卷積神經(jīng)網(wǎng)絡(luò)卷積計算與全連接計算示意圖

卷積神經(jīng)網(wǎng)絡(luò)包括卷積層、下采樣層、池化層和全連接層,每一層都需要做模塊化的功能處理。在卷積層中,通過卷積核替代標量的權(quán)重,加上偏置量,并在每一層添加非線性激活函數(shù),通過多個卷積層來解決較為復(fù)雜的問題。圖2展示了基于憶阻器陣列的卷積計算和全連接計算示意圖,用一個憶阻器陣列來實現(xiàn)一個卷積層的卷積計算,如對輸入圖像 “ 2”進行卷積處理,同時該卷積層包括多個卷積核,每個卷積核對應(yīng)憶阻器陣列的一行,且每行的多個憶阻器分別用于表示一個卷積核的各個元素的值。而對于全連接型的計算,該憶阻器陣列的每一列用于接收全連接層的輸入,各行用于提供全連接層的輸出,每一行的多個憶阻器分別用于表示該行的輸出對應(yīng)的各個權(quán)重。

清華大學(xué)的存算一體化架構(gòu)和并行加速方法專利

圖3 基于憶阻器的神經(jīng)網(wǎng)絡(luò)并行加速示意圖

基于憶阻器的神經(jīng)網(wǎng)絡(luò)并行加速示意圖如圖3所示,主要將多個第一憶阻器陣列并行地執(zhí)行卷積層的操作,并將結(jié)果輸出至第二功能層。通常卷積層需要多個子輸入數(shù)據(jù),可以按照任意順序分別提供給多個第一憶阻器陣列,由于各子輸入數(shù)據(jù)由憶阻器陣列進行卷積處理需要耗用的時間基本相同,因此加快卷積層的處理速度,即加快神經(jīng)網(wǎng)絡(luò)的處理速度,利用并行處理方式可以大大縮短處理時間。

清華大學(xué)的存算一體化架構(gòu)和并行加速方法專利

圖4 神經(jīng)網(wǎng)絡(luò)片外訓(xùn)練方法

圖4展示了基于憶阻器陣列的神經(jīng)網(wǎng)絡(luò)片外訓(xùn)練方法,首先利用數(shù)學(xué)軟件構(gòu)建神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型,進而基于處理器和存儲器等運行及訓(xùn)練上述數(shù)學(xué)模型,最后將訓(xùn)練好的數(shù)學(xué)模型的權(quán)重參數(shù)寫入神經(jīng)網(wǎng)絡(luò)對應(yīng)的憶阻器陣列,此時則可執(zhí)行并行加速的計算過程,并同時對數(shù)據(jù)進行存儲,實現(xiàn)存算一體加速。

隨著計算存儲一體化的發(fā)展趨勢,基于憶阻器在硬件架構(gòu)方面的革新,將數(shù)據(jù)存儲單元和計算單元融合為一體,能顯著減少數(shù)據(jù)搬運,極大提高計算并行度和能效。清華大學(xué)的錢鶴、吳華強教授團隊搭建的這一基于多個憶阻器陣列的全硬件完整存算一體系統(tǒng),并能夠高效的運行卷積神經(jīng)網(wǎng)絡(luò)算法,并驗證了圖像識別功能,證明了存算一體架構(gòu)全硬件實現(xiàn)的可行性,對今后AI算力瓶頸的突破有著極大意義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4718

    瀏覽量

    100077
  • 憶阻器
    +關(guān)注

    關(guān)注

    8

    文章

    69

    瀏覽量

    19739
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    4257
收藏 人收藏

    評論

    相關(guān)推薦

    后摩智能推出邊端大模型AI芯片M30,展現(xiàn)出一體架構(gòu)優(yōu)勢

    了基于M30芯片的智模組(SoM)和力謀??AI加速卡。 ? 后摩智能一體架構(gòu)芯片產(chǎn)品 ?
    的頭像 發(fā)表于 07-03 00:58 ?3862次閱讀

    探索內(nèi)計算—基于 SRAM 的內(nèi)計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術(shù)在計算領(lǐng)域的應(yīng)用和發(fā)展。首先,介紹了基于SRAM的內(nèi)邏輯計算技術(shù),包括其原理、優(yōu)勢以及在神經(jīng)網(wǎng)絡(luò)領(lǐng)域的應(yīng)用。其次,詳細討論了基于MR
    的頭像 發(fā)表于 05-16 16:10 ?2001次閱讀
    探索<b class='flag-5'>存</b>內(nèi)計算—基于 SRAM 的<b class='flag-5'>存</b>內(nèi)計算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    科技攜手北大共建一體化技術(shù)實驗室,推動AI創(chuàng)新

    揭牌儀式結(jié)束后,王紹迪在北大集成電路學(xué)院舉辦的“未名·芯”論壇上做了主題演講,分享了他對于多模態(tài)大模型時代內(nèi)計算發(fā)展的見解。他強調(diào)了一體在人工智能領(lǐng)域的重要性及其未來發(fā)展趨勢。
    的頭像 發(fā)表于 05-08 17:25 ?756次閱讀

    北京大學(xué)-知科技一體聯(lián)合實驗室揭牌,開啟知科技產(chǎn)學(xué)研融合戰(zhàn)略新升級

    5月5日,“北京大學(xué)-知科技一體技術(shù)聯(lián)合實驗室”在北京大學(xué)微納電子大廈正式揭牌,北京
    的頭像 發(fā)表于 05-07 19:31 ?1235次閱讀
    北京<b class='flag-5'>大學(xué)</b>-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>聯(lián)合實驗室揭牌,開啟知<b class='flag-5'>存</b>科技產(chǎn)學(xué)研融合戰(zhàn)略新升級

    聚焦全國一體化力體系構(gòu)建,憶聯(lián)以強大力“引擎”釋放力潛能

    力是數(shù)字時代的生產(chǎn)力,為數(shù)字經(jīng)濟與實體經(jīng)濟深度融合提供了強大支持。在不久前結(jié)束的全國兩會中,“全國一體化力體系”成為新詞熱詞,會議提出“適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國一體化
    的頭像 發(fā)表于 03-22 18:13 ?433次閱讀
    聚焦全國<b class='flag-5'>一體化</b><b class='flag-5'>算</b>力體系構(gòu)建,憶聯(lián)以強大<b class='flag-5'>存</b>力“引擎”釋放<b class='flag-5'>算</b>力潛能

    什么是通感一體化?通感一體化的應(yīng)用場景

    通感一體化可廣泛應(yīng)用于智能家居、智慧城市、智慧交通、醫(yī)療健康等方面。文檔君為大家搜集了些典型的應(yīng)用場景。 智能家居 通感一體化利用基站
    發(fā)表于 01-18 16:12 ?9338次閱讀
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一體化</b>?通感<b class='flag-5'>算</b><b class='flag-5'>一體化</b>的應(yīng)用場景

    探討6G與天地一體化發(fā)展愿景和產(chǎn)業(yè)路徑

    ”為主題,匯聚了來自中國信通院、中國移動研究院、中國電信、中國聯(lián)通、中興通訊、新華三、清華大學(xué)、上海大學(xué)等科研機構(gòu)、知名企業(yè)和高校的專家和學(xué)者,共同探討6G與天地一體化發(fā)展愿景和產(chǎn)業(yè)路徑。
    的頭像 發(fā)表于 01-15 10:07 ?876次閱讀

    淺談為AI大力而生的-芯片

    大模型爆火之后,一體獲得了更多的關(guān)注與機會,其原因之是因為
    發(fā)表于 12-06 15:00 ?310次閱讀
    淺談為AI大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>體</b>芯片

    怎么測試交直流一體化電源?交直流一體化電源測試系統(tǒng)如何測試?

    交直流一體化電源擁有高度適應(yīng)性,可以用于不同的電力需求領(lǐng)域。但是為了確保其質(zhì)量和性能,需要對交直流一體化電源進行各項測試以保證正常工作。本文納米軟件將介紹交直流一體化電源的測試方法,以
    的頭像 發(fā)表于 11-23 14:59 ?513次閱讀

    憶阻器(RRAM)一體路線再次被肯定

    近日,清華大學(xué)發(fā)布的顆憶阻器一體芯片,火了。該芯片的火爆源于個月前,
    的頭像 發(fā)表于 10-26 09:13 ?1206次閱讀
    憶阻器(RRAM)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>路線再次被肯定

    什么是一體芯片?一體芯片的優(yōu)勢和應(yīng)用領(lǐng)域

    一體片上學(xué)習(xí)在實現(xiàn)更低延遲和更小能耗的同時,能夠有效保護用戶隱私和數(shù)據(jù)。該芯片參照仿生類腦處理方式,可實現(xiàn)不同任務(wù)的快速“片上訓(xùn)練”與“片上識別”,能夠有效完成邊緣計算場景下的增量學(xué)習(xí)任務(wù),以極低的耗電適應(yīng)新場景、學(xué)習(xí)新知識
    的頭像 發(fā)表于 10-23 14:15 ?4700次閱讀
    什么是<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片?<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片的優(yōu)勢和應(yīng)用領(lǐng)域

    清華大學(xué)研發(fā)出存儲芯片“診療一體化”技術(shù)

    清華大學(xué)物理系教授薛平團隊與公安部鑒定中心合作的方法開發(fā)的機器人技術(shù)融合智能機器人做手術(shù),光學(xué)影像和激光蝕消融等技術(shù)以損毀的存儲芯片幫助一體化“手術(shù)”一體化usb儲存裝置等丟了恢復(fù)數(shù)據(jù)
    的頭像 發(fā)表于 10-18 11:01 ?665次閱讀

    我國芯片突破!清華大學(xué)全球首枚!

    10月10日消息,據(jù)清華大學(xué)公眾號,近日,清華大學(xué)集成電路學(xué)院教授吳華強、副教授高濱基于一體計算范式,研制出全球首顆全系統(tǒng)集成的、支持高
    的頭像 發(fā)表于 10-14 08:11 ?501次閱讀
    我國芯片突破!<b class='flag-5'>清華大學(xué)</b>全球首枚!

    一體芯片新突破!清華大學(xué)研制出首顆一體芯片

    這幾天清華大學(xué)又火出圈了。但這次并不是因為招生搶人和飯?zhí)茫?b class='flag-5'>清華大學(xué)的芯片研發(fā)團隊研制出全球首顆全系統(tǒng)集成的一體芯片。這是我國、乃至全
    的頭像 發(fā)表于 10-11 14:39 ?950次閱讀

    清華大學(xué)重磅消息:全球首顆!我國芯片領(lǐng)域取得重大突破

    清華大學(xué)集成電路學(xué)院教授吳華強、副教授高濱基于一體計算范式,研制出全球首顆全系統(tǒng)集成的、支持高效片上學(xué)習(xí)(機器學(xué)習(xí)能在硬件端直接完成)的憶阻器
    的頭像 發(fā)表于 10-11 08:39 ?648次閱讀
    <b class='flag-5'>清華大學(xué)</b>重磅消息:全球首顆!我國芯片領(lǐng)域取得重大突破