0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

何為異構(gòu)芯片 協(xié)同異構(gòu)AI芯片的挑戰(zhàn)

AI芯天下 ? 來源:晶上聯(lián)盟 ? 2024-02-25 13:53 ? 次閱讀

進入大模型時代,全社會算力需求被推高到了前所未有的程度。

由于大模型AI對于全社會的重要性,以及各行各業(yè)加快建設(shè)智算中心,也引發(fā)了全社會學(xué)習(xí)異構(gòu)AI芯片的熱潮。

異構(gòu)AI芯片出現(xiàn)的現(xiàn)象

2024年1月,微軟聯(lián)合創(chuàng)始人比爾·蓋茨與OpenAI首席執(zhí)行官山姆·奧特曼進行了一次對話,奧特曼在對話中表示人工智能將引發(fā)人類歷史上“最快”的一次技術(shù)革命,人類可能還沒有準(zhǔn)備好以多快的速度適應(yīng)這種變革。

奧特曼預(yù)計,這項技術(shù)將迅速發(fā)展,使系統(tǒng)的計算能力達(dá)到GPT-4的10萬倍或100萬倍。

簡單來說,用于人工智能計算的英偉達(dá)GPU芯片遠(yuǎn)遠(yuǎn)不夠用了。

而為應(yīng)對GPU全球供應(yīng)短缺問題,以及美國對GPU的出口限制問題,當(dāng)然更重要的是在AI場景下降低成本,于是市場上涌現(xiàn)了各類異構(gòu)AI芯片。

何為異構(gòu)芯片

異構(gòu)芯片即結(jié)合兩種或多種不同類型的處理器控制器架構(gòu)的芯片。

異構(gòu)芯片可以是CPU+FPGA,CPU+GPU也可以是CPU+AI,也可以是CPU+動態(tài)可重構(gòu)等不同架構(gòu),這些架構(gòu)都是利用一種架構(gòu)的優(yōu)勢來彌補另外一種架構(gòu)的不足,以適應(yīng)用戶多種用途的應(yīng)用需求。

Intel的CPU+Altera的FPGA或者AMD的Instinct MI300和英偉達(dá)的Grace Hopper超級芯片也是采用“CPU+GPU”的異構(gòu)形式。

CPU+GPU架構(gòu)的優(yōu)勢

CPU和GPU協(xié)同工作時,CPU包含幾個專為串行處理而優(yōu)化的核心,GPU則由數(shù)以千計更小、更節(jié)能的核心組成,這些核心專為提供強勁的并行運算性能而設(shè)計。

程序的串行部分在CPU上運行,而并行部分則在GPU上運行。

GPU目前已經(jīng)發(fā)展到成熟階段,可輕松執(zhí)行現(xiàn)實生活中的各種應(yīng)用程序,而且程序運行速度已遠(yuǎn)遠(yuǎn)超過使用多核系統(tǒng)時的情形。

因此,CPU和GPU的結(jié)合剛好可以解決深度學(xué)習(xí)模型訓(xùn)練在CPU上耗時長的問題,提升深度學(xué)習(xí)模型的訓(xùn)練效率。

CPU與GPU的應(yīng)用場景也不斷拓寬

隨著CPU與GPU的結(jié)合,其相較于單獨CPU與GPU的應(yīng)用場景也不斷拓寬。

CPU+GPU架構(gòu)適用于處理高性能計算。伴隨著高性能計算類應(yīng)用的發(fā)展,驅(qū)動算力需求不斷攀升,但目前單一計算類型和架構(gòu)的處理器已經(jīng)無法處理更復(fù)雜、更多樣的數(shù)據(jù)。

數(shù)據(jù)中心如何在增強算力和性能的同時,具備應(yīng)對多類型任務(wù)的處理能力,成為全球性的技術(shù)難題。

CPU+GPU的異構(gòu)并行計算架構(gòu)作為高性能計算的一種主流解決方案,受到廣泛關(guān)注。

CPU+GPU架構(gòu)適用于處理數(shù)據(jù)中心產(chǎn)生的海量數(shù)據(jù)。數(shù)據(jù)爆炸時代來臨,使用單一架構(gòu)來處理數(shù)據(jù)的時代已經(jīng)過去。

比如:個人互聯(lián)網(wǎng)用戶每天產(chǎn)生約1GB數(shù)據(jù),智能汽車每天約50GB,智能醫(yī)院每天約3TB數(shù)據(jù),智慧城市每天約50PB數(shù)據(jù)。

數(shù)據(jù)的數(shù)量和多樣性以及數(shù)據(jù)處理的地點、時間和方式也在迅速變化。無論工作任務(wù)是在邊緣還是在云中,不管是人工智能工作任務(wù)還是存儲工作任務(wù),都需要有正確的架構(gòu)和軟件來充分利用這些特點。

CPU+GPU架構(gòu)可以共享內(nèi)存空間,消除冗余內(nèi)存副本來改善問題。

在此前的技術(shù)中,雖然GPU和CPU已整合到同一個芯片上,但是芯片在運算時要定位內(nèi)存的位置仍然得經(jīng)過繁雜的步驟,這是因為CPU和GPU的內(nèi)存池仍然是獨立運作。

為了解決兩者內(nèi)存池獨立的運算問題,當(dāng)CPU程式需要在GPU上進行部分運算時,CPU都必須從CPU的內(nèi)存上復(fù)制所有的資料到GPU的內(nèi)存上,而當(dāng)GPU上的運算完成時,這些資料還得再復(fù)制回到CPU內(nèi)存上。

然而,將CPU與GPU放入同一架構(gòu),就能夠消除冗余內(nèi)存副本來改善問題,處理器不再需要將數(shù)據(jù)復(fù)制到自己的專用內(nèi)存池來訪問/更改該數(shù)據(jù)。

統(tǒng)一內(nèi)存池還意味著不需要第二個內(nèi)存芯片池,即連接到CPU的DRAM

因此,通過CPU+GPU異構(gòu)并行計算架構(gòu)組成的服務(wù)器,正成為服務(wù)器市場中的一匹黑馬。現(xiàn)在已有多家芯片廠商開始跟進。

協(xié)同異構(gòu)AI芯片的挑戰(zhàn)

在實際建設(shè)智算中心的時候,到底在GPU、FPGA、DSA和ASIC之間選擇哪種算力和算力組合,這是一個很大的問題。

GPU雖然能夠應(yīng)對大模型計算需求,但一卡難求以及限制性能等問題嚴(yán)重;

DSA靈活性有限,硬件和軟件架構(gòu)呈現(xiàn)碎片化;

FPGA的功耗和成本較高,主要用于原型驗證,難以在實際場景中大規(guī)模落地;

ASIC功能固化,缺乏足夠的靈活性,而且ASIC芯片的研發(fā)周期長、成本高和風(fēng)險大等,都為大規(guī)模和長期采用帶來了挑戰(zhàn)。

另外,多異構(gòu)計算的硬件層次高集成度和系統(tǒng)軟件層次多協(xié)同、通用編程模型和開發(fā)環(huán)境等,都是行業(yè)需要解決的問題,多異構(gòu)共存的異構(gòu)計算孤島現(xiàn)象越來越突顯。

特別是不同的異構(gòu)計算編程框架,要求開發(fā)者掌握多種編程模式和語言,使得代碼移植面臨巨大挑戰(zhàn)。

尋找一個真正統(tǒng)一、能滿足所有硬件和應(yīng)用需求的編程方法,仍是當(dāng)下計算領(lǐng)域的熱門研究課題。

結(jié)尾:可發(fā)展產(chǎn)業(yè)機遇

大模型AI的出現(xiàn),為重構(gòu)數(shù)據(jù)中心帶來了機遇。由于大模型AI天然帶來海量的數(shù)據(jù)中心內(nèi)部通信而不是對外通信,在將數(shù)據(jù)中心重構(gòu)為智算中心的時候,就帶來了“一個數(shù)據(jù)中心即為一臺計算機”的設(shè)計理念,這就是以系統(tǒng)設(shè)計為中心的原則。

以系統(tǒng)設(shè)計為中心,即考慮一個數(shù)據(jù)中心上承載大模型訓(xùn)練等邏輯上單一的“大應(yīng)用”,也就是數(shù)據(jù)中心級的業(yè)務(wù)系統(tǒng)。

因此在智算中心的設(shè)計上要超越硬件和軟件的傳統(tǒng)界限,將整個數(shù)據(jù)中心作為一個協(xié)同工作的系統(tǒng)。

有了以數(shù)據(jù)中心為一臺計算機的設(shè)計理念和角度,就能找到有效的軟硬件協(xié)同的異構(gòu)融合計算之路。

內(nèi)容及圖片來源于:晶上聯(lián)盟



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19100

    瀏覽量

    228817
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    16105

    瀏覽量

    177080
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1850

    瀏覽量

    34849
  • 異構(gòu)芯片
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    2095

原文標(biāo)題:趨勢丨2024年再怎么重視“異構(gòu)芯片”都不為過

文章出處:【微信號:World_2078,微信公眾號:AI芯天下】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    異構(gòu)集成封裝類型詳解

    隨著摩爾定律的放緩,半導(dǎo)體行業(yè)越來越多地采用芯片設(shè)計和異構(gòu)集成封裝來繼續(xù)推動性能的提高。這種方法是將大型硅芯片分割成多個較小的芯片,分別進行設(shè)計、制造和優(yōu)化,然后再集成到單個封裝中。
    的頭像 發(fā)表于 11-05 11:00 ?200次閱讀
    <b class='flag-5'>異構(gòu)</b>集成封裝類型詳解

    安謀科技異構(gòu)算力組合,破局生成式AI算力挑戰(zhàn)

    近日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片
    的頭像 發(fā)表于 08-13 09:12 ?499次閱讀

    此芯科技發(fā)布“此芯P1”異構(gòu)高能效芯片,引領(lǐng)AI PC新紀(jì)元

    近日,此芯科技集團有限公司(簡稱“此芯科技”)在上海隆重舉辦了AI PC戰(zhàn)略發(fā)布會,正式揭曉了其首款創(chuàng)新力作——“此芯P1”異構(gòu)高能效芯片。這一里程碑式的發(fā)布,標(biāo)志著國產(chǎn)芯片
    的頭像 發(fā)表于 08-01 17:42 ?759次閱讀

    安謀科技異構(gòu)算力賦能AI計算,此芯科技首款AI PC芯片發(fā)布

    7月30日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片
    發(fā)表于 07-31 14:36 ?988次閱讀
    安謀科技<b class='flag-5'>異構(gòu)</b>算力賦能<b class='flag-5'>AI</b>計算,此芯科技首款<b class='flag-5'>AI</b> PC<b class='flag-5'>芯片</b>發(fā)布

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

    策略來確保各個核心能夠充分發(fā)揮其性能優(yōu)勢,并實現(xiàn)有效的通信和協(xié)同工作。這就形成了一種稱為異構(gòu)多處理系統(tǒng)(AMP系統(tǒng))的架構(gòu)。 在AMP系統(tǒng)中,通常采用主-從結(jié)構(gòu)。主核心作為系統(tǒng)的控制中心,負(fù)責(zé)啟動和管理
    發(fā)表于 07-24 09:54

    異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高算力利用率

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著AI技術(shù)的飛速發(fā)展,大模型的訓(xùn)練和推理任務(wù)對算力的需求日益增長。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應(yīng)鏈風(fēng)險。因此,異構(gòu)芯片混訓(xùn)成為
    的頭像 發(fā)表于 07-18 00:11 ?3300次閱讀

    新思科技面向英特爾代工推出可量產(chǎn)的多裸晶芯片設(shè)計參考流程,加速芯片創(chuàng)新

    3DIC Compiler協(xié)同設(shè)計與分析解決方案結(jié)合新思科技IP,加速英特爾代工EMIB技術(shù)的異構(gòu)集成 摘要: 新思科技人工智能(AI)驅(qū)動型多裸晶芯片(Multi-die)設(shè)計參考流
    發(fā)表于 07-09 13:42 ?755次閱讀

    全志科技T527高算力八核異構(gòu)芯片獲“年度最佳SoC”榮譽

    全志科技T527高算力八核異構(gòu)芯片獲“年度最佳SoC”榮譽
    的頭像 發(fā)表于 04-08 10:29 ?1463次閱讀
    全志科技T527高算力八核<b class='flag-5'>異構(gòu)</b><b class='flag-5'>芯片</b>獲“年度最佳SoC”榮譽

    高通NPU和異構(gòu)計算提升生成式AI性能?

    異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?707次閱讀

    華芯邦科技開創(chuàng)異構(gòu)集成新紀(jì)元,Chiplet異構(gòu)集成技術(shù)衍生HIM異構(gòu)集成模塊賦能孔科微電子新賽道

    華芯邦科技將chiplet技術(shù)應(yīng)用于HIM異構(gòu)集成模塊中伴隨著集成電路和微電子技術(shù)不斷升級,行業(yè)也進入了新的發(fā)展周期。HIM異構(gòu)集成模塊化-是華芯邦集團旗下公司深圳市前??卓莆㈦娮佑邢薰綤OOM的主營方向,將PCBA芯片化、
    的頭像 發(fā)表于 01-18 15:20 ?532次閱讀

    異構(gòu)專用AI芯片的黃金時代

    異構(gòu)專用AI芯片的黃金時代
    的頭像 發(fā)表于 12-04 16:42 ?580次閱讀
    <b class='flag-5'>異構(gòu)</b>專用<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的黃金時代

    異構(gòu)集成 (HI) 與系統(tǒng)級芯片 (SoC) 有何區(qū)別?

    異構(gòu)集成 (HI) 與系統(tǒng)級芯片 (SoC) 有何區(qū)別?
    的頭像 發(fā)表于 11-29 15:39 ?1903次閱讀
    <b class='flag-5'>異構(gòu)</b>集成 (HI) 與系統(tǒng)級<b class='flag-5'>芯片</b> (SoC) 有何區(qū)別?

    3D異構(gòu)集成與 COTS (商用現(xiàn)成品)小芯片的發(fā)展問題

    3D 異構(gòu)集成與 COTS (商用現(xiàn)成品)小芯片的發(fā)展問題
    的頭像 發(fā)表于 11-27 16:37 ?829次閱讀
    3D<b class='flag-5'>異構(gòu)</b>集成與 COTS (商用現(xiàn)成品)小<b class='flag-5'>芯片</b>的發(fā)展問題

    什么是異構(gòu)集成?什么是異構(gòu)計算?異構(gòu)集成、異構(gòu)計算的關(guān)系?

    異構(gòu)集成主要指將多個不同工藝節(jié)點單獨制造的芯片封裝到一個封裝內(nèi)部,以增強功能性和提高性能。
    的頭像 發(fā)表于 11-27 10:22 ?6754次閱讀
    什么是<b class='flag-5'>異構(gòu)</b>集成?什么是<b class='flag-5'>異構(gòu)</b>計算?<b class='flag-5'>異構(gòu)</b>集成、<b class='flag-5'>異構(gòu)</b>計算的關(guān)系?

    當(dāng)芯片變身 3D系統(tǒng),3D異構(gòu)集成面臨哪些挑戰(zhàn)

    當(dāng)芯片變身 3D 系統(tǒng),3D 異構(gòu)集成面臨哪些挑戰(zhàn)
    的頭像 發(fā)表于 11-24 17:51 ?766次閱讀
    當(dāng)<b class='flag-5'>芯片</b>變身 3D系統(tǒng),3D<b class='flag-5'>異構(gòu)</b>集成面臨哪些<b class='flag-5'>挑戰(zhàn)</b>