0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI大模型這股東風(fēng),RISC-V該如何乘?

時光流逝最終成了回憶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2023-12-04 06:53 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/吳子鵬)說起AI大模型的訓(xùn)練和推理,很多人的第一想法肯定是英偉達(dá)芯片,那么背后也就是ARM架構(gòu)。統(tǒng)計數(shù)據(jù)顯示,在AI芯片領(lǐng)域,英偉達(dá)一家獨(dú)占七成市場份額;如果單獨(dú)看AI大模型訓(xùn)練芯片,正如花旗研究分析師Christopher Danely提到的,英偉達(dá)的市場占比超過九成。

實(shí)際上,即便是谷歌、亞馬遜、Meta、IBM及其他一些企業(yè)提供的AI芯片,背后的架構(gòu)也基本是ARM架構(gòu)。那么,目前同樣大火的RISC-V架構(gòu)是否能夠在AI大模型市場捕捉到機(jī)會呢?

RISC-V在AI大模型領(lǐng)域的嘗試

當(dāng)然,雖然在芯片性能方面還無法和ARM架構(gòu)芯片正面抗衡,不過RISC-V架構(gòu)陣營也沒有坐以待斃,而是在積極探索進(jìn)入AI大模型市場的機(jī)會,且已經(jīng)有一些成果。

在今年的世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,希姆計算聯(lián)合國鑫發(fā)布基于RISC-V架構(gòu)打造的大模型系列一體機(jī),包括2U4卡、4U8卡機(jī),支持部署6B、7B、13B參數(shù)規(guī)模的大模型。

這就是很好的聯(lián)動,希姆計算成立于2019年4月,成立之初就確立了基于RISC-V指令集設(shè)計數(shù)據(jù)中心高性能芯片的技術(shù)路線、由專用計算(DSA,領(lǐng)域?qū)S眉軜?gòu))向通用計算(CPU)逐步演進(jìn)的發(fā)展戰(zhàn)略。目前,該公司已經(jīng)有一款加速卡產(chǎn)品——STCP920。

STCP920是希姆計算基于RISC-V架構(gòu)打造的人工智能計算加速卡,混合支持FP16/INT8數(shù)據(jù)類型。算力表現(xiàn)為:半精度浮點(diǎn)運(yùn)算速度(FP16)為128TFLOPS;整數(shù)運(yùn)算速度(INT8)為256 TOPS。內(nèi)存類型為LPDDR4X,內(nèi)存帶寬為119.4GB/S。

國鑫則是中國領(lǐng)先的服務(wù)器解決方案供應(yīng)商,具有全產(chǎn)業(yè)鏈的自主研發(fā)能力和生產(chǎn)能力,是目前中國屈指可數(shù)的集研發(fā)、生產(chǎn)、銷售、服務(wù)于一體的服務(wù)器和存儲軟硬件廠商之一。目前,該公司在智算中心方面的服務(wù)器主要還是基于英特爾AMD的芯片產(chǎn)品。

再看另一個案例,來自芯至科技。該公司今年才開始正式運(yùn)營,不過卻在助推RISC-V進(jìn)入大模型運(yùn)算方面做出了突出的成績。根據(jù)該公司官網(wǎng)信息,芯至科技在今年發(fā)布了全球首款Risc-V based GPGPU SIMT核——焦山核(Turbocore)V100。

焦山核V100全面支持SIMT,支持RV32G指令集,支持Tensor擴(kuò)展指令集,支持類CUDA編程模型,提供硬件任務(wù)調(diào)度,指令并行度為32Threads*128??杀挥糜贕PGPU進(jìn)行AI推理等多種場景,單核性能不低于16T Int8/GHz,預(yù)計采用12nm工藝流片,頻率將不低于1.2GHZ。

芯至科技聯(lián)合創(chuàng)始人、首席芯片架構(gòu)師兼副總裁尹文此前表示,AI大模型落地到推理側(cè)的新機(jī)會與RISC-V架構(gòu)創(chuàng)新不謀而合,Scaler小標(biāo)量+SIMT大算力的指令集/微架構(gòu)融合將是未來RISC-V發(fā)力的重點(diǎn),能以相對低的成本,為AI推理側(cè)應(yīng)用提供高效支持。

尹文這種“RISC-V可以做線程級并行AI計算”的想法,和英特爾是不謀而合的。英特爾Piuma是一個定制RISC內(nèi)核的特殊芯片,它的特殊之處在雖然只有8個核心,但是卻有528個線程,單核擁有66個線程。另外,Piuma芯片還具有非??植赖幕ヂ?lián)能力,最多可以實(shí)現(xiàn)131072個Piuma芯片互連,讓一個芯片集群擁有1680萬個核心,這會帶來非??植赖臄?shù)據(jù)并行能力。雖然英特爾沒有說這是RISC-V內(nèi)核,但是技術(shù)上是一脈相通的,給行業(yè)發(fā)展提供了一個全新的思路。

另外,我們看一下阿里平頭哥,該公司最近連發(fā)了三顆RISC-V處理器內(nèi)核——首次實(shí)現(xiàn)AI矩陣擴(kuò)展的C907、滿足Vector1.0標(biāo)準(zhǔn)的C920,以及實(shí)時處理器R910。其中,C920已經(jīng)新增支持Transformer模型,C907首次實(shí)現(xiàn)了獨(dú)立矩陣運(yùn)算(Matrix)擴(kuò)展,這些內(nèi)核都表明商用RISC-V內(nèi)核確實(shí)在向著AI大模型的核心戰(zhàn)場進(jìn)展,滿足性能指標(biāo)只會是時間問題。

除了上述提到的,另外國芯科技和上海清華國際創(chuàng)新中心、智繪微電子已經(jīng)簽署了關(guān)于開源RISC-V GPGPU合作開發(fā)的備忘錄,這也是一種積極的探索。從理論上說,RISC-V的Vector擴(kuò)展支持用GPGPU方式來執(zhí)行,那么基于RISC-V實(shí)現(xiàn)GPGPU就有了可行性。

RISC-V在AI大模型領(lǐng)域的挑戰(zhàn)

根據(jù)此前的報道,在一項(xiàng)專業(yè)基準(zhǔn)測試中,專注高性能RISC-V芯片的Tenstorrent推出基于自有處理器內(nèi)核的RISC-V CPU芯片,該芯片的評分領(lǐng)先于英特爾的Sapphire Rapids、英偉達(dá)的Grace和AMD的Zen4。這說明,在傳統(tǒng)CPU方向上,RISC-V架構(gòu)已經(jīng)開始嶄露頭角,證明了RISC-V架構(gòu)做高性能芯片的能力,那么在AI大模型方面會遇到哪些挑戰(zhàn)呢?

在AI大模型這類型應(yīng)用中,RISC-V架構(gòu)第一大挑戰(zhàn)肯定是內(nèi)核本身。通過美國對于我國的AI芯片禁令就可以看出,AI芯片做大模型訓(xùn)練是有一定門檻的,低于這個門檻效果就會大打折扣,雖然RISC-V架構(gòu)已經(jīng)做了很多嘗試,不過總體性能和長期深耕GPU領(lǐng)域的ARM架構(gòu)肯定沒法比。當(dāng)然,英特爾和芯至科技這類嘗試說明,RISC-V架構(gòu)可以率先攻克大模型推理芯片市場以及終端一體機(jī)市場。

在性能背后就會牽扯出第二問題——專利。英偉達(dá)等芯片廠商以及Arm公司在高性能計算芯片領(lǐng)域儲備了大量的專利,為了追求極致的運(yùn)算性能,很多方式方法都已經(jīng)被論證過了,并形成了專利,要繞開這些專利限制實(shí)現(xiàn)高性能計算芯片,進(jìn)一步提升了相關(guān)廠商的研發(fā)難度。

第三個問題也是一個老生常談的問題,那就是生態(tài)。AI大模型這類型的應(yīng)用,無論是訓(xùn)練端還是推理端,都會是一個軟硬件結(jié)合的系統(tǒng),尤其是具體到某一個細(xì)分領(lǐng)域的推理應(yīng)用,具有豐富的上層應(yīng)用,也就需要更高效的軟硬件融合。不過,目前對于RISC-V架構(gòu)而言,很多生態(tài)還是荒漠,比如DDK、接口、中間件這些關(guān)鍵的生態(tài)工具,基本還沒有。

小結(jié)

還記得之前平頭哥的觀點(diǎn):RISC-V將成為AI時代的原生架構(gòu),各行業(yè)芯片都值得用RISC-V做一次。那么,應(yīng)用于AI大模型的芯片也是如此。不過,目前應(yīng)用于這一領(lǐng)域的芯片還在高速地發(fā)展,這給RISC-V架構(gòu)增加了追趕的難度,且生態(tài)封閉的問題需要從業(yè)者有更大的勇氣和決心。目前,RISC-V在AI大模型應(yīng)用中已經(jīng)有所嘗試,接下來要做到的就是完善產(chǎn)品和生態(tài),沒有其他捷徑可走。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28902

    瀏覽量

    266275
  • RISC-V
    +關(guān)注

    關(guān)注

    44

    文章

    2142

    瀏覽量

    45714
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1828

    瀏覽量

    34671
  • 阿里平頭哥
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    1832
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2139

    瀏覽量

    1989
  • 芯至科技
    +關(guān)注

    關(guān)注

    0

    文章

    1

    瀏覽量

    62
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    281

    瀏覽量

    219
收藏 人收藏

    評論

    相關(guān)推薦

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

    加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進(jìn)步的關(guān)鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?133次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !

    萬物智聯(lián)時代,RISC-VAI的融合之路如何走?

    在全球科技飛速發(fā)展的背景下,RISC-V與人工智能(AI)的結(jié)合成為了業(yè)內(nèi)關(guān)注的焦點(diǎn),今天,第四屆滴水湖中國RISC-V產(chǎn)業(yè)論壇在上海臨港滴水湖畔召開,北京大學(xué)講席教授、RISC-V
    的頭像 發(fā)表于 08-31 08:06 ?437次閱讀
    萬物智聯(lián)時代,<b class='flag-5'>RISC-V</b>與<b class='flag-5'>AI</b>的融合之路<b class='flag-5'>該</b>如何走?

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    沁恒在歷屆峰會上分享RISC-V在MCU領(lǐng)域的創(chuàng)新成果,和大家共同見證了本土RISC-V產(chǎn)業(yè)的成長。早在第一屆RISC-V中國峰會上,沁恒就公開了青稞RISC-V系列量產(chǎn)芯片的關(guān)鍵技術(shù)
    的頭像 發(fā)表于 08-30 18:18 ?1104次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    2024 RISC-V 中國峰會:華秋電子助力RISC-V生態(tài)!

    第四屆RISC-V中國峰會(RISC-V Summit China 2024)于8月21日至23日在杭州盛大召開,成為RISC-V領(lǐng)域的一次重要盛會
    的頭像 發(fā)表于 08-26 18:33 ?618次閱讀
    2024 <b class='flag-5'>RISC-V</b> 中國峰會:華秋電子助力<b class='flag-5'>RISC-V</b>生態(tài)!

    RISC-V最重要的方向是AI,但如何構(gòu)建RISC-V+AI生態(tài)系統(tǒng)?

    普遍認(rèn)為RISC-V+AI是未來的大方向。在第四屆滴水湖中國RISC-V產(chǎn)業(yè)論壇上,圓桌論壇環(huán)節(jié)也著重聊到了RISC-V+AI這個話題。 ? 隨著AI落地的深入,應(yīng)用方面遇到的挑戰(zhàn)也隨
    的頭像 發(fā)表于 08-19 14:02 ?903次閱讀

    risc-v的發(fā)展歷史

    ,研究團(tuán)隊成立了一個四人小組,僅用了3個月的時間就完成了RISC-V指令集的開發(fā)。 二、公開與標(biāo)準(zhǔn)化 2014年:RISC-V架構(gòu)正式對外公開,并成立了RISC-V基金會(
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開源的指令集架構(gòu)(ISA),自其誕生以來就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點(diǎn): 1. 性能問題 相對于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18

    RISC-V適合什么樣的應(yīng)用場景

    設(shè)計使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。 3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML) 高性能計算:RISC-V結(jié)合AI加速器或協(xié)處理器,可以提供高效的人工智能計算
    發(fā)表于 07-29 17:16

    RISC-V在中國的發(fā)展機(jī)遇有哪些場景?

    聯(lián)網(wǎng)市場的重要參與者,擁有龐大的用戶基數(shù)和豐富的應(yīng)用場景。RISC-V在中國的發(fā)展將受益于這一市場需求的增長。 2. 人工智能(AIAI算力需求:隨著人工智能技術(shù)的廣泛應(yīng)用,對算力的需求不斷增加
    發(fā)表于 07-29 17:14

    risc-v多核芯片在AI方面的應(yīng)用

    RISC-V多核芯片在AI方面的應(yīng)用主要體現(xiàn)在其低功耗、低成本、靈活可擴(kuò)展以及能夠更好地適應(yīng)AI算法的不同需求等特點(diǎn)上。 首先,RISC-V適合用于高效設(shè)計實(shí)現(xiàn),其內(nèi)核面積更小,功耗更
    發(fā)表于 04-28 09:20

    解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索

    4月12日,第二期“大家來談芯|解鎖RISC-V技術(shù)力量”在上海臨港新片區(qū)頂科永久會址舉辦,本期沙龍聚焦RISC-V技術(shù),圍繞AI時代的RISC-V市場機(jī)會、
    的頭像 發(fā)表于 04-16 08:16 ?484次閱讀
    解鎖<b class='flag-5'>RISC-V</b>技術(shù)力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索

    RISC-V廠商正在AI領(lǐng)域積極布局!

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)在AI大浪潮的席卷下,越來越多具備多模態(tài)能力的AI模型加速涌現(xiàn),AI推理芯片逐漸成為市場焦點(diǎn),以期支撐大模型
    的頭像 發(fā)表于 04-09 00:13 ?4337次閱讀
    <b class='flag-5'>RISC-V</b>廠商正在<b class='flag-5'>AI</b>領(lǐng)域積極布局!

    什么是RISC-V

    siFive搞RISC-V 賽昉搞RISC-V 香山搞RISC-V 到底什么是RISC-V? 先不問有什么用,RISC-V目前的能力來說,工
    發(fā)表于 02-02 10:41

    RISC-V內(nèi)核突破百億顆 RVV1.0如何解鎖端側(cè)AI市場應(yīng)用潛能

    ”(南湖)開源高性能RISC-V處理器內(nèi)核,其性能已超過ARM A76;阿里平頭哥發(fā)布的首個自研RISC-V AI平臺,支持運(yùn)行170余個主流AI
    發(fā)表于 12-01 13:17

    RISC-V mcu何時進(jìn)軍AI

    今天看了篇文章,講述MCU界“六大天王”ST、NXP、Microchip、Renesas、TI、Infineon都在加大布局邊緣AI,這也應(yīng)該是RISC-V MCU 的一次機(jī)遇??!
    發(fā)表于 11-04 09:58