0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

預(yù)定下代超算第一?富士通144核Arm處理器公開

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-06-24 00:26 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))相信對超算市場有過一定了解的朋友,都對曾經(jīng)的第一名富岳超算不陌生。這臺(tái)2021年正式啟用的超算,是全球首臺(tái)登頂TOP500的Arm架構(gòu)超算。富岳采用了富士通設(shè)計(jì)A64FX SoC,整個(gè)超算集群的峰值性能可以達(dá)到537.21PFlop/s。如此強(qiáng)大的性能,甚至于日本東京工業(yè)大學(xué)、日本東北大學(xué)等都宣布將借助富岳來開發(fā)日語生成式AI。

然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經(jīng)降至第四名的位置。為此,富士通也在開發(fā)A64FX的繼任者,并計(jì)劃用于下一代超算的開發(fā)中去。

Monaka,A64FX的繼任者

作為一直在超算領(lǐng)域發(fā)力的頭部廠商之一,富士通此前一直選擇SPARC作為其計(jì)算處理器的架構(gòu),直到A64FX的出現(xiàn)。A64FX面世之時(shí)一度被稱為最強(qiáng)Arm處理器,也讓不少人對Arm在數(shù)據(jù)中心和HPC的前景有了新的改觀。

然而這種眾核處理器,除非經(jīng)過特殊的架構(gòu)優(yōu)化,否則并不適合用于通用服務(wù)器,國產(chǎn)的申威26010服務(wù)器也是類似的設(shè)計(jì)思路。但不可否認(rèn)在HPC應(yīng)用下,眾核處理器可以發(fā)揮出媲美甚至超越傳統(tǒng)x86旗艦處理器的實(shí)力。

近日,富士通宣布了他們在研的下一代眾核Arm處理器Monaka,該處理器除了改用Armv9架構(gòu),引入了SVE2之外,還采用了云原生的3D眾核設(shè)計(jì),專為數(shù)據(jù)中心做了能效優(yōu)化。Monaka采用了3D Chiplet的設(shè)計(jì)方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
Monaka 3D眾核架構(gòu) / 富士通

據(jù)富士通透露,2nm的核心die區(qū)域僅僅占了整個(gè)芯片面積的不到30%,從而帶來極高的能效表現(xiàn),只需用到風(fēng)冷。同時(shí)3D眾核架構(gòu)使其可以塞入雙插槽144個(gè)核心,實(shí)現(xiàn)極低的延遲和更高的帶寬。

至于在軟件支持上,富士通除了持續(xù)開發(fā)Linux OS中行業(yè)標(biāo)準(zhǔn)軟件的支持外,也會(huì)參與發(fā)展與Arm相關(guān)的開源軟件生態(tài),加強(qiáng)在Python、Java、LLVM等標(biāo)準(zhǔn)工具上的性能表現(xiàn)。Monaka預(yù)計(jì)將于2027年正式亮相,考慮到其流片時(shí)間,富士通既有可能選擇臺(tái)積電、英特爾等現(xiàn)有的先進(jìn)晶圓代工廠,也可能考慮正在建設(shè)2nm工廠的Rapidus。

HPC轉(zhuǎn)向AI主導(dǎo)?

作為目前最有利可圖的市場,AI正在驅(qū)動(dòng)GPGPU聚焦在低精度計(jì)算的算力升級上。在CUDA平臺(tái)的助力下,HPC生態(tài)的門檻也在持續(xù)降低。從這幾年發(fā)布的新品來看,無論是FP16、FP8的算力都在成倍增長,然而在FP64這種傳統(tǒng)HPC應(yīng)用需要用到的高精度數(shù)據(jù)格式上,性能提升卻相當(dāng)有限。

更重要的是,要想通過堆量來提高HPC集群的FP64性能也不再現(xiàn)實(shí)了,因?yàn)镚PU的TDP提升幅度甚至更高。為此,富士通的看法是,將更多的FP64單元放在CPU端,而將更多的HBM和低精度矩陣單元放在GPU端,這樣構(gòu)建HPC系統(tǒng)的客戶就不再需要為GPU的巨額成本和巨量功耗買單,卻可以利用其在深度學(xué)習(xí)上的卓越性能。同時(shí),開發(fā)更多HPL-MxP應(yīng)用,利用混合精度計(jì)算來提高效率。當(dāng)然了,也可以施壓GPU廠商進(jìn)一步改善其FP64性能,只不過在生成式AI依舊火熱的當(dāng)下,讓GPU廠商放棄這個(gè)搖錢樹并不現(xiàn)實(shí)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    8967

    瀏覽量

    365018
  • 超算
    +關(guān)注

    關(guān)注

    1

    文章

    114

    瀏覽量

    9006
  • 富士通
    +關(guān)注

    關(guān)注

    2

    文章

    189

    瀏覽量

    54440
收藏 人收藏

    評論

    相關(guān)推薦

    ARM處理器和CPU有什么區(qū)別

    ARM處理器和CPU(中央處理器)之間的關(guān)系及區(qū)別,可以從多個(gè)維度進(jìn)行深入探討。首先,需要明確的是,ARM處理器并非
    的頭像 發(fā)表于 09-10 11:24 ?238次閱讀

    ARM處理器的寄存組織及功能

    ARM處理器的寄存組織是其核心架構(gòu)的重要組成部分,對于理解ARM處理器的運(yùn)行機(jī)制和性能特點(diǎn)具有重要意義。以下是對
    的頭像 發(fā)表于 09-10 11:11 ?241次閱讀

    ARM處理器和CISC處理器的區(qū)別

    ARM處理器和CISC(復(fù)雜指令集計(jì)算機(jī))處理器在多個(gè)方面存在顯著的區(qū)別。這些區(qū)別主要體現(xiàn)在架構(gòu)原理、性能與功耗、設(shè)計(jì)目標(biāo)、應(yīng)用領(lǐng)域以及市場生態(tài)等方面。
    的頭像 發(fā)表于 09-10 11:10 ?153次閱讀

    ARM處理器的結(jié)構(gòu)和特點(diǎn)

    ARM處理器,全稱Advanced RISC Machines,是種基于精簡指令集(RISC)架構(gòu)的微處理器。其結(jié)構(gòu)和特點(diǎn)在嵌入式系統(tǒng)、移動(dòng)設(shè)備、物聯(lián)網(wǎng)等多個(gè)領(lǐng)域具有顯著優(yōu)勢。以下將
    的頭像 發(fā)表于 09-10 11:09 ?174次閱讀

    ARM處理器概述和發(fā)展歷程

    ARM處理器種基于RISC(精簡指令集計(jì)算機(jī))架構(gòu)的高性能微處理器,由英國公司ARM(Advanced RISC Machines)開發(fā)
    的頭像 發(fā)表于 09-10 11:07 ?185次閱讀

    富士通發(fā)布2024財(cái)年第一季度財(cái)報(bào)

    富士通于昨日發(fā)布了2024財(cái)年第一季度財(cái)報(bào)。根據(jù)財(cái)報(bào)顯示,2024財(cái)年第一季度整體營收為8,300億日元,較上年度同期增長3.8%。
    的頭像 發(fā)表于 07-26 17:22 ?664次閱讀

    實(shí)測分享,瑞芯微RK3588八國產(chǎn)處理器性能測評!確實(shí)“遙遙領(lǐng)先”!

    ARM Cortex-A76@2.4GHz + 四ARM Cortex-A55@1.8GHz大小架構(gòu),有國產(chǎn)“至強(qiáng)嵌入式處理器”之稱,可
    發(fā)表于 07-17 10:49

    采用144,能效提升66%!英特爾至強(qiáng)6處理器震撼上市,加速數(shù)據(jù)中心升級

    6能效處理器基于Intel 3制程工藝,憑借高核心密度及出色的每瓦性能,可在提供高效力的同時(shí)顯著降低能源成本。英特爾至強(qiáng)6700E采用144
    的頭像 發(fā)表于 06-11 18:13 ?5948次閱讀
    采用<b class='flag-5'>144</b><b class='flag-5'>核</b>,能效提升66%!英特爾至強(qiáng)6<b class='flag-5'>處理器</b>震撼上市,加速數(shù)據(jù)中心升級

    英特爾發(fā)布至強(qiáng)6能效處理器

    英特爾近日發(fā)布了款革命性的處理器產(chǎn)品——至強(qiáng)6(代號Sierra Forest)。這款處理器以其獨(dú)特的能效設(shè)計(jì)和基于Intel 3制程工藝的技術(shù),在提供卓越
    的頭像 發(fā)表于 06-07 15:55 ?440次閱讀

    富士通發(fā)布《富士通技術(shù)與服務(wù)愿景2024》

    富士通近日發(fā)布了《富士通技術(shù)與服務(wù)愿景2024(Fujitsu Technology and Service Vision 2024,簡稱FT&SV 2024)》,闡述了對未來商業(yè)和社會(huì)的愿景。
    的頭像 發(fā)表于 05-29 17:07 ?369次閱讀
    <b class='flag-5'>富士通</b>發(fā)布《<b class='flag-5'>富士通</b>技術(shù)與服務(wù)愿景2024》

    富士通使用富岳超級計(jì)算機(jī)訓(xùn)練LLM

    盡管富士通的富岳超級計(jì)算機(jī)不再是超級計(jì)算機(jī)500強(qiáng)名單中最快的機(jī)器,但它仍然是個(gè)非常強(qiáng)大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負(fù)載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?421次閱讀

    實(shí)測分享,瑞芯微RK3588八國產(chǎn)處理器性能測評!確實(shí)“遙遙領(lǐng)先”

    RK3588處理器優(yōu)勢 RK3588是瑞芯微最新代旗艦工業(yè)處理器,它具有如下卓越優(yōu)勢: ? 超強(qiáng)運(yùn)算能力: 四ARM Cortex-A7
    的頭像 發(fā)表于 01-29 14:03 ?1.2w次閱讀
    實(shí)測分享,瑞芯微RK3588八<b class='flag-5'>核</b>國產(chǎn)<b class='flag-5'>處理器</b>性能測評!確實(shí)“遙遙領(lǐng)先”

    國產(chǎn)ARM建設(shè)歷程 Arm計(jì)算在領(lǐng)域的實(shí)踐

    ARM 指令集兼容架構(gòu)已成為HPC 主流技術(shù)與未來發(fā)展的重要趨勢,可滿足大型系統(tǒng)與商用HPC 系統(tǒng)的技術(shù)需求。
    的頭像 發(fā)表于 01-25 14:06 ?1096次閱讀
    國產(chǎn)<b class='flag-5'>ARM</b><b class='flag-5'>超</b><b class='flag-5'>算</b>建設(shè)歷程 <b class='flag-5'>Arm</b>計(jì)算在<b class='flag-5'>超</b><b class='flag-5'>算</b>領(lǐng)域的實(shí)踐

    2nm能造就新的Arm芯片霸主嗎?富士通代旗艦處理器Monaka公開

    ARM架構(gòu),基于A64FX打造。 ? 盡管主打HPC應(yīng)用,并未配備任何GPU組件,富岳在AI計(jì)算上依舊不遜色這些年新出的
    的頭像 發(fā)表于 10-20 01:14 ?1898次閱讀
    2nm能造就新的<b class='flag-5'>Arm</b>芯片霸主嗎?<b class='flag-5'>富士通</b>下<b class='flag-5'>一</b>代旗艦<b class='flag-5'>處理器</b>Monaka<b class='flag-5'>公開</b>

    arm處理器有哪些中斷源?arm處理器對異常中斷的響應(yīng)過程

    arm處理器有哪些中斷源?arm處理器對異常中斷的響應(yīng)過程? ARM處理器
    的頭像 發(fā)表于 10-19 16:35 ?1246次閱讀