0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Graphcore發(fā)布最新IPU:世界首款采用臺積電3D Wafer-on-Wafer的處理器

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-03-03 18:39 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)3月3日,Graphcore發(fā)布最新一代IPU,性能比上一代提升40%,電源效率提升16%,這是全球首款基于臺積電3D Wafer-on-Wafer的處理器。從上一代IPU到新的IPU,開發(fā)者無需修改代碼,價格保持不變,現(xiàn)在已經(jīng)上市。

世界首顆基于臺積電3D Wafer-on-Wafer的處理器


Graphcore大中華區(qū)總裁兼全球首席營收官盧濤向媒體介紹,新一代IPU名叫Bow IPU,是一個3D封裝的芯片,單個封裝中有超過600億個晶體管,具有350 TeraFLOPS的人工智能計算的性能,上一代MK2 IPU是250 TeraFLOPS。


Bow IPU在供電方面也做了很多優(yōu)化,片內(nèi)存儲保持了0.9 GB的容量,但吞吐量從47.5TB/s提高到65TB/s。

處理器內(nèi)核個數(shù)、獨立線程個數(shù)等等,包括外部的一些接口,Bow IPU跟上一代處理器相比都沒有變化。相比上一代,Bow IPU變化主要體現(xiàn)在它是一個3D封裝的處理器,晶體管的規(guī)模有所增加,以及算力和吞吐量有所提升。


Bow IPU由2顆裸片疊在一起構(gòu)成,使用了臺積電的SoIC-WoW技術(shù)。一個IPU的裸片在下面,另一個裸片在上面。上面的裸片為供電、節(jié)能等功能提供幫助。

盧濤表示,跟之前的處理器相比,這個設(shè)計使得新產(chǎn)品在實際運算算力提高的情況下,能效方面也有所提升。

從某種意義來說,這是Graphcore跟臺積電一起聯(lián)合創(chuàng)新的結(jié)果。

基于Bow IPU的Bow系統(tǒng)性能大幅提升

除了BowIPU,Graphcore同時發(fā)布了基于Bow IPU的Bow系統(tǒng),包括Bow Pod16、Bow Pod32、Bow Pod64、Bow Pod256,以及Bow Pod1024。以Bow Pod16為例,Bow Pod16中包括4臺1U的Bow-2000,還包括1臺CPU服務(wù)器,能提供5.6 PetaFLOPS算力。


以Bow Pod16縱向擴展的Bow Pod32、Bow Pod64分別包括8臺Bow-2000、16臺Bow-2000。基于Bow Pod64可以再橫向擴展到Bow Pod256、Bow Pod1024等。Bow Pod1024包括256臺Bow-2000,可以提供358.4 PetaFLOPS的人工智能計算。目前,除了Bow Pod1024在早期訪問階段外,Bow Pod16、Bow Pod32、Bow Pod64、Bow Pod256均已量產(chǎn)。


性能擴展方面,以IPU-POD16的性能作為基準,Bow Pod16的性能可以提升1.4倍,Bow Pod256可以提升18倍。


盧濤介紹,Bow-2000 IPUMachine使用了4顆Bow IPU。此前,在這樣一個1U刀片里,Graphcore提供了1 PetaFLOPS的算力,現(xiàn)在Graphcore提供了1.4 PetaFLOPS的算力。Bow-2000具有3.6 GB處理器內(nèi)存儲,吞吐量為260TB/s,IPU流存儲多達256 GB,IPU-Fabric為2.8 Tbps。

100%軟件兼容,開箱即用無需更改代碼


盧濤強調(diào),新一代產(chǎn)品跟前一代產(chǎn)品百分之百軟件兼容,基本上能做到開箱即用。用戶得到性能提升的同時不需要修改代碼,不僅是應(yīng)用軟件,包括底層軟件、驅(qū)動等都不需要做任何修改,可以無縫集成到正在不斷變得更加廣泛的IPU軟件合作伙伴生態(tài)中。

這一點特別關(guān)鍵。很多產(chǎn)品在從一代往另一代演進的時候,在實現(xiàn)性能提升的同時,還需要很多的軟件適配工作。而100%的軟件兼容,意味著已經(jīng)使用Graphcore上一代IPU的用戶在未來購置新的Bow IPU后,不需要做任何軟件適配工作就能獲得性能提升。

提供完整軟件棧生態(tài)系統(tǒng)

Graphcore中國工程副總裁、AI算法科學(xué)家金琛對媒體表示,上述的這些性能提升,除了硬件新架構(gòu)外,也要歸功于Graphcore的軟件棧和生態(tài)系統(tǒng),其中的核心部分就是Poplar SDK。

金琛表示,Poplar SDK包括driver,上層XLA的backend,以及Graphcore自研的PopART等,這些軟件的加持使得Graphcore能夠?qū)崿F(xiàn)在不同應(yīng)用的性能上的廣泛和通用的提升。


除此之外,Graphcore還提供比較豐富的生態(tài)。比如AI軟件框架,支持PyTorch、TensorFlow、HALO、PaddlePaddle,以及Keras等。在用戶方面,支持Jupyter NoteBook,以及Inference Deployment Toolkit等,幫助客戶實現(xiàn)推算一體的部署。

在開發(fā)者社區(qū)方面,Graphcore提供廣泛的代碼用例,以及各種文檔、視頻的示范。Graphcore在機器學(xué)習(xí)應(yīng)用上提供了特別多模型范例,覆蓋了不同的AI垂直領(lǐng)域,如圖像識別、物體檢測,語音模型、語言模型等,這個模型庫還在不停迭代和增加。

在云上,Graphcore也提供了廣泛的部署。此外,Graphcore的PopVision工具可以幫助用戶和Poplar編程者更有效地提升應(yīng)用在Graphcore的平臺上的性能優(yōu)化。


提供10倍的總體擁有成本優(yōu)勢


Graphcore不僅提供高效的性能,在性價比上也有比較顯著的優(yōu)勢。比如,上圖左邊是Bow Pod的一個形態(tài),右邊是DGX-A100的一個形態(tài)??梢钥吹?,在DGX-A100上需要70個小時的訓(xùn)練時間,在Bow Pod16上,EfficientNet-B4的backbone的訓(xùn)練只需要14個小時左右,基本快了5倍,性價比又有優(yōu)勢,總體擁有成本(TCO)的增益可以達到接近10倍左右。

Graphcore未來還要做什么?


人的大腦大概有860億個神經(jīng)元,100萬億個突觸,這個突觸相當(dāng)于人工智能里面模型的參數(shù)個數(shù)。也就是說,最大的人工智能模型的參數(shù)跟真正的人的大腦比較起來,還有100倍左右的差距。

盧濤談到,目前Graphcore正在開發(fā)一款可以用來超越人腦處理的超級智能機器——Good Computer,即古德計算機。這個命名有兩層含義,一層是好的計算機,希望計算機能夠帶來正面的影響,另外也是向前輩致敬——JackGood是一位非常知名的計算機科學(xué)家。


Good Computer大概能夠達到8192個未來的IPU,提供超過10 Exa-Flops的AI算力,未來也許會繼續(xù)向3D Wafer-on-Wafer演進,可以實現(xiàn)4 PB的存儲,可以助力超過500萬億參數(shù)規(guī)模的人工智能模型的開發(fā),Poplar SDK完全支持。

預(yù)計價格取決于不同的配置,大概在100萬美元到1.5億美元的規(guī)模。盧濤表示,從Bow IPU往前展望,這是Graphcore正在做的一個產(chǎn)品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 臺積電
    +關(guān)注

    關(guān)注

    43

    文章

    5596

    瀏覽量

    165971
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    15534
收藏 人收藏

    評論

    相關(guān)推薦

    WAFER連接在現(xiàn)代電子領(lǐng)域的多樣化應(yīng)用

    WAFER連接是一種廣泛應(yīng)用于現(xiàn)代電子設(shè)備中的連接組件,其設(shè)計和功能使其在多種應(yīng)用場景中表現(xiàn)出色。作為一種高效、可靠的連接解決方案,WAFER連接憑借其小巧、精密的設(shè)計贏得了工程師
    的頭像 發(fā)表于 10-11 14:26 ?235次閱讀

    WAFER線對板連接的特點與應(yīng)用分析

    WAFER線對板連接是一種廣泛應(yīng)用于電子設(shè)備中的連接解決方案。其設(shè)計旨在實現(xiàn)高密度連接,特別適合于空間有限的環(huán)境。WAFER線對板連接的結(jié)構(gòu)簡單,通常由絕緣體、金屬接觸件和鎖緊機制
    的頭像 發(fā)表于 09-19 15:10 ?510次閱讀
    <b class='flag-5'>WAFER</b>線對板連接<b class='flag-5'>器</b>的特點與應(yīng)用分析

    3nm制程需求激增,全年營收預(yù)期上調(diào)

    近期迎來3nm制程技術(shù)的出貨高潮,預(yù)示著其在半導(dǎo)體制造領(lǐng)域的領(lǐng)先地位進一步鞏固。隨著蘋果iPhone 16系列新機發(fā)布,預(yù)計搭載的A1
    的頭像 發(fā)表于 09-10 16:56 ?607次閱讀

    CoWoS產(chǎn)能將提升4倍

    先進封裝解決方案的激增需求,正全力加速擴充其CoWoS(Chip-on-Wafer-on-Substrate)封裝產(chǎn)能。
    的頭像 發(fā)表于 09-06 17:20 ?645次閱讀

    先進封裝領(lǐng)域競爭白熱化,三星重組團隊全力應(yīng)對臺挑戰(zhàn)

    8月,通過收購群創(chuàng)位于臺南的工廠,正式將其轉(zhuǎn)型為CoWoS(Chip-on-Wafer-on-Substrate)高級封裝技術(shù)的生產(chǎn)基地,此舉被視為
    的頭像 發(fā)表于 09-02 15:58 ?462次閱讀

    或收購群創(chuàng)5.5代LCD廠以擴充CoWoS產(chǎn)能

    近期,半導(dǎo)體行業(yè)再次傳來重磅消息,據(jù)市場傳聞,正計劃收購系顯示面板巨頭群創(chuàng)光電旗下已關(guān)閉的5.5代LCD面板廠——臺南四廠。此次收購的目標直指擴充
    的頭像 發(fā)表于 08-06 09:25 ?533次閱讀

    Alphawave推出業(yè)界首支持CoWoS封裝的3nm UCIe IP

    3nm Die-to-Die(D2D)多協(xié)議子系統(tǒng)IP。這一里程碑式的成果不僅標志著半導(dǎo)體互連技術(shù)的又一次飛躍,還通過深度融合的Ch
    的頭像 發(fā)表于 08-01 17:07 ?738次閱讀

    加速擴產(chǎn)CoWoS,云林縣成新封裝廠選址

    ,作為全球領(lǐng)先的半導(dǎo)體制造巨頭,正加速推進其CoWoS(Chip On Wafer On Substrate)封裝技術(shù)的產(chǎn)能擴張計劃。據(jù)最新消息,
    的頭像 發(fā)表于 07-03 09:20 ?1476次閱讀

    加速CoWoS大擴產(chǎn),以應(yīng)對AI服務(wù)市場持續(xù)增長

    隨著人工智能(AI)技術(shù)的飛速發(fā)展,全球?qū)Ω咝阅苡嬎悖℉PC)服務(wù)的需求呈現(xiàn)井噴態(tài)勢。作為全球領(lǐng)先的半導(dǎo)體制造企業(yè),(TSMC)近日宣布將大幅擴大其CoWoS(Chip-on-
    的頭像 發(fā)表于 06-28 10:51 ?749次閱讀

    斬獲Intel 3nm處理器訂單,為酷睿Ultra 200系列助力

    近日,半導(dǎo)體界傳來了一則令人振奮的消息。據(jù)業(yè)內(nèi)權(quán)威人士透露,全球知名的晶圓代工廠已成功斬獲Intel的3nm PC處理器訂單,這一里程
    的頭像 發(fā)表于 06-21 09:29 ?578次閱讀

    從對標英偉達到被收購,AI獨角獸Graphcore的多舛命運

    初創(chuàng)公司困于生存問題。以英國公司Graphcore為例,他們就面臨著被收購的命運。 ? Graphcore ,從對標英偉達到獨木難支 ? Graphcore成立于2016年,其主要產(chǎn)品為以創(chuàng)新架構(gòu)開發(fā)的
    的頭像 發(fā)表于 05-14 00:09 ?2507次閱讀

    蘋果M4芯片將采用N3E工藝,分三

    據(jù)悉,蘋果將于當(dāng)?shù)貢r間今晚十時舉行的“放飛吧”特別活動上發(fā)布全新iPad Pro產(chǎn)品,預(yù)計搭載M4處理器,且有傳言稱其將采用
    的頭像 發(fā)表于 05-07 15:40 ?675次閱讀

    :AI服務(wù)處理器預(yù)計翻番,拉動收入增長?

    將 AI 服務(wù)處理器嚴格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI 加速
    的頭像 發(fā)表于 04-19 15:04 ?316次閱讀

    英特爾Lunar Lake處理器采用N3B工藝

    據(jù)悉,此次消息出自IFS Direct 2024會議之后一場小型記者招待會上,基辛格首次明確表態(tài)了與的合作生產(chǎn)計劃。他在此次發(fā)布會上稱,已經(jīng)增大了對臺
    的頭像 發(fā)表于 02-25 15:43 ?798次閱讀

    高通3nm驍龍8 Gen4處理器,仍由代工

    高通的下一代旗艦處理器驍龍8 Gen 4仍然將由獨家代工,而不是之前傳聞的
    的頭像 發(fā)表于 12-01 16:55 ?1397次閱讀