0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM 新款高能效 AI 芯片:能效比高過(guò) NVIDIA A100

工程師鄧生 ? 來(lái)源:芯東西 ? 作者:溫淑 ? 2021-02-19 11:03 ? 次閱讀

2 月 18 日?qǐng)?bào)道,本屆集成電路設(shè)計(jì)領(lǐng)域頂會(huì) “國(guó)際固態(tài)電路會(huì)議(ISSCC 2021)”正在進(jìn)行中(2021 年 2 月 13 日到 22 日)。作為已有近 70 年歷史的集成電路產(chǎn)學(xué)屆盛會(huì),ISSCC 2021 亦被許多廠商視為發(fā)布其領(lǐng)先芯片技術(shù)的權(quán)威舞臺(tái)。

本屆會(huì)議上,IBM 發(fā)表了據(jù)稱是 “全球首款”的高能效 AI 芯片,該芯片采用 7nm 制程工藝,可達(dá)到 80% 以上的訓(xùn)練利用率和 60% 以上的推理利用率,而通常情況下,GPU 的利用率在 30% 以下。

性能參數(shù)方面,IBM 新品的運(yùn)算密度高于同樣采用 7nm 工藝的 NVIDIA A100 GPU;其在多種精度下的整數(shù)運(yùn)算性能,還優(yōu)于聯(lián)發(fā)科 7nm 專用 AI 芯片等產(chǎn)品。

據(jù) IBM 官網(wǎng)分享,其新款 7nm 高能效 AI 芯片該款芯片在多種場(chǎng)景中均有較好的應(yīng)用前景,比如,可用于混合云環(huán)境中的低能耗 AI 訓(xùn)練、或用于實(shí)現(xiàn)更接近邊緣的云端訓(xùn)練等。

一、IBM 新款高能效 AI 芯片:能效比高過(guò) NVIDIA A100

對(duì)比結(jié)果顯示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韓國(guó)科學(xué)院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平頭哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、聯(lián)發(fā)科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮點(diǎn)運(yùn)算次數(shù),分別達(dá)到 16TFLOPS 和 25.6TFLOPS;運(yùn)算密度分別為 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分別為 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的運(yùn)算密度分別為 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分別為 16.5TOPS/W 和 8.9TOPS/W。

對(duì)比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮點(diǎn)運(yùn)算次數(shù),分別為 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比為 1.4TFLOPS/W。

另外,在 7nm 芯片陣營(yíng)中,NVIDIA A100 GPU 在 fp16 精度下的能效比為 0.78TFLOPS/W,在 int4 精度下的能效比為 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片與同類產(chǎn)品的性能參數(shù)對(duì)比

二、采用 IBM 自研超低精度訓(xùn)練 / 推理設(shè)計(jì)

IBM 官網(wǎng)文章寫(xiě)道,其新款 AI 芯片之所以能夠兼顧能效和性能,是因?yàn)樵撔酒С殖途然旌?8 位浮點(diǎn)格式((HFP8,hybrid FP8)。這是 IBM 于 2019 年發(fā)布的一種高度優(yōu)化設(shè)計(jì),允許 AI 芯片在低精度下完成訓(xùn)練任務(wù)和不同 AI 模型的推理任務(wù),同時(shí)避免任何質(zhì)量損失。

據(jù)悉,目前 IBM 將超低精度混合 8 位浮點(diǎn)格式用于訓(xùn)練、超低精度混合 4 位浮點(diǎn)格式用于推理,并開(kāi)發(fā)了數(shù)據(jù)通信協(xié)議,以提升多核心 AI 芯片上不同核心間的數(shù)據(jù)交換效率。

據(jù) IBM 官網(wǎng)文章,自 2015 年起,該公司每年將芯片的功耗性能提升 2.5 倍。這背后,IBM 致力于實(shí)現(xiàn)算法、架構(gòu)、軟件堆棧等各方面的創(chuàng)新。

▲ IBM 在低精度 AI 訓(xùn)練、推理方面的研究歷程

除了采用超低精度混合 8 位浮點(diǎn)格式外,IBM 新款高能效 AI 芯片添加了電源管理功能。IBM 研究顯示,在同等功率的情況下,通過(guò)減緩計(jì)算階段的功率消耗,可以最大限度地提升芯片性能。

結(jié)語(yǔ):AI 發(fā)展對(duì)芯片能耗提出更高要求

隨著智能化浪潮席卷各個(gè)領(lǐng)域,AI 模型的復(fù)雜性日趨提高。相應(yīng)地,AI 應(yīng)用的能源消耗水平亦水漲船高。這一背景下,如何最大限度提升能效,成為 AI 芯片設(shè)計(jì)玩家們面臨的重要命題。

IBM 通過(guò)采用超低精度混合 8 位浮點(diǎn)格式和內(nèi)置電源管理功能,為其新款 AI 芯片實(shí)現(xiàn)了業(yè)界領(lǐng)先的高能效。但是,這一芯片尚未實(shí)現(xiàn)規(guī)?;慨a(chǎn),仍有待市場(chǎng)檢驗(yàn)。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50254

    瀏覽量

    421121
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1743

    瀏覽量

    74591
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268154
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    智慧水務(wù)綜合管理系統(tǒng)-提高污水廠

    簡(jiǎn)婷 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務(wù)管理平臺(tái) 1平臺(tái)概述 安科瑞電氣具備從終端感知、邊緣計(jì)算到管理平臺(tái)的產(chǎn)品*態(tài)體系,Acrel
    的頭像 發(fā)表于 10-21 14:14 ?129次閱讀
    智慧水務(wù)綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統(tǒng)-提高污水廠<b class='flag-5'>能</b><b class='flag-5'>效</b>

    聯(lián)發(fā)科天璣9400發(fā)布:比與端側(cè)AI引領(lǐng)移動(dòng)芯片行業(yè)革新

    AI大模型的推動(dòng)下,智能手機(jī)市場(chǎng)的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競(jìng)爭(zhēng)已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗、高能
    的頭像 發(fā)表于 10-12 15:56 ?508次閱讀

    使用TPS2116實(shí)現(xiàn)建筑自動(dòng)化應(yīng)用的高能

    電子發(fā)燒友網(wǎng)站提供《使用TPS2116實(shí)現(xiàn)建筑自動(dòng)化應(yīng)用的高能.pdf》資料免費(fèi)下載
    發(fā)表于 09-25 11:12 ?0次下載
    使用TPS2116實(shí)現(xiàn)建筑自動(dòng)化應(yīng)用的<b class='flag-5'>高能</b><b class='flag-5'>效</b>

    此芯科技發(fā)布“此芯P1”異構(gòu)高能芯片,引領(lǐng)AI PC新紀(jì)元

    近日,此芯科技集團(tuán)有限公司(簡(jiǎn)稱“此芯科技”)在上海隆重舉辦了AI PC戰(zhàn)略發(fā)布會(huì),正式揭曉了其首款創(chuàng)新力作——“此芯P1”異構(gòu)高能芯片。這一里程碑式的發(fā)布,標(biāo)志著國(guó)產(chǎn)
    的頭像 發(fā)表于 08-01 17:42 ?764次閱讀

    利用AI和加速計(jì)算提升天氣預(yù)報(bào)效率和

    NVIDIA GPU 驅(qū)動(dòng)的擴(kuò)散模型助力下,生成式 AI 在各個(gè)領(lǐng)域?qū)崿F(xiàn)新的應(yīng)用,大大提升了效率。   當(dāng)臺(tái)灣氣象員得以在一臺(tái)機(jī)器上模擬臺(tái)風(fēng)的細(xì)節(jié),他們深感其對(duì)預(yù)報(bào)任務(wù)
    的頭像 發(fā)表于 06-07 15:06 ?483次閱讀

    智慧水務(wù)管理平臺(tái)-為污水處理的管理提供科學(xué)、精細(xì)的解決方案

    程瑜 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務(wù)管理平臺(tái) 1平臺(tái)概述 安科瑞電氣具備從終端感知、邊緣計(jì)算到管理平臺(tái)的產(chǎn)品*態(tài)體系,Acrel
    的頭像 發(fā)表于 04-18 15:50 ?403次閱讀
    智慧水務(wù)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平臺(tái)-為污水處理的<b class='flag-5'>能</b><b class='flag-5'>效</b>管理提供科學(xué)、精細(xì)的解決方案

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場(chǎng)景等多個(gè)方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3288次閱讀

    華為GigaGreen創(chuàng)新發(fā)布,構(gòu)筑5G-A時(shí)代極致體驗(yàn)、極致

    MWC 2024 | 華為GigaGreen創(chuàng)新發(fā)布,構(gòu)筑5G-A時(shí)代極致體驗(yàn)、極致
    的頭像 發(fā)表于 02-23 17:02 ?542次閱讀
    華為GigaGreen創(chuàng)新發(fā)布,構(gòu)筑5G-<b class='flag-5'>A</b>時(shí)代極致體驗(yàn)、極致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    解讀六大科技巨頭自研AI芯片進(jìn)展,誰(shuí)將領(lǐng)跑未來(lái)?

    在當(dāng)前的AI發(fā)展浪潮中,NVIDIA無(wú)疑是AI算力的領(lǐng)跑者。其A100/H100系列芯片已獲得全
    發(fā)表于 02-22 10:35 ?433次閱讀
    解讀六大科技巨頭自研<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>進(jìn)展,誰(shuí)將領(lǐng)跑未來(lái)?

    以節(jié)能為導(dǎo)向,笙泉BLDC硬件演算提高能

    電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))隨著高能電機(jī)在各領(lǐng)域的廣泛使用,全球的電機(jī)市場(chǎng)得到了很大的增長(zhǎng)。以BLDC為代表的高能電機(jī)正在各類應(yīng)用領(lǐng)域取代傳統(tǒng)低能
    的頭像 發(fā)表于 01-09 00:06 ?1512次閱讀

    NVIDIA特供中國(guó)的芯片,AI性能大降10%售價(jià)依然高

    目前NVIDIA最昂貴的A100、H100芯片無(wú)法對(duì)中國(guó)市場(chǎng)出售,此前為中國(guó)市場(chǎng)定制的A800、H800
    的頭像 發(fā)表于 01-03 16:07 ?1265次閱讀

    DC電源模塊的優(yōu)化探索與應(yīng)用

    DC電源模塊的優(yōu)化探索與應(yīng)用是一項(xiàng)重要的研究領(lǐng)域。優(yōu)化可以提高電源模塊的功率轉(zhuǎn)換效率,減少能源的浪費(fèi),降低電源模塊的發(fā)熱量,延長(zhǎng)其使用壽命。以下是一些
    的頭像 發(fā)表于 12-22 14:28 ?400次閱讀
    DC電源模塊的<b class='flag-5'>能</b><b class='flag-5'>效</b>優(yōu)化探索與應(yīng)用

    DC電源模塊的優(yōu)化探索與應(yīng)用

    BOSHIDA DC電源模塊的優(yōu)化探索與應(yīng)用 DC電源模塊的優(yōu)化探索與應(yīng)用是一項(xiàng)重要的研究領(lǐng)域。
    的頭像 發(fā)表于 12-22 11:16 ?401次閱讀
    DC電源模塊的<b class='flag-5'>能</b><b class='flag-5'>效</b>優(yōu)化探索與應(yīng)用

    對(duì)英偉達(dá)A100芯片算力服務(wù)收費(fèi)價(jià)格上調(diào)100%,這家企業(yè)的硬氣來(lái)自哪里?

    半導(dǎo)體芯情了解到,A100是英偉達(dá)最新推出的一款高性能計(jì)算芯片,采用了全新的Ampere架構(gòu),Ampere架構(gòu)是NVIDIA于 GTC 2020發(fā)布的GPU架構(gòu),NVIDIA Ampe
    的頭像 發(fā)表于 11-14 16:30 ?1166次閱讀
    對(duì)英偉達(dá)<b class='flag-5'>A100</b><b class='flag-5'>芯片</b>算力服務(wù)收費(fèi)價(jià)格上調(diào)<b class='flag-5'>100</b>%,這家企業(yè)的硬氣來(lái)自哪里?

    高能AC-DC開(kāi)關(guān)穩(wěn)壓器方案

    電子發(fā)燒友網(wǎng)站提供《高能AC-DC開(kāi)關(guān)穩(wěn)壓器方案.doc》資料免費(fèi)下載
    發(fā)表于 11-14 14:26 ?0次下載
    <b class='flag-5'>高能</b><b class='flag-5'>效</b>AC-DC開(kāi)關(guān)穩(wěn)壓器方案