0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM全新AIU芯片:5nm工藝,230億晶體管!深度學(xué)習(xí)處理性能強(qiáng)勁!

lPCU_elecfans ? 來(lái)源:未知 ? 2022-11-24 07:10 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)不久前,IBM 研究院推出了一款AI處理器,名為人工智能單元(Artificial Intelligent Unit,AIU),這是IBM首個(gè)用于運(yùn)行和訓(xùn)練深度學(xué)習(xí)模型的完整 SoC。IBM聲稱(chēng),其比通用CPU工作更快、更高效。

AIU:32個(gè)處理器核心、230億個(gè)晶體管

這款A(yù)IU芯片是IBM研究院AI硬件中心投入五年開(kāi)發(fā)出的結(jié)果,AI硬件中心于2019年啟動(dòng),專(zhuān)注于開(kāi)發(fā)下一代芯片與AI系統(tǒng)。該中心的目標(biāo)是,計(jì)劃未來(lái)每年將AI硬件效率提升2.5倍。到2029年,將AI模型的訓(xùn)練和運(yùn)行速度拉高1000倍。
據(jù)IBM介紹,該芯片采用5nm制程工藝,共有32個(gè)處理器核心和230億個(gè)晶體管,在設(shè)計(jì)易用性方面,與普通顯卡相當(dāng),能夠介入任何帶有PCI插槽的計(jì)算機(jī)或服務(wù)器。AIU芯片,旨在支持多種格式并簡(jiǎn)化從圖像識(shí)別到自然語(yǔ)言處理的人工智能工作流程。
AIU芯片與傳統(tǒng)用于訓(xùn)練的GPU芯片有何不同?一直以來(lái),深度學(xué)習(xí)模型依賴(lài)于CPU加GPU協(xié)處理器的組合進(jìn)行訓(xùn)練與運(yùn)行。GPU最初是為沉浸圖形圖像而開(kāi)發(fā),后來(lái)人們發(fā)現(xiàn)其在AI領(lǐng)域有著顯著優(yōu)勢(shì),因此GPU在AI訓(xùn)練領(lǐng)域占據(jù)了非常重要的位置。
IBM開(kāi)發(fā)的AIU并非圖形處理器,它是專(zhuān)為深度學(xué)習(xí)模型加速設(shè)計(jì)的,針對(duì)矩陣和矢量計(jì)算進(jìn)行了優(yōu)化。AIU能夠解決高復(fù)雜計(jì)算問(wèn)題,并以遠(yuǎn)超CPU的速度執(zhí)行數(shù)據(jù)分析。
AIU芯片有何特點(diǎn)呢?過(guò)去這些年,AI與深度學(xué)習(xí)模型在各行各業(yè)中快速普及,同時(shí)深度學(xué)習(xí)的發(fā)展也給算力資源帶來(lái)了巨大的壓力。深度學(xué)習(xí)模型的體量越來(lái)越大,包含數(shù)十億甚至數(shù)萬(wàn)億個(gè)參數(shù)。而硬件效率的發(fā)展卻似乎跟不上深度學(xué)習(xí)模型的增長(zhǎng)速度。
過(guò)去,計(jì)算一般集中在高精度64位與32位浮點(diǎn)運(yùn)算層面。IBM認(rèn)為,有些計(jì)算任務(wù)并不需要這樣的精度,于是提出了降低傳統(tǒng)計(jì)算精度的新術(shù)語(yǔ)——近似計(jì)算。
如何理解呢?IBM認(rèn)為對(duì)于常見(jiàn)的深度學(xué)習(xí)任務(wù),其實(shí)并不需要那么高的計(jì)算精度,就比如說(shuō)人類(lèi)大腦,即使沒(méi)有高分辨率,也能夠分辨出家人或者小貓。也就是說(shuō)各種任務(wù),其實(shí)都可以通過(guò)近似計(jì)算來(lái)處理。
在AIU芯片的設(shè)計(jì)中,近似計(jì)算發(fā)揮著重要作用。IBM研究人員設(shè)計(jì)的AIU芯片精度低于CPU,而這種較低精度也讓新型AIU硬件加速器獲得了更高的計(jì)算密度。IBM使用混合8位浮點(diǎn)(HFP)計(jì)算,而非AI訓(xùn)練中常見(jiàn)的32位或16點(diǎn)浮點(diǎn)計(jì)算。由于精度較低,因此該芯片的運(yùn)算執(zhí)行速度可達(dá)到FP16的2倍,同時(shí)繼續(xù)保持類(lèi)似的訓(xùn)練效能。

IBM在AI芯片技術(shù)上的不斷升級(jí)

在去年2月的國(guó)際固態(tài)電路會(huì)議(ISSCC 2021)上,IBM也曾發(fā)布過(guò)一款性能優(yōu)異的AI芯片,據(jù)IBM稱(chēng)它是當(dāng)時(shí)全球首款高能效AI芯片,采用7nm制程工藝,可達(dá)到80%以上的訓(xùn)練利用率和60%以上的推理利用率,而通常情況下,GPU的利用率在30%以下。
有對(duì)比數(shù)據(jù)顯示,IBM 7nm高能效AI芯片的性能和能效,不同程度地超過(guò)了IBM此前推出的14nm芯片、韓國(guó)科學(xué)院(KAIST)推出的65nm芯片、平頭哥推出的12nm芯片含光800、NVIDIA推出的7nm芯片A100、聯(lián)發(fā)科推出的7nm芯片。
IBM去年推出的這款7nm AI芯片支持fp8、fp16、fp32、int4、int2混合精度。在fp32和fp8精度下,這款芯片每秒浮點(diǎn)運(yùn)算次數(shù)分別達(dá)到16TFLOPS和25.6TFLOPS,能效比為3.5TFLOPS/W和1.9TFLOPS。而被業(yè)界高度認(rèn)可的NVIDIA A100 GPU在fp16精度下的能效比為0.78TFLOPS/W,低于IBM這款高能效AI芯片。
IBM在官網(wǎng)中稱(chēng),這款A(yù)I芯片之所以能夠兼顧能效和性能,是因?yàn)樵撔酒С殖途然旌?位浮點(diǎn)格式((HFP8,hybrid FP8)。這是IBM于2019年發(fā)布的一種高度優(yōu)化設(shè)計(jì),允許AI芯片在低精度下完成訓(xùn)練任務(wù)和不同AI模型的推理任務(wù),同時(shí)避免任何質(zhì)量損失。
可以看到IBM此次發(fā)布的新款A(yù)IU與去年2月發(fā)布的7nm AI芯片,都采用了IBM此前提出的近似計(jì)算。從性能來(lái)看,去年推出的那款A(yù)I芯片一定程度上甚至超過(guò)了目前業(yè)界訓(xùn)練場(chǎng)景普遍使用的NVIDIA A100 GPU,而今年新推出的AIU無(wú)論是在制程工藝、晶體管數(shù)量上都有升級(jí),可想而知性能水平將會(huì)更高。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。


更多熱點(diǎn)文章閱讀

  • “極寒之地”!數(shù)據(jù)稱(chēng)硅谷裁員占全球科技公司三分之一,至少8家企業(yè)裁員過(guò)千
  • AI技術(shù)“偏科”,V2X反應(yīng)不及人眼?自動(dòng)駕駛從L3過(guò)渡L4面臨哪些挑戰(zhàn)
  • 英國(guó)阻撓中企收購(gòu)!已完成收購(gòu),卻被要求剝離86%的股權(quán)!
  • 對(duì)標(biāo)蘋(píng)果M系列芯片,高通推出Oryon芯片內(nèi)核,PC市場(chǎng)又起戰(zhàn)事
  • 轉(zhuǎn)向美國(guó)制造,蘋(píng)果大幅調(diào)整供應(yīng)鏈的背后邏輯是什么?


原文標(biāo)題:IBM全新AIU芯片:5nm工藝,230億晶體管!深度學(xué)習(xí)處理性能強(qiáng)勁!

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:IBM全新AIU芯片:5nm工藝,230億晶體管!深度學(xué)習(xí)處理性能強(qiáng)勁!

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    晶體管對(duì)CPU性能的影響

    晶體管作為CPU(中央處理器)的基本構(gòu)成單元,對(duì)CPU的性能有著至關(guān)重要的影響。
    的頭像 發(fā)表于 09-13 17:22 ?174次閱讀

    NMOS晶體管和PMOS晶體管的區(qū)別

    NMOS晶體管和PMOS晶體管是兩種常見(jiàn)的金屬氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管(MOSFET)類(lèi)型,它們?cè)诙鄠€(gè)方面存在顯著的差異。以下將從結(jié)構(gòu)、工作原理、性能特點(diǎn)、應(yīng)用場(chǎng)景等方面詳細(xì)闡述NMO
    的頭像 發(fā)表于 09-13 14:10 ?208次閱讀

    GaN晶體管的基本結(jié)構(gòu)和性能優(yōu)勢(shì)

    GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),是近年來(lái)在電力電子和高頻通信領(lǐng)域受到廣泛關(guān)注的一種新型功率器件。其結(jié)構(gòu)復(fù)雜而精細(xì),融合了多種材料和工藝,以實(shí)現(xiàn)高效、高頻率和高功率密度的
    的頭像 發(fā)表于 08-15 11:01 ?435次閱讀

    芯片晶體管深度和寬度有關(guān)系嗎

    一、引言 有關(guān)系。隨著集成電路技術(shù)的飛速發(fā)展,芯片晶體管作為電子設(shè)備的核心元件,其性能的優(yōu)化和制造技術(shù)的提升成為了行業(yè)關(guān)注的焦點(diǎn)。在晶體管的眾多設(shè)計(jì)參數(shù)中,深度和寬度是兩個(gè)至關(guān)重要的因
    的頭像 發(fā)表于 07-18 17:23 ?340次閱讀

    臺(tái)積電升級(jí)4nm N4C工藝,優(yōu)化能效與降低成本

    在近日舉辦的 2024 年北美技術(shù)研討會(huì)上,業(yè)務(wù)發(fā)展副總裁張凱文發(fā)表講話稱(chēng):“盡管我們的 5nm 和 4nm 工藝尚未完全成熟,但從 N5 到 N4 的光學(xué)微縮密度已提升 4%,且
    的頭像 發(fā)表于 04-26 14:35 ?692次閱讀

    蘋(píng)果M3芯片晶體管數(shù)量

    蘋(píng)果M3芯片晶體管數(shù)量相當(dāng)可觀,相比前代產(chǎn)品有了顯著的提升。這款芯片搭載了高達(dá)250個(gè)晶體管,比M2
    的頭像 發(fā)表于 03-11 16:45 ?713次閱讀

    蘋(píng)果M3芯片有多少晶體管組成

    蘋(píng)果M3芯片晶體管數(shù)量上有了顯著的提升。具體來(lái)說(shuō),標(biāo)準(zhǔn)版的M3芯片內(nèi)部集成了250個(gè)晶體管,相比前代M2
    的頭像 發(fā)表于 03-08 17:00 ?830次閱讀

    蘋(píng)果M3芯片有多少顆晶體管

    蘋(píng)果M3芯片搭載了250個(gè)晶體管,相較于前代M2芯片多了50個(gè)晶體管。這一顯著的提升使得M3
    的頭像 發(fā)表于 03-08 16:58 ?937次閱讀

    M3芯片有多少晶體管

    M3芯片晶體管數(shù)量根據(jù)不同的版本有所差異。具體來(lái)說(shuō),標(biāo)準(zhǔn)版的M3芯片擁有250個(gè)晶體管,這一數(shù)量相比前代產(chǎn)品M2有了顯著的提升,使得M3
    的頭像 發(fā)表于 03-08 15:43 ?819次閱讀

    IBM發(fā)布首款專(zhuān)為液氮冷卻設(shè)計(jì)的CMOS晶體管

    IBM突破性研發(fā)的納米片晶體管,通過(guò)將硅通道薄化切割為納米級(jí)別的薄片,再用柵極全方位圍繞,實(shí)現(xiàn)更為精準(zhǔn)控電。此結(jié)構(gòu)使得在指甲蓋大小空間內(nèi)可容納最多達(dá)500個(gè)晶體管,并且經(jīng)過(guò)液氮冷卻
    的頭像 發(fā)表于 12-26 14:55 ?603次閱讀

    性能翻倍的新型納米片晶體管

    IBM 的概念納米片晶體管在氮沸點(diǎn)下表現(xiàn)出近乎兩倍的性能提升。這一成就預(yù)計(jì)將帶來(lái)多項(xiàng)技術(shù)進(jìn)步,并可能為納米片晶體管取代 FinFET 鋪平道路。更令人興奮的是,它可能會(huì)導(dǎo)致更強(qiáng)大的
    的頭像 發(fā)表于 12-26 10:12 ?486次閱讀

    三大芯片巨頭角逐2nm技術(shù)

    過(guò)去數(shù)十年里,芯片設(shè)計(jì)團(tuán)隊(duì)始終專(zhuān)注于小型化。減小晶體管體積,能降低功耗并提升處理性能。如今,2nm及3nm已取代實(shí)際物理尺寸,成為描述新一代
    的頭像 發(fā)表于 12-12 09:57 ?792次閱讀

    全球首顆3nm電腦來(lái)了!蘋(píng)果Mac電腦正式進(jìn)入3nm時(shí)代

    前兩代M1和M2系列芯片均采用5nm制程工藝,而M3系列芯片的發(fā)布,標(biāo)志著蘋(píng)果Mac電腦正式進(jìn)入3nm時(shí)代。 3
    發(fā)表于 11-07 12:39 ?523次閱讀
    全球首顆3<b class='flag-5'>nm</b>電腦來(lái)了!蘋(píng)果Mac電腦正式進(jìn)入3<b class='flag-5'>nm</b>時(shí)代

    芯片內(nèi)部晶體管的工作原理

    晶體管,作為現(xiàn)代電子設(shè)備的基石,其功能和工作原理一直是電子學(xué)和半導(dǎo)體物理領(lǐng)域研究的核心。芯片中的每個(gè)晶體管都是一個(gè)微型開(kāi)關(guān),負(fù)責(zé)控制電流的流動(dòng)。隨著技術(shù)的不斷發(fā)展,現(xiàn)代芯片上可能集成了
    的頭像 發(fā)表于 10-16 10:09 ?2084次閱讀
    <b class='flag-5'>芯片</b>內(nèi)部<b class='flag-5'>晶體管</b>的工作原理

    a17芯片和麒麟9000s區(qū)別 a17芯片有多少晶體管組成

    多少晶體管組成 A17的晶體管數(shù)量組成可以達(dá)到200以上,相比于上一代的A16芯片的160個(gè)晶體管
    的頭像 發(fā)表于 09-26 15:06 ?4443次閱讀