0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如今火熱的AI芯片到底是什么

拉拉 ? 來源:jf_35653895 ? 作者:jf_35653895 ? 2024-09-06 10:10 ? 次閱讀

眾所周知,人工智能的三大基礎(chǔ)要素是數(shù)據(jù)、算法和算力,而這三大要素的核心就是AI芯片技術(shù)。隨著各項(xiàng)基于AIGC前沿科技的廣泛應(yīng)用,AI對于算力的要求開始不斷地快速攀升。特別是深度學(xué)習(xí)成為當(dāng)前AI研究和運(yùn)用的主流方式,目前通用的CPU可以拿來執(zhí)行AI的算法。但是因?yàn)閮?nèi)部有大量的非運(yùn)算邏輯,而這些指令級對于目前的AI算法來說是完全用不上的,所以CPU并不能達(dá)到最高的運(yùn)算效率。因此,具有海量并行計(jì)算能力并且能夠加速AI計(jì)算的AI芯片應(yīng)運(yùn)而生。

什么是AI芯片

從廣義上講,只要能夠進(jìn)行人工智能算法或者面向AI計(jì)算應(yīng)用的芯片都叫做AI芯片。但是,通常意義上的AI芯片指的是針對人工智能算法做了特殊加速設(shè)計(jì)的芯片。他們的目的就是為了更高效地執(zhí)行AI算法。

AI芯片的發(fā)展歷程

從圖靈的論文《計(jì)算機(jī)器與智能》和圖靈測試,到最初的神經(jīng)元模擬單元感知機(jī),再到現(xiàn)在多達(dá)上百層的深度神經(jīng)網(wǎng)絡(luò),人類對人工智能的探索從來都沒有停止過。上世紀(jì)80年代,多層神經(jīng)網(wǎng)絡(luò)和反向傳播算法的出現(xiàn)給人工智能行業(yè)點(diǎn)燃了新的火花。1989年,貝爾實(shí)驗(yàn)室成功利用了反向傳播算法在多層神經(jīng)網(wǎng)絡(luò)開發(fā)了一個手寫郵編識別器。1998年,兩位人工智能科學(xué)家楊立坤和約書亞·本杰奧發(fā)表了手寫識別神經(jīng)網(wǎng)絡(luò)和反向傳播優(yōu)化相關(guān)的論文,開創(chuàng)了卷積神經(jīng)網(wǎng)絡(luò)的時代。此后,人工智能陷入了長時間的發(fā)展沉寂階段,直到1997年IBM的深藍(lán)戰(zhàn)勝了國際象棋大師,和2011年IBM的沃森智能系統(tǒng)在《危險邊緣》節(jié)目中勝出,人工智能才又一次被人們所關(guān)注。2016年,阿爾法狗擊敗了韓國圍棋九段的職業(yè)選手,就標(biāo)志著人工智能的又一波高潮。從基礎(chǔ)算法、底層硬件和工具框架到實(shí)際的應(yīng)用場景,現(xiàn)階段的人工智能領(lǐng)域已經(jīng)全面開花。作為人工智能核心的底層硬件,AI芯片同樣也經(jīng)歷了多次的起伏和波折。總體來看,AI芯片的發(fā)展前后經(jīng)歷了四次大的變化。

2007年以前,AI芯片產(chǎn)業(yè)一直沒有發(fā)展成為成熟的產(chǎn)業(yè),同時由于當(dāng)時的算法、數(shù)據(jù)量等因素,這個階段的AI芯片并沒有特別強(qiáng)烈的市場需求,通用的CPU芯片即可滿足應(yīng)用需求。隨著高清視頻VR、AR、游戲等行業(yè)的發(fā)展,GPU產(chǎn)品得到了快速的突破,同時人們發(fā)現(xiàn)GPU的并行計(jì)算特性恰好適應(yīng)人工智能算法及大數(shù)據(jù)并行計(jì)算的需求。如GPU比之前傳統(tǒng)的CPU在深度學(xué)習(xí)算法的運(yùn)算上可以提升幾十倍的效率,因此開始嘗試使用GPU進(jìn)行人工智能計(jì)算。進(jìn)入2010年后,云計(jì)算開始廣泛推廣,人工智能的研究人員通過云計(jì)算借助大量的CPU和GPU進(jìn)行混合運(yùn)算,進(jìn)一步推進(jìn)了AI芯片的深入應(yīng)用,從而催生了各類AI芯片的研發(fā)和應(yīng)用。人工智能對于計(jì)算能力的要求在不斷地提升,進(jìn)入2015年后,GPU性能功耗比不高的特點(diǎn)使其在工作適用場合受到多種限制,業(yè)界開始研發(fā)針對人工智能的專用芯片,以其通過更好的硬件和芯片架構(gòu)在計(jì)算效率、能耗比等性能上得到進(jìn)一步的提升。

AI芯片的分類

首先,從AI芯片的功能來看,AI實(shí)現(xiàn)包括兩個環(huán)節(jié):訓(xùn)練和推理。

所以根據(jù)承擔(dān)的任務(wù)不同,AI芯片可以分為基于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練芯片,和利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測的推理芯片。訓(xùn)練環(huán)節(jié)通常需要通過大量的數(shù)據(jù)輸入,訓(xùn)練出一個復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練過程由于涉及海量的訓(xùn)練數(shù)據(jù)和復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),運(yùn)算量非常巨大,需要龐大的計(jì)算規(guī)模。對于處理器的計(jì)算能力、精度、可擴(kuò)展性的性能要求非常高。比如英偉達(dá)的H100,基于FP16的算力達(dá)到了2000TOPS,即每秒可以進(jìn)行2,000萬億次的操作。而推理則是利用訓(xùn)練好的模型,使用新的數(shù)據(jù)去推理出各種結(jié)論。這個環(huán)節(jié)的計(jì)算量相對于訓(xùn)練環(huán)節(jié)就少很多,但是仍然會涉及到大量的矩陣運(yùn)算。比如英偉達(dá)的T4,基于INT8的算力為1,300TOPS。因此,訓(xùn)練芯片注重絕對的計(jì)算能力,而推理芯片更注重的是綜合指標(biāo),單位能耗、算力、延時等各項(xiàng)成本都需要考慮。

從AI芯片的應(yīng)用場景來看,也可以分為兩大類:服務(wù)器端和移動端,也可以說是云端和終端。

服務(wù)器端,從剛剛提到的訓(xùn)練階段,由于數(shù)據(jù)量和運(yùn)算量巨大,單一的處理器幾乎不可能獨(dú)立完成一個模型的訓(xùn)練過程,因此訓(xùn)練環(huán)節(jié)只能在云端實(shí)現(xiàn)。而推理階段,由于訓(xùn)練出來的深度神經(jīng)網(wǎng)絡(luò)模型仍然非常復(fù)雜,推理過程仍然屬于計(jì)算密集型和存儲密集型,同樣可以選擇部署在服務(wù)器端。移動端,如手機(jī)、智能家居、無人駕駛,移動端AI芯片在設(shè)計(jì)思路上與服務(wù)器端的AI芯片有著本質(zhì)的區(qū)別。首先,它們對計(jì)算的能效要求非常之高;其次,在智能駕駛等實(shí)時性要求很高的場合,推理過程必須在設(shè)備本身完成,因此要求移動設(shè)備具備足夠的推理能力。而某些場合還會有低功耗、低延遲、低成本的要求,從而要求移動端的AI芯片更是多種多樣??偟膩碚f,服務(wù)器端AI芯片的特點(diǎn)是性能強(qiáng)大,并且能夠支持大量運(yùn)算;而移動端的AI芯片特點(diǎn)是體積小、耗電少,并且有很快的計(jì)算效率。

最后,還可以從技術(shù)架構(gòu)來劃分,比如GPU、FPGA、ASIC和類腦芯片。

GPU:傳統(tǒng)的CPU之所以不適合人工智能算法的執(zhí)行,主要原因是在于計(jì)算指令遵循著串行執(zhí)行的,沒有辦法發(fā)揮出芯片的全部潛力。CPU大部分面積為控制器寄存器,而GPU擁有更多的邏輯運(yùn)算單元,用于數(shù)據(jù)處理。這樣的結(jié)構(gòu)適合對于密集型數(shù)據(jù)進(jìn)行并行計(jì)算,程序在GPU系統(tǒng)上運(yùn)行速度相較于單行的CPU往往提升幾十倍甚至上千倍。但是,GPU也有一定的局限性:深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩個部分,GPU平臺在算法訓(xùn)練上是非常高效,但是在推斷中,由于單項(xiàng)輸入進(jìn)行處理的時候并行計(jì)算的優(yōu)勢不能完全發(fā)揮出來。此外,GPU無法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作,而且功耗比較高。

FPGA:FPGA全稱現(xiàn)場可編程門陣列,與GPU不同的是,F(xiàn)PGA同時擁有硬件流水線并行和數(shù)據(jù)并行處理能力,適用于以硬件流水線方式處理一條數(shù)據(jù),且整體運(yùn)算性更高。因此,常用于深度學(xué)習(xí)算法中的推斷階段。不過,F(xiàn)PGA通過硬件的配置實(shí)現(xiàn)軟件算法,因此在實(shí)現(xiàn)復(fù)雜算法方面有一定的難度。相比于CPU,F(xiàn)PGA因?yàn)闆]有數(shù)據(jù)和指令存儲和讀取的功能,速度會變得更快,而功耗會更低。那么它的劣勢就是價格比較高,編程相對復(fù)雜,而且整體運(yùn)算能力不是很高。

ASIC:ASIC是專用集成電路,是專用的定制芯片,即是為實(shí)現(xiàn)特定要求而定制的芯片。定制的特性有助于提高ASIC的性能功耗比,缺點(diǎn)是電路設(shè)計(jì)需要定制,相對開發(fā)周期長,功能難以擴(kuò)展。但在功耗、可靠性、集成度等方面都有優(yōu)勢,尤其在要求高性能、低功耗的移動端體現(xiàn)非常明顯。因此在深度學(xué)習(xí)算法穩(wěn)定后,AI芯片可以采用ASIC設(shè)計(jì)方法進(jìn)行全面定制,使性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)的算法做到最優(yōu)。

神經(jīng)擬態(tài)芯片,也就是類腦芯片。神經(jīng)擬態(tài)計(jì)算是模擬生物神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)制,神經(jīng)擬態(tài)計(jì)算是從結(jié)構(gòu)層面去逼近大腦。這種芯片把定制化的數(shù)字處理內(nèi)核當(dāng)作神經(jīng)元,把內(nèi)存作為突觸。其邏輯結(jié)構(gòu)與傳統(tǒng)的馮·諾依曼結(jié)構(gòu)完全不同,它的內(nèi)存、CPU和通信部件完全是集成在一起,因此信息的處理在本地進(jìn)行,克服了傳統(tǒng)計(jì)算機(jī)的內(nèi)存和CPU之間的速度瓶頸問題。同時,神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他的神經(jīng)元發(fā)過來的脈沖,那么這些神經(jīng)元就會同時做出反應(yīng)和動作。

AI芯片的發(fā)展

AI芯片的發(fā)展向著更低功耗、更接近人腦、更靠近邊緣的方向發(fā)展?,F(xiàn)在用于深度學(xué)習(xí)的AI芯片,為了實(shí)現(xiàn)深度學(xué)習(xí)的龐大乘積累加運(yùn)算和實(shí)現(xiàn)計(jì)算的高性能,芯片面積越做越大,帶來了成本和散熱等問題。AI芯片編程的成熟度和芯片的安全以及神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性等問題也都未能得到很好的解決。因此在現(xiàn)有的基礎(chǔ)上進(jìn)行改進(jìn)和完善此類芯片,仍然是當(dāng)前的主要研究方向。最終,AI芯片將進(jìn)一步提高智能,向著更接近人腦的高度智能方向不斷發(fā)展,并且向著邊緣逐步移動,以獲得更低的能耗。AI芯片的發(fā)展,計(jì)算范式隨著創(chuàng)新方向以及硬件實(shí)現(xiàn),AI硬件加速技術(shù)已經(jīng)逐漸走向成熟。未來可能會有更多的創(chuàng)業(yè)會來自電路和器件級技術(shù)的結(jié)合,比如存內(nèi)計(jì)算、類腦計(jì)算,或者是針對特殊的計(jì)算模式或者是新模型,還會有稀疏化計(jì)算和近似計(jì)算。關(guān)于深度計(jì)算的研究,也將持續(xù)進(jìn)行。

為搭建汽車芯片產(chǎn)業(yè)上下游聯(lián)動發(fā)展的平臺,上海市集成電路行業(yè)協(xié)會、上海市交通電子行業(yè)協(xié)會依托上海汽車芯片產(chǎn)業(yè)聯(lián)盟、ATC汽車技術(shù)平臺,并聯(lián)合江、浙、皖三地半導(dǎo)體行業(yè)協(xié)會等單位,定于11月12-13日在上海舉辦“2024汽車與新能源芯片生態(tài)大會暨第四屆長三角汽車芯片對接交流會”,本屆峰會將重點(diǎn)討論:芯片平臺的搭建和設(shè)計(jì),車載芯片在自動駕駛、智能座艙、車載網(wǎng)絡(luò)、新能源三電等等的需求及應(yīng)用案例,最新芯片設(shè)計(jì)、安全、測試、封裝測試及三代半材料工藝等等熱點(diǎn)技術(shù)問題深入探討,共同交流!同時建立一個您與終端用戶、行業(yè)專家、上下游產(chǎn)業(yè)鏈技術(shù)與項(xiàng)目交流的絕佳平臺

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4551

    瀏覽量

    92012
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46048

    瀏覽量

    234940
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1828

    瀏覽量

    34660
收藏 人收藏

    評論

    相關(guān)推薦

    功放和運(yùn)放到底是什么區(qū)別?

    想請問一下功放和運(yùn)放到底是什么區(qū)別,感覺只要接一個小負(fù)載,運(yùn)放的輸出電流也可以很大???到底有什么區(qū)別啊
    發(fā)表于 09-10 07:00

    運(yùn)放的輸入電容到底是什么?

    我想請問一下運(yùn)放的輸入電容到底是什么?
    發(fā)表于 09-04 06:52

    LMH6502的輸入電壓到底是多少?

    LMH6502的輸入電壓到底是多少,我稍微給如大一點(diǎn)點(diǎn)的信號,放大不行還能接受,我衰減都失真,
    發(fā)表于 08-27 07:02

    運(yùn)放旁路電容必須靠近芯片引腳的原因到底是什么呢?

    運(yùn)放旁路電容必須靠近芯片引腳的原因到底是什么呢?有的說是怕走線的電感與旁路電容形成諧振,旁路電容靠近運(yùn)放的時候走線的電感不應(yīng)該更大了嗎(走線越長,走線的寄生電感也就越大)
    發(fā)表于 08-01 06:56

    共享單車到底是什么通信原理

    我們經(jīng)常騎的共享單車到底是什么通信原理,有人了解過嗎? 一、智能車鎖 共享單車最核心的硬件是智能車鎖,主要用于實(shí)現(xiàn)控制和定位功能。
    發(fā)表于 04-09 10:33 ?624次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理

    共享單車到底是什么通信原理?

    我們經(jīng)常騎的共享單車到底是什么通信原理,有人了解過嗎?下面寶藍(lán)小編就帶大家了解下。
    的頭像 發(fā)表于 02-25 10:32 ?1130次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理?

    邊緣AI到底是什么?能做什么?

    邊緣AI到底是什么?能做什么? 邊緣人工智能是一種新興的人工智能技術(shù),它將人工智能的計(jì)算和決策能力移動到離數(shù)據(jù)生成源和終端設(shè)備更近的邊緣節(jié)點(diǎn)上。與傳統(tǒng)的云計(jì)算方式相比,邊緣AI將計(jì)算和決策推向網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-11 14:44 ?1088次閱讀

    OpenAI重金押注的 “類腦” AI芯片,到底是什么?

    Rain AI 是一家 AI 芯片初創(chuàng)公司,旨在大幅降低 AI 算力的成本。通過研發(fā)一種模仿人腦的工作方式的 AI
    的頭像 發(fā)表于 12-10 14:45 ?814次閱讀
    OpenAI重金押注的 “類腦” <b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>到底是</b>什么?

    請問AD9684最低采樣率到底是多少?

    關(guān)于AD9684最低采樣率,數(shù)據(jù)手冊有兩處描述,但是不一致。請問AD9684最低采樣率到底是多少?
    發(fā)表于 12-04 06:34

    呼吸燈到底是如何影響人的視覺的?

    呼吸燈到底是通過使燈快速亮滅還是改變平均電壓來影響人的視覺的
    發(fā)表于 11-08 06:04

    請問單片機(jī)的中斷系統(tǒng)到底是什么?

    中斷系統(tǒng)到底是什么?還搞不定
    發(fā)表于 11-07 07:40

    上拉電阻到底是咋完成上拉的???

    上拉電阻到底是咋完成上拉的啊
    發(fā)表于 10-31 06:52

    什么是虛擬線程?虛擬線程到底是做什么用的呢?

    虛擬線程是在Java并發(fā)領(lǐng)域添加的一個新概念,那么虛擬線程到底是做什么用的呢?
    的頭像 發(fā)表于 10-29 10:23 ?2916次閱讀
    什么是虛擬線程?虛擬線程<b class='flag-5'>到底是</b>做什么用的呢?

    單片機(jī)的“性能”到底是什么?

    單片機(jī)的“性能”到底是什么?
    的頭像 發(fā)表于 10-24 16:58 ?453次閱讀
    單片機(jī)的“性能”<b class='flag-5'>到底是</b>什么?

    AT指令,AT固件,這個AT到底是什么意思?

    我們常說AT指令,AT固件,這個AT到底是什么意思?
    發(fā)表于 09-26 07:25