0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3種AI芯片之間的對比,誰更勝一籌?

電子工程師 ? 來源:郭婷 ? 2019-08-26 11:57 ? 次閱讀

人工智能AI)主要包括三大要素,分別是數(shù)據(jù)、算法和算力。其中數(shù)據(jù)是基礎(chǔ),正是因為在實際應(yīng)用當(dāng)中的數(shù)據(jù)量越來越大,使得傳統(tǒng)計算方式和硬件難以滿足要求,才催生了AI應(yīng)用的落地。而算法是連接軟件、數(shù)據(jù)、應(yīng)用和硬件的重要橋梁,非常關(guān)鍵。算力方面,主要靠硬件實現(xiàn),也就是各種實現(xiàn)AI功能的處理器,而隨著應(yīng)用和技術(shù)的發(fā)展,能實現(xiàn)各種算力、滿足不同應(yīng)用的AI處理器陸續(xù)登場,經(jīng)過不同的發(fā)展階段,發(fā)揮著各自的作用。

在比較成熟的AI平臺方面,在2012年出現(xiàn)了AlexNet,一直到最近,2018年出現(xiàn)了AlphaGo Zero,在短短的6年內(nèi),算力提高了20多萬倍,這完全不同于傳統(tǒng)計算硬件(如CPU、mcu等)的演進軌跡,速度之驚人令我們難以預(yù)測。

來自O(shè)penAI的分析顯示,近幾年,AI訓(xùn)練所需的算力每3個多月就會翻倍,這比著名的摩爾定律(每18~24個月,芯片的性能翻倍)演進速度快多了。而提升算力的關(guān)鍵是芯片設(shè)計,特別是底層的架構(gòu)設(shè)計,目前來看,傳統(tǒng)的芯片架構(gòu)已經(jīng)難以滿足AI應(yīng)用的需要。包括IC廠商和互聯(lián)網(wǎng)企業(yè)在內(nèi),越來越多的廠商開始投入研發(fā)或已經(jīng)推出AI專用芯片。根據(jù)Gartner統(tǒng)計,AI芯片在2017年的市場規(guī)模約為46億美元,而到2020年,預(yù)計將會達到148億美元,年均復(fù)合增長率為47%。而據(jù)麥肯錫預(yù)測,未來10年,人工智能和深度學(xué)習(xí)將成為提升硅片需求的主要因素,2025年,在AI的推動下,全球硅片營收將超過600億美元,接近全球半導(dǎo)體銷售額的20%。

三種AI芯片的對比

從AI芯片的應(yīng)用場景類別來看,主要分為云端和終端。目前,AI在云端應(yīng)用的更多,相對成熟,而其在云端應(yīng)用又可分為訓(xùn)練和推理兩種,其中訓(xùn)練的市場規(guī)模占比較高。另外,訓(xùn)練需要的數(shù)據(jù)量和計算量較大,所用的處理器主要是GPU。至于推理,也以GPU為主,此外,還有FPGA,以及專用的AI芯片(ASIC),其中,ASIC還不是很成熟,量產(chǎn)的產(chǎn)品也不多,因此用量有限,還處于發(fā)展初期,如果能實現(xiàn)大規(guī)模量產(chǎn),其性能和成本是最優(yōu)的,主要推進廠商是Google,其標(biāo)志性產(chǎn)品就是TPU。

綜上,目前,行業(yè)為實現(xiàn)AI計算,主要采用的芯片有三種,分別是通用型的GPU,可定制的FPGA,以及專用的ASIC。

在計算層面,芯片的晶體管數(shù)量和芯片面積決定了算力,面積越大算力越強,但功耗也將隨之增加。過去幾年,在AI處理器的選擇上,可用于通用基礎(chǔ)計算且運算速率更快的GPU迅速成為實現(xiàn)AI計算的主流芯片,英偉達也因此占據(jù)著數(shù)據(jù)中心AI芯片的主要市場份額。

FPGA是典型的半定制化芯片,其功能可以通過編程來修改,并行計算能力很強,但是延遲和功耗遠低于GPU,而與ASIC相比,F(xiàn)PGA的一次性成本要低很多,但其量產(chǎn)成本很高。因此,在實際應(yīng)用需求還未成規(guī)模,且算法需要不斷迭代、改進的情況下,利用FPGA的可重構(gòu)特性來實現(xiàn)半定制的AI芯片是最佳選擇。

AI專用芯片ASIC是面向特定應(yīng)用需求而定制的芯片,一旦流片,其功能無法更改,因此,必須要有量的保證,且應(yīng)用需求穩(wěn)定,不會發(fā)生大的變化。專用ASIC芯片的性能高于FPGA,如果出貨量可觀,其單顆成本可做到遠低于FPGA和GPU。

目前來看,由于GPU具備強大的并行計算能力和完善的生態(tài)系統(tǒng),現(xiàn)在云端AI應(yīng)用方面處于主導(dǎo)地位。FPGA方面,由于是半定制化的,可以通過編程來實現(xiàn)不同的功能電路,因此,其在通用性和性能之間取得了比較好的平衡,但是較高的開發(fā)門檻和量產(chǎn)成本,對其應(yīng)用是個限制。

3種AI芯片之間的對比,誰更勝一籌?

圖:在實現(xiàn)AI功能方面,GPU、FPGA和ASIC的優(yōu)缺點對比(來源:長城證券研究所)

專用的AI芯片應(yīng)該是未來的發(fā)展趨勢,無論是在云端還是在邊緣側(cè),隨著應(yīng)用的逐漸落地,應(yīng)用場景和各種專用功能會愈加清晰,市場需求也會越來越多。另外,與GPU和FPGA相比,ASIC的專利壁壘要小得多,而且其設(shè)計難度也是最小的。隨著AI應(yīng)用場景的落地,專用的ASIC芯片量產(chǎn)成本低、性能高、功耗低的優(yōu)勢會逐漸凸顯出來。

AI芯片案例

目前,在AI應(yīng)用方面,全球數(shù)據(jù)中心用GPU市場基本被英偉達壟斷,這里用到的都是高性能GPU,其門檻很高,又是用于AI,因此,還沒有什么競爭對手。

除了GPU芯片本身之外,英偉達還有一個優(yōu)勢,那就是其在AI計算方面,有CUDA軟件生態(tài)系統(tǒng)的配合。CUDA編程工具包讓開發(fā)者可以對每一個像素輕松編程,在這之前,對程序員來說,GPU編程是一件很痛苦的事,CUDA成功將Java、C++等高級語言開放給了GPU編程,從而讓GPU編程變得簡單了許多,研究者也可以更低的成本快速開發(fā)他們的深度學(xué)習(xí)模型。以圖形處理器加速卡Tesla V100 PCIe/SXM2為例,其芯片采用臺積電的12nm制程工藝,通過與CUDA軟件和NVLink快速通道的配合,能達到近125兆次深度學(xué)習(xí)的浮點運算訓(xùn)練速度,而以16bit的半精度浮點性能來看,可達到31Tera FLOPS。

FPGA方面,ALTERA英特爾收購之后,賽靈思是目前的霸主,作為傳統(tǒng)的CPU廠商,英特爾近幾年正在AI領(lǐng)域大力布局,收購相關(guān)公司自然是一個重要手段,通過收購全面布局 FPGA和ASIC,除了Altera的FPGA之外,還通過收購Mobileye和視覺處理器公司Movidius,布局無人駕駛計算機視覺,這也是將來AI大有可為的兩個應(yīng)用領(lǐng)域。

在收購Altera之后,英特爾的技術(shù)發(fā)展路線就出現(xiàn)了調(diào)整,例如,其原來的產(chǎn)品策略是做分立的CPU+FPGA加速器,而兩家公司整合后,由簡單的分立器件疊加改為了封裝集成,即將CPU和FPGA芯片封裝在一起,這還不算完,英特爾下一步還要將CPU和FPGA集成在同一芯片內(nèi),做成SoC。

賽靈思方面,該公司于2018年底推出了以低成本、低延遲、高能效深度神經(jīng)網(wǎng)絡(luò)(DNN)算法為基礎(chǔ)的Alveo加速卡,基于該公司的UltraScale架構(gòu),采用了臺積電的16nm制程工藝,目標(biāo)市場就是數(shù)據(jù)中心和云端的AI推理市場。

AI專用ASIC方面,國內(nèi)外已經(jīng)有多家企業(yè)投入了研發(fā),例如國內(nèi)的寒武紀(jì)(正在開發(fā)NPU)、地平線(BPU系列),還有華為海思和比特大陸,也在專用AI芯片方面投入了不少資源。國外最為知名的就是谷歌的TPU了,這也是到目前為止,最為成熟的高性能AI專用芯片了。做ASIC需要對應(yīng)用場景有深刻和精確到位的了解,而這方面卻是傳統(tǒng)芯片設(shè)計企業(yè)和IDM的短板,因此,目前做AI專用ASIC的,大多是系統(tǒng)產(chǎn)商,互聯(lián)網(wǎng)巨頭,或者以算法起家的公司。

在中國,比特大陸的算豐 (SOPHON) BM1680和BM1682云端安防及大數(shù)據(jù)AI推理系列產(chǎn)品已經(jīng)上市,此外,還有其它幾家沒有量產(chǎn)的芯片,如華為海思的升騰Ascend 910系列,據(jù)悉會采用臺積電的7nm制程工藝,預(yù)計會在今年年底量產(chǎn)。此外,百度的昆侖芯片(采用三星的14nm制程),以及阿里平頭哥的Ali-NPU等,也處在研發(fā)階段,距離量產(chǎn)還有一段時日。

以上談的主要是用于云端的AI芯片,包括GPU、FPGA和ASIC,這也是目前AI的主要應(yīng)用領(lǐng)域,而在終端和邊緣側(cè),更多的要依靠不斷成熟的ASIC,因為ASIC與應(yīng)用場景有著非常緊密的關(guān)系,而這里說的應(yīng)用場景,主要是在終端和邊緣側(cè)。

結(jié)語

AI發(fā)展正處于強勁的上升階段,此時,各種AI芯片實現(xiàn)方案都有其發(fā)揮的空間,可以說是處于最佳時期,這也給眾多廠商占領(lǐng)各自擅長之應(yīng)用市場提供了更多的機會。而隨著應(yīng)用場景的完全落地,以及AI專用芯片的成熟和大規(guī)模量產(chǎn),這一發(fā)展窗口期很可能就將關(guān)閉,因此,眼下各家廠商,無論是做GPU、FPGA,還是做ASIC的,都在抓緊時間研發(fā)和拓展市場,競爭愈發(fā)激烈。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50262

    瀏覽量

    421176
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4679

    瀏覽量

    128620
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29877

    瀏覽量

    268171
收藏 人收藏

    評論

    相關(guān)推薦

    Llama 3 模型與其他AI工具對比

    Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術(shù)架構(gòu)、性能表現(xiàn)、應(yīng)用場景、定制化能力、開源與成本等方面。以下是對Llama 3模型與其他
    的頭像 發(fā)表于 10-27 14:37 ?282次閱讀

    有源晶振與無源晶振穩(wěn)定性比較:為何有源晶振更勝一籌

    。、有源晶振的穩(wěn)定性優(yōu)勢有源晶振內(nèi)置了振蕩電路和放大器,這使得它在提供時鐘信號方面具有以下優(yōu)勢: 獨立工作能力:有源晶振能夠獨立工作,不需要依賴外部電路即可產(chǎn)生穩(wěn)定的時鐘信號。這種自給自足的特性使得
    發(fā)表于 10-14 16:54

    壓縮機的秘密:風(fēng)冷、蒸發(fā)冷卻、冷水式,更勝一籌?

    在精密空調(diào)領(lǐng)域,制冷壓縮機的選擇至關(guān)重要,壓縮機不僅影響精密空調(diào)的制冷效率,還直接關(guān)系到精密空調(diào)的運行成本與維護便利性。目前市場上主流的精密空調(diào)制冷壓縮機主要包括風(fēng)冷式、蒸發(fā)冷卻式及冷水式三類型,它們各自具有獨特的技術(shù)特點和應(yīng)用優(yōu)勢。
    的頭像 發(fā)表于 10-12 18:15 ?306次閱讀
    壓縮機的秘密:風(fēng)冷、蒸發(fā)冷卻、冷水式,<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    LED顯示屏驅(qū)動電源:恒流與恒壓,更勝一籌?

    。然而,在這背后,有個不可或缺的元素在默默支撐著這切——那就是LED顯示屏的驅(qū)動電源。 LED顯示屏的驅(qū)動電源,主要分為恒壓驅(qū)動和恒流驅(qū)動兩種方法。它們各自有著不同的工作原理和特性,對LED顯示屏的性能和使用壽命產(chǎn)生著深遠的影
    的頭像 發(fā)表于 09-24 01:50 ?268次閱讀
    LED顯示屏驅(qū)動電源:恒流與恒壓,<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    無壓燒結(jié)銀VS有壓燒結(jié)銀:更勝一籌

    銀及其合金在電子、電力、航空航天等眾多領(lǐng)域具有廣泛應(yīng)用。為了提高銀材料的物理和機械性能,常采用燒結(jié)工藝進行材料制備。燒結(jié)工藝根據(jù)施加壓力的不同,可分為無壓燒結(jié)和有壓燒結(jié)兩。本文旨在詳細探討無壓燒結(jié)銀與有壓燒結(jié)銀工藝流程的區(qū)別,并分析各自的特點和適用場景。
    的頭像 發(fā)表于 07-13 09:05 ?1124次閱讀
    無壓燒結(jié)銀VS有壓燒結(jié)銀:<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    UVLED解膠機VS傳統(tǒng)解膠方式:更勝一籌

    與產(chǎn)品質(zhì)量的關(guān)鍵因素。近年來,隨著技術(shù)的不斷進步,UVLED解膠機以其獨特的優(yōu)勢逐漸嶄露頭角,引發(fā)了人們與傳統(tǒng)解膠方式的比較和探討。 ?、UVLED解膠機的獨特優(yōu)勢 ?UVLED解膠機采用高效的紫外線LED光源,通過發(fā)出特定波長的紫
    的頭像 發(fā)表于 05-30 14:15 ?316次閱讀

    UV固化烘箱VS傳統(tǒng)烘干方式:更勝一籌?

    更勝一籌呢?接下來,我們將從多個角度進行對比分析。 、烘干效率 UV固化烘箱采用紫外線光源進行烘干,具有烘干速度快、效率高的特點。相比之下,傳統(tǒng)烘干方式如熱風(fēng)烘干、紅外線烘干等,烘干速度較慢,效率較低。因此,在追求高效率
    的頭像 發(fā)表于 05-13 14:12 ?663次閱讀
    UV固化烘箱VS傳統(tǒng)烘干方式:<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    UVLED面光源與傳統(tǒng)光源對比更勝一籌?

    之間對比結(jié)果又如何呢?本文將對UVLED面光源與傳統(tǒng)光源進行全面對比,以揭示更勝一籌。
    的頭像 發(fā)表于 05-10 15:28 ?563次閱讀
    UVLED面光源與傳統(tǒng)光源<b class='flag-5'>對比</b>:<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    新火種AI|李彥宏發(fā)聲:文心言4.0在國內(nèi)可以取代ChatGPT!事實真的如此嗎?

    文心言 VS ChatGPT,更勝一籌?
    的頭像 發(fā)表于 04-19 10:14 ?701次閱讀
    新火種<b class='flag-5'>AI</b>|李彥宏發(fā)聲:文心<b class='flag-5'>一</b>言4.0在國內(nèi)可以取代ChatGPT!事實真的如此嗎?

    英偉達最新AI芯片售價將超3萬美元

    英偉達最新AI芯片Blackwell的售價引發(fā)了業(yè)界的廣泛關(guān)注。據(jù)公司創(chuàng)始人黃仁勛透露,這款芯片的售價預(yù)計將在3萬美元至4萬美元之間。這
    的頭像 發(fā)表于 03-21 10:50 ?873次閱讀

    谷歌模型訓(xùn)練軟件有哪些功能和作用

    谷歌模型訓(xùn)練軟件主要是指ELECTRA,這是一種新的預(yù)訓(xùn)練方法,源自谷歌AI。ELECTRA不僅擁有BERT的優(yōu)勢,而且在效率上更勝一籌。
    的頭像 發(fā)表于 02-29 17:37 ?730次閱讀

    塊板即輕松搞定!| TH244A001 - 32位Arduino開發(fā)資源進階介紹(2)

    (TH244A001) 皆為更勝一籌。 Arduino-Throne哪里可買? 1) 淘寶App 請搜尋店名: Megawin笙泉科技企業(yè)店鋪,或關(guān)鍵詞: 笙泉科技Megawin
    發(fā)表于 01-12 11:54

    2023年數(shù)據(jù)中心基礎(chǔ)設(shè)施供應(yīng)商業(yè)績對比更勝一籌?

    除了AI服務(wù)器外,今年的服務(wù)器市場整體處于下滑趨勢。英特爾的數(shù)據(jù)中心收入穩(wěn)定在 50 億美元左右,AMD 每季度增長 15 億美元,并且有望在不久的將來達到 20 億美元。
    的頭像 發(fā)表于 12-28 16:50 ?1177次閱讀
    2023年數(shù)據(jù)中心基礎(chǔ)設(shè)施供應(yīng)商業(yè)績<b class='flag-5'>對比</b>,<b class='flag-5'>誰</b><b class='flag-5'>更勝一籌</b>?

    什么是光子芯片透明屏?它與LED透明屏有何不同?

    、色彩表現(xiàn)和靈活性方面都有著明顯的優(yōu)勢。 首先,光子芯片透明屏在透明度方面更勝一籌。傳統(tǒng)的LED透明屏使用的是點光源,通過排列組成矩陣來形成顯示畫面。這種結(jié)構(gòu)導(dǎo)致了屏幕上的點光源之間存在
    的頭像 發(fā)表于 12-11 13:43 ?1969次閱讀