0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

如意 ? 來(lái)源:OFweek電子工程網(wǎng) ? 作者:Ai芯天下 ? 2020-10-19 16:04 ? 次閱讀

前言:

AI近些年的大火,直接促進(jìn)了CPUGPU的發(fā)展,而英偉達(dá)的GPU真正借此迅速成為AI市場(chǎng)的主流產(chǎn)品之一,其勢(shì)頭甚至蓋過(guò)了CPU。

而AI應(yīng)用需要專(zhuān)門(mén)的處理器,而IPU正是這樣的處理器。目前,AI在各行各業(yè)均得到廣泛應(yīng)用,IPU可以基于自身優(yōu)勢(shì)為世界的智能化進(jìn)程增添不竭動(dòng)力。

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

英偉達(dá)專(zhuān)注的GPU優(yōu)勢(shì)逐漸縮小

從專(zhuān)注圖像渲染崛起的英偉達(dá)的GPU,走的也是相當(dāng)于ASIC的技術(shù)路線,但隨著游戲、視頻渲染以及AI加速需要的出現(xiàn),英偉達(dá)的GPU也在向著GPGPU的方向演進(jìn)。

當(dāng)硬件更多的需要與軟件生態(tài)掛鉤時(shí),市場(chǎng)大多數(shù)參與者便會(huì)倒下。在競(jìng)爭(zhēng)清理過(guò)后,GPU形成了如今的雙寡頭市場(chǎng),并且步入相當(dāng)成熟的階段。

ASIC本身的成本、靈活性缺失,以及應(yīng)用范圍很窄的特點(diǎn),都導(dǎo)致它無(wú)法采用最先進(jìn)制程: 即便它們具備性能和能效優(yōu)勢(shì),一旦無(wú)法采用最先進(jìn)制程,則這一優(yōu)勢(shì)也將不再明顯。

為保持其在GPU領(lǐng)域的寡頭地位,使得英偉達(dá)必須一直保持先進(jìn)的制程工藝,保持其通用性,但是要犧牲一定的效能優(yōu)勢(shì)。

相比于來(lái)自類(lèi)GPU的競(jìng)爭(zhēng),英偉達(dá)不應(yīng)該忽視Graphcore的IPU,特別是Graphcore一直都在強(qiáng)調(diào)其是為AI而生,面向的應(yīng)用也是CPU、GPU不那么擅長(zhǎng)的AI應(yīng)用。

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

利用AI計(jì)算打側(cè)面競(jìng)爭(zhēng)戰(zhàn)

不管CPU還是GPU都無(wú)法從根本上解決AI問(wèn)題,因?yàn)锳I是一個(gè)面向計(jì)算圖的任務(wù)、與CPU的標(biāo)量計(jì)算和GPU的矢量計(jì)算區(qū)別很大。

而另一邊的IPU,則為AI計(jì)算提供了全新的技術(shù)架構(gòu),同時(shí)將訓(xùn)練和推理合二為一,兼具處理二者工作的能力。

作為標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)處理芯片,IPU可以支持多種神經(jīng)網(wǎng)絡(luò)模型,因其具備數(shù)以千計(jì)到數(shù)百萬(wàn)計(jì)的頂點(diǎn)數(shù)量,遠(yuǎn)遠(yuǎn)超過(guò)GPU的頂點(diǎn)規(guī)模,可以進(jìn)行更高潛力的并行計(jì)算工作。

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

計(jì)算加上數(shù)據(jù)的突破可以讓IPU在原生稀疏計(jì)算中展現(xiàn)出領(lǐng)先IPU 10-50倍的性能優(yōu)勢(shì),到了數(shù)據(jù)稀疏以及動(dòng)態(tài)稀疏時(shí),IPU就有了比GPU越來(lái)越顯著的優(yōu)勢(shì)。

此外,如果是在IPU更擅長(zhǎng)的分組卷積內(nèi)核中,組維度越少,IPU的性能優(yōu)勢(shì)越明顯,總體而言,有4-100倍的吞吐量提升。

5G網(wǎng)絡(luò)切片和資源管理中需要用到的強(qiáng)化學(xué)習(xí),用IPU訓(xùn)練吞吐量也能夠提升最多13倍。

兩種芯片勢(shì)能英偉達(dá)與Graphcore的較量

Graphcore成立于2016年,是一家專(zhuān)注于機(jī)器智能、同時(shí)也代表著全新計(jì)算負(fù)載的芯片制造公司,其包括IPU在內(nèi)的產(chǎn)品研發(fā)擅長(zhǎng)大規(guī)模并行計(jì)算、稀疏的數(shù)據(jù)結(jié)構(gòu)、低精度計(jì)算、數(shù)據(jù)參數(shù)復(fù)用以及靜態(tài)圖結(jié)構(gòu)。

英偉達(dá)的潛在競(jìng)爭(zhēng)對(duì)手Graphcore的第二代IPU在多個(gè)主流模型上的表現(xiàn)優(yōu)于A100 GPU,兩者將在超大規(guī)模數(shù)據(jù)中心正面競(jìng)爭(zhēng)。

未來(lái),IPU可能在一些新興的AI應(yīng)用中展現(xiàn)出更大的優(yōu)勢(shì)。

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

第二代IPU相比第一代IPU有兩倍峰值算力的提升,在典型的CV還有NLP的模型中,第二代IPU相比第一代IPU則展現(xiàn)出了平均8倍的性能提升。

如果對(duì)比英偉達(dá)基于8個(gè)最新A100 GPU的DGX-A100,Graphcore 8個(gè)M2000組成的系統(tǒng)的FP32算力是DGX-A100的12倍,AI計(jì)算是3倍,AI存儲(chǔ)是10倍。

AI計(jì)算未來(lái)有三種計(jì)算平臺(tái)

第一種平臺(tái)是CPU,它還會(huì)持續(xù)存在,因?yàn)橐恍I(yè)務(wù)在CPU上的表現(xiàn)依然不錯(cuò);

第二種平臺(tái)是GPU,它還會(huì)持續(xù)發(fā)展,會(huì)有適合GPU的應(yīng)用場(chǎng)景。

第三種平臺(tái)是就是Graphcore的IPU。

IPU旨在幫助創(chuàng)新者在AI應(yīng)用上實(shí)現(xiàn)新的突破,幫助用戶(hù)應(yīng)對(duì)當(dāng)前在CPU、GPU上表現(xiàn)不太好的任務(wù)或者阻礙大家創(chuàng)新的場(chǎng)景?!北R濤副總指出。

目前GPU在全球已是大規(guī)模的商用部署,其次是Google的TPU通過(guò)內(nèi)部應(yīng)用及TensorFlow的生態(tài)占第二大規(guī)模,IPU處于第三,是量產(chǎn)的、部署的平臺(tái)。

與此同時(shí),Graphcore也在中國(guó)積極組建其創(chuàng)新社區(qū)。Graphcore已在微信、知乎、微博和GitHub開(kāi)通了官方頻道,旨在與開(kāi)發(fā)者、創(chuàng)新者、研究者更好地交流和互動(dòng)。

關(guān)于未來(lái)的AI計(jì)算領(lǐng)域,未來(lái)會(huì)是 “CPU、GPU、IPU并行” 的時(shí)代,GPU或部分CPU專(zhuān)注于業(yè)務(wù)場(chǎng)景的實(shí)現(xiàn)和落地,而IPU專(zhuān)為AI創(chuàng)新者帶來(lái)更多突破。

未來(lái)的AI計(jì)算領(lǐng)域,將是CPU、GPU、IPU并行

構(gòu)建生態(tài)鏈條IPU仍在路上

IPU想要在AI計(jì)算中擁有挑戰(zhàn)GPU地位的資格,除了在性能和價(jià)格上面證明自己的優(yōu)勢(shì)之外,還需要在為機(jī)器學(xué)習(xí)框架提供的軟件棧上提供更多選擇,獲得主流AI算法廠商的支持。

在標(biāo)準(zhǔn)生態(tài)、操作系統(tǒng)上也需要有廣泛的支持,對(duì)于開(kāi)發(fā)者有更方便的開(kāi)發(fā)工具和社區(qū)內(nèi)容的支持,才能從實(shí)際應(yīng)用中壯大IPU的開(kāi)發(fā)生態(tài)。

一個(gè)AI芯片從產(chǎn)出到大規(guī)模應(yīng)用必須要經(jīng)過(guò)一系列的中間環(huán)節(jié),包括像上面提到的支持主流算法框架的軟件庫(kù)、工具鏈、用戶(hù)生態(tài)等等,打通這樣一條鏈條都會(huì)面臨一個(gè)巨大挑戰(zhàn)。

目前申請(qǐng)使用Graphcore IPU開(kāi)發(fā)者云的主要是商業(yè)用戶(hù)和高校,個(gè)人研究者比較少。IPU開(kāi)發(fā)者云支持當(dāng)前一些最先進(jìn)和最復(fù)雜的AI算法模型的訓(xùn)練和推理。

和本世紀(jì)初的GPU市場(chǎng)一樣,在AI芯片市場(chǎng)步入弱編程階段,如今百家爭(zhēng)鳴的局面預(yù)計(jì)也將很快結(jié)束,市場(chǎng)在一輪廝殺后會(huì)剩下為數(shù)不多的參與者做最終對(duì)決。

現(xiàn)在要看的是在發(fā)展初期的逐一擊破階段,Graphcore是否真有定義并主控第三類(lèi)芯片的魄力了。

不過(guò)從創(chuàng)新的架構(gòu)到芯片再到成為革命性的產(chǎn)品,Graphcore從芯片到落地之間的距離,需要易用的軟件和豐富的工具來(lái)支持,特別是對(duì)軟件生態(tài)依賴(lài)程度比較到的云端芯片市場(chǎng)。

結(jié)尾:

IPU不是GPU,這個(gè)可能是最大的一個(gè)挑戰(zhàn),但同時(shí)也是最大的一個(gè)機(jī)會(huì)。IPU并不是GPU的替代品或者類(lèi)似品,所以不能拿GPU的邏輯來(lái)套用IPU的邏輯。

近兩年,AI 芯片出現(xiàn)了各種品類(lèi)的井噴,可以預(yù)計(jì)未來(lái)IPU在各類(lèi)AI應(yīng)用中將具有更大的優(yōu)勢(shì)。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210824
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128591
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29805

    瀏覽量

    268102
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    PyTorch GPU 加速訓(xùn)練模型方法

    的基本原理 GPU(圖形處理單元)最初是為圖形渲染設(shè)計(jì)的,但隨著技術(shù)的發(fā)展,人們發(fā)現(xiàn)GPU并行計(jì)算方面有著天然的優(yōu)勢(shì)。GPU擁有成千上萬(wàn)個(gè)核心,可以同時(shí)處理大量數(shù)據(jù),這使得它在進(jìn)行矩
    的頭像 發(fā)表于 11-05 17:43 ?404次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個(gè)CUDA單元在 OpenCL 編程框架中都有對(duì)應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲(chǔ)體系 共享內(nèi)存是開(kāi)發(fā)者可配置的編程資源,使用門(mén)檻較高,編程上需要更多的人工顯式處理。 在并行計(jì)算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜
    的頭像 發(fā)表于 10-25 09:23 ?189次閱讀

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強(qiáng)大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?176次閱讀

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    ,即大模型專(zhuān)用AI超級(jí)計(jì)算機(jī)的中樞核心。 作者介紹: 濮元愷,曾就職于中關(guān)村在線核心硬件事業(yè)部,負(fù)責(zé)CPUGPU類(lèi)產(chǎn)品評(píng)測(cè),長(zhǎng)期關(guān)注GPGPU
    發(fā)表于 09-02 10:09

    ai服務(wù)器是什么架構(gòu)類(lèi)型

    架構(gòu)的AI服務(wù)器通常具有較高的通用性,可以運(yùn)行各種人工智能算法。但是,CPU架構(gòu)的AI服務(wù)器在處理大規(guī)模并行計(jì)算時(shí),性能可能不如GPU架構(gòu)的
    的頭像 發(fā)表于 07-02 09:51 ?876次閱讀

    CPU渲染和GPU渲染優(yōu)劣分析

    使用計(jì)算機(jī)進(jìn)行渲染時(shí),有兩種流行的系統(tǒng):基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計(jì)算機(jī)的
    的頭像 發(fā)表于 05-23 08:27 ?507次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    為什么跑AI往往用GPU而不是CPU?

    GPU的能力,并且支持的GPU數(shù)量越多,就代表其AI性能越強(qiáng)大。那么問(wèn)題來(lái)了,為什么是GPU而不是CPU?
    的頭像 發(fā)表于 04-24 08:27 ?1726次閱讀
    為什么跑<b class='flag-5'>AI</b>往往用<b class='flag-5'>GPU</b>而不是<b class='flag-5'>CPU</b>?

    FPGA的力量:2024年AI計(jì)算領(lǐng)域的黑馬?

    隨著人工智能(AI)的快速發(fā)展,其對(duì)計(jì)算能力的需求也在持續(xù)增長(zhǎng)。傳統(tǒng)的中央處理器(CPU)和圖形處理器(GPU)雖然在AI
    的頭像 發(fā)表于 03-07 09:37 ?855次閱讀
    FPGA的力量:2024年<b class='flag-5'>AI</b><b class='flag-5'>計(jì)算</b><b class='flag-5'>領(lǐng)域</b>的黑馬?

    gpu是什么和cpu的區(qū)別

    GPUCPU是兩種常見(jiàn)的計(jì)算機(jī)處理器,它們?cè)诮Y(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU的區(qū)別,并詳細(xì)介紹它們的原理、
    的頭像 發(fā)表于 02-20 11:24 ?1.8w次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別有哪些

    處理器是GPU還是CPU,以及它們的計(jì)算方法和應(yīng)用領(lǐng)域。 首先,讓我們了解一下何為GPU。GPU
    的頭像 發(fā)表于 01-30 15:31 ?786次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時(shí)處理多個(gè)任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項(xiàng)任務(wù)。這是因?yàn)?/div>
    的頭像 發(fā)表于 01-26 08:30 ?2153次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    CPUGPU與TPU之間有什么區(qū)別?

    機(jī)系統(tǒng)的核心,用于執(zhí)行程序中的指令,控制和協(xié)調(diào)系統(tǒng)的各種操作。CPU具有通用性,并且能夠以高度靈活的方式處理各種計(jì)算任務(wù)。 GPU(Graphics Processing Unit,圖形處理器)是一種專(zhuān)用處理器,主要用于圖形渲染
    的頭像 發(fā)表于 12-15 10:10 ?6483次閱讀

    ASIC和GPU,誰(shuí)才是AI計(jì)算的最優(yōu)解?

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI計(jì)算開(kāi)始有著風(fēng)頭蓋過(guò)通用計(jì)算開(kāi)始,不少芯片廠商都將其視為下一輪技術(shù)革新。CPU、GPU、FPGA和AS
    的頭像 發(fā)表于 12-03 08:31 ?1999次閱讀
    ASIC和<b class='flag-5'>GPU</b>,誰(shuí)才是<b class='flag-5'>AI</b><b class='flag-5'>計(jì)算</b>的最優(yōu)解?

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時(shí)計(jì)算大量相似的計(jì)算操作,可以實(shí)現(xiàn)更強(qiáng)的并行計(jì)算性能。GP
    的頭像 發(fā)表于 12-02 17:20 ?1839次閱讀