0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA、ASIC等AI芯片特性及對比

jf_78858299 ? 來源:汽車電子與軟件 ? 作者:汽車電子與軟件 ? 2023-03-21 14:42 ? 次閱讀

01.前言

目前,智能駕駛領(lǐng)域在處理深度學習AI算法方面, 主要采用GPUFPGA 等適合并行計算的通用芯片來實現(xiàn)加速 。同時有部分芯片企業(yè)開始設(shè)計專門用于AI算法的ASIC專用芯片,比如谷歌TPU、地平線BPU等。在智能駕駛產(chǎn)業(yè)應(yīng)用沒有大規(guī)模興起和批量投放之前,使用GPU、FPGA等已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風險,但是,由于這類通用芯片設(shè)計初衷并非專門針對深度學習,因而存在性能不足、功耗過高等方面的問題。這些問題隨著自動駕駛行業(yè)應(yīng)用規(guī)模的擴大將會日益突出。

本文從芯片種類、性能、應(yīng)用和供應(yīng)商等多角度介紹AI芯片,用于給行業(yè)內(nèi)入門新人掃盲。

02.什么是人工智能(AI)芯片?

從廣義上講,能運行AI算法的芯片都叫AI芯片。

目前通用的CPU、GPU、FPGA等都能執(zhí)行AI算法,只是執(zhí)行效率差異較大。但狹義上講一般將AI芯片定義為“專門針對AI算法做了特殊加速設(shè)計的芯片”。

目前AI芯片的主要用于語音識別、自然語言處理、圖像處理等大量使用AI算法的領(lǐng)域,通過芯片加速提高算法效率。 AI芯片的主要任務(wù)是矩陣或向量的乘法、加法,然后配合一些除法、指數(shù)等算法。 AI算法在圖像識別等領(lǐng)域,常用的是CNN卷積網(wǎng)絡(luò),一個成熟的AI算法,就是大量的卷積、殘差網(wǎng)絡(luò)、全連接等類型的計算,本質(zhì)是乘法和加法。

對汽車行業(yè)而言,AI芯片的主要用于就是處理智能駕駛中環(huán)境感知、傳感器融合和路徑規(guī)劃等算法帶來的大量并行計算需求。

AI芯片可以理解為一個快速計算乘法和加法的計算器,而CPU要處理和運行非常復(fù)雜的指令集,難度比AI芯片大很多。GPU雖然為圖形處理而設(shè)計,但是CPU與GPU并不是專用AI芯片,其內(nèi)部有大量其他邏輯來實現(xiàn)其他功能,這些邏輯對于目前的AI算法來說完全無用。目前經(jīng)過專門針對AI算法做過開發(fā)的GPU應(yīng)用較多,也有部分企業(yè)用FPGA做開發(fā),但是行業(yè)內(nèi)對于AI算法必然出現(xiàn)專用AI芯片。

03.為什么要用AI芯片?

人工智能從功能上來看包括推理和訓練兩個環(huán)節(jié),智能駕駛行業(yè)亦然。在訓練環(huán)節(jié), 通過大數(shù)據(jù)訓練出一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,目前大部分企業(yè)在訓練環(huán)節(jié)主要使用英偉達的GPU集群完成 。推理環(huán)節(jié)是指利用訓練好的模型,使用大量數(shù)據(jù)推理出各種結(jié)論。因此,訓練環(huán)節(jié)對芯片的算力性能要求比較高,推理環(huán)節(jié)對簡單指定的重復(fù)計算和低延遲的要求很高。

從應(yīng)用場景來看,人工智能芯片應(yīng)用于云端和設(shè)備端,在智能駕駛領(lǐng)域同樣具備云服務(wù)器和車載的各種計算平臺或域控制器, 在智能駕駛深度學習的訓練階段需要極大的數(shù)據(jù)量和大量運算,單一處理器無法獨立完成,因此訓練環(huán)節(jié)只能在云服務(wù)器實現(xiàn)。相對的在設(shè)備端即車上,各種ECU、DCU等終端數(shù)量龐大,而且需求差異較大。因此,推理環(huán)節(jié)無法在云端完成,這就要求車上的各種電子單元、硬件計算平臺或域控制器有獨立的推理計算能力,因此必須要有專用的AI芯片來應(yīng)對這些推理計算需求。

傳統(tǒng)的CPU、GPU都可以拿來執(zhí)行AI算法,但是速度慢,性能低,尤其是CPU,在智能駕駛領(lǐng)域無法實際投入商用。

比如,自動駕駛需要識別道路、行人、紅綠燈等路況和交通狀況,這在自動駕駛算法里面都是屬于并行計算,如果是CPU去執(zhí)行計算,那么估計車撞到人了也沒算出來個結(jié)果,CPU并行計算速度慢屬于先天不足。如果用GPU速度要快得多,畢竟GPU專為圖像處理并行計算設(shè)計,但是GPU功耗過大,汽車的電池無法長時間支撐正常使用,而且GPU價格相對較高,用于自動駕駛量產(chǎn)的話普通消費者也用不起。另外,GPU因為不是專門針對AI算法開發(fā)的ASIC,執(zhí)行AI計算的速度優(yōu)勢還沒到極限,還有提升空間。

在智能駕駛這樣的領(lǐng)域,環(huán)境感知、物體識別等深度學習應(yīng)用要求計算響應(yīng)方面必須快! 時間就是生命,慢一步就有可能造成無法挽回的情況,但是保證性能快效率高的同時,功耗不能過高,不能對智能汽車的續(xù)航里程造成較大影響,也就是AI芯片必須功耗低,所以GPU不是適合智能駕駛的最佳AI芯片選擇。因此開發(fā)ASIC就成了必然。

04.AI芯片的種類

當前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片架構(gòu),屬于通用型芯片。ASIC屬于為AI特定場景定制的芯片。行業(yè)內(nèi)已經(jīng)確認CPU不適用于AI計算,但是在AI應(yīng)用領(lǐng)域也是必不可少,另外一種說法是還有一種類腦芯片,算是ASIC的一種。

FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列)具有足夠的計算能力和足夠的靈活性。FPGA的計算速度快是源于它本質(zhì)上是無指令、無需共享內(nèi)存的體系結(jié)構(gòu)。對于保存狀態(tài)的需求,F(xiàn)PGA中的寄存器和片上內(nèi)存(BRAM)是屬于各自的控制邏輯的,無需不必要的仲裁和緩存,因此FPGA在運算速度足夠快,優(yōu)于GPU。同時FPGA也是一種半定制的硬件,通過編程可定義其中的單元配置和鏈接架構(gòu)進行計算,因此具有較強的靈活性。相對于GPU,F(xiàn)PGA能管理能運算,但是相對開發(fā)周期長,復(fù)雜算法開發(fā)難度大。

ASIC(Application Specific Integrated Circuit特定用途集成電路)根據(jù)產(chǎn)品的需求進行特定設(shè)計和制造的集成電路,能夠在特定功能上進行強化,具有更高的處理速度和更低的能耗。缺點是研發(fā)成本高,前期研發(fā)投入周期長,且由于是定制化,可復(fù)制性一般,因此只有用量足夠大時才能夠分攤前期投入,降低成本。

4.1 CPU (CentralProcessing Unit)

中央處理器作為計算機系統(tǒng)的運算和控制核心,是信息處理、程序運行的最終執(zhí)行單元,CPU 是對計算機的所有硬件資源(如存儲器、輸入輸出單元) 進行控制調(diào)配、執(zhí)行通用運算的核心硬件單元。

優(yōu)點: CPU有大量的緩存和復(fù)雜的邏輯控制單元,非常擅長邏輯控制、串行的運算

缺點: 不擅長復(fù)雜算法運算和處理并行重復(fù)的操作。

對于AI芯片來說,算力最弱的是cpu。雖然cpu主頻最高,但是單顆也就8核,16核的樣子,一個核3.5g,16核也就56g,再考慮指令周期,每秒最多也就30g次乘法。還是定點的。

生產(chǎn)廠商: intelAMD

4.2 GPU (GraphicsProcessing Unit)

圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上做圖像和圖形相關(guān)運算工作的微處理器。

優(yōu)點: 提供了多核并行計算的基礎(chǔ)結(jié)構(gòu),且核心數(shù)非常多,可以支撐大量數(shù)據(jù)的并行計算,擁有更高的浮點運算能力。

缺點: 管理控制能力(最弱),功耗(最高)。

生產(chǎn)廠商: AMD、NVIDIA

4.3 FPGA(Field Programmable Gate Array)

FPGA是在PAL、GAL等可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

優(yōu)點: 可以無限次編程,延時性比較低,同時擁有流水線并行和數(shù)據(jù)并行(GPU只有數(shù)據(jù)并行)、實時性最強、靈活性最高。

缺點: 開發(fā)難度大、只適合定點運算、價格比較昂貴

生產(chǎn)廠商: Altera(Intel收購)、Xilinx

4.4 ASIC(Application Specific IntegratedCircuit)

ASIC,即專用集成電路,指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。目前用CPLD(復(fù)雜可編程邏輯器件)和 FPGA(現(xiàn)場可編程邏輯陣列)來進行ASIC設(shè)計是最為流行的方式之一。

優(yōu)點: 它作為集成電路技術(shù)與特定用戶的整機或系統(tǒng)技術(shù)緊密結(jié)合的產(chǎn)物,與通用集成電路相比具有體積更小、重量更輕、 功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優(yōu)點。

缺點: 靈活性不夠,成本比FPGA貴

主要性能指標: 功耗、速度、成本

生產(chǎn)廠商: 谷歌、地平線、寒武紀

4.5 四種芯片的特性總結(jié)

CPU是一個有多種功能的優(yōu)秀領(lǐng)導者。它的優(yōu)點在于調(diào)度、管理、協(xié)調(diào)能力強,計算能力則位于其次。而GPU相當于一個接受CPU調(diào)度的“擁有大量計算能力”的員工。

GPU 作為圖像處理器,設(shè)計初衷是為了應(yīng)對圖像處理中需要大規(guī)模并行計算。

因此,其在應(yīng)用于深度學習算法時,有三個方面的局限性:

第一, 應(yīng)用過程中無法充分發(fā)揮并行計算優(yōu)勢。深度學習包含訓練和應(yīng)用兩個計算環(huán)節(jié),GPU 在深度學習算法訓練上非常高效,但在應(yīng)用時一次性只能對于一張輸入圖像進行處理,并行度的優(yōu)勢不能完全發(fā)揮。

第二, 硬件結(jié)構(gòu)固定不具備可編程性。深度學習算法還未完全穩(wěn)定,若深度學習算法發(fā)生大的變化,GPU 無法像FPGA 一樣可以靈活的配置硬件結(jié)構(gòu)。

第三, 運行深度學習算法能效遠低于FPGA。學術(shù)界和產(chǎn)業(yè)界研究已經(jīng)證明,運行深度學習算法中實現(xiàn)同樣的性能,GPU 所需功耗遠大于FPGA,例如國內(nèi)初創(chuàng)企業(yè)深鑒科技基于FPGA 平臺的人工智能芯片在同樣開發(fā)周期內(nèi)相對GPU 能效有一個數(shù)量級的提升。

FPGA,其設(shè)計初衷是為了實現(xiàn)半定制芯片的功能,即硬件結(jié)構(gòu)可根據(jù)需要實時配置靈活改變。

研究報告顯示,目前的FPGA市場由Xilinx 和Altera 主導,兩者共同占有85%的市場份額,其中Altera 在2015 年被intel以167 億美元收購, Xilinx則選擇與IBM進行深度合作,背后都體現(xiàn)了 FPGA 在人工智能時代的重要地位。

盡管 FPGA 倍受看好,甚至百度大腦、地平線AI芯片也是基于FPGA 平臺研發(fā),但其畢竟不是專門為了適用深度學習算法而研發(fā),實際仍然存在不少局限:

第一, 基本單元的計算能力有限。為了實現(xiàn)可重構(gòu)特性,F(xiàn)PGA 內(nèi)部有大量極細粒度的基本單元,但是每個單元的計算能力(主要依靠LUT 查找表)都遠遠低于CPU 和GPU中的ALU模塊。

第二, 速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距。

第三, FPGA 價格較為昂貴,在規(guī)模放量的情況下單塊FPGA 的成本要遠高于專用定制芯片。

人工智能定制芯片是大趨勢,從發(fā)展趨勢上看,人工智能定制芯片將是計算芯片發(fā)展的大方向。

05.AI芯片算力對比

5.1 通用芯片—GPU

GPU(Graphics Processing Unit)即為圖形處理器。 NVIDIA公司在1999年發(fā)布GeForce256圖形處理芯片時首先提出GPU的概念。從此NVIDIA顯卡的芯就用這個新名字GPU來稱呼。GPU使顯卡削減了對CPU的依賴,部分替代原本CPU的工作,特別是在3D圖形處理方面。由于在浮點運算、并行計算等方面,GPU可以提供數(shù)十倍乃至于上百倍于CPU的性能。

GPU相比CPU更適合人工智能計算。 GPU和CPU分別針對的是兩種不同的應(yīng)用場景,他們的設(shè)計目標不同,CPU需要很強的通用性來處理各種不同的數(shù)據(jù)類型,同時邏輯判斷又會引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU擅長的則是在不需要被打斷的純凈的計算環(huán)境中進行類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)處理,人工智能的計算恰巧主要是后者,這使得原本為圖像處理而生的GPU在人工智能時代煥發(fā)第二春。

CPU的邏輯運算單元(ALU)較少,控制器(control)占比較大; GPU的邏輯運算單元(ALU)小而多,控制器功能簡單,緩存(cache)也較少。架構(gòu)的不同使得CPU擅長進行邏輯控制、串行計算,而GPU擅長高強度的并行計算。GPU單個運算單元處理能力弱于CPU的ALU,但是數(shù)量眾多的運算單元可以同時工作,當面對高強度并行計算時,其性能要優(yōu)于CPU。現(xiàn)如今GPU除了圖像處理外,也越來越多的運用到別的計算中。

CPU根據(jù)功能劃分,將需要大量并行計算的任務(wù)分配給GPU。 GPU從CPU獲得指令后,把大規(guī)模、無結(jié)構(gòu)化的數(shù)據(jù)分解成許多獨立部分,分配給各個流處理集群(SMM)。每個流處理集群再次把數(shù)據(jù)分解,分配給調(diào)度器,調(diào)度器將任務(wù)放入自身所控制的計算核心core中完成最終的數(shù)據(jù)處理任務(wù)。

GPU性能較強但功耗較高。以NVIDIA開發(fā)的GPU為例,Xavier最高算力為30Tops,功耗為30W,NVIDIA最新發(fā)布的GPUA100相比Volta架構(gòu)的640個Tensor Core,A100核心的TensorCore減少到了432個,但是性能大幅增強,支持全新的TF32運算,浮點性能156TFLOPS,同時INT8浮點性能624TOPS,F(xiàn)P16性能312TFLOPS,同時功耗也達到了400W。

5.2 半定制化芯片—FPGA

FPGA(Field-ProgrammableGate Array),即現(xiàn)場可編程門陣列。它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

FPGA內(nèi)部有很多可配置邏輯模塊(CLB),這些模塊是現(xiàn)實邏輯功能的基本單元,F(xiàn)PGA可通過靈活地配置CLB來令其實現(xiàn)工程師想要實現(xiàn)的邏輯功能。

FPGA的并行處理能力也很強大,其可編程性也適用于不斷優(yōu)化的深度學習算法的運算。目前很多公司基于FPGA開發(fā)人工智能處理器。于2016年成立的深鑒科技,就在研發(fā)深度學習通用解決方案。2016年初,深鑒科技就設(shè)計了基于FPGA、針對深度學習的DPU硬件架構(gòu)。該產(chǎn)品實現(xiàn)了高性能功耗比,并且成本也比GPU產(chǎn)品低很多。今年8月加州的Hot Chips大會上,百度也發(fā)布了其基于FPGA芯片的A.I加速芯片—XPU。該芯片有256核,旨在尋求性能和效率的平衡,處理多樣化計算任務(wù)。

基于FPGA開發(fā)的人工智能處理器具有高性能、低能耗、可硬件編程的特點。

1)高性能

除了GPU,F(xiàn)PGA也擅長并行計算,基于FPGA開發(fā)的處理器可以實現(xiàn)更高的并行計算。而且FPGA帶有豐富的片上存儲資源,可以大大減少訪問片外存儲的延遲,提高計算性能,訪問DRAM儲存大約是訪問寄存器存儲延遲的幾百倍以上。

2)低能耗

相比于CPU和GPU,F(xiàn)PGA的能耗優(yōu)勢主要有兩個原因:1)相比于CPU、GPU,F(xiàn)PGA架構(gòu)有一定的優(yōu)化,CPU、GPU需要頻繁的訪問DRAM,而這個能量消耗較大,F(xiàn)PGA可以減少這方面的能耗。2)FPGA的主頻低,CPU和GPU的主頻一般在1-3GHz之間,而FPGA的主頻一般在500MHz一下。因此,F(xiàn)PGA的能耗要低于CPU、GPU。

3)可硬件編程

FPGA可硬件編程,并且可以進行靜態(tài)重復(fù)編程和動態(tài)系統(tǒng)重配置。用戶可像編程修改軟件一樣修改系統(tǒng)的硬件功能,大大增強了系統(tǒng)設(shè)計的靈活性和通用性。使得FPGA可以靈活地部署在需要修改硬件設(shè)置場景中。

FPGA+CPU異構(gòu)架構(gòu)被越來越多地研究和認可。相比于CPU+GPU,因為FPGA的高性能低功耗等優(yōu)勢使FPGA+CPU可以提供更好的單位功耗性能,且更易于修改和編程。因此FPGA適合做可并行計算的任務(wù),如矩陣運算。如果是一些判斷類的問題,F(xiàn)PGA算得并沒有CPU快。所以已經(jīng)有研究人員探討FPGA+CPU的架構(gòu)模式。

5.3 全定制芯片—ASIC

ASIC(Application Specific IntegratedCircuit)在集成電路界被認為是一種為專門目的而設(shè)計的集成電路。是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。ASIC的特點是面向特定用戶的需求,ASIC在批量生產(chǎn)時與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優(yōu)點。簡單地講,ASIC芯片就是通過臺積電等代工廠流片的芯片。目前,基于ASIC的人工智能芯片有地平線BPU、谷歌的TPU。

基于ASIC開發(fā)人工智能芯片開發(fā)周期較長?;贏SIC開發(fā)人工智能芯片更像是電路設(shè)計,需要反復(fù)優(yōu)化,需要經(jīng)歷較長的流片周期,故開發(fā)周期較長。

量產(chǎn)后ASIC人工智能芯片成本及價格較低。雖然相較于FPGA, ASIC人工智能芯片需要經(jīng)歷較長的開發(fā)周期,并且需要價格昂貴的流片投入,但是這些前期開發(fā)投入在量產(chǎn)后會被攤薄,所以量產(chǎn)后,ASIC人工智能芯片的成本和價格會低于FPGA人工智能芯片。

ASIC芯片性能功耗比較高。從性能功耗比來看,ASIC作為定制芯片,其性能要比基于通用芯片F(xiàn)PGA開發(fā)出的各種半定制人工智能芯片更具有優(yōu)勢。而且ASIC也并不是完全不具備可配置能力,只是沒有FPGA那么靈活,只要在設(shè)計的時候把電路做成某些參數(shù)可調(diào)即可。

ASIC人工智能芯片主要面向消費電子市場。ASIC更高的性能,更低的量產(chǎn)成本以及有限可配置特性,使其主要面向消費電子市場,如寒武紀等公司。

5.4 類腦芯片

類人腦芯片架構(gòu)是一款基于神經(jīng)形態(tài)的工程,旨在打破“馮·諾依曼”架構(gòu)的束縛,模擬人腦處理過程,感知世界、處理問題。這種芯片的功能類似于大腦的神經(jīng)突觸,處理器類似于神經(jīng)元,而其通訊系統(tǒng)類似于神經(jīng)纖維,可以允許開發(fā)者為類人腦芯片設(shè)計應(yīng)用程序。通過這種神經(jīng)元網(wǎng)絡(luò)系統(tǒng),計算機可以感知、記憶和處理大量不同的信息。類腦芯片的兩大突破:1、有望形成自主認知的新形式;2、突破傳統(tǒng)計算機體系結(jié)構(gòu)的限制,實現(xiàn)數(shù)據(jù)并行傳送、分布式處理,能以極低功耗實時處理大量數(shù)據(jù)。

06.總結(jié)

圖片

CPU 有強大的調(diào)度、管理、協(xié)調(diào)能力。應(yīng)用范圍廣。開發(fā)方便且靈活。但其在大量數(shù)據(jù)處理上沒有 GPU 專業(yè),相對運算量低,但功耗不低。

GPU:是單指令、多數(shù)據(jù)處理,采用數(shù)量眾多的計算單元和超長的流水線,如名字一樣,圖形處理器, GPU善于處理圖像領(lǐng)域的運算加速。但GPU無法單獨工作,必須由CPU進行控制調(diào)用才能工作。CPU可單獨作用,處理復(fù)雜的邏輯運算和不同的數(shù)據(jù)類型,但當需要大量的處理類型統(tǒng)一的數(shù)據(jù)時,則可調(diào)用GPU進行并行計算。

FPGA:和GPU相反,F(xiàn)PGA適用于多指令,單數(shù)據(jù)流的分析,因此常用于預(yù)測階段,如云端。 FPGA是用硬件實現(xiàn)軟件算法,因此在實現(xiàn)復(fù)雜算法方面有一定的難度,缺點是價格比較高。將FPGA和GPU對比發(fā)現(xiàn),一是缺少內(nèi)存和控制所帶來的存儲和讀取部分,速度更快。二是因為缺少讀取的作用,所以功耗低,劣勢是運算量并不是很大。結(jié)合CPU和GPU各自的優(yōu)勢,有一種解決方案就是異構(gòu)。

ASIC芯片:是專用定制芯片,為實現(xiàn)特定要求而定制的芯片。 除了不能擴展以外,在功耗、可靠性、體積方面都有優(yōu)勢,尤其在高性能、低功耗的移動端。谷歌的TPU、寒武紀的MLU,地平線的BPU都屬于ASIC芯片。谷歌的TPU比CPU和GPU的方案快30-80倍,與CPU和GPU相比,TPU把控制縮小了,因此減少了芯片的面積,降低了功耗。

四種架構(gòu)將走向哪里?

眾所周知,通用處理器(CPU)的摩爾定律已入暮年,而機器學習和Web 服務(wù)的規(guī)模卻在指數(shù)級增長。

人們使用定制硬件來加速常見的計算任務(wù),然而日新月異的行業(yè)又要求這些定制的硬件可被重新編程來執(zhí)行新類型的計算任務(wù)。

將以上四種架構(gòu)對比,GPU未來的主攻方向是高級復(fù)雜算法和通用性人工智能平臺,其發(fā)展路線分兩條走: 一是主攻高端算法的實現(xiàn),對于指令的邏輯性控制要更復(fù)雜一些,在面向需求通用的AI計算方面具有優(yōu)勢;二是主攻通用性人工智能平臺,GPU的通用性強,所以應(yīng)用于大型人工智能平臺可高效完成不同的需求。FPGA更適用于各種細分的行業(yè),人工智能會應(yīng)用到各個細分領(lǐng)域。

ASIC芯片是全定制芯片,長遠看適用于人工智能。現(xiàn)在很多做AI算法的企業(yè)也是從這個點切入。因為算法復(fù)雜度越強,越需要一套專用的芯片架構(gòu)與其進行對應(yīng),ASIC基于人工智能算法進行定制,其發(fā)展前景看好。類腦芯片是人工智能最終的發(fā)展模式,但是離產(chǎn)業(yè)化還很遙遠。

幾個品牌的SOC及域控制器做的還是不錯的,尤其是基于NVIDIA Xavier以及前期PX2等芯片的開發(fā)。國內(nèi)大部分企業(yè)的應(yīng)用比較集中在Xavier平臺和Linux系統(tǒng),尤其是新勢力造車企業(yè),而傳統(tǒng)車企更青睞TI、瑞薩半導體公司的智能AI芯片以及QNX系統(tǒng)。國內(nèi)基于Xavier做開發(fā)的企業(yè)很多,天津優(yōu)控智行目前的域控制器產(chǎn)品在行業(yè)內(nèi)屬于中等偏上水平,但是其軟件工具和服務(wù)做得相對有些優(yōu)勢,后期有時間也扒一扒地平線、智行者等企業(yè)的域控制器學習學習。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1620

    文章

    21510

    瀏覽量

    598900
  • 芯片
    +關(guān)注

    關(guān)注

    450

    文章

    49636

    瀏覽量

    417144
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1175

    瀏覽量

    119987
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128141
收藏 人收藏

    評論

    相關(guān)推薦

    ASICFPGA的優(yōu)勢與劣勢

    ASICFPGA具有不同的價值主張,在作出選擇前必須仔細評估。兩種種技術(shù)對比。這里介紹了ASICFPGA 的優(yōu)勢與劣勢。
    發(fā)表于 03-31 17:30 ?5553次閱讀
    <b class='flag-5'>ASIC</b>和<b class='flag-5'>FPGA</b>的優(yōu)勢與劣勢

    自動駕駛主流架構(gòu)方案對比:GPU、FPGA、ASIC

    當前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片
    發(fā)表于 02-14 11:03 ?3017次閱讀

    到底什么是ASICFPGA?

    用在ADAS(高級駕駛輔助系統(tǒng))和伺服電機驅(qū)動上。 消費電子用FPGA,是因為產(chǎn)品迭代太快。ASIC的開發(fā)周期太長了,做出東西來,黃花菜都涼了。 FPGA、
    發(fā)表于 01-23 19:08

    cogoask講解fpgaASIC是什么意思

    、GAL、EPLD可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點?! ?b class='flag-5'>FPGA采用
    發(fā)表于 02-27 17:46

    FPGAASIC芯片解密有哪些性能分析

    有流水處理和響應(yīng)迅速的特點。 芯片解密認為,FPGA一般來說比ASIC的速度要慢,無法完成復(fù)雜的設(shè)計,但是功耗較低。但是他們也有很多的優(yōu)點比如可以快速成品,可以被修改來改正程序中的錯誤和更便宜的造價
    發(fā)表于 06-12 15:56

    AI運算核心,FPGA領(lǐng)域前程遠大

    、GPU、FPGAASIC四種,依特性與使用目的不同又可區(qū)分為云端運算與邊緣運算。 前者云端運算因為需要處理龐大數(shù)據(jù),加上長時間運作,芯片需求特性
    發(fā)表于 12-05 08:09

    ASICFPGA有什么區(qū)別

    進行重新編程?! ?、開發(fā)流程區(qū)別:  FPGA開發(fā)是利用HDL和quartus、vivadoEDA工具,重新配置(configure)芯片的功能,而ASIC通常都具有較少的可重配置
    發(fā)表于 12-01 17:41

    ai芯片和gpu的區(qū)別

    ai芯片和gpu的區(qū)別▌車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應(yīng)的電子控制單元(ECU)為
    發(fā)表于 07-27 07:29

    什么是ASIC芯片?與CPU、GPU、FPGA相比如何?

    不過在聯(lián)發(fā)科副總經(jīng)理暨智能設(shè)備事業(yè)群總經(jīng)理游人杰看來,雖然CPU、GPU通用型芯片以及FPGA可以適應(yīng)相對更多種的算法,但是特定算法下ASIC的性能和效能要更高。另外,雖然
    的頭像 發(fā)表于 05-04 15:39 ?25.3w次閱讀
    什么是<b class='flag-5'>ASIC</b><b class='flag-5'>芯片</b>?與CPU、GPU、<b class='flag-5'>FPGA</b>相比如何?

    淺析GPU、FPGA、ASIC三種主流AI芯片的區(qū)別

    當前主流的AI芯片主要分為三類,GPU、FPGAASIC。其中GPU、FPGA均是前期較為成熟的芯片
    發(fā)表于 03-07 14:39 ?3w次閱讀

    AI的三種專用芯片 GPU和FPGA以及ASIC

    人工智能的三大支撐是硬件、算法和數(shù)據(jù),其中硬件指的是運行 AI 算法的芯片與相對應(yīng)的計算平臺。在硬件方面,目前主要是使用 GPU 并行計算神經(jīng)網(wǎng)絡(luò),同時,還有 FPGAASIC
    發(fā)表于 08-21 17:48 ?5469次閱讀

    FPGA對比 ASIC你看好誰?

    FPGA vs. ASIC 你看好誰?
    的頭像 發(fā)表于 01-15 16:10 ?4259次閱讀

    關(guān)于AI芯片的介紹與四大芯片特性和總結(jié)及對比

    目前,智能駕駛領(lǐng)域在處理深度學習AI算法方面,主要采用GPU、FPGA 適合并行計算的通用芯片來實現(xiàn)加速。同時有部分芯片企業(yè)開始設(shè)計專門用
    的頭像 發(fā)表于 03-19 17:24 ?2.3w次閱讀
    關(guān)于<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的介紹與四大<b class='flag-5'>芯片</b>的<b class='flag-5'>特性</b>和總結(jié)及<b class='flag-5'>對比</b>

    自動駕駛主流芯片:GPU、FPGAASIC

    當前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片
    發(fā)表于 03-17 11:05 ?1831次閱讀

    FPGA、ASIC技術(shù)對比

    FPGA要取代ASIC了,這是FPGA廠商喊了十多年的口號??墒牵?b class='flag-5'>FPGA地盤占了不少,ASIC也依舊玩得愉快。那么,這兩位仁兄到底有啥不一
    的頭像 發(fā)表于 03-31 14:41 ?1483次閱讀
    <b class='flag-5'>FPGA</b>、<b class='flag-5'>ASIC</b>技術(shù)<b class='flag-5'>對比</b>