汽車電子發(fā)展初期以分布式ECU架構(gòu)為主流,芯片與傳感器一一對應(yīng),后來,中心化架構(gòu)DCU、MDC逐步成為了發(fā)展趨勢;隨著汽車輔助駕駛功能滲透率越來越高,傳統(tǒng)CPU算力不足過去,在自動駕駛領(lǐng)域GPU取代CPU成為了主流方案;隨著自動駕駛的定制化需求提升,未來定制化ASIC專用芯片將成為主流。
我們將按時(shí)間順序梳理車載芯片的發(fā)展歷程,探討未來發(fā)展方向。
汽車電子發(fā)展初期以分布式ECU架構(gòu)為主流,芯片與傳感器一一對應(yīng),隨著汽車電子化程度提升,傳感器增多、線路復(fù)雜度增大,中心化架構(gòu)DCU、MDC逐步成為了發(fā)展趨勢;
隨著汽車輔助駕駛功能滲透率越來越高,傳統(tǒng)CPU算力不足,越來越難以滿足處理視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的需求,而GPU同時(shí)處理大量簡單計(jì)算任務(wù)的特性在自動駕駛領(lǐng)域取代CPU成為了主流方案;
從ADAS向自動駕駛進(jìn)化的過程中,激光雷達(dá)點(diǎn)云數(shù)據(jù)以及大量傳感器加入到系統(tǒng)中,需要接受、分析、處理的信號大量且復(fù)雜,定制化的ASIC芯片可在相對低水平的能耗下,將車載信息的數(shù)據(jù)處理速度提升更快,并且性能、能耗和大規(guī)模量產(chǎn)成本均顯著優(yōu)于GPU和FPGA,隨著自動駕駛的定制化需求提升,定制化ASIC專用芯片將成為主流。
目前出貨量最大的駕駛輔助芯片廠商Mobileye、Nvidia形成“雙雄爭霸”局面,Xilinx則在FPGA的路線上進(jìn)軍,Google、地平線、寒武紀(jì)向?qū)S妙I(lǐng)域AI芯片發(fā)力,國內(nèi)四維圖新、全志科技、森國科(國科微)在自動駕駛芯片領(lǐng)域積極布局。
Mobileye的核心優(yōu)勢是 EyeQ 系列芯片,可以處理攝像頭、雷達(dá)等多種傳感器融合產(chǎn)生的大量數(shù)據(jù),在L1-L3自動駕駛領(lǐng)域具有極大的話語權(quán),目前出貨量超過了2700萬顆;
NVIDIA在GPU領(lǐng)域具有絕對的領(lǐng)導(dǎo)地位,芯片算力強(qiáng)大且具備很強(qiáng)的靈活性,但功耗高、成本高,AI機(jī)器學(xué)習(xí)并不太適合GPU的應(yīng)用;
此外Google、地平線、寒武紀(jì)、四維圖新等更聚焦在針對不同場景下的具體應(yīng)用,芯片設(shè)計(jì)也開始增加硬件的深度學(xué)習(xí)設(shè)計(jì),自動駕駛上AI的應(yīng)用已經(jīng)成為未來的趨勢。
基于產(chǎn)業(yè)前景和潛在的巨大市場,給予行業(yè)買入評級,上市公司方面看好四維圖新,建議關(guān)注地平線、寒武紀(jì)。
車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)
過去—以CPU為核心的ECU
2.1 ECU的核心CPU
ECU(Electronic Control Unit)是電子控制單元,其工作過程為CPU接收到各個(gè)傳感器的信號后轉(zhuǎn)化為數(shù)據(jù),并由Program區(qū)域的程序?qū)ata區(qū)域的數(shù)據(jù)圖表調(diào)用來進(jìn)行數(shù)據(jù)處理,從而得出具體驅(qū)動數(shù)據(jù),并通過CPU針腳傳送到相關(guān)驅(qū)動芯片,驅(qū)動芯片再通過相應(yīng)的周邊電路產(chǎn)生驅(qū)動信號,用來驅(qū)動驅(qū)動器。即傳感器信號——傳感器數(shù)據(jù)——驅(qū)動數(shù)據(jù)——驅(qū)動信號這樣一個(gè)完整工作流程。
2.2 分布式架構(gòu)向多域控制器發(fā)展
汽車電子發(fā)展的初期階段,ECU主要是用于控制發(fā)動機(jī)工作,只有汽車發(fā)動機(jī)的排氣管(氧傳感器)、氣缸(爆震傳感器)、水溫傳感器等核心部件才會放置傳感器,由于傳感器數(shù)量較少,為保證傳感器-ECU-控制器回路的穩(wěn)定性,ECU與傳感器一一對應(yīng)的分布式架構(gòu)是汽車電子的典型模式。
隨著汽車電子化的發(fā)展,車載傳感器數(shù)量越來越多,傳感器與ECU一一對應(yīng)使得車輛整體性下降,線路復(fù)雜性也急劇增加,此時(shí)DCU(域控制器)和MDC(多域控制器)等更強(qiáng)大的中心化架構(gòu)逐步替代了分布式架構(gòu)。
現(xiàn)在—以GPU為核心的智能輔助駕駛芯片
人工智能的發(fā)展也帶動了汽車智能化發(fā)展,過去的以CPU為核心的處理器越來越難以滿足處理視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的需求,同時(shí)處理器也需要整合雷達(dá)、視頻等多路數(shù)據(jù),這些都對車載處理器的并行計(jì)算效率提出更高要求,而GPU同時(shí)處理大量簡單計(jì)算任務(wù)的特性在自動駕駛領(lǐng)域取代CPU成為了主流方案。
3.1 GPU Vs. CPU
3.2 GPU占據(jù)現(xiàn)階段自動駕駛芯片主導(dǎo)地位
目前無論是尚未商業(yè)化生產(chǎn)的自動駕駛AI芯片還是已經(jīng)可以量產(chǎn)使用的輔助駕駛芯片,由于自動駕駛算法還在快速更新迭代,對云端“訓(xùn)練”部分提出很高要求,既需要大規(guī)模的并行計(jì)算,又需要大數(shù)據(jù)的多線程計(jì)算,因此以GPU+FPGA解決方案為核心;在終端的“推理”部分,核心需求是大量并行計(jì)算,從而以GPU為核心。
3.3 相關(guān)公司
3.3.1 NVIDIA
NVIDIA 在自動駕駛領(lǐng)域的成就正是得益于他們在 GPU 領(lǐng)域內(nèi)的深耕,NVIDIA GPU專為并行計(jì)算而設(shè)計(jì),適合深度學(xué)習(xí)任務(wù),并且能夠處理在深度學(xué)習(xí)中普遍存在的向量和矩陣操作。相對于Mobileye專注于視覺處理,NVIDIA 的方案重點(diǎn)在于融合不同傳感器。
2016年,英偉達(dá)在Drive PX 2平臺上推出了三款產(chǎn)品,分別是配備單GPU和單攝像頭及雷達(dá)輸入端口的Drive PX2 Autocruise(自動巡航)芯片(下圖左上)、配備雙GPU及多個(gè)攝像頭及雷達(dá)輸入端口的Drive PX2 AutoChauffeur(自動私人司機(jī))芯片(右上)、配備多個(gè)GPU及多個(gè)攝像頭及雷達(dá)輸入端口的Drive PX2 Fully Autonomous Driving(全自動駕駛)芯片(下方)。
以目前銷售情況,Drive PX 2搭載上一代 Pascal 架構(gòu) GPU已經(jīng)實(shí)現(xiàn)量產(chǎn),并且已經(jīng)搭載在 Tesla 的量產(chǎn)車型 Model S 以及 Model X 上。目前 PX 2 仍然是 NVIDIA 自動駕駛平臺出貨的主力,Tesla,Audi 和 ZF等對外公布 Drive PX 2 應(yīng)用于量產(chǎn)車。
Xavier是 Drive PX 2 的進(jìn)化版本,搭配了最新一代的 Volta 架構(gòu) GPU, 相較于Drive PX 2性能將提升近一倍,2017年年底量產(chǎn)。由于多家主機(jī)廠L3級別以上自動駕駛量產(chǎn)車的計(jì)劃在 2020 年左右,而Xavier的量產(chǎn)計(jì)劃將能和自動駕駛車的研發(fā)周期相互配合(一般 3 年左右),因此Xavier 的合作都是有量產(chǎn)車落地計(jì)劃的。
目前,L4及以上的市場基本上被NVIDIA壟斷,CEO黃仁勛稱全球有300余家自動駕駛研發(fā)機(jī)構(gòu)使用Drive PX2。Drive PX 2單價(jià)為1.6萬美金,功耗達(dá)425瓦,但目前沒有達(dá)到車規(guī),按功耗和成本看,只能小規(guī)模測試階段使用。
3.3.2 四維圖新
國內(nèi)地圖行業(yè)龍頭,向ADAS和自動駕駛進(jìn)軍。公司成立于2002年,是國內(nèi)首家獲導(dǎo)航地圖制作資質(zhì)的企業(yè)(目前僅13家),為領(lǐng)先的數(shù)字地圖內(nèi)容、車聯(lián)網(wǎng)與動態(tài)交通信息服務(wù)、基于位置的大數(shù)據(jù)垂直應(yīng)用服務(wù)的提供商之一。其拳頭業(yè)務(wù)——地圖業(yè)務(wù),以國內(nèi)60%的份額穩(wěn)居壟斷地位。2017年以來,公司收購杰發(fā)科技、入股中寰衛(wèi)星與禾多科技,“高精度地圖+芯片+算法+軟件”的自動駕駛產(chǎn)業(yè)鏈全方位布局雛形已現(xiàn)。
高精度地圖:代表國內(nèi)最高水平。公司以地圖起家,目前國內(nèi)高精度地圖僅兩家玩家(另一家為高德),公司深度綁定獲得寶馬、大眾、奔馳、通用、沃爾沃、福特、上汽、豐田、日產(chǎn)、現(xiàn)代、標(biāo)致等主流車企發(fā)展,占絕對優(yōu)勢。2017年公司實(shí)現(xiàn)支持L3級別(至少20個(gè)城市)的高精度地圖,計(jì)劃于2019年覆蓋所有城市,并為L4的推出做準(zhǔn)備。
芯片:收購杰發(fā)科技布局汽車芯片。杰發(fā)科技(2017年3月完成收購)脫胎于聯(lián)發(fā)科,主攻車載信息娛樂系統(tǒng)芯片?,F(xiàn)階段在國內(nèi)后裝市場市占率超70%,前裝超30%(主要為吉利、豐田等車企),其車規(guī)級 IVI 芯片被多家國際主流零部件廠商采用,并計(jì)劃推出AMP、MCU及TPMS(胎壓 監(jiān)測)芯片等新一代產(chǎn)品。公司通過收購杰發(fā)科技,具備了為車廠提供高性能汽車電子芯片的能力,打通從軟件到硬件的關(guān)鍵性關(guān)卡,并與蔚來、威馬、愛馳億維等造車新勢力公司達(dá)成了合作。
3.3.3 全志科技
在今年5月的CES Asia,全志科技發(fā)布首款車規(guī)級處理器T7,同時(shí)發(fā)布基于T7的多種智能座艙產(chǎn)品形態(tài)。T7是數(shù)字座艙車規(guī)(AEC-Q100)平臺型處理器,支持Android、Linux、QNX系統(tǒng),集成多路高清影像輸入和輸出,完美支持高清多媒體處理,內(nèi)置的EVE視覺處理單元可提升輔助駕駛運(yùn)算效率。
未來—以ASIC為核心的自動駕駛芯片
4.1 ASIC vs GPU+FPGA
GPU適用于單一指令的并行計(jì)算,而FPGA與之相反,適用于多指令,單數(shù)據(jù)流,常用于云端的“訓(xùn)練”階段。此外與GPU對比,F(xiàn)PGA沒有存取功能,因此速度更快,功耗低,但同時(shí)運(yùn)算量不大。結(jié)合兩者優(yōu)勢,形成GPU+FPGA的解決方案。
FPGA和ASIC的區(qū)別主要在是否可以編程。FPGA客戶可根據(jù)需求編程,改變用途,但量產(chǎn)成本較高,適用于應(yīng)用場景較多的企業(yè)、軍事等用戶;而ASIC已經(jīng)制作完成并且只搭載一種算法和形成一種用途,首次“開?!背杀靖?,但量產(chǎn)成本低,適用于場景單一的消費(fèi)電子、“挖礦”等客戶。目前自動駕駛算法仍在快速更迭和進(jìn)化,因此大多自動駕駛芯片使用GPU+FPGA的解決方案。未來算法穩(wěn)定后,ASIC將成為主流。
計(jì)算能耗比,ASIC > FPGA > GPU > CPU,究其原因,ASIC和FPGA更接近底層IO,同時(shí) FPGA有冗余晶體管和連線用于編程,而ASIC是固定算法最優(yōu)化設(shè)計(jì),因此ASIC能耗比最高。相比前兩者,GPU和CPU屏蔽底層IO,降低了數(shù)據(jù)的遷移和運(yùn)算效率,能耗比較高。同時(shí)GPU的邏輯和緩存功能簡單,以并行計(jì)算為主,因此GPU能耗比又高于CPU。
4.2 ASIC是未來自動駕駛芯片的核心和趨勢
結(jié)合ASIC的優(yōu)勢,我們認(rèn)為長遠(yuǎn)看自動駕駛的AI芯片會以ASIC為解決方案,主要有以下幾個(gè)原因:
綜上ASIC專用芯片幾乎是自動駕駛量產(chǎn)芯片唯一的解決方案。由于這種芯片僅支持單一算法,對芯片設(shè)計(jì)者在算法、IC設(shè)計(jì)上都提出很高要求。
以上并非下定論目前ASIC為核心的芯片一定比GPU+FPGA的芯片強(qiáng),由于目前自動駕駛算法還在快速迭代和升級過程中,過早以固有算法生產(chǎn)ASIC芯片長期來看不一定是最優(yōu)選擇。
4.3 相關(guān)公司
4.3.1 Mobileye
Intel在 ADAS 處理器上的布局已經(jīng)完善,包括 Mobileye 的 ADAS 視覺處理,利用 Altera 的 FPGA 處理,以及英特爾自身的至強(qiáng)等型號的處理器,可以形成自動駕駛整個(gè)硬件超級中央控制的解決方案。
Mobileye具有自主研發(fā)設(shè)計(jì)的芯片EyeQ系列,由意法半導(dǎo)體公司生產(chǎn)供應(yīng)?,F(xiàn)在已經(jīng)量產(chǎn)的芯片型號有EyeQ1至EyeQ4,EyeQ5正在開發(fā)進(jìn)行中,計(jì)劃2020年面世,對標(biāo)英偉達(dá)Drive PX Xavier,并透露EyeQ5的計(jì)算性能達(dá)到了24 TOPS,功耗為10瓦,芯片節(jié)能效率是Drive Xavier的2.4倍。英特爾自動駕駛系統(tǒng)將采用攝像頭為先的方法設(shè)計(jì),搭載兩塊EyeQ5系統(tǒng)芯片、一個(gè)英特爾凌動C3xx4處理器以及Mobileye軟件,大規(guī)模應(yīng)用于可擴(kuò)展的L4/L5自動駕駛汽車。該系列已被奧迪、寶馬、菲亞特、福特、通用等多家汽車制造商使用。
此外通過行業(yè)訪談?wù){(diào)研等途徑了解到,Mobileye在L1-L3智能駕駛領(lǐng)域具有極大的話語權(quán),對Tire1和OEM非常強(qiáng)勢,其算法和芯片綁定,不允許更改。
4.3.2 寒武紀(jì)
5 月 3 日,寒武紀(jì)科技在2018 產(chǎn)品發(fā)布會上發(fā)布了多個(gè)IP 產(chǎn)品——采用 7nm 工藝的終端芯片Cambricon 1M、云端智能芯片MLU100等。
其中寒武紀(jì)1M芯片是公司第三代IP產(chǎn)品,在TSMC7nm工藝下8位運(yùn)算的效能比達(dá)5Tops/w(每瓦5萬億次運(yùn)算),同時(shí)提供2Tops、4Tops、8Tops三種尺寸的處理器內(nèi)核,以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學(xué)習(xí)模型與機(jī)器學(xué)習(xí)算法的加速,能夠完成視覺、語音、自然語言處理等任務(wù)。通過靈活配置1M處理器,可以實(shí)現(xiàn)多線和復(fù)雜自動駕駛?cè)蝿?wù)的資源最大化利用。它還支持終端的訓(xùn)練,以此避免敏感數(shù)據(jù)的傳輸和實(shí)現(xiàn)更快的響應(yīng)。
寒武紀(jì)首款云端智能芯片Cambricon MLU100同期發(fā)布,同時(shí)公布了在R-CNN算法下MLU100與英偉達(dá)Tesla V100(2017)和英偉達(dá)Tesla P4(2016)的對比,從參數(shù)上看,主要對標(biāo)Tesla P4。
4.3.3 地平線
2017年地平線發(fā)布了新一代自動駕駛芯片“征程”和配套軟件平臺方案“雨果”,同時(shí)還發(fā)布了應(yīng)用于智能攝像頭的“旭日”處理器。“征程”是一款專用AI芯片,采用地平線的第一代BPU架構(gòu),可實(shí)時(shí)處理1080p@30視頻,每幀中可同時(shí)對200個(gè)目標(biāo)進(jìn)行檢測、跟蹤、識別,典型功耗1.5W,每幀延時(shí)小于30ms。CEO余凱介紹,地平線的芯片更聚焦在針對不同場景下的具體應(yīng)用,相比于英偉達(dá)的方案,在功耗上低一個(gè)數(shù)量級,價(jià)格也會有更大的競爭力。
2018年亞洲CES,地平線宣布推出從L2到L4級別全系列的自動駕駛計(jì)算平臺。
4.3.4 百度“昆侖”
7月4日百度AI開發(fā)者大會上,李彥宏發(fā)布了由百度自主研發(fā)的中國首款云端全功能AI芯片——“昆侖”?!袄觥被诎俣?年的AI加速器經(jīng)驗(yàn)的研發(fā),預(yù)計(jì)將于明年流片。
“昆侖”采用14nm 三星工藝,是業(yè)內(nèi)設(shè)計(jì)算力最高的AI芯片(100+瓦功耗下提供260Tops性能);512GB/s內(nèi)存帶寬,由幾萬個(gè)小核心構(gòu)成。
“昆侖”可高效地同時(shí)滿足訓(xùn)練和推斷的需求,除了常用深度學(xué)習(xí)算法等云端需求,還能適配諸如自然語言處理,大規(guī)模語音識別,自動駕駛,大規(guī)模推薦等具體終端場景的計(jì)算需求。此外可以支持paddle等多個(gè)深度學(xué)習(xí)框架,編程靈活度高。
4.3.5 Google TPU
Google TPU于2016年在Google I / O上宣布,當(dāng)時(shí)該公司表示TPU已在其數(shù)據(jù)中心內(nèi)使用了一年以上。該芯片專為Google的Tensor Flow(一個(gè)符號數(shù)學(xué)庫,用于神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)應(yīng)用)框架而設(shè)計(jì)。
TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率(性能/瓦特)提升。
4.3.6 Xilinx & 深鑒科技
Xilinx賽靈思是FPGA的先行者和領(lǐng)導(dǎo)者,1984年,賽靈思發(fā)明了現(xiàn)場可編程門陣列FPGA,作為半定制化的ASIC,順應(yīng)了計(jì)算機(jī)需求更專業(yè)的趨勢。FPGA 的好處是可編程以及帶來的靈活配置,同時(shí)還可以提高整體系統(tǒng)性能,比單獨(dú)開發(fā)芯片整個(gè)開發(fā)周期大為縮短,但缺點(diǎn)是價(jià)格、尺寸等因素。
在汽車ADAS和自動駕駛解決方案上,賽靈思的FPGA和SOC產(chǎn)品家族衍生出三個(gè)模塊:
1.自動駕駛中央控制器Zynq UltraScale+ MPSoC
2.前置攝像頭Zynq-7000 / Zynq UltraScale+ MPSoC
3.多傳感器融合系統(tǒng)Zynq UltraScale+ MPSoC
深鑒科技成立于 2016 年,其創(chuàng)始團(tuán)隊(duì)有著深厚的清華背景,專注于神經(jīng)網(wǎng)絡(luò)剪枝、深度壓縮技術(shù)及系統(tǒng)級優(yōu)化。2018年7月17日,賽靈思宣布收購深鑒科技。自成立以來,深鑒科技就一直基于賽靈思的技術(shù)平臺開發(fā)機(jī)器學(xué)習(xí)解決方案,推出的兩個(gè)用于深度學(xué)習(xí)處理器的底層架構(gòu)—亞里士多德架構(gòu)和笛卡爾架構(gòu)的 DPU 產(chǎn)品,都是基于賽靈思 FPGA 器件。
2018年6月,深鑒科技宣布進(jìn)軍自動駕駛領(lǐng)域,自主研發(fā)的ADAS輔助駕駛系統(tǒng)——DPhiAuto,目前已獲得日本與歐洲一線車企廠商和Tier 1的訂單,即將實(shí)現(xiàn)量產(chǎn)。
DPhiAuto,基于FPGA,是面向高級輔助駕駛和自動駕駛的嵌入式AI計(jì)算平臺, 可提供車輛檢測、行人檢測、車道線檢測、語義分割、交通標(biāo)志識別、可行駛區(qū)域檢測等深度學(xué)習(xí)算法功能,是一套針對計(jì)算機(jī)視覺環(huán)境感知的軟硬件協(xié)同產(chǎn)品。功耗方面,可以在10-20W的功耗范圍內(nèi),實(shí)現(xiàn)等效性能,能效比指標(biāo)高于目前主流的CPU、GPU方案。
-
傳感器
+關(guān)注
關(guān)注
2546文章
50490瀏覽量
751180 -
車載芯片
+關(guān)注
關(guān)注
0文章
71瀏覽量
14653 -
自動駕駛
+關(guān)注
關(guān)注
782文章
13631瀏覽量
165988
原文標(biāo)題:自動駕駛的大腦——芯片簡介
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論