隨著人工智能、云服務(wù)等新興需求的迅猛增長(zhǎng),算力正在從滿足多任務(wù)的通用芯片,向單一任務(wù)的多種專用芯片發(fā)展,傳統(tǒng)以CPU為核心的計(jì)算架構(gòu),已經(jīng)不能滿足新興業(yè)務(wù)需求,異構(gòu)計(jì)算成為重要趨勢(shì)。
近年來(lái),在云計(jì)算蓬勃發(fā)展的同時(shí),異構(gòu)計(jì)算市場(chǎng)也乘風(fēng)得到了長(zhǎng)足的發(fā)展。對(duì)芯片設(shè)計(jì)企業(yè)而言,過去進(jìn)入服務(wù)器計(jì)算芯片市場(chǎng)只有通過有競(jìng)爭(zhēng)力的X86 CPU,而現(xiàn)在GPU、FPGA、AI芯片各類架構(gòu)CPU等多種計(jì)算芯片均在服務(wù)器中得到廣泛應(yīng)用,為國(guó)產(chǎn)CPU及AI芯片公司,以及基于***的智能計(jì)算產(chǎn)業(yè)鏈提供了良好的發(fā)展機(jī)會(huì)。
CPU是中央處理器作為計(jì)算機(jī)系統(tǒng)的運(yùn)算和控制核心,是信息處理、程序運(yùn)行的最終執(zhí)行單元。 FPGA是基于通用邏輯電路陣列的集成電路芯片,其最大的特點(diǎn)是芯片的具體功能在制造完成以后由用戶配置決定。 GPU/GPGPU是并行計(jì)算的主力算力引擎。隨著業(yè)務(wù)越來(lái)越復(fù)雜,數(shù)據(jù)流量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),全部業(yè)務(wù)和數(shù)據(jù)靠CPU處理,性價(jià)比極低。AI加速芯片為專門針對(duì)AI深度學(xué)習(xí),結(jié)合標(biāo)量計(jì)算、矢量計(jì)算和張量計(jì)算真的專用架構(gòu)應(yīng)運(yùn)而生,針對(duì)AI推理應(yīng)用,實(shí)際算力利用率可超過90%。 DPU作為數(shù)據(jù)處理器,其核心是通過協(xié)處理器協(xié)助主控CPU處理網(wǎng)絡(luò)負(fù)載,編程網(wǎng)絡(luò)接口功能。支持?jǐn)?shù)據(jù)中心底層存儲(chǔ)、安全、服務(wù)質(zhì)量管理等基礎(chǔ)設(shè)施層服務(wù),提升整個(gè)計(jì)算系統(tǒng)的效率、降低整體系統(tǒng)的總體擁有成本。 目前,我國(guó)服務(wù)器計(jì)算芯片主要從英特爾、AMD超威半導(dǎo)體、英偉達(dá)等企業(yè)進(jìn)口,未來(lái)計(jì)算芯片國(guó)產(chǎn)化市場(chǎng)空間大,進(jìn)口替代空間廣闊。本文主要關(guān)注計(jì)算芯片,包括CPU、GPU/GPGPU、FPGA、AI加速芯片等和以DPU為代表的網(wǎng)絡(luò)通信芯片。
1、CPU
CPU中央處理器作為計(jì)算機(jī)系統(tǒng)的運(yùn)算和控制核心,是信息處理、程序運(yùn)行的最終執(zhí)行單元。CPU是整個(gè)IT生態(tài)的定義者,無(wú)論是服務(wù)器端的X86還是移動(dòng)端的ARM(安謀),都各自構(gòu)建了穩(wěn)固的生態(tài)系統(tǒng),不僅形成技術(shù)生態(tài)圈,還形成閉合價(jià)值鏈。
市場(chǎng)空間
數(shù)據(jù)中心應(yīng)用CPU價(jià)格高,利潤(rùn)最為豐富,根據(jù)不同配置,CPU占據(jù)服務(wù)器總成本約1/3到1/2。預(yù)計(jì)到2025年,隨著中國(guó)數(shù)據(jù)中心的不斷擴(kuò)容和升級(jí),以及云計(jì)算、大數(shù)據(jù)、人工智能等應(yīng)用的快速發(fā)展,中國(guó)數(shù)據(jù)中心應(yīng)用CPU市場(chǎng)規(guī)模有望繼續(xù)增長(zhǎng)。根據(jù)中金證券研究數(shù)據(jù),2021年中國(guó)服務(wù)器CPU市場(chǎng)規(guī)模60億美元,預(yù)計(jì)2024年達(dá)到92億美元,3年年均復(fù)合增長(zhǎng)率15%。
發(fā)展趨勢(shì)
國(guó)產(chǎn)CPU各個(gè)技術(shù)賽道全方面布局。X86、ARM、RISC-V(Reduced Instruction Set Computer-V,第五代精簡(jiǎn)指令集計(jì)算機(jī) )是CPU三大技術(shù)架構(gòu)。服務(wù)器市場(chǎng)上X86處理器市占率超過90%,占據(jù)絕對(duì)主導(dǎo)地位。CPU產(chǎn)業(yè)鏈巨頭大多集中在海外,位居產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)核心,對(duì)全球CPU行業(yè)影響力較大。在設(shè)計(jì)環(huán)節(jié),英特爾和AMD幾乎壟斷通用型CPU市場(chǎng)。借助臺(tái)積電先進(jìn)制程,AMD服務(wù)器CPU霄龍強(qiáng)勢(shì)崛起,根據(jù)IDC數(shù)據(jù)2021年第四季度, AMD數(shù)據(jù)中心CPU市場(chǎng)占有率自2016年之后首超10%。為應(yīng)對(duì)新的挑戰(zhàn),英特爾2021年底歷史第一次宣布開放X86指令集給第三方公司。 ARM開放指令集以及在移動(dòng)端構(gòu)建的良好生態(tài),數(shù)據(jù)中心巨大市場(chǎng)以及豐厚利潤(rùn)吸引各家巨頭入局開發(fā)ARM架構(gòu)服務(wù)器CPU,其市場(chǎng)占有率穩(wěn)步提升。除美滿、富士通、英偉達(dá)、海思等傳統(tǒng)芯片巨頭之外,亞馬遜、谷歌、阿里等手握資金、技術(shù)以及應(yīng)用場(chǎng)景的新型互聯(lián)網(wǎng)公司也加入這一戰(zhàn)局,給市場(chǎng)帶來(lái)變數(shù)。ARM架構(gòu)服務(wù)器CPU性能不斷提升、生態(tài)不斷完善,與X86架構(gòu)正面競(jìng)爭(zhēng),蠶食之勢(shì)不容小覷。 RISC-V作為后起之秀發(fā)展迅速,英特爾在2021年提出20億美元收購(gòu)專注于高性能計(jì)算的RISC-V初創(chuàng)公司SiFIVE。RISC-V是開源指令集,開放程度比ARM更好,支持指令集擴(kuò)展。RISC-V開放的定位是***實(shí)現(xiàn)全產(chǎn)業(yè)鏈自主可控的重要基礎(chǔ),截至2022年末,我國(guó)大約有50款不同型號(hào)的國(guó)產(chǎn)RISC-V芯片量產(chǎn),應(yīng)用場(chǎng)景集中在MCU、電源管理、無(wú)線連接、存儲(chǔ)控制、物聯(lián)網(wǎng)等中低端場(chǎng)景。而目前已有多家創(chuàng)新企業(yè)計(jì)劃在2023年發(fā)布對(duì)標(biāo)64核高性能的服務(wù)器級(jí)處理器,應(yīng)用領(lǐng)域也有望從專業(yè)應(yīng)用場(chǎng)景逐步拓展到通用計(jì)算場(chǎng)景。 在信創(chuàng)市場(chǎng)驅(qū)動(dòng)下,國(guó)產(chǎn)CPU各個(gè)技術(shù)賽道全方面布局,不同于以往的國(guó)產(chǎn)化替代,信創(chuàng)更強(qiáng)調(diào)生態(tài)構(gòu)建。從IT基礎(chǔ)設(shè)施到應(yīng)用軟件,再到IT安全,2022年信創(chuàng)產(chǎn)業(yè)規(guī)模達(dá)到9220.2億元,近五年復(fù)合增長(zhǎng)率35.7%,預(yù)計(jì)2025年突破2萬(wàn)億,國(guó)產(chǎn)CPU在信創(chuàng)領(lǐng)域存在巨大的市場(chǎng)發(fā)展機(jī)會(huì)。同時(shí),中國(guó)CPU另外一個(gè)特點(diǎn)就是各個(gè)技術(shù)賽道全方面布局,中國(guó)全自主架構(gòu)唯一代表有龍芯LoongArch架構(gòu),X86架構(gòu)有海光、兆芯,ARM架構(gòu)有飛騰、海思,RISC-V架構(gòu)有阿里等。
2、GPU/GPGPU
傳統(tǒng)CPU為核心的計(jì)算架構(gòu)中所有數(shù)據(jù)和指令都由CPU來(lái)處理。然而CPU的架構(gòu)不適合處理高并行度數(shù)據(jù)計(jì)算業(yè)務(wù),更適合進(jìn)行邏輯運(yùn)算和整個(gè)計(jì)算機(jī)的管理。隨著業(yè)務(wù)越來(lái)越復(fù)雜,數(shù)據(jù)流量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),全部業(yè)務(wù)和數(shù)據(jù)靠CPU處理,性價(jià)比極低。因此出現(xiàn)了各種協(xié)處理器XPU,專門幫助CPU處理各種特定應(yīng)用場(chǎng)景業(yè)務(wù)。最早出現(xiàn)的就是計(jì)算機(jī)3D圖形渲染專用加速芯片,特點(diǎn)是大量的并行小核,需要在CPU調(diào)度下工作。1999年英偉達(dá)發(fā)布第一款GPU產(chǎn)品NV10,在市場(chǎng)上第一次推出GPU概念。隨后英偉達(dá)把GPU應(yīng)用推廣到GPGPU和CUDA編程框架推廣,GPU成為并行計(jì)算的主力算力引擎。2012年的ImageNet比賽,取得突破的AlexNet的發(fā)明人亞歷克斯使用了英偉達(dá)的GPU,證明了GPU非常適合用于多并行計(jì)算的神經(jīng)網(wǎng)絡(luò),從此GPU成為深度學(xué)習(xí)標(biāo)配,引爆市場(chǎng)。
市場(chǎng)空間
目前中國(guó)深度學(xué)習(xí)加速服務(wù)器90%還是采用GPU/GPGPU,根據(jù)中金證券測(cè)算,2021年中國(guó)2022年中國(guó)服務(wù)器應(yīng)用GPU/GPGPU市場(chǎng)規(guī)模達(dá)到32億美元,預(yù)計(jì)2024年市場(chǎng)規(guī)模達(dá)到54億美元。
發(fā)展趨勢(shì)
GPT應(yīng)用激發(fā)算力需求,國(guó)產(chǎn)GPU加速補(bǔ)位,仍面臨巨大算力缺口。GPU采用最先進(jìn)的邏輯工藝,不考慮巨大的生態(tài)建設(shè)費(fèi)用,單芯片研發(fā)成本10億人民幣起步,過去鮮有資本和創(chuàng)業(yè)團(tuán)隊(duì)涉足。然而,英偉達(dá)、AMD高端GPGPU產(chǎn)品受美國(guó)政府禁令的影響已經(jīng)預(yù)示了國(guó)產(chǎn)GPGPU供應(yīng)鏈安全問題的嚴(yán)重性,中國(guó)政府及資本市場(chǎng)也對(duì)于國(guó)內(nèi)GPU企業(yè)予以高度重視,國(guó)產(chǎn)GPU廠商存在替代補(bǔ)位的機(jī)會(huì),GPU初創(chuàng)公司不斷涌現(xiàn),融資金額屢創(chuàng)新高,估值動(dòng)輒超百億。英偉達(dá)、AMD高管為主的創(chuàng)業(yè)團(tuán)隊(duì),超一線VC機(jī)構(gòu)重金支持,成為國(guó)產(chǎn)GPU初創(chuàng)公司范式。 另一方面,今年爆火的ChatGPT和GPT-4等新一代AI應(yīng)用的商用化,對(duì)芯片算力的技術(shù)要求將大幅提高,并有望創(chuàng)造出可觀AI芯片增量市場(chǎng)空間。
3、FPGA
FPGA是基于通用邏輯電路陣列的集成電路芯片,和ASIC芯片不同,其最大的特點(diǎn)是芯片的具體功能在制造完成以后由用戶配置決定。用戶可通過配套的FPGA專用EDA軟件實(shí)現(xiàn)具體功能,首先由專用EDA軟件接受用硬件語(yǔ)言描述的用戶電路,其次編譯生成二進(jìn)制位流數(shù)據(jù),最后將位流下載到芯片中實(shí)現(xiàn)用戶所需特定功能的集成電路芯片。每顆FPGA芯片均可以進(jìn)行多次不同功能配置,從而實(shí)現(xiàn)不同的功能。 服務(wù)器和存儲(chǔ)器作為數(shù)據(jù)中心的通用基礎(chǔ)設(shè)備,為了應(yīng)對(duì)復(fù)雜多變的應(yīng)用情景,需要FPGA芯片實(shí)現(xiàn)邏輯控制、數(shù)據(jù)轉(zhuǎn)換、功能擴(kuò)展、系統(tǒng)升級(jí)等功能。在數(shù)據(jù)中心運(yùn)算處理領(lǐng)域,相比CPU,F(xiàn)PGA芯片由于其無(wú)指令、無(wú)需共享內(nèi)存的體系結(jié)構(gòu),能夠同時(shí)提供強(qiáng)大的計(jì)算能力和足夠的靈活性;相比GPU,F(xiàn)PGA芯片在數(shù)據(jù)中心具有低延遲及高吞吐的優(yōu)勢(shì);相比ASIC,F(xiàn)PGA芯片在性能、靈活性、同構(gòu)性、成本和功耗等五個(gè)方面達(dá)到出色平衡。
市場(chǎng)空間
FPGA芯片具有靈活性高、應(yīng)用開發(fā)成本低、上市時(shí)間短等優(yōu)勢(shì)。數(shù)據(jù)中心是FPGA芯片的新興應(yīng)用市場(chǎng)之一,根據(jù)Frost&sullivan數(shù)據(jù),2020年應(yīng)用于該領(lǐng)域的FPGA芯片中國(guó)銷售額將達(dá)到16.1億元,占中國(guó)FPGA芯片市場(chǎng)份額的10.7%,預(yù)計(jì)2024年將達(dá)到30億元,2021年至2024年年均復(fù)合增長(zhǎng)率將達(dá)到16.6%。
發(fā)展趨勢(shì)
FPGA芯片在數(shù)據(jù)中心領(lǐng)域主要用于硬件加速,數(shù)據(jù)中心使用FPGA芯片代替?zhèn)鹘y(tǒng)的CPU方案后,處理其自定義算法時(shí)可實(shí)現(xiàn)顯著的加速效果。因此從2016年開始,微軟Azure、亞馬遜AWS、阿里云的服務(wù)器上都開始部署FPGA加速器用于運(yùn)算加速。在云計(jì)算大面積應(yīng)用的背景下,未來(lái)數(shù)據(jù)中心對(duì)芯片性能的要求將進(jìn)一步提升,更多數(shù)據(jù)中心將采納FPGA芯片方案,這將進(jìn)一步提高FPGA芯片在數(shù)據(jù)中心芯片中的價(jià)值占比。 FPGA芯片向高集成化的現(xiàn)場(chǎng)可編程系統(tǒng)級(jí)芯片發(fā)展。英特爾2015年收購(gòu)Altera阿爾特拉,AMD 2022年完成收購(gòu)Xilinx賽靈思,CPU和FPGA融合成為趨勢(shì)。國(guó)際主流FPGA芯片公司逐漸形成了在FPGA芯片中加入處理器的技術(shù)路線,并產(chǎn)生了可編程系統(tǒng)級(jí)芯片這一新產(chǎn)物。和傳統(tǒng)FPGA芯片不同,現(xiàn)場(chǎng)可編程系統(tǒng)級(jí)芯片的特點(diǎn)是單芯片高度集成電子信息設(shè)備所需的CPU、FPGA、存儲(chǔ)接口、I/O外設(shè)接口甚至人工智能專用引擎等所有模塊,單顆芯片可完成應(yīng)用情景的所有功能需求。
4、AI加速芯片
深度學(xué)習(xí)涉及少量標(biāo)量計(jì)算、大量的矢量計(jì)算和張量計(jì)算。GPU是標(biāo)量計(jì)算核,在處理深度學(xué)習(xí)數(shù)據(jù)時(shí),需要消耗大量資源把矢量和張量計(jì)算轉(zhuǎn)變?yōu)闃?biāo)量計(jì)算,因此GPU實(shí)際算力利用率最高只能達(dá)到40%。固定算法的ASIC芯片利用率最高,但是不適合業(yè)務(wù)復(fù)雜、算法在一直更新的云計(jì)算應(yīng)用,而更適合邊緣端應(yīng)用。因此專門針對(duì)深度學(xué)習(xí)應(yīng)用,結(jié)合標(biāo)量計(jì)算、矢量計(jì)算和張量計(jì)算的DSA(Domain SpecificArchitectures,特定領(lǐng)域?qū)S眉軜?gòu))架構(gòu)應(yīng)運(yùn)而生,針對(duì)AI推理應(yīng)用,實(shí)際算力利用率可超過90%,并且其芯片提供最基本的深度學(xué)習(xí)算子,保證芯片在深度學(xué)習(xí)應(yīng)用的通用性和擴(kuò)展性,從而實(shí)現(xiàn)數(shù)據(jù)中心降本增效。2019年英特爾20億美元收購(gòu)了以色列初創(chuàng)公司Habana Lab,證明了DSA架構(gòu)在商業(yè)和技術(shù)上的成功。國(guó)內(nèi)希姆計(jì)算、瀚博、燧原等初創(chuàng)公司都采用DSA架構(gòu)技術(shù)路線,并開始商業(yè)落地。
市場(chǎng)空間
根據(jù)中金證券測(cè)算,2021年中國(guó)云計(jì)算應(yīng)用AI加速芯片市場(chǎng)規(guī)模約5億美元,預(yù)計(jì)2024年市場(chǎng)規(guī)模將達(dá)到14億美元,三年年均復(fù)合增長(zhǎng)率達(dá)到47%。
發(fā)展趨勢(shì)
面向場(chǎng)景專用的云端AI芯片進(jìn)一步加速滲透?;ヂ?lián)網(wǎng)公司成為AI加速芯片主力?;ヂ?lián)網(wǎng)公司直接面向終端提供服務(wù),既擁有豐富的業(yè)務(wù)場(chǎng)景,又具備技術(shù)和資金實(shí)力,于是開始繞過英特爾、英偉達(dá)等傳統(tǒng)芯片供應(yīng)商下場(chǎng)自研芯片或者投資芯片初創(chuàng)公司,滿足自身需求。比如谷歌TPU,百度昆侖芯片,亞馬遜,字節(jié)跳動(dòng)等,都在結(jié)合自身應(yīng)用場(chǎng)景自研AI加速芯片。 場(chǎng)景專用的云端AI推理加速芯片,有望依靠性價(jià)比取勝?;ヂ?lián)網(wǎng)公司推理應(yīng)用場(chǎng)景主要是內(nèi)容推薦和內(nèi)容審核,內(nèi)容和用戶都已經(jīng)完成向量化,對(duì)芯片實(shí)時(shí)性要求高,對(duì)芯片生態(tài)和通用性要求低。并且推理芯片的需求量和增速遠(yuǎn)高于訓(xùn)練芯片,根據(jù)Facebook給出的預(yù)測(cè),今后推理芯片和訓(xùn)練芯片的需求量是9:1。專門針對(duì)AI云端推理計(jì)算的AI推理加速芯片,實(shí)際任務(wù)負(fù)載達(dá)到90%以上,實(shí)現(xiàn)相同工藝節(jié)點(diǎn)GPU的2倍以上性價(jià)比。
5、DPU
數(shù)據(jù)中心規(guī)模越來(lái)越大,任務(wù)越來(lái)越復(fù)雜,根據(jù)亞馬遜統(tǒng)計(jì)僅處理網(wǎng)絡(luò)通信就需消耗CPU 30%的算力,亞馬遜稱之為“datacenter tax(數(shù)據(jù)中心稅)”。DPU是以數(shù)據(jù)為中心構(gòu)造的專用處理器,支持?jǐn)?shù)據(jù)中心底層存儲(chǔ)、安全、服務(wù)質(zhì)量管理等基礎(chǔ)設(shè)施層服務(wù)。DPU要解決的核心問題是基礎(chǔ)設(shè)施的“降本增效”,即將“CPU處理效率低下、GPU處理不了”的負(fù)載卸載到專用DPU,提升整個(gè)計(jì)算系統(tǒng)的效率、降低整體系統(tǒng)的總體擁有成本(TCO)。
市場(chǎng)空間
根據(jù)頭豹研究院測(cè)算,2022年中國(guó)DPU市場(chǎng)規(guī)模約11億美元,預(yù)計(jì)到2025年市場(chǎng)規(guī)模將達(dá)到37億美元。
發(fā)展趨勢(shì)
存在廣闊的應(yīng)用前景和巨大的市場(chǎng)空間。DPU存在廣闊的應(yīng)用前景和巨大的市場(chǎng)空間。國(guó)際巨頭近年來(lái)也先后布局DPU產(chǎn)品,英偉達(dá)于2021年發(fā)布新一代DPU BlueField 3,英特爾發(fā)布基礎(chǔ)設(shè)施處理器IPU,AMD收購(gòu)DPU廠商Pensando。同時(shí),DPU作為專門負(fù)責(zé)數(shù)據(jù)中心底層網(wǎng)絡(luò)通信的算力芯片,是一個(gè)新興賽道,國(guó)內(nèi)外發(fā)展差距小,競(jìng)爭(zhēng)格局還較為分散,沒有像CPU和GPU那樣的明確巨頭。因此,各大國(guó)內(nèi)芯片廠商正在積極通過中國(guó)在云計(jì)算領(lǐng)域積累的市場(chǎng)規(guī)模、增速、特別是用戶數(shù)量的優(yōu)勢(shì)來(lái)推動(dòng)國(guó)內(nèi)DPU的開放生態(tài)建設(shè)。 DPU作為新興賽道,最大的挑戰(zhàn)是行業(yè)標(biāo)準(zhǔn)化。由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠商一方面采用現(xiàn)成商業(yè)軟件來(lái)構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化(IaaS、PaaS、SaaS),打造面向不用類型客戶的標(biāo)準(zhǔn)化產(chǎn)品。除此之外的所有技術(shù)實(shí)現(xiàn)幾乎都是“八仙過海,各顯神通”,例如各大公有云廠商、電信運(yùn)營(yíng)商等都有比較完整,同時(shí)比較封閉的底層架構(gòu)和應(yīng)用生態(tài)。上層負(fù)載不同,必然對(duì)底層架構(gòu)有各異的需求,這也許是目前DPU標(biāo)準(zhǔn)化面臨的最大的挑戰(zhàn)。
-
FPGA
+關(guān)注
關(guān)注
1625文章
21620瀏覽量
601239 -
gpu
+關(guān)注
關(guān)注
28文章
4673瀏覽量
128593 -
網(wǎng)絡(luò)通信
+關(guān)注
關(guān)注
4文章
781瀏覽量
29744
原文標(biāo)題:中國(guó)云生態(tài):基礎(chǔ)硬件及芯片(2023)
文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論