電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)根據(jù)應(yīng)用場(chǎng)景的不同,AI芯片被分為云端AI芯片和邊緣AI芯片。云端AI芯片有些用于訓(xùn)練,有些用于推理。過(guò)去幾年AI芯片的市場(chǎng)需求不斷增加,2017年整體AI芯片市場(chǎng)規(guī)模為62.7億美元,預(yù)計(jì)到2022年將會(huì)達(dá)到596.2億美元。
而云端AI芯片的市場(chǎng)需求也是增長(zhǎng)明顯,根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)數(shù)據(jù),2017年云端訓(xùn)練AI芯片市場(chǎng)規(guī)模為20.2億美元,云端推理芯片為3.4億美元。預(yù)計(jì)到2022年,云端訓(xùn)練AI芯片將達(dá)到172.1億美元,云端推理芯片為71.9億美元。
如今在全球云端AI芯片市場(chǎng)領(lǐng)域,可以說(shuō)是英偉達(dá)一家獨(dú)大,在云端訓(xùn)練市場(chǎng)占比達(dá)到90%,在云端推理市場(chǎng)占比也高達(dá)60%。另外,國(guó)外的英特爾、AMD等廠商也在積極布局。
在國(guó)內(nèi),也有大批企業(yè)尋求在云端AI芯片方面不斷突破,包括寒武紀(jì)、昆侖芯、燧原科技、天數(shù)智芯,以及瀚博半導(dǎo)體、沐曦集成、壁仞科技、摩爾線程、登臨科技等。這里對(duì)這些企業(yè)及產(chǎn)品進(jìn)展做了梳理,如下:
寒武紀(jì)
寒武紀(jì)成立于2016年,專(zhuān)注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,致力于打造人工智能領(lǐng)域的核心處理器芯片。產(chǎn)品廣泛應(yīng)用于服務(wù)器廠商和產(chǎn)業(yè)公司,面向互聯(lián)網(wǎng)、金融、交通、能源、電力和制造等領(lǐng)域的復(fù)雜AI應(yīng)用場(chǎng)景提供充裕算力,推動(dòng)人工智能賦能產(chǎn)業(yè)升級(jí)。
寒武紀(jì)云端智能芯片產(chǎn)品,大致可以分為云端訓(xùn)練芯片和云端推理芯片,包括云端推理芯片思元270,主要面向云端訓(xùn)練的高端產(chǎn)品思元290,以及主要面向中高端訓(xùn)推場(chǎng)景的思元370。
思元290是寒武紀(jì)首顆AI訓(xùn)練芯片,采用創(chuàng)新性的MLUv02擴(kuò)展架構(gòu),使用臺(tái)積電7nm先進(jìn)制程工藝制造,在一顆芯片上集成了高達(dá)460億的晶體管。
思元370基于7nm制程工藝,是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個(gè)晶體管,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,思元370實(shí)測(cè)性能表現(xiàn)更為優(yōu)秀。
思元370是國(guó)內(nèi)第一款公開(kāi)發(fā)布支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達(dá)GDDR6的1.5倍。搭載MLU-Link多芯互聯(lián)技術(shù),在分布式訓(xùn)練或推理任務(wù)中為多顆思元370芯片提供高效協(xié)同能力。全新升級(jí)的Cambricon NeuWare軟件棧,新增推理加速引擎MagicMind,實(shí)現(xiàn)訓(xùn)推一體,大幅提升了開(kāi)發(fā)部署的效率,降低用戶(hù)的學(xué)習(xí)成本、開(kāi)發(fā)成本和運(yùn)營(yíng)成本。
思元370通過(guò)不同MLU-Die組合出了三款不同規(guī)格、符合不同場(chǎng)景需求的加速卡產(chǎn)品MLU370-S4、MLU370-X4、MLU370-X8。
2021年,寒武紀(jì)與阿里巴巴等頭部互聯(lián)網(wǎng)企業(yè)的多個(gè)業(yè)務(wù)部門(mén)進(jìn)行了深入合作,云端產(chǎn)品思元370芯片及加速卡在視覺(jué)、語(yǔ)音、圖文識(shí)別等場(chǎng)景的適配性能表現(xiàn)超出客戶(hù)預(yù)期,部分場(chǎng)景已經(jīng)進(jìn)入小批量銷(xiāo)售環(huán)節(jié)。在金融領(lǐng)域,寒武紀(jì)與多家頭部銀行進(jìn)行了導(dǎo)入和適配。其中,MLU370-X4在招商銀行多個(gè)業(yè)務(wù)場(chǎng)景的實(shí)測(cè)性能超過(guò)競(jìng)品,能夠大幅提升客戶(hù)的效率。
昆侖芯
昆侖芯于2021年4月完成了獨(dú)立融資,前身是百度智能芯片及架構(gòu)部,在實(shí)際業(yè)務(wù)場(chǎng)景中深耕AI加速領(lǐng)域已十余年,是一家在體系結(jié)構(gòu)、芯片實(shí)現(xiàn)、軟件系統(tǒng)和場(chǎng)景應(yīng)用均有深厚積累的AI芯片企業(yè)。
昆侖芯1代芯片于2020年量產(chǎn),昆侖芯2代于2021年8月18日宣布正式量產(chǎn)。2022年09月百度集團(tuán)執(zhí)行副總裁沈抖透露,昆侖芯3代將于2024年初量產(chǎn)。
昆侖芯1代芯片采用14nm工藝,256 TOPS@INT8算力,可用于云數(shù)據(jù)中心和智能邊緣,支持全AI算法,落地超過(guò)兩萬(wàn)片;昆侖芯2代芯片,搭載自研的第二代XPU架構(gòu),采用7nm制程,GDDR6高性能顯存,算力256 TOPS@INT8,128 TFLOPS@FP16,相比一代性能提升2-3倍,適用于云、端、邊等多場(chǎng)景,支持硬件虛擬化,芯片間互聯(lián)和視頻編解碼。
昆侖芯 AI 芯片除了擁有自研 XPU 架構(gòu)及多項(xiàng)自主設(shè)計(jì),也已與飛騰等多款國(guó)產(chǎn)通用處理器、麒麟等多款國(guó)產(chǎn)操作系統(tǒng)以及百度自研的飛槳深度學(xué)習(xí)框架完成了端到端的適配,擁有軟硬一體的全棧國(guó)產(chǎn)AI能力。
目前,昆侖芯科技已與智能產(chǎn)業(yè)的上下游企業(yè)建立了良好的合作生態(tài),通過(guò)向不同行業(yè)提供以人工智能芯片為基礎(chǔ)的算力產(chǎn)品,輻射互聯(lián)網(wǎng)、智慧城市、智算中心、智慧工業(yè)、智慧應(yīng)急、智慧交通、智慧金融等“智慧+”產(chǎn)業(yè),以計(jì)算驅(qū)動(dòng)智能,以智能促進(jìn)發(fā)展。
燧原科技
燧原科技成立于2018年3月,專(zhuān)注人工智能領(lǐng)域云端算力產(chǎn)品,致力為人工智能產(chǎn)業(yè)發(fā)展交付普惠的基礎(chǔ)設(shè)施解決方案,提供原始創(chuàng)新、全棧自研、具備完全自主知識(shí)產(chǎn)權(quán)的通用人工智能訓(xùn)練和推理產(chǎn)品。憑借其高算力、 高能效比以及靈活編程能力,可廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、交通、能源及新基建等多個(gè)行業(yè)和場(chǎng)景。
截至目前,燧原科技已經(jīng)開(kāi)發(fā)了兩個(gè)產(chǎn)品線,一個(gè)是云端的訓(xùn)練,包括邃思1.0和邃思2.0,一個(gè)是推理芯片,邃思2.5。
邃思1.0基于可編程芯片的設(shè)計(jì)理念,其計(jì)算核心包含32個(gè)通用可擴(kuò)展神經(jīng)元處理器(SIP),每8個(gè)SIP組合成1個(gè)可擴(kuò)展智能計(jì)算群(SIC)。SIC之間通過(guò)HBM實(shí)現(xiàn)高速互聯(lián),通過(guò)片上調(diào)度算法,數(shù)據(jù)在搬遷中完成計(jì)算,實(shí)現(xiàn)SIP利用率最大化。邃思支持CNN、RNN、LSTM、BERT等網(wǎng)絡(luò)模型和豐富的數(shù)據(jù)類(lèi)型(FP32 / FP16 / BF16 / Int8 / Int16 / Int32等)。
邃思2.0基于GCU-CARA 2.0架構(gòu),以TF32為核心提供多數(shù)據(jù)精度AI算力支持,針對(duì)張量、矢量、標(biāo)量等多計(jì)算范式提供領(lǐng)先性能,支持指令驅(qū)動(dòng)、可編程的融合式數(shù)據(jù)流架構(gòu),提供軟件透明、基于任務(wù)的智能調(diào)度;基于12nm FinFET先進(jìn)工藝,單芯片包含225億個(gè)晶體管,有效提升算力密度;廣泛支持視覺(jué)、語(yǔ)音語(yǔ)義、強(qiáng)化學(xué)習(xí)等各技術(shù)方向的模型訓(xùn)練。
燧原科技創(chuàng)始人趙立東前不久表示,公司去年與浪潮科技,聯(lián)合發(fā)布了錢(qián)塘江智算中心的解決方案,打造了一個(gè)液冷的160臺(tái)服務(wù)器的算力集群,集成了180張燧原科技第一代的訓(xùn)練卡,現(xiàn)在已部署在之江實(shí)驗(yàn)室上線運(yùn)行。
天數(shù)智芯
天數(shù)智芯2018年正式啟動(dòng)通用并行云端計(jì)算芯片設(shè)計(jì),公司致力于開(kāi)發(fā)云端服務(wù)器級(jí)的通用高性能計(jì)算芯片,以客戶(hù)、市場(chǎng)為導(dǎo)向,瞄準(zhǔn)以云計(jì)算、人工智能、數(shù)字化轉(zhuǎn)型為代表的數(shù)據(jù)驅(qū)動(dòng)技術(shù)市場(chǎng),解決核心算力瓶頸問(wèn)題,為全產(chǎn)業(yè)打造高端算力解決方案。
2021年3月,天數(shù)智芯正式發(fā)布通用GPU“天垓100”芯片及天垓100加速卡。天垓100芯片基于7nm工藝,采用全自研的架構(gòu)、計(jì)算核、指令集及基礎(chǔ)軟件棧,2.5D CoWoS晶圓封裝技術(shù),包括240億個(gè)晶體管。
天數(shù)智芯堅(jiān)持自研通用GPU體系思路,天垓100適配x86、ARM、MIPS等架構(gòu)CPU指令集,業(yè)界標(biāo)準(zhǔn)的軟件API(應(yīng)用程序編程接口)支持垂直類(lèi)行業(yè)應(yīng)用開(kāi)發(fā),支持TensorFlow、PyTorch等各種主流深度學(xué)習(xí)開(kāi)發(fā)框架,以及軟硬件全棧支持等,廣泛應(yīng)用于互聯(lián)網(wǎng)、運(yùn)營(yíng)商、生物醫(yī)療、教育科研、智算中心等不同行業(yè)眾多應(yīng)用場(chǎng)景。
2022年4月,天數(shù)智芯宣布,目前天垓100產(chǎn)品累計(jì)訂單金額已經(jīng)接近2億元,覆蓋新華三等多個(gè)頭部企業(yè)。而且,天垓100已支撐近百個(gè)客戶(hù)在人工智能領(lǐng)域進(jìn)行超過(guò)兩百個(gè)不同種類(lèi)模型訓(xùn)練。另外天數(shù)智芯首款7nm通用GPU推理產(chǎn)品智鎧100也在今年5月份成功點(diǎn)亮。
瀚博半導(dǎo)體
瀚博半導(dǎo)體成立于2018年,專(zhuān)注于研發(fā)高性能通用加速芯片,為計(jì)算機(jī)視覺(jué)、智能視頻處理、自然語(yǔ)言處理等應(yīng)用場(chǎng)景,提供低延時(shí)、高吞吐的異構(gòu)計(jì)算性能和高效的性能/功耗比,芯片解決方案覆蓋從云端到邊緣的服務(wù)器及一體機(jī)市場(chǎng)。
2021年7月7日,瀚博半導(dǎo)體發(fā)布首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。SV100系列,深度學(xué)習(xí)推理性能指標(biāo)數(shù)倍于現(xiàn)有主流數(shù)據(jù)中心GPU,超高吞吐量、超低延遲;針對(duì)各種深度學(xué)習(xí)推理負(fù)載而優(yōu)化的通用架構(gòu),支持計(jì)算機(jī)視覺(jué)、視頻處理、自然語(yǔ)言處理和搜索推薦等推理應(yīng)用場(chǎng)景;集成高密度視頻解碼,廣泛適用于云端與邊緣解決方案,單芯片INT8峰值算力超過(guò)200TOPS,節(jié)省設(shè)備投資、降低運(yùn)營(yíng)成本。
在2022年世界人工智能大會(huì)期間,瀚博半導(dǎo)體又發(fā)布了四款新品:瀚博統(tǒng)一計(jì)算架構(gòu)、全新數(shù)據(jù)中心AI推理卡載天VA10、邊緣AI推理加速卡載天VE1、以及瀚博軟件平臺(tái)VastStream擴(kuò)展版。此外,瀚博還預(yù)覽展示國(guó)產(chǎn)7nm云端GPU芯片SG100,用于圖像渲染、視頻、元宇宙等領(lǐng)域,不過(guò)這款產(chǎn)品目前還未發(fā)布。
沐曦集成
沐曦集成成立于2022年9月,公司致力于為異構(gòu)計(jì)算提供安全可靠的高性能GPU芯片及解決方案,可廣泛應(yīng)用于人工智能、智慧城市、數(shù)據(jù)中心、云計(jì)算、自動(dòng)駕駛、科學(xué)計(jì)算、數(shù)字孿生、元宇宙等前沿領(lǐng)域,為數(shù)字經(jīng)濟(jì)發(fā)展提供強(qiáng)大的算力支撐。
2022年1月,沐曦首款采用7nm工藝的異構(gòu)GPU產(chǎn)品已正式流片,預(yù)計(jì)很快量產(chǎn)。該產(chǎn)品主要用于AI推理場(chǎng)景,可在人工智能、自動(dòng)駕駛、工業(yè)和制造自動(dòng)化、智慧城市、自然語(yǔ)言處理、邊緣計(jì)算等領(lǐng)域應(yīng)用。
沐曦第二款用于科學(xué)計(jì)算、數(shù)據(jù)中心彈性計(jì)算、AI訓(xùn)練等的旗艦GPU芯片也已進(jìn)入研發(fā)收尾階段,計(jì)劃于2024年全面量產(chǎn)。此外,到2025年,沐曦將推出融合了圖形渲染的完整GPU產(chǎn)品,也就是顯示和游戲用途的GPU。
沐曦產(chǎn)品均采用完全自主研發(fā)的高性能GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MACAMACA),具備高性能、高效能和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻?hù)構(gòu)建軟硬件一體的全面生態(tài)解決方案。
壁仞科技
壁仞科技創(chuàng)立于2019年,致力于開(kāi)發(fā)原創(chuàng)性的通用計(jì)算體系,建立高效的軟硬件平臺(tái),同時(shí)在智能計(jì)算領(lǐng)域提供一體化的解決方案。從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計(jì)算,逐步在人工智能訓(xùn)練和推理、圖形渲染等多個(gè)領(lǐng)域趕超現(xiàn)有解決方案。
壁仞科技BR100系列通用GPU芯片,針對(duì)人工智能訓(xùn)練、推理,及科學(xué)計(jì)算等更廣泛的通用計(jì)算場(chǎng)景開(kāi)發(fā),主要部署在大型數(shù)據(jù)中心,依托“壁立仞”原創(chuàng)架構(gòu),可提供高能效、高通用性的加速計(jì)算算力。目前,BR100系列擁有BR100、BR104兩款芯片。
BR100系列采用7nm制程,并創(chuàng)新性應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),兼顧高良率與高性能;支持PCIe 5.0接口技術(shù)與CXL通信協(xié)議,雙向帶寬最高達(dá)128 GB/s;原創(chuàng)BLink高速GPU互連技術(shù),單卡互連帶寬最高達(dá)448 GB/s,并支持單節(jié)點(diǎn)8卡全互連;除原生支持FP32、BF16、FP16、INT8等主流數(shù)據(jù)精度外,原創(chuàng)定義TF32+數(shù)據(jù)精度,相較TF32提供更高數(shù)據(jù)精度與吞吐性能。
摩爾線程
摩爾線程成立于2020年10月,專(zhuān)注于研發(fā)設(shè)計(jì)全功能GPU芯片及相關(guān)產(chǎn)品,支持3D高速圖形渲染、AI訓(xùn)練推理加速、超高清視頻編解碼和高性能科學(xué)計(jì)算等多種組合工作負(fù)載,兼顧算力與算效,能夠?yàn)橹袊?guó)科技生態(tài)合作伙伴提供強(qiáng)大的計(jì)算加速能力。
2022年3月30日,摩爾線程正式推出首款基于其先進(jìn)架構(gòu)MUSA統(tǒng)一系統(tǒng)架構(gòu)(Moore Threads Unified System Architecture)打造的數(shù)據(jù)中心級(jí)多功能GPU產(chǎn)品MTT S2000,內(nèi)置渲染、音視頻編解碼、人工智能加速和并行計(jì)算等硬件模塊,能夠提供圖形圖像渲染、視頻云處理、AI和科學(xué)計(jì)算在內(nèi)的全棧功能。
憑借其獨(dú)特的渲染、虛擬化等能力和廣泛的生態(tài)支持,MTT S2000可以在云桌面、安卓云游戲、視頻云、云渲染和AI推理計(jì)算加速等應(yīng)用場(chǎng)景全面助力綠色數(shù)字經(jīng)濟(jì)發(fā)展。
摩爾線程MTT S2000兼容X86、ARM等CPU架構(gòu)以及主流Linux操作系統(tǒng)發(fā)行版,并已著手與多家服務(wù)器合作伙伴開(kāi)展合作,包括浪潮、新華三、聯(lián)想、清華同方、長(zhǎng)城超云、思騰合力等OEM廠商多款通用服務(wù)器及GPU服務(wù)器型號(hào),可以在眾多硬件和應(yīng)用環(huán)境中完成部署。
得益于豐富的模型庫(kù)支持和先進(jìn)硬件設(shè)計(jì),MTT S2000能夠滿(mǎn)足計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等多種智能應(yīng)用場(chǎng)景的模型訓(xùn)練和推理應(yīng)用,并對(duì)包括DBNet、CRNN、FastRCNN、Yolo V2/V3/V5、PSENet、Mask RCNN、Resnet 50/101、Inception、Vgg、Alexnet、Densenet、Unet等在內(nèi)的眾多主流深度學(xué)習(xí)算法提供支持。
同時(shí),MTT S2000也支持用戶(hù)使用PyTorch、TensorFlow、PaddlePaddle等深度學(xué)習(xí)框架進(jìn)行算法開(kāi)發(fā)及應(yīng)用搭建。此外,用戶(hù)也可通過(guò)應(yīng)用更廣泛的OpenCL及CUDA環(huán)境進(jìn)行開(kāi)發(fā),大幅降低了新硬件的學(xué)習(xí)及應(yīng)用門(mén)檻,提升開(kāi)發(fā)速度。
登臨科技
登臨科技成立于2017年,專(zhuān)注于高性能通用計(jì)算平臺(tái)的芯片研發(fā)與技術(shù)創(chuàng)新,致力于打造云邊端一體、軟硬件協(xié)同、訓(xùn)練推理融合的前沿芯片產(chǎn)品和平臺(tái)化基礎(chǔ)系統(tǒng)軟件。
公司自主創(chuàng)新的GPU+,在兼容CUDA/OpenCL在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過(guò)架構(gòu)創(chuàng)新,完美解決了通用性和高效率的雙重難題。大量客戶(hù)產(chǎn)品實(shí)測(cè)證明,針對(duì)AI計(jì)算,GPU+相比傳統(tǒng)GPU在性能尤其是能效上有顯著提升。
2022年9月,登臨科技創(chuàng)始人李建文在某會(huì)議上表示,登臨科技首款系列產(chǎn)品基于GPU+的創(chuàng)新AI加速器Goldwasser已在智慧城市、交通、金融、能源、電力、教育、無(wú)人駕駛、互聯(lián)網(wǎng)等眾多行業(yè)實(shí)現(xiàn)商業(yè)化落地,目標(biāo)年內(nèi)客戶(hù)訂單達(dá)數(shù)萬(wàn)片,并且已實(shí)現(xiàn)批量量產(chǎn)交付。登臨第二代產(chǎn)品將于明年上半年進(jìn)入市場(chǎng),其能效比將是第一代產(chǎn)品的2倍。
另外,登臨科技還發(fā)布了完整的翰銘(Hamming)軟件工具鏈,該工具鏈支持國(guó)內(nèi)外主流AI框架、操作系統(tǒng)、CPU、容器與虛擬機(jī)、以及推理服務(wù)器,可幫助客戶(hù)盡快把算法部署到實(shí)際業(yè)務(wù)上,并幫助云端與數(shù)據(jù)中心的客戶(hù)更好地利用硬件資源。
小結(jié)
總結(jié)來(lái)看,寒武紀(jì)、昆侖芯的云端AI芯片已經(jīng)有一定量出貨,燧原科技的產(chǎn)品也已經(jīng)智算中心中部署運(yùn)行,天數(shù)智芯表示其天垓100產(chǎn)品累計(jì)已拿下接近2億元的訂單金額,登臨科技的產(chǎn)品也已經(jīng)實(shí)現(xiàn)批量交付。其他各家的產(chǎn)品在研發(fā)和推進(jìn)應(yīng)用方面,都有不同程度的進(jìn)展。整體而言,各家廠商都在積極尋求創(chuàng)新,尋求突破。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11073瀏覽量
102613 -
人工智慧
+關(guān)注
關(guān)注
0文章
12瀏覽量
2049 -
AI芯片
+關(guān)注
關(guān)注
17文章
1850瀏覽量
34849
原文標(biāo)題:?云端AI芯片市場(chǎng)需求不斷增長(zhǎng),國(guó)內(nèi)廠商進(jìn)展如何?
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論