3月30日,“壁仞科技完成B輪融資,成立一年多累計融資超過47億”的新聞刷爆了半導體圈。
2019年9月成立的壁仞科技在其官網上聲稱,從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計算,逐步在人工智能訓練和推理、圖形渲染、高性能通用計算等多個領域趕超現(xiàn)有解決方案,實現(xiàn)國產高端通用智能計算芯片的突破。據稱該公司創(chuàng)始團隊由國內外芯片和云計算領域核心專業(yè)人員、研發(fā)人員組成,在GPU、DSA(專用加速器)和計算機體系結構等領域具有深厚的技術積累和獨到的行業(yè)洞見。
2020年6月成立的摩爾線程獲得數(shù)十億元融資,該公司致力于構建中國視覺計算及人工智能領域計算平臺,研發(fā)全球領先的自主創(chuàng)新GPU知識產權,以及助力建立中國本土的高性能計算生態(tài)系統(tǒng),其GPU產品線覆蓋通用圖形計算和高性能計算。據稱其創(chuàng)始團隊核心成員主要來自英偉達(NVIDIA)、微軟(Microsoft)、英特爾(Intel)、AMD和Arm等,主要成員都在GPU驅動、編譯、AI芯片、軟件算法以及系統(tǒng)設計等領域超過10年以上經驗。
2020年9月成立的沐曦集成電路完成數(shù)億元PreA+輪融資,據稱這家高性能通用GPU芯片設計公司的創(chuàng)始團隊主要來自AMD等國際公司,擁有從40nm到7nm制程GPU芯片的設計和量產經驗。
2019年11月成立的芯瞳半導體創(chuàng)始團隊來自西郵GPU研發(fā)團隊,這家專注于計算機圖形和高性能計算的芯片設計初創(chuàng)公司將在南京投資1.5億元,開發(fā)高性能、高可靠和高穩(wěn)定性的國產自主GPU和人工智能芯片。
于2018年12月在上海成立的瀚博半導體已經完成總計5000萬美元的A輪融資,其核心員工平均擁有15年以上的相關芯片和軟件設計經驗,目前有員工150多人。其產品注重計算機視覺及視頻處理的優(yōu)化,可提供豐富的特性和高效的性能/功耗,適用多個人工智能領域。
2017年11月成立的登臨科技最近完成A+輪融資,其首款GPU+(軟件定義的片內異構通用AI處理器)產品已成功回片通過測試。成立三年以來,登臨致力于完全自主研發(fā)的多場景AI 計算平臺,其Goldwasser GPU+產品在現(xiàn)有市場主流GPU 架構上,創(chuàng)新性地采用軟硬件協(xié)同的異構設計,相比傳統(tǒng)GPU在AI計算性能和能效上均有明顯提升。
成立于2015年12月的上海天數(shù)智芯最近完成12億元的C輪融資,其7納米通用(GPGPU)云端計算芯片BI于 2020 年 5 月流片、11 月回片并于12月成功 “點亮”。天數(shù)智芯將進一步加速面向5G需求的云端訓練及推理芯片的研發(fā),提供針對當前主流 GPGPU 生態(tài)產品選項,幫助人工智能在更多領域落地應用。
這些由來自英偉達或AMD等國際巨頭的資深華人專家創(chuàng)辦的國產GPU新貴們大都只有雄心壯志和發(fā)展宏圖,還沒有具體的產品和應用方案。在短時間內拿到這么大金額的VC投資,這是不是又一輪國產芯片的“泡沫”?
要準確回答和預測這一輪國產GPU融資和創(chuàng)業(yè)的前景,還要先從GPU的發(fā)展歷程、全球和中國市場現(xiàn)狀,以及未來應用發(fā)展?jié)摿砜础?/p>
編者注:以下內容參照維基百科和方正證券研究報告《GPU研究框架—行業(yè)深度報告》。
圖形處理器(GPU)發(fā)展進程
對GPU比較熟悉的朋友可跳過這部分內容,直接到“全球GPU市場進入寡頭壟斷格局”部分。
圖形處理器(Graphics Processing Unit,GPU)又稱顯示核心、顯卡、視覺處理器、顯示芯片或繪圖芯片,是一種專門在PC、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上運行繪圖運算工作的微處理器。
圖形處理器(GPU)的構成。(來源:維基百科)
圖形處理器是英偉達公司(NVIDIA)在1999年8月發(fā)布NVIDIA GeForce 256圖形處理芯片時首先提出的概念。在此之前,電腦中處理圖形輸出的顯示芯片很少被視為是一個獨立的運算單元。而競爭對手ATI(后來被AMD收購)也提出了視覺處理器(Visual Processing Unit,VPU)的概念。圖形處理器可讓顯卡減少對CPU的依賴,并分擔部分原本由CPU所執(zhí)行的任務,尤其是在進行三維繪圖運算時,功效更加明顯。GPU所采用的核心技術有硬件坐標轉換與光源、立體環(huán)境材質貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等。
GPU可單獨與專用電路板組成顯卡,或作為單獨的芯片直接內嵌到主板上,或者內置于主板的北橋芯片中,現(xiàn)在也有內置于CPU組成SoC的。在2007年,90%以上的新型臺式機和筆記本電腦都帶有嵌入式圖形芯片,但是在性能上往往低于獨立顯卡。但2009年以后,AMD和英特爾都各自大力發(fā)展內置于CPU的高性能集成式圖形處理內核,其性能在2012年已經超過那些低端獨立顯卡,這使得不少低端的獨立顯卡逐漸失去市場需求。而在手持和移動設備領域,隨著設備對圖形處理能力的需求越來越高,像高通(Qualcomm)、Imagination、ARM等開始在GPU領域“大顯身手”,但大都是以GPU內核的形式植入應用處理器MPU中。
傳統(tǒng)的CPU(如Intel i5或i7處理器)內核數(shù)量較少,是為通用計算而設計的。相反,GPU是一種特殊類型的處理器,具有數(shù)百或數(shù)千個內核,經過優(yōu)化可并行執(zhí)行大量計算。雖然GPU在游戲中以3D渲染而聞名,但它對數(shù)據分析、深度學習和機器學習算法尤其有用。GPU可讓某些計算比傳統(tǒng)CPU的處理速度快10倍至100倍。
AI加速讓GPU和英偉達騰飛
人工智能加速器(AI accelerator)是一種專門的硬件加速器或計算機系統(tǒng),旨在加速人工智能應用,尤其是人工神經網絡、機器視覺和機器學習。AI加速器的典型應用包括機器人、物聯(lián)網和其他數(shù)據密集型或傳感器驅動任務的算法。它們通常由許多處理器內核設計而成,并且通常專注于低精度算術運算,采用新的數(shù)據流體系結構或存內計算架構。
GPU是用于處理圖像和計算局部圖像屬性的專用硬件,而神經網絡和圖像處理的數(shù)學基礎是相似的,都需要處理龐大的矩陣并行任務。自從2012年AI開始流行以來,GPU越來越多地用于機器學習任務。特別是2016年以來,GPU在處理AI任務中越來越流行,并朝著深度學習的方向發(fā)展。無論是數(shù)據中心的AI訓練還是自動駕駛的邊緣AI推理,GPU都可以從容應對。隨著GPU在AI方面的普及,專注于GPU的英偉達自然也成為AI時代的寵兒,一改多年活在英特爾和AMD夾縫中的“underdog”形象,一躍成為市值超過英特爾的華爾街新貴。
深度學習框架和AI算法仍在不斷發(fā)展中,這使得設計定制硬件變得異常困難。像現(xiàn)場可編程門陣列(FPGA)這類可重配置的器件可以比GPU更為靈活地跟隨AI框架和軟件而演進。微軟率先使用FPGA芯片進行AI推理加速,F(xiàn)PGA在AI加速中的應用前景也促使Intel收購Altera,目的是將FPGA集成到服務器CPU中,使得CPU在執(zhí)行通用計算任務的同時還能夠實現(xiàn)AI加速。
盡管GPU和FPGA在執(zhí)行AI相關任務上性能表現(xiàn)要比CPU更好,但基于特定域架構(DSA)理念而定制設計的ASIC可將效率再提高多達10倍。這種AI加速器采用優(yōu)化內存使用和低精度算術之類的辦法來加速計算,并提高計算吞吐量。Facebook、Amazon和Google等互聯(lián)網巨頭都在設計自己的AI ASIC,像Google的TPU等。
全球GPU市場進入寡頭壟斷格局
據權威調研機構預測,2020年全球GPU市場規(guī)模達254.1億美元,預計2027年將達到1853.1億美元,年復合增長率高達32.82%。按GPU的行業(yè)應用劃分,市場可細分為電子、IT與電信、國防與情報、媒體與娛樂、汽車及其它。由于GPU在設計和工程應用中的廣泛使用,預計汽車細分行業(yè)的年復合增長率最高。
在全球AI芯片市場,GPU約占1/3左右。高性能計算(HPC)領域歷來都是GPU的重要市場,有數(shù)據預測到2023年將有10%的服務器配備GPU以加速AI工作負載,而這一數(shù)字在2018年還不到2%。隨著HPC與AI的加速融合,GPU正在重新定義數(shù)據中心和高性能計算市場。
全球GPU已經進入了寡頭壟斷的格局。在傳統(tǒng)GPU市場中,排名前三的Nvidia、AMD、Intel的營收幾乎可以代表整個GPU行業(yè)的收入。在手機和平板GPU方面,聯(lián)發(fā)科、海思麒麟和三星Exynos的GPU設計主要基于公版ARM Mali GPU或Imagination PowerVR微架構,而高通驍龍Adreno和蘋果A系列則采用自研GPU微架構。
英偉達是GPU計算領域公認的全球領導者,其主要GPU產線“GeForce”和AMD的“Radeon”形成直接競爭。英偉達的四大業(yè)務增長驅動力分別是游戲、數(shù)據中心、專業(yè)視覺和自動駕駛,代表性GPU方案包括GeForce、DGX、EGX、HGX、Quadro、AGX。該公司2021財年營收為167億美元,其中游戲、數(shù)據中心、專業(yè)視覺和自動駕駛業(yè)務在2020財年分別貢獻47%、40%、6%和3%。繼2014年毛利率達到50%之后,英偉達于2021財年毛利率突破60%。
2020年9月,NVIDIA宣布以400億美元收購ARM。如果這宗并購成功,英偉達領先的AI計算平臺和ARM龐大的處理器生態(tài)相結合,將締造出AI時代的世界級計算公司。合并后的英偉達將把計算從云端、智能手機、PC、自動駕駛和機器人領域推進到邊緣物聯(lián)網,將AI計算拓展到全球市場。同時,英偉達計算平臺的開發(fā)者將由200萬擴大至超過1500萬,從而形成全球最大的計算平臺和生態(tài)社區(qū)。
國產GPU發(fā)展現(xiàn)狀及市場潛力
經過多年的探索和發(fā)展,國產CPU已經形成一定的氣候,產業(yè)和生態(tài)也逐漸健全起來。以龍芯、兆芯和飛騰為代表的國產CPU開始圍繞各自的核心產品發(fā)展和擴展生態(tài),借助國家信創(chuàng)和獨立自主發(fā)展半導體產業(yè)的東風而逐漸發(fā)展壯大。然而,國產GPU的發(fā)展卻遠遠落后于國產CPU。直到2014年,景嘉微才成功研發(fā)出國內首款高性能、低功耗GPU芯片—JM5400。
究其原因,GPU自身依賴于CPU的屬性是主要因素。GPU結構沒有控制器,必須由CPU進行控制調用才能工作,否則GPU無法單獨工作。所以,國產CPU較GPU先行一步是符合芯片產業(yè)發(fā)展邏輯的。再者,GPU技術開發(fā)難度很高。國內人才缺口也是國產GPU發(fā)展緩慢的原因之一。
然而,中國GPU市場規(guī)模和潛力非常大,龐大的整機制造能力意味著巨量的GPU采購。雖然近些年,計算機整機和智能手機產量增長都出現(xiàn)瓶頸,但由于這兩類產品體量龐大,GPU的需求量大且單品價值非常高,市場規(guī)模依然非??捎^。同時,服務器GPU伴隨著整機出貨的快速成長,需求量增長也較為迅速。據統(tǒng)計,2018年國內服務器出貨量達到330.4萬臺,同比增長26%,其中互聯(lián)網、電信、金融和服務業(yè)等行業(yè)的出貨量增速均超過20%。另外,國內在物聯(lián)網、車聯(lián)網、人工智能等新興計算領域,對GPU也存在海量的需求。
除本文開頭提到的幾家以AI為賣點的國產GPU初創(chuàng)公司外,還有一些國產GPU廠商已經在特定領域深耕多年,現(xiàn)正把握信創(chuàng)市場和“國產替代”的機遇擴展應用市場,加速國產GPU行業(yè)的發(fā)展。
景嘉微
長沙景嘉微成立于2006年4月,是目前唯一專注于國產GPU芯片設計的上市企業(yè),其主要產品包括JM5400、JM7200和JM7201圖形處理器,所面向的應用市場包括筆記本電腦、一體機、移動工作站、刀片式主板等桌面辦公和工業(yè)控制領域。
2014年4月,景嘉微成功研發(fā)出國內首款高可靠、低功耗GPU芯片-JM5400,具有完全自主知識產權,打破了國外產品長期壟斷中國GPU市場的局面。第一代GPU JM5400主要用于軍用市場,替代原ATI M9、M54、M72等美系GPU芯片。
景嘉微的第二代GPU JM7200系列于2018年8月流片成功,并在2019年3月獲得首個訂單。相較于前代產品,JM7200在理論性能上有翻倍的提升,同時制程也提升至28納米。但是JM7200在顯存帶寬、像素填充率、浮點性能等方面較2012年發(fā)布的采用完整版GK107核心的英偉達GT640還有相當差距。
2019年,該公司在JM7200基礎上,推出了商用版本JM7201,以滿足桌面系統(tǒng)高性能顯示需求,并全面支持國產CPU和國產操作系統(tǒng),從而推動國產計算機產業(yè)的生態(tài)構建進一步完善。JM7201對民用市場的桌面應用進行了優(yōu)化,推出了標準MXM和標準PCIE顯卡,在保證性能的同時,降低了功耗,并縮小了體積。
景嘉微GPU已完成與龍芯、飛騰、麒麟軟件、統(tǒng)信軟件、道、天脈等國內主要CPU和操作系統(tǒng)廠商的適配工作;與中國長城、超越電子等十余家國內主要計算機整機廠商建立合作關系并進行產品測試;與麒麟、長城、蒼穹、寶德、超圖、昆侖、中科方德、中科可控、寧美等多家軟硬件廠商進行互相認證,共同構建國產化計算機應用生態(tài)。
景嘉微GPU產線。(來源:景嘉微和方正證券)
2018年12月,景嘉微定增募集10.88億元,用于高性能通用圖形處理器和面向消費電子領域的通用類芯片研發(fā)和產業(yè)化項目。其中,高性能通用圖形處理器項目包括JM9231和JM9271兩款GPU芯片,分別面向不同應用領域的中、高檔系列產品。據公司2020年中報顯示,下一代圖形處理器研發(fā)處于后端設計階段。景嘉微JM9系列是繼JM5400和JM7200局部渲染計算內核之后,首次采用統(tǒng)一渲染結構的GPU,并且增加了可編程計算模塊數(shù)量。JM9231和JM9271在性能表現(xiàn)上分別對標英偉達于2016年推出的GTX1050和GTX1080。
JM9系列的推出將使公司GPU水平與國際龍頭縮短至5年,大幅提升公司在GPU領域的競爭力。
芯動科技
2020年10月,位于武漢的芯動科技宣布與Imagination達成合作,將采用多晶粒(chiplet)和GDDR6高速顯存等SoC創(chuàng)新技術,基于Imagination全新頂配BXT多核架構,開發(fā)“風華”系列GPU。
芯動科技“風華”系列顯卡GPU。(來源:芯動科技)
在信創(chuàng)和算力安全方面,“風華”系列GPU內置物理不可克隆iUnique Security PUF信息安全加密技術,提升數(shù)據安全和算力抗攻擊性,支持桌面電腦和數(shù)據中心GPU計算自主可控生態(tài)。這款GPU芯片自帶浮點和智能3D圖形處理功能,全定制多級流水計算內核,兼具高性能渲染和智能AI算力,還可級聯(lián)組合多顆芯片合并處理能力,靈活性大大增加,適配國產桌面市場1080P/4K/8K高品質顯示,支持VR/AR/AI,多路服務器云桌面、云游戲、云辦公等應用場景。
IP和芯片定制開發(fā)服務商芯原
在科創(chuàng)板上市的芯原股份的GPU IP源于在2016年收購嵌入式GPU開發(fā)商圖芯技術(Vivante)。芯原在GPU IP領域已經掌握了支持主流圖形加速標準、自主可控指令集和可拓展性強等核心技術,廣泛應用于IOT、汽車電子、PC等市場。芯原可拓展的Vivante GPU IP應用涵蓋從低功耗的小型物聯(lián)網MCU(GPU Nano IP系列)到面向汽車和計算機應用的強大SoC(GPU Arcturus圖形IP),可滿足各種芯片尺寸和功耗預算,是具有成本效益的優(yōu)質圖形處理器解決方案。
芯原的圖形處理器技術支持業(yè)界主流的嵌入式圖形加速標準Vulkan 1.0、OpenGL 3.2、OpenCL 1.2 EP/FP和OpenVX 1.2等,具有自主可控的指令集及專用編譯器,支持每秒2500億次的浮點運算能力及128個并行著色器處理單元。
芯原在圖形處理器技術方面的研發(fā)包括高性能的通用圖形處理器GC8400 IP,該IP適用于汽車電子,目前仍處IP設計驗證階段,擬達到每秒1萬億次的浮點運算能力雙倍精密度,512個并行著色器處理單元。
兆芯
總部位于上海張江的兆芯是世界上第三家擁有X86授權的微處理器公司,掌握CPU、GPU、芯片組三大核心技術,且具備三大核心芯片及相關IP設計與研發(fā)能力。兆芯提供桌面整機、服務器、工業(yè)主板和系統(tǒng)級解決方案,在黨政辦公、交通、金融、能源、教育和網絡安全方面有著廣泛的應用。
兆芯KX-6000是國內第一款完整集成CPU、GPU、芯片組的SoC單芯片國產通用處理器,采用16納米制程,集成高性能顯卡,支持DP/HDMI/VGA輸出,兼容DirectX、OpenGL、OpenCL等主流API,最高可同時輸出3臺顯示器,分辨率可達4K。
未來,兆芯還會對KX系列處理器進行進一步升級,使用全新的CPU架構,將內存從DDR4升級為DDR5,將總線從PCIe3.0升級至PCIe4.0。內存和總線的升級分別可以提高顯卡的帶寬和CPU與GPU間的通訊速度。除了集成GPU外,兆芯還計劃發(fā)布一款采用臺積電28納米工藝,TDP 70瓦的獨立GPU芯片。
芯瞳半導體
西安芯瞳半導體致力于研發(fā)高性能的GPU芯片,公司創(chuàng)始團隊在GPU領域有著超過10年的學術和工程經驗,是一支軟硬件全棧式支持的研發(fā)團隊。其核心技術人員來自西郵GPU核心團隊、Intel、Mstar、華為海思、中興、RedHat、騰訊、ThoughtWorks等知名軟硬件公司。
公司第一代GPU芯片(GenBu01)系列產品已完成與國產CPU和主流操作系統(tǒng)的適配工作,可應用于嵌入式計算及設備、辦公電腦和工控顯示設備等應用場景。與深圳中微信息聯(lián)合發(fā)布基于芯瞳GenBu01的MXMGB01顯卡,是支持國產固件BIOS、國產操作系統(tǒng)、國產CPU的純國產化顯示解決方案。
在研的高性能產品可應用于服務器、數(shù)據中心等大型設備。公司目前所發(fā)明的專利囊括了GPU芯片設計的多個技術核心方向,包括顯存管理、芯片架構建模、圖形管線架構、著色器設計等方面。
登臨科技
登臨科技花費三年時間研發(fā)的第一代產品 Goldwasser已在2020年三季度量產,該產品目前正在與互聯(lián)網和安防等領域的龍頭企業(yè)合作集成及業(yè)務測試。該公司采用自主創(chuàng)新的 Minsky體系結構(軟件定義的異構人工智能計算平臺),在提供兼容 CUDA/OpenCL 硬件加速能力的前提下,全面支持各類流行的人工智能網絡框架及底層算子。相比英偉達公司目前主流云端推理產品 (T4),登臨科技的產品在同樣的工藝上,具有更小的芯片面積,在同樣功耗的情況下,視不同 AI 網絡可將計算效率提升 3-10 倍,同時也減低了芯片性能對外存吞吐的依賴。
英偉達和AMD感受到威脅了嗎?
在AI加速計算、國產半導體自主創(chuàng)新和風投資本的多重驅動下,原本風平浪靜的國產GPU突然風生水起,在本就躁動不安的中國半導體業(yè)界掀起一股風浪。這對半導體行業(yè)和國產GPU的產業(yè)發(fā)展肯定是好事,但筆者認為這股被資本追逐和掀起的風浪有點熱過了頭。即便有資深的GPU研發(fā)專家、雄厚的資本加持,從頭開創(chuàng)一個產業(yè)去跟全球GPU巨頭競爭是不太現(xiàn)實的。英偉達和AMD是否感受到威脅了呢?我認為除了一些技術管理人才流失和研發(fā)人員被挖之外,國產GPU短期內還無法撼動他們的地位。
國家信創(chuàng)市場需求和工業(yè)控制等特定領域對GPU的需求增長將給景嘉微等國產GPU廠商帶來增長和擴大市場的機遇。至于以AI為主要應用市場的這些GPU新貴們,除了拿出真正可以對比的GPU芯片外,還需要在生態(tài)建設和AI場景落地方面下功夫,才能證明自己拿到這么多錢確實是“物有所值”,才能消除“泡沫”的嫌疑。
原文標題:國產GPU風生水起,英偉達和AMD感受到威脅了嗎?
文章出處:【微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
gpu
+關注
關注
28文章
4678瀏覽量
128612 -
AI
+關注
關注
87文章
29858瀏覽量
268152
原文標題:國產GPU風生水起,英偉達和AMD感受到威脅了嗎?
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論