電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)GPU中文叫圖形處理單元,是一種并行處理的硬件,早起只用來(lái)渲染復(fù)雜的計(jì)算機(jī)圖形環(huán)境。隨著技術(shù)進(jìn)步,GPU不再局限于圖形領(lǐng)域,擴(kuò)展應(yīng)用到其他計(jì)算密集的領(lǐng)域,被稱(chēng)為GPGPU,成為AI 芯片領(lǐng)域的代表。
GPU具有很好的通用性,同時(shí)傳統(tǒng)的架構(gòu)也存在一定局限,比如計(jì)算密度低、效率低,如何在保證通用性的情況下,又提高它的計(jì)算效率成為業(yè)界關(guān)注的重點(diǎn)。
創(chuàng)新架構(gòu)提高AI計(jì)算效率
那么應(yīng)該如何做呢?為了提高GPU的計(jì)算效率,GPU知名企業(yè)英偉達(dá)也進(jìn)行的相應(yīng)的嘗試,即對(duì)原來(lái)的GPU架構(gòu)進(jìn)行修改,比如增加專(zhuān)門(mén)的張量計(jì)算單元、增加片上內(nèi)存器等,這一定程度可以提高AI的計(jì)算效率,不過(guò)受限于GPU整體架構(gòu),問(wèn)題并沒(méi)有得到很好的解決。
圖:傳統(tǒng)GPU對(duì)AI加速的局限體現(xiàn)在哪些方面(圖片來(lái)自登臨科技分享)
成立于2017年的登臨科技,從2018年自主研發(fā)創(chuàng)新性的GPU+架構(gòu),一款由軟件定義的、片內(nèi)異構(gòu)的支持并行化計(jì)算的架構(gòu)。GPU+架構(gòu)針對(duì)AI應(yīng)用,具備和GPU一樣的可編程能力和通用性。同時(shí)通過(guò)架構(gòu)創(chuàng)新,提供更高的計(jì)算密度,更快的計(jì)算速度,同時(shí)大幅降低對(duì)外部帶寬的需求。而這些是傳統(tǒng)GPU芯片無(wú)法兼顧的。
由于GPU良好的通用性,在服務(wù)器及云端等使用場(chǎng)景中,會(huì)大規(guī)模應(yīng)用 GPU。運(yùn)行各類(lèi)神經(jīng)網(wǎng)絡(luò)。大量開(kāi)源生態(tài)的應(yīng)用、大量客戶(hù)定制化的軟件,都是在主流的GPU軟件生態(tài)上完成。如何保持客戶(hù)已有的投入,即如何減少客戶(hù)的使用成本,也是AI技術(shù)產(chǎn)業(yè)化的重要課題。
怎么做呢?登臨科技在接受電子發(fā)燒友采訪的時(shí)候表示,登臨自主創(chuàng)新的GPU+架構(gòu),通過(guò)對(duì)高效的Tensor引擎和可編程的GPGPU引擎的有機(jī)配合,硬件直接兼容CUDA/OpenCL,可無(wú)縫接入現(xiàn)有軟件生態(tài),大大降低了客戶(hù)的遷移成本。
通過(guò)片內(nèi)異構(gòu),GPU+解決了傳統(tǒng)的系統(tǒng)級(jí)異構(gòu)計(jì)算調(diào)度,數(shù)據(jù)交換的開(kāi)銷(xiāo)大,以及數(shù)據(jù)的連貫相干性的難題。在整個(gè)系統(tǒng)的計(jì)算密度極高的基礎(chǔ)上,通過(guò)軟件定義,使針對(duì)不同神經(jīng)網(wǎng)絡(luò)的應(yīng)用場(chǎng)景,都能達(dá)到硬件性能和能效最大化。
登臨科技表示,通過(guò)大規(guī)模客戶(hù)實(shí)測(cè),在同等功耗下,GPU+的性能可以達(dá)到國(guó)際主流產(chǎn)品3倍以上的能效。
打造真正符合市場(chǎng)需求的產(chǎn)品
登臨科技成立以后,一直思考如何制定真正符合市場(chǎng)需求的技術(shù)路線,即上文所談的如何保持客戶(hù)已有的投入,減少客戶(hù)的使用成本,這是登臨科技制定產(chǎn)品的價(jià)值導(dǎo)向。
2018年登臨確定了產(chǎn)品的方向:基于GPGPU的高能效計(jì)算,并自主研發(fā)創(chuàng)新的GPU+架構(gòu)。經(jīng)過(guò)團(tuán)隊(duì)一年多的工作,于2019年6月,公司完成了首款基于GPU+架構(gòu)的Goldwasser設(shè)計(jì),并mpw流片成功。
2020年6月Goldwasser成功回片通過(guò)測(cè)試,開(kāi)始客戶(hù)送樣,Goldwasser目前已在成熟的12nm/14nm工藝上實(shí)現(xiàn)量產(chǎn)。登臨Goldwasser已于2021年在智慧城市、互聯(lián)網(wǎng)等領(lǐng)域順利實(shí)現(xiàn)了商業(yè)化落地,并同時(shí)與數(shù)十家客戶(hù)在邊緣至云端的不同應(yīng)用場(chǎng)景中進(jìn)行產(chǎn)品開(kāi)發(fā)、測(cè)試。
登臨科技的Goldwasser 系列產(chǎn)品包括:邊緣計(jì)算產(chǎn)品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半長(zhǎng)的服務(wù)器計(jì)算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一種全高全長(zhǎng)的 Goldwasser XL,輸出 512TOPS 算力。多種規(guī)格的產(chǎn)品,使得客戶(hù)可以根據(jù)自身需求分別部署在邊緣側(cè)、云端的各種計(jì)算設(shè)備中。
登臨科技方案架構(gòu)總監(jiān)鄭韜此前在某論壇上也介紹過(guò),Goldwasser覆蓋主流系統(tǒng)生態(tài),登臨Hamming軟件開(kāi)發(fā)包支持主流GPU編程語(yǔ)言,包括CUDA、OpenCL等;適配國(guó)內(nèi)外主流服務(wù)器廠家;支持主流國(guó)內(nèi)外AI計(jì)算框架,包括PyTorch、百度飛漿、TensorFlow等;適配國(guó)內(nèi)外主流CPU廠家,包括飛騰、龍芯、英特爾、AMD等。
在不同的應(yīng)用場(chǎng)景下,Goldwasser可以支持多種不同的算法實(shí)現(xiàn)和落地,如智慧城市、智能交通、語(yǔ)音識(shí)別、虛擬客服、智慧工地、智慧車(chē)站、機(jī)器翻譯、工業(yè)視覺(jué)等,場(chǎng)景覆蓋CV、NLP、知識(shí)圖譜、信號(hào)處理和計(jì)算等多個(gè)領(lǐng)域。Goldwasser可以同時(shí)支持訓(xùn)練和推理。
登臨科技表示,目前Goldwasser正與30多家不同行業(yè)的頭部企業(yè)進(jìn)行量產(chǎn)導(dǎo)入。同時(shí),登臨科技打通供應(yīng)鏈上下游相關(guān)企業(yè)和合作伙伴,確保產(chǎn)品正常交付。
小結(jié)
當(dāng)前AI技術(shù)正快速發(fā)展,GPGPU呈現(xiàn)出強(qiáng)勁的增長(zhǎng)勢(shì)頭,根據(jù)有關(guān)數(shù)據(jù)預(yù)測(cè),到2025年,我國(guó)GPGPU芯片板卡的市場(chǎng)規(guī)模將達(dá)458億元,年復(fù)合增長(zhǎng)率高達(dá)32%,未來(lái)市場(chǎng)可觀。
目前國(guó)際巨頭占據(jù)大部分市場(chǎng),與之相比國(guó)內(nèi)廠商還存在差距,不過(guò)近幾年不少?lài)?guó)內(nèi)GPU廠商通過(guò)自主創(chuàng)新,在技術(shù)上逐漸取得進(jìn)展,產(chǎn)品也逐步走向落地商用,比如登臨科技。
另外,對(duì)于政府目前重點(diǎn)關(guān)注的降碳增效,登臨科技表示,對(duì)計(jì)算芯片而言關(guān)鍵指標(biāo)是能效比,而這也是公司產(chǎn)品的最重要的優(yōu)勢(shì)之一,登臨將繼續(xù)通過(guò)對(duì)傳統(tǒng)GPU的架構(gòu)創(chuàng)新,不斷提升異構(gòu)硬件的算力,達(dá)到非常顯著的能效比優(yōu)勢(shì),為降碳和增效做貢獻(xiàn)。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論