“未來可能不是百模大戰(zhàn),而是萬模群舞。”自ChatGPT掀起大模型的發(fā)展熱潮之后,層出不窮的大模型已然蜂擁而入,風(fēng)雷激蕩。但在經(jīng)歷了最初的驚艷之后,行業(yè)已轉(zhuǎn)移到對商業(yè)化落地的冷靜觀察,一方面業(yè)界認(rèn)可垂直類應(yīng)用模型有望率先實現(xiàn)落地應(yīng)用,另一方面AI大模型的壓縮和優(yōu)化發(fā)展,使得向邊緣端滲透的步伐也在加快,邊緣算力的重要性正加速凸顯。
以更直觀的數(shù)據(jù)來看,有預(yù)測到2030年,邊緣計算潛在市場將在10年內(nèi)以48%的復(fù)合年增長率從2020年的90億美元增長到2030年的4450億美元。而且,中國是邊緣算力的主戰(zhàn)場,預(yù)估到2026年全球26%的網(wǎng)絡(luò)邊緣站點將位于中國。
通用GPU這一算力主流芯片在經(jīng)過AI的淬煉之后,如何更進一步,承接AI大模型下沉至邊緣端的新機遇?無疑,這將更是一場實打?qū)嵉挠舱獭?/p>
可重構(gòu)架構(gòu)打造算力第三極
在日前舉辦的第六屆世界人工智能大會(WAIC)上,珠海芯動力、天數(shù)智芯、燧原科技、登臨科技、愛芯元智、沐曦等企業(yè)展出的芯片、加速卡、軟硬件解決方案和廣泛的行業(yè)應(yīng)用,成為WAIC不容錯過的“風(fēng)景”。
在WAIC舞臺同場競技的背后,暗藏的邏輯是通用GPU廠商比拼的賽點,已經(jīng)從單純的性能指標(biāo)轉(zhuǎn)向進入真實應(yīng)用場景落地的較量,邊緣側(cè)的競奪也走向白熱化。
“隨著AIGC興起,算力將成為重要的生產(chǎn)力。相比云端,邊緣側(cè)應(yīng)用場景更廣泛,也更能促進生產(chǎn)力的提升創(chuàng)造價值,將對通用GPU產(chǎn)生巨大的市場機會?!毙緞恿EO李原樂觀表示。
顯然這涉及通用GPU的算力、擴展性和編程性、生態(tài)等多維度的比拼。在這一市場,英偉達、AMD、英特爾等占據(jù)強勢地位,且在當(dāng)下國內(nèi)半導(dǎo)體制造面臨全面打壓的情形下,我國通用GPU企業(yè)想要撕開一道口子,有專家建議不能按“常理”出牌,需要從架構(gòu)、材料、封裝等層面進行創(chuàng)新。
不走尋常路,發(fā)布首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8的珠海芯動力可謂獨辟蹊徑。該公司在2017年成功研發(fā)出可重構(gòu)并行處理器(RPP)架構(gòu),借助于獨有的底層硬件架構(gòu),自帶高性能、原生支持CUDA語言和低功耗等“光芒”,可對AI推理的性能進行深度優(yōu)化。
(RPP-六邊形戰(zhàn)士)
芯動力創(chuàng)始人李原分析,在可重構(gòu)芯片面世之前,AI算力芯片主要有專用和通用GPU兩大類,專用芯片性能雖強但編程能力差,有的通用GPU可編程性高但算力不強,要從激烈的競爭中脫穎而出,必須建立強大的優(yōu)勢,而第三類可重構(gòu)芯片則將兩類產(chǎn)品的優(yōu)勢“合二為一”,將躋身成為通用GPU的新一極。
據(jù)悉,RPP-R8作為一款通用GPU,每顆芯片內(nèi)含有1024個計算核,相比傳統(tǒng)GPU架構(gòu)在同樣的算力占用更小的芯片面積,實現(xiàn)了低功耗和高能效的有效平衡。此外,面積效率比可達到同類產(chǎn)品的7~10倍,能效比也超過3倍。而且,除原生支持CUDA之外,芯動力還擁有自主開發(fā)的工具鏈,使得其能夠在cuDNN和TensorRT上實現(xiàn)API的兼容,同時也支持廣泛的人工智能框架,如TensorFlow和Pytorch等,可全面滿足高效并行計算及AI算力應(yīng)用。
憑借高能效、高算力、低功耗、編程靈活等功力的“加持”,芯動力的RPP-R8在邊緣側(cè)的落地也在快馬加鞭。
解決客戶痛點 打開落地之旅
觸及落地,盡管RPP-R8的性能和生態(tài)獨樹一幟,但作為一個新生“物種”,仍要面臨逐級解鎖的過程。
對此李原認(rèn)為,邊緣側(cè)的市場巨大,傳統(tǒng)市場的AI加速是剛需,通用GPU可替代專用芯片打入供應(yīng)鏈;而新興市場的需求如智能安防、機器視覺等市場也在持續(xù)擴容。但落地最重要的是要解決客戶的痛點,要厘清市場的規(guī)律。
李原進一步剖析,芯片公司容易陷入提倡軟硬件一體化的“怪圈”,但邊緣側(cè)終端客戶對成本并非那么敏感,從產(chǎn)業(yè)鏈來看,芯片公司的客戶大都為設(shè)備廠商,處于終端客戶的下游,一方面芯片公司要學(xué)會將更多利潤留給設(shè)備廠商,讓他們有動力合作切入市場,另一方面芯片公司的客戶大都有實力進行軟件自主開發(fā),因而要順應(yīng)軟硬件分離的需求。
“因而,芯動力提供的是一個過硬的純硬件,加上底層兼容x86、Arm、Windows等軟件系統(tǒng),與其他家的軟件結(jié)合在一起可快速應(yīng)用,讓客戶可順暢地進行開發(fā),有效幫助企業(yè)降低開發(fā)成本和產(chǎn)品周期,加速產(chǎn)品迭代與擴展,這是共贏之道和長久之道?!崩钤治稣f。
基于這樣的深刻洞察,加上直擊痛點以及秉承讓利的“哲學(xué)”,讓芯動力的產(chǎn)品在落地之旅行進在“坦途”之上。李原提到,芯動力產(chǎn)品在智能安防、工業(yè)自動化等一些行業(yè)因可切實解決設(shè)備廠商的痛點,具有不可替代性,起量非??欤疽烟幱诠拯c,更大規(guī)模的出貨將順利推進。
而這只是芯動力的“一小步”,未來還有更遼闊的征程。
李原介紹,芯動力已推出了基于可重構(gòu)架構(gòu)RPP-R8系列三種不同封裝形式的GPGPU芯片,分別是AE8100、AE7100和AE6100;每一款芯片能夠滿足相對的應(yīng)用場景需求。
“AE8100芯片面向邊緣服務(wù)器等領(lǐng)域,對體積、功耗要求較高;AE7100芯片著力面向低功耗、小體積的應(yīng)用場景;AE6100則聚焦于更小體積上承載更大的性能,正在與客戶一起定義,針對機器視覺的Camera,融合信號采集、圖像處理和GPU加速等功能,以代替前端的ISP,下半年將著重在工業(yè)視覺領(lǐng)域?qū)崿F(xiàn)新的突破?!崩钤P躇滿志表示。
不再跟隨?創(chuàng)新當(dāng)?shù)?/p>
在AIGC熱潮掀起通用GPU的算力革命之際,一個更值得業(yè)界深思的問題也浮出水面。
“業(yè)界均認(rèn)為AIGC大模型是一大風(fēng)口,一大史詩級機遇。但值得深思的是,中國這么多AI公司和GPU公司,為什么美國開大模型之先河?如果不深刻反省,下次再有風(fēng)口出現(xiàn)時我們還是被動跟隨的境況?!崩钤谋硎鲋胁刂恍┥顚拥膬?nèi)省。
李原進一步提議,對國內(nèi)高科技界來說,最重要的是要思考未來十年會向什么方向演變?如果只是一味地跟隨或Repeating,實際上沒有太大價值,也走不出這一循環(huán)。
著眼于通用GPU發(fā)展,李原高瞻遠矚地表示,下一個十年比拼的是它的效率,而不僅是性能。為持續(xù)降低時延和提高帶寬,將衍生出眾多新技術(shù),業(yè)界應(yīng)著力解決芯片外部互聯(lián)挑戰(zhàn),并嘗試采用光電子技術(shù),突破原有的方式才有可能實現(xiàn)超越。
此外,chiplet成為未來算力芯片“擴張”的必然之路,也將產(chǎn)生更多Cost Effective的效果。李原提到,芯動力也將在這一方向持續(xù)耕耘,加強與FPGA廠商合作共贏,切入更多場景,為客戶帶來更具想象力的價值。
對于CUDA兼容的走向,李原也洞察道,客戶不在意底層是用CUDA或別的語言,最重要的是能夠快速迭代、快速開發(fā)。在已經(jīng)選用了CUDA語言的領(lǐng)域里,我們會尊重客戶的選擇,但在新的領(lǐng)域里,完全可以有自由的選擇。
伴隨生成式AI帶動下的這場新興科技革命,邊緣計算的價值將被如芯動力這批“搶灘登陸”的企業(yè)率先釋放,而芯動力的未來之路,也將成為國內(nèi)眾多行業(yè)的數(shù)字化、智能化轉(zhuǎn)型升級的動力之源。
(來源/愛集微)
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
453文章
50249瀏覽量
421111 -
gpu
+關(guān)注
關(guān)注
28文章
4678瀏覽量
128612 -
AI
+關(guān)注
關(guān)注
87文章
29852瀏覽量
268151 -
大模型
+關(guān)注
關(guān)注
2文章
2283瀏覽量
2372
發(fā)布評論請先 登錄
相關(guān)推薦
評論