2021年一月,上海天數(shù)智芯半導(dǎo)體有限公司(以下簡稱:天數(shù)智芯)宣布,公司旗艦7nm工藝GPGPU云端訓(xùn)練芯片BI成功點亮,這是國內(nèi)第一款全自研、真正基于GPU架構(gòu)下的7nm工藝GPGPU訓(xùn)練芯片。
緊接著,2021年3月31日,天數(shù)智芯正式對外發(fā)布全自研高性能云端7nm芯片BI及產(chǎn)品卡,實現(xiàn)國產(chǎn)云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產(chǎn)品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數(shù)智芯在BI產(chǎn)品“點亮”時提到,BI產(chǎn)品的理論峰值性能達市場主流產(chǎn)品的2倍。一時間,國產(chǎn)GPGPU似乎已經(jīng)站在世界之巔。但天數(shù)智芯產(chǎn)品副總裁鄒翾在接受電子發(fā)燒友采訪時表示:“實測性能對用戶才是關(guān)鍵,目前國內(nèi)的軟件生態(tài)是短板,幾乎90%的AI應(yīng)用都基于國外的基礎(chǔ)軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計算力,提供優(yōu)秀的實測性能,這是國產(chǎn)GPGPU 發(fā)展的關(guān)鍵?!?br />
天數(shù)智芯產(chǎn)品副總裁鄒翾
他還說到,國內(nèi)企業(yè)一定要敢于承認這種差距,在解決這些問題以后,國內(nèi)的運算平臺才會有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調(diào)API兼容業(yè)界主流生態(tài)以及無痛遷移?!疤峁└咝实能浖Y(jié)構(gòu),最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個產(chǎn)業(yè)的發(fā)展?!?鄒翾指出,“天數(shù)智芯在產(chǎn)品的設(shè)計之初就關(guān)注到,客戶需要最大限度降低跨平臺的開發(fā)成本。我們考慮到GPGPU產(chǎn)品架構(gòu)的通用兼容性,本著以客戶需求為出發(fā)點的原則,從實際角度為客戶實現(xiàn)跨平臺轉(zhuǎn)換的無痛遷移?!?br />
鄒翾介紹說,BI產(chǎn)品是國內(nèi)第一款全自研、真正基于通用GPU架構(gòu)的GPGPU云端高端訓(xùn)練芯片,以比同類產(chǎn)品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能??偨Y(jié)而言,BI產(chǎn)品有以下幾個優(yōu)勢:
a) 全自研IP核心;
b) GPGPU架構(gòu),更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態(tài)兼容,客戶的跨平臺開發(fā)成本更低。
作為一種通用計算芯片,云端訓(xùn)練只是GPGPU典型的應(yīng)用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務(wù)?!?br />
在采訪的過程中,我們談到了端側(cè)AI的應(yīng)用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經(jīng)被驗證的芯片架構(gòu)。AI端側(cè)發(fā)展會驅(qū)動應(yīng)用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結(jié):
GPGPU的設(shè)計特點在于其通用可編程性,對于層出不窮的新的算法和應(yīng)用,能做到性能和開發(fā)成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構(gòu)間的產(chǎn)品間進行應(yīng)用的無痛遷移。
在GPGPU領(lǐng)域,NVIDIA無疑是行業(yè)的標桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領(lǐng)先優(yōu)勢,再考慮到產(chǎn)業(yè)生態(tài),國產(chǎn)GPGPU替代還有很長的路要走。在NVIDIA官網(wǎng)有提到,AI應(yīng)用不僅需要大的內(nèi)存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進行高效并行處理,CPU的優(yōu)勢是處理復(fù)雜邏輯流程。CPU和GPU在一個芯片上是可以實現(xiàn)的,而且以前也存在這種整合性的產(chǎn)品,但是對于高端的、云端的CPU加上GPU同時實現(xiàn),需要非常大的尺寸規(guī)模,而且會限制芯片在各自領(lǐng)域的性價比。
毫無疑問,云端訓(xùn)練在未來很長一段時間內(nèi)仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術(shù)的持續(xù)發(fā)展與應(yīng)用落地,端側(cè)及邊緣側(cè)未來對算力性能的要求會越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數(shù)智芯的產(chǎn)品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領(lǐng)域的高通用性及更廣闊的應(yīng)用領(lǐng)域。天數(shù)智芯始終以市場需求為導(dǎo)向,結(jié)合公司技術(shù)優(yōu)勢,關(guān)注客戶需求痛點并推出適合的GPGPU產(chǎn)品。隨著城市數(shù)字化轉(zhuǎn)型,傳統(tǒng)行業(yè)智能化轉(zhuǎn)型升級需求逐漸擴大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應(yīng)用領(lǐng)域?qū)Ω叨薌PGPU芯片產(chǎn)品的需求量都在急劇增加?!?br />
2021年3月1日,天數(shù)智芯對外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重。“天數(shù)智芯目前已經(jīng)擁有了一支全球頂尖的數(shù)字集成電路設(shè)計與基礎(chǔ)軟件設(shè)計科學(xué)家團隊,為實現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。這支完整的GPGPU研發(fā)團隊,由公司聯(lián)合創(chuàng)始人、高級副總裁及首席科學(xué)家鄭金山先生帶領(lǐng),占比公司總?cè)藬?shù)85%以上,這其中既有一批行業(yè)經(jīng)驗超過20年的世界級技術(shù)專家,也有一大批擁有5-15年業(yè)界經(jīng)驗的高執(zhí)行力技術(shù)菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業(yè)務(wù)發(fā)展,我們將會持續(xù)不斷地吸納優(yōu)秀人才深耕國產(chǎn)GPGPU芯片設(shè)計。隨著新產(chǎn)品的推出,團隊也將進一步擴大。另外,根據(jù)我們產(chǎn)品規(guī)劃和市場發(fā)展需要,天數(shù)智芯也會進一步通過融資支持公司的長遠發(fā)展?!?br />
緊接著,2021年3月31日,天數(shù)智芯正式對外發(fā)布全自研高性能云端7nm芯片BI及產(chǎn)品卡,實現(xiàn)國產(chǎn)云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產(chǎn)品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數(shù)智芯在BI產(chǎn)品“點亮”時提到,BI產(chǎn)品的理論峰值性能達市場主流產(chǎn)品的2倍。一時間,國產(chǎn)GPGPU似乎已經(jīng)站在世界之巔。但天數(shù)智芯產(chǎn)品副總裁鄒翾在接受電子發(fā)燒友采訪時表示:“實測性能對用戶才是關(guān)鍵,目前國內(nèi)的軟件生態(tài)是短板,幾乎90%的AI應(yīng)用都基于國外的基礎(chǔ)軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計算力,提供優(yōu)秀的實測性能,這是國產(chǎn)GPGPU 發(fā)展的關(guān)鍵?!?br />
天數(shù)智芯產(chǎn)品副總裁鄒翾
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發(fā)揮GPGPU硬件潛力的必要一環(huán),讓抽象的算力資源能夠和具體應(yīng)用深度結(jié)合。目前,在GPGPU領(lǐng)域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺,還是TensorFlow/PyTorch等主流深度學(xué)習(xí)開發(fā)框架,主導(dǎo)者都是國際廠商或機構(gòu)。鄒翾認為:“自己的軟件平臺一定是需要的,但目前來說,我們與國外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對比,還包括產(chǎn)品的覆蓋范圍、生態(tài)等方面。尤其是生態(tài)建設(shè),這是國內(nèi)廠商必須要面對的問題?!?br />他還說到,國內(nèi)企業(yè)一定要敢于承認這種差距,在解決這些問題以后,國內(nèi)的運算平臺才會有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調(diào)API兼容業(yè)界主流生態(tài)以及無痛遷移?!疤峁└咝实能浖Y(jié)構(gòu),最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個產(chǎn)業(yè)的發(fā)展?!?鄒翾指出,“天數(shù)智芯在產(chǎn)品的設(shè)計之初就關(guān)注到,客戶需要最大限度降低跨平臺的開發(fā)成本。我們考慮到GPGPU產(chǎn)品架構(gòu)的通用兼容性,本著以客戶需求為出發(fā)點的原則,從實際角度為客戶實現(xiàn)跨平臺轉(zhuǎn)換的無痛遷移?!?br />
從云端走向更廣闊的場景
在天數(shù)智芯BI產(chǎn)品的介紹中我們看到,這款全自研通用計算GPGPU芯片聚焦于云端訓(xùn)練市場。長期以來,云端訓(xùn)練市場被國際巨頭壟斷,不僅加速卡產(chǎn)品成本高,且生態(tài)較為封閉,制約了AI產(chǎn)品多元化發(fā)展和升級迭代。鄒翾介紹說,BI產(chǎn)品是國內(nèi)第一款全自研、真正基于通用GPU架構(gòu)的GPGPU云端高端訓(xùn)練芯片,以比同類產(chǎn)品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能??偨Y(jié)而言,BI產(chǎn)品有以下幾個優(yōu)勢:
a) 全自研IP核心;
b) GPGPU架構(gòu),更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態(tài)兼容,客戶的跨平臺開發(fā)成本更低。
作為一種通用計算芯片,云端訓(xùn)練只是GPGPU典型的應(yīng)用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務(wù)?!?br />
在采訪的過程中,我們談到了端側(cè)AI的應(yīng)用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經(jīng)被驗證的芯片架構(gòu)。AI端側(cè)發(fā)展會驅(qū)動應(yīng)用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結(jié):
GPGPU的設(shè)計特點在于其通用可編程性,對于層出不窮的新的算法和應(yīng)用,能做到性能和開發(fā)成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構(gòu)間的產(chǎn)品間進行應(yīng)用的無痛遷移。
在GPGPU領(lǐng)域,NVIDIA無疑是行業(yè)的標桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領(lǐng)先優(yōu)勢,再考慮到產(chǎn)業(yè)生態(tài),國產(chǎn)GPGPU替代還有很長的路要走。在NVIDIA官網(wǎng)有提到,AI應(yīng)用不僅需要大的內(nèi)存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進行高效并行處理,CPU的優(yōu)勢是處理復(fù)雜邏輯流程。CPU和GPU在一個芯片上是可以實現(xiàn)的,而且以前也存在這種整合性的產(chǎn)品,但是對于高端的、云端的CPU加上GPU同時實現(xiàn),需要非常大的尺寸規(guī)模,而且會限制芯片在各自領(lǐng)域的性價比。
天數(shù)智芯的下一步
艾瑞咨詢此前在相關(guān)報告中指出,2020年中國人工智能基礎(chǔ)層市場規(guī)模為497億元,為AI產(chǎn)業(yè)總規(guī)模的33%,AI芯片的高增長是產(chǎn)業(yè)規(guī)模增長的主要推動力。未來,算力模塊的智能服務(wù)器國產(chǎn)化率將逐步提升。毫無疑問,云端訓(xùn)練在未來很長一段時間內(nèi)仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術(shù)的持續(xù)發(fā)展與應(yīng)用落地,端側(cè)及邊緣側(cè)未來對算力性能的要求會越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數(shù)智芯的產(chǎn)品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領(lǐng)域的高通用性及更廣闊的應(yīng)用領(lǐng)域。天數(shù)智芯始終以市場需求為導(dǎo)向,結(jié)合公司技術(shù)優(yōu)勢,關(guān)注客戶需求痛點并推出適合的GPGPU產(chǎn)品。隨著城市數(shù)字化轉(zhuǎn)型,傳統(tǒng)行業(yè)智能化轉(zhuǎn)型升級需求逐漸擴大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應(yīng)用領(lǐng)域?qū)Ω叨薌PGPU芯片產(chǎn)品的需求量都在急劇增加?!?br />
2021年3月1日,天數(shù)智芯對外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重。“天數(shù)智芯目前已經(jīng)擁有了一支全球頂尖的數(shù)字集成電路設(shè)計與基礎(chǔ)軟件設(shè)計科學(xué)家團隊,為實現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。這支完整的GPGPU研發(fā)團隊,由公司聯(lián)合創(chuàng)始人、高級副總裁及首席科學(xué)家鄭金山先生帶領(lǐng),占比公司總?cè)藬?shù)85%以上,這其中既有一批行業(yè)經(jīng)驗超過20年的世界級技術(shù)專家,也有一大批擁有5-15年業(yè)界經(jīng)驗的高執(zhí)行力技術(shù)菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業(yè)務(wù)發(fā)展,我們將會持續(xù)不斷地吸納優(yōu)秀人才深耕國產(chǎn)GPGPU芯片設(shè)計。隨著新產(chǎn)品的推出,團隊也將進一步擴大。另外,根據(jù)我們產(chǎn)品規(guī)劃和市場發(fā)展需要,天數(shù)智芯也會進一步通過融資支持公司的長遠發(fā)展?!?br />
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
軟件
+關(guān)注
關(guān)注
69文章
4699瀏覽量
87088 -
天數(shù)智芯
+關(guān)注
關(guān)注
0文章
94瀏覽量
5514 -
GPGPU
+關(guān)注
關(guān)注
0文章
28瀏覽量
4879
發(fā)布評論請先 登錄
相關(guān)推薦
CPU\GPU引領(lǐng),國產(chǎn)AI PC進階
電子發(fā)燒友網(wǎng)報道(文/黃晶晶)當前AI PC已經(jīng)成為PC產(chǎn)業(yè)的下一個浪潮,國產(chǎn)CPU、GPU廠商在PC市場一直處于追趕態(tài)勢,AI PC給了大家新的機遇,在這個賽道國產(chǎn)廠商加速了布局與滲透。 首款國產(chǎn)
國內(nèi)板對板連接器行情:國產(chǎn)連接器的發(fā)展之路與現(xiàn)狀
和物聯(lián)網(wǎng)設(shè)備等新興領(lǐng)域展現(xiàn)出了不可或缺的作用。在國內(nèi),板對板連接器的國產(chǎn)替代趨勢愈發(fā)明顯,這一趨勢的背后是市場需求的變化、技術(shù)的進步以及政策的支持。 國產(chǎn)連接器發(fā)展的不容易 國產(chǎn)連接器的發(fā)展之
龍芯中科首款GPGPU芯片9A1000計劃明年流片
龍芯中科在GPU領(lǐng)域邁出了堅實步伐,其首款集成自研GPGPU核心的2K3000芯片已在上半年成功交付流片,標志著龍芯在終端應(yīng)用市場的深入探索。更令人矚目的是,其首款GPGPU芯片9A1000計劃于今
國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實的破局之路
國產(chǎn)芯片原廠的出路:從風(fēng)潮到現(xiàn)實的破局之路
國產(chǎn)FPGA的發(fā)展前景是什么?
,提升產(chǎn)品性能和技術(shù)水平。通過與國際巨頭的合作與競爭,國產(chǎn)FPGA在容量、制程、性能等方面逐步縮小與國際先進水平的差距。
技術(shù)創(chuàng)新:國產(chǎn)FPGA廠商積極探索新技術(shù)、新應(yīng)用,如SoC FPGA(系統(tǒng)級可編程
發(fā)表于 07-29 17:04
大國質(zhì)造——匠心礪技,解讀深視智能從國產(chǎn)替代到行業(yè)領(lǐng)先的傳感器發(fā)展之路
大國質(zhì)造——匠心礪技,解讀深視智能從國產(chǎn)替代到行業(yè)領(lǐng)先的傳感器發(fā)展之路
商湯科技采購40000顆英偉達芯片,縮小中美算力差距
徐冰認為,國產(chǎn)芯片崛起以及算力商品化帶來的投資價值,使中美算力差距有望逐步縮小。只要中國持續(xù)在算力研發(fā)上投入資金及資源,便能拉近與美國的算力差距。
開源芯片系列講座第20期:基于RISC-V向量擴展的開源GPGPU軟硬件設(shè)計
在當前國際科技競爭日益激烈的情勢下,我國急需要建立一個采用開源指令集GPGPU架構(gòu),構(gòu)建起統(tǒng)一的軟硬件生態(tài)。相關(guān)參與方共同努力,共同建設(shè)起我國自主可控的GPGPU產(chǎn)業(yè),服務(wù)于我國電子信息核心關(guān)鍵產(chǎn)業(yè)。
從杰發(fā)科技AutoChips AC8015看國產(chǎn)汽車芯片突圍之路
原標題:從杰發(fā)科技AutoChips AC8015看國產(chǎn)汽車芯片突圍之路 來源:Gartner 長期以來,中國汽車芯片一直依賴恩智浦、英飛凌、瑞薩、德州儀器等國際大廠,進口比例高達90%以上。根據(jù)
RK3568驅(qū)動指南|驅(qū)動基礎(chǔ)進階篇-進階5 自定義實現(xiàn)insmod命令實驗
RK3568驅(qū)動指南|驅(qū)動基礎(chǔ)進階篇-進階5 自定義實現(xiàn)insmod命令實驗
RK3568驅(qū)動指南|驅(qū)動基礎(chǔ)進階篇-進階8 內(nèi)核運行ko文件總結(jié)
RK3568驅(qū)動指南|驅(qū)動基礎(chǔ)進階篇-進階8 內(nèi)核運行ko文件總結(jié)
以龍芯、鯤鵬、海光為例,談國產(chǎn)芯片的進階發(fā)展
現(xiàn)如今,國內(nèi)芯片產(chǎn)業(yè)發(fā)展進入深水期,“從無到有”的任務(wù)已經(jīng)順利完成,正在邁入“由弱到強”的進階發(fā)展。以龍芯、鯤鵬、海光等國產(chǎn)CPU六強為例,都在引進技術(shù)的基礎(chǔ)上,成功實現(xiàn)了不同程度的突破,并都在各自
從圖形到通用計算:GPGPU技術(shù)的進化之路
在當今的計算世界中,GPGPU(General-Purpose computing on Graphics Processing Units)已成為一種重要的技術(shù)概念。它與傳統(tǒng)的圖形處理單元(GPU
評論