0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI、游戲與通用計(jì)算,國產(chǎn)GPU的定位

lPCU_elecfans ? 來源:未知 ? 2022-11-11 07:35 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從去年國產(chǎn)GPU開始陸續(xù)冒尖后,今年各大廠商的動作明顯更大了一些,新品頻繁面世。但從這些新品的規(guī)格和技術(shù)來看,其實(shí)每家公司對于自己GPU產(chǎn)品的定位都是不同的,我們就選幾家國產(chǎn)GPU廠商來分析一下他們的產(chǎn)品定位以及未來技術(shù)趨勢。

摩爾線程

作為近期剛發(fā)布了新品的國產(chǎn)GPU廠商,摩爾線程確實(shí)收獲了不少關(guān)注,他們最新的顯卡MTT S80也一度成了熱點(diǎn)話題。MTT S80作為一張游戲顯卡,搭載了MT-春曉芯片核心,功耗最高250W,單精度浮點(diǎn)算力高達(dá)14.4TFLOPS。

不僅如此,MTT S80也是業(yè)內(nèi)首個PCIe 5.0的顯卡,支持雙向128GB/s的傳輸帶寬。更重要的是,哪怕標(biāo)榜的是游戲顯卡,MTT S80依然支持3D圖形渲染、智能多媒體、物理仿真及科學(xué)計(jì)算和AI計(jì)算加速的全功能應(yīng)用。

MTT S3000 / 摩爾線程

除了MTT S80以外,春曉這一芯片也為摩爾線程帶來了面向服務(wù)器GPU市場的新產(chǎn)品,MTT S3000。單從芯片規(guī)格上來看,MTT S3000與MTT S80都用的是完整的MT-春曉芯片,都內(nèi)置了4096個MUSA流處理單元,但前者將主頻提高到了1.9GHz,F(xiàn)P32也因此提升到了15.2TFLOPS。

為了讓MTT S3000更適用于服務(wù)器市場,摩爾線程也將其顯存提升至了32GB,并增加了對虛擬化的支持,可對GPU彈性切分,MTT S3000也從MTT S80的主動散熱改為了被動散熱。

到了AI上,摩爾線程的MUSA架構(gòu)和軟件棧為MTT S3000提供了訓(xùn)推一體的支持。除了訓(xùn)練支持TensorFlow、PyTorch、飛槳等常見框架外,摩爾線程還在推理上打造了自研AI推理引擎TensorX,甚至推出了兼容CUDA源碼的方案。

可以看出,摩爾線程不僅已經(jīng)在游戲GPU市場有了彌足珍貴的進(jìn)展,同樣想在服務(wù)器市場實(shí)現(xiàn)突破,甚至是通過兼容CUDA來吸引更多的客戶,這其實(shí)也是英偉達(dá)這樣的GPU巨頭主攻的兩大方向。但兼容或?qū)?biāo)CUDA一法,AMD、英特爾這樣的國際大廠也都在推進(jìn),卻也都是各自為戰(zhàn),考慮到其中涉及的開發(fā)投入和難度之大,或許在軟件生態(tài)上走合作之路會更適合。

芯動科技

在使用GPU這類產(chǎn)品的過程中,支持不同的圖形與計(jì)算API對于開發(fā)者來說尤為重要。而芯動科技的風(fēng)華GPU在這API上的支持尤為亮眼,目前已經(jīng)完美支持到OpenGL 4.3、OpenGL ES 3.2、Vulkan 1.2和OpenCL 3.0,這也為風(fēng)華GPU的開發(fā)生態(tài)奠定了基礎(chǔ)。

芯動高性能接口IP / 芯動科技

雖然其產(chǎn)品性能本身已經(jīng)足夠亮眼,但風(fēng)華GPU真正最大的優(yōu)勢在于芯動自研高性能接口IP上,包括高帶寬內(nèi)存(GDDR6x、HBM3)、高速SerDes(PCIe 5.0、CXL 2.0)和高清多媒體(HDMI 2.1、eDP 1.4)等等,同時這些IP也實(shí)現(xiàn)了對先進(jìn)工藝的覆蓋。而且芯動科技已經(jīng)在最近推出了跨工藝、跨封裝的Chiplet互聯(lián)解決方案Innolink Chiplet,同時兼容UCIe Chiplet。

對于高性能GPU來說,如果說核心IP決定了性能上限的話,那么這些接口IP就決定了GPU能發(fā)揮出多少實(shí)力,以及是否能在未來的服務(wù)器市場大放異彩。目前看來,風(fēng)華2號的定位是一款低功耗的GPU產(chǎn)品,更適合用于智能座艙之類的應(yīng)用中,而風(fēng)華1號則是面向服務(wù)器市場,尤其是像云游戲、云手機(jī)之類的場景。

可從規(guī)格來看,這兩款一年以內(nèi)發(fā)布的產(chǎn)品其實(shí)都還沒有用到PCIe 5.0之類的新接口技術(shù)。芯動科技已經(jīng)在8月公開表示,風(fēng)華3號也已經(jīng)基本完成研發(fā),還支持光線追蹤技術(shù),據(jù)了解該產(chǎn)品和風(fēng)華1號一樣也是面向服務(wù)器/數(shù)據(jù)中心市場的,但或許還是會側(cè)重在云游戲等商用場景上,相信我們會在未來的發(fā)布上看到風(fēng)華3號更強(qiáng)大的性能表現(xiàn)。

壁仞科技

雖然壁仞科技最近遇上了一些麻煩,但不可否認(rèn)的是,其BR100系列通用GPU芯片確實(shí)在性能上達(dá)到了極高的水準(zhǔn)。與上面提到的兩個GPU不同,BR100雖然是通用計(jì)算GPU,但明顯更適合于AI和科學(xué)計(jì)算這樣的高性能計(jì)算場景,所以BR100并沒有去做DirectX和Vulkan這樣的圖形API支持。

這點(diǎn)從BR100的芯片設(shè)計(jì)上也能看出,單個BR100由16個流處理簇構(gòu)成,每個都采用了16個執(zhí)行單元的設(shè)計(jì),而每個執(zhí)行單元包含16個流處理核心(V-core)和一個向量引擎(T-Core)。V-Core作為SIMT處理器,支持到FP32、FP16、INT32、INT16,用于通用計(jì)算。

而T-core在SPC級別的2.5D GEMM架構(gòu)下,可以極大加速常見的AI運(yùn)算,諸如MMA矩陣乘加和卷積等。T-Core不僅支持FP32、TF32這些主流數(shù)據(jù)精度外,還原創(chuàng)定義了TF32+數(shù)據(jù)精度,相較TF32在實(shí)現(xiàn)更高精度的同時,也提高了吞吐性能。

從軟件平臺上看,壁仞科技的BIRENSUPA不僅支持PyTorch之類的主流框架,也有壁仞自研的推理加速引擎。從BIRENSUPA平臺框圖中的應(yīng)用定位來看,壁仞科技的主要發(fā)力方向看來還是多媒體、自動駕駛推薦系統(tǒng)等重AI的場景。

壁仞100P OAM模組 / 壁仞科技

壁仞科技也是在一眾國產(chǎn)PCIe產(chǎn)品中,唯一推出了OAM模組的廠商,壁仞科技也和浪潮合作推出了“海玄”這種OAM服務(wù)器,實(shí)現(xiàn)了8PFLLOPS的峰值算力。不過也正是因?yàn)閷?shí)現(xiàn)了如此高的性能,似乎招致了一些惡意阻礙,但這也恰恰說明了他們走的方向是對的,如果他們能走出這一困境的話,無疑能在服務(wù)器市場大有作為。


聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。

更多熱點(diǎn)文章閱讀
  • 董明珠:格力為特斯拉供應(yīng)底盤裝備,白電企業(yè)對“造車”達(dá)成共識?
  • 俄羅斯生產(chǎn)首顆純國產(chǎn)通信衛(wèi)星!俄衛(wèi)星實(shí)力有多強(qiáng)?
  • 歐盟統(tǒng)一充電接口!蘋果:確定改用USB-C!
  • Marvell大幅裁撤中國研發(fā)團(tuán)隊(duì),但另一市場正加大在華投資
  • 警惕!德州儀器:芯片需求疲軟,正從消費(fèi)電子蔓延至工業(yè)領(lǐng)域!


原文標(biāo)題:AI、游戲與通用計(jì)算,國產(chǎn)GPU的定位

文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:AI、游戲與通用計(jì)算,國產(chǎn)GPU的定位

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    CPU\GPU引領(lǐng),國產(chǎn)AI PC進(jìn)階

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前AI PC已經(jīng)成為PC產(chǎn)業(yè)的下一個浪潮,國產(chǎn)CPU、GPU廠商在PC市場一直處于追趕態(tài)勢,AI PC給了大家新的機(jī)遇,在這個賽道
    的頭像 發(fā)表于 09-01 02:15 ?4948次閱讀
    CPU\<b class='flag-5'>GPU</b>引領(lǐng),<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>AI</b> PC進(jìn)階

    GPU加速計(jì)算平臺是什么

    GPU加速計(jì)算平臺,簡而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜
    的頭像 發(fā)表于 10-25 09:23 ?194次閱讀

    新的Arm GPU助力釋放消費(fèi)電子設(shè)備市場中的游戲AI創(chuàng)新潛能

    作為人們?nèi)粘?shù)字生活中不可或缺的一部分,Arm GPU 賦能了從當(dāng)今智能手機(jī)上的沉浸式游戲,到各類邊緣側(cè)人工智能 (AI) 體驗(yàn)的方方面面。
    的頭像 發(fā)表于 05-30 11:47 ?657次閱讀
    新的Arm <b class='flag-5'>GPU</b>助力釋放消費(fèi)電子設(shè)備市場中的<b class='flag-5'>游戲</b>和<b class='flag-5'>AI</b>創(chuàng)新潛能

    為什么跑AI往往用GPU而不是CPU?

    GPU的能力,并且支持的GPU數(shù)量越多,就代表其AI性能越強(qiáng)大。那么問題來了,為什么是GPU而不是CPU?GPU難道不是我們?nèi)粘J褂玫碾娔X里
    的頭像 發(fā)表于 04-24 08:27 ?1743次閱讀
    為什么跑<b class='flag-5'>AI</b>往往用<b class='flag-5'>GPU</b>而不是CPU?

    國產(chǎn)GPUAI大模型領(lǐng)域的應(yīng)用案例一覽

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近一年多時間,隨著大模型的發(fā)展,GPUAI領(lǐng)域的重要性再次凸顯。雖然相比英偉達(dá)等國際大廠,國產(chǎn)GPU起步較晚、聲勢較小。不過近幾年,國內(nèi)不少
    的頭像 發(fā)表于 04-01 09:28 ?3647次閱讀
    <b class='flag-5'>國產(chǎn)</b><b class='flag-5'>GPU</b>在<b class='flag-5'>AI</b>大模型領(lǐng)域的應(yīng)用案例一覽

    盤點(diǎn)國產(chǎn)GPU在支持大模型應(yīng)用方面的進(jìn)展

    ,近些年國內(nèi)也有不少GPU企業(yè)在逐步成長,雖然在大模型的訓(xùn)練和推理方面,與英偉達(dá)GPU差距極大,但是不可忽視的是,不少國產(chǎn)GPU企業(yè)也在AI
    的頭像 發(fā)表于 03-29 00:27 ?5927次閱讀
    盤點(diǎn)<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>GPU</b>在支持大模型應(yīng)用方面的進(jìn)展

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    基礎(chǔ)設(shè)施,人們?nèi)匀粵]有定論。如果 Mipsology 成功完成了研究實(shí)驗(yàn),許多正受 GPU 折磨的 AI 開發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此
    發(fā)表于 03-21 15:19

    硅光計(jì)算芯片:AI芯片國產(chǎn)化的關(guān)鍵突破口

    大模型訓(xùn)練和推理的硬件以通用圖形處理單元(GPU)為主,2022年全球GPU市場規(guī)模達(dá)到448.3億美元,美國AI芯片巨頭英偉達(dá)公司占有80%的市場份額并仍在持續(xù)攀升。
    發(fā)表于 01-19 14:12 ?4312次閱讀
    硅光<b class='flag-5'>計(jì)算</b>芯片:<b class='flag-5'>AI</b>芯片<b class='flag-5'>國產(chǎn)</b>化的關(guān)鍵突破口

    GPU技術(shù)、生態(tài)及算力分析

    對比AMD從2013年開始建設(shè)GPU生態(tài),近10年時間后用于通用計(jì)算的ROCm開放式軟件平臺才逐步有影響力,且還是在兼容CUDA的基礎(chǔ)上。因此我們認(rèn)為國內(nèi)廠商在軟件和生態(tài)層面與英偉達(dá)CUDA生態(tài)的差距較計(jì)算性能更為明顯。
    的頭像 發(fā)表于 01-14 10:06 ?1157次閱讀
    <b class='flag-5'>GPU</b>技術(shù)、生態(tài)及算力分析

    如何能夠?qū)崿F(xiàn)通用FPGA問題?

    FPGA 是一種偽通用計(jì)算加速器,與 GPGPU(通用 GPU)類似,F(xiàn)PGA 可以很好地卸載特定類型的計(jì)算。從編程角度上講,F(xiàn)PGA 比 CPU 更難,但從工作負(fù)載角度上講 FPGA
    發(fā)表于 12-29 10:29 ?403次閱讀

    什么是第三代通用計(jì)算?既通用又高性能的計(jì)算存在嗎?

    對大芯片來說,通用是成功的必由之路。CPU是通用芯片,成就了Intel的成功;GPU通用芯片,成就了NVIDIA的成功。目前,還沒有看到做專用芯片非常成功的案例。
    發(fā)表于 12-12 10:16 ?650次閱讀
    什么是第三代<b class='flag-5'>通用計(jì)算</b>?既<b class='flag-5'>通用</b>又高性能的<b class='flag-5'>計(jì)算</b>存在嗎?

    英偉達(dá)用AI設(shè)計(jì)GPU算術(shù)電路有何優(yōu)勢

    大量的算術(shù)電路陣列為英偉達(dá)GPU提供了動力,以實(shí)現(xiàn)前所未有的AI、高性能計(jì)算計(jì)算機(jī)圖形加速。因此,改進(jìn)這些算術(shù)電路的設(shè)計(jì)對于提升 GPU
    發(fā)表于 12-05 11:05 ?393次閱讀

    ASIC和GPU,誰才是AI計(jì)算的最優(yōu)解?

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI計(jì)算開始有著風(fēng)頭蓋過通用計(jì)算開始,不少芯片廠商都將其視為下一輪技術(shù)革新。CPU、GPU、FPGA和ASIC紛紛投入到這輪
    的頭像 發(fā)表于 12-03 08:31 ?2001次閱讀
    ASIC和<b class='flag-5'>GPU</b>,誰才是<b class='flag-5'>AI</b><b class='flag-5'>計(jì)算</b>的最優(yōu)解?

    從圖形到通用計(jì)算:GPGPU技術(shù)的進(jìn)化之路

    在當(dāng)今的計(jì)算世界中,GPGPU(General-Purpose computing on Graphics Processing Units)已成為一種重要的技術(shù)概念。它與傳統(tǒng)的圖形處理單元(GPU
    的頭像 發(fā)表于 12-01 12:55 ?1029次閱讀
    從圖形到<b class='flag-5'>通用計(jì)算</b>:GPGPU技術(shù)的進(jìn)化之路

    AMD游戲GPU架構(gòu)的優(yōu)勢分析

    目前AMD的GPU 分為兩個截然不同的產(chǎn)品領(lǐng)域,一個是針對游戲的,另一個是用于超級計(jì)算機(jī)、大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)系統(tǒng)的。
    發(fā)表于 11-19 12:21 ?625次閱讀
    AMD<b class='flag-5'>游戲</b><b class='flag-5'>GPU</b>架構(gòu)的優(yōu)勢分析