0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是GPU及其分類?GPU如何演化為通用計(jì)算平臺(tái)?

Linux閱碼場(chǎng) ? 來源:GPU and Computing ? 作者:GPU and Computing ? 2021-06-15 10:37 ? 次閱讀

在前面文章中,我們交代了計(jì)算平臺(tái)相關(guān)的一些基本概念以及為什么以GPU為代表的專門計(jì)算平臺(tái)能夠取代CPU成為大規(guī)模并行計(jì)算的主要力量。在接下來的文章中,我們會(huì)近距離從軟硬件協(xié)同角度討論GPU計(jì)算如何開展。跟先前的文章類似,筆者會(huì)采用自上而下,從抽象到具體的方式來論述。希望讀者不只是對(duì)GPU計(jì)算能有所理解,而且能夠從中了解可以遷移到其它計(jì)算平臺(tái)的知識(shí),此是筆者之愿景,能否實(shí)現(xiàn)一二,還懇請(qǐng)各位看官不斷反饋指正,歡迎大家在后臺(tái)留言交流。在本文中,我們首先介紹下GPU及其分類,并簡(jiǎn)單回顧下GPU繪制流水線的運(yùn)作,最后又如何演化為通用計(jì)算平臺(tái)。

一,什么是GPU及其分類

按維基百科定義,GPU(Graphics Processing Unit,圖形處理器)是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上運(yùn)行繪圖運(yùn)算工作的微處理器。為了以后討論方便,這里先給市面的GPU按配置大致做個(gè)分類,分類之間界限比較模糊,不一定完全準(zhǔn)確。

獨(dú)立GPU(Discrete GPU),或者獨(dú)立顯卡。是指GPU通過PCI Express或者早期的AGP、PCI等擴(kuò)展接口與主板連接。所謂的“獨(dú)立”即是指顯卡內(nèi)的RAM只會(huì)被該GPU專用,而不是指顯卡是否可從主板上移除。由于尺寸和重量的限制,供筆記本電腦使用的獨(dú)立GPU通常會(huì)通過非標(biāo)準(zhǔn)的接口作連接,然而由于邏輯接口相同,這些接口仍會(huì)被視為PCIE,即使在物理上它們是不可與其他顯卡互換。一些專門的GPU互聯(lián)技術(shù),如NVIDIA的SLI、NVLink和AMD的CrossFire等允許多個(gè)獨(dú)立GPU協(xié)同工作,可顯著增強(qiáng)設(shè)備的圖形處理能力。獨(dú)立GPU價(jià)格高,體積大,功耗高,但性能更強(qiáng)勁,而且因?yàn)樽詭э@存,消耗的系統(tǒng)資源也更少。

poYBAGDIFBaAD9kXAACdmyzLWsk142.jpg

集成GPU(Integrated GPU), 或者集成顯卡。是集成在主板或CPU上的GPU,運(yùn)行時(shí)會(huì)占用部分的系統(tǒng)內(nèi)存,相比起使用獨(dú)立顯卡的方案,這種方案較為便宜,但性能也相對(duì)較低。從2009年開始,集成GPU已經(jīng)從主板移至CPU了,Intel將之稱為HD Graphics(核芯顯卡),AMD也推出了集成了CPU和GPU的APU。將GPU集成至處理器的好處是可以降低功耗,提升性能。隨著技術(shù)的成熟,目前的集成GPU已經(jīng)足夠應(yīng)付基本3D的需求,不過由于仍然依賴主板本身的RAM,相比獨(dú)立顯卡,訪存帶寬始終是個(gè)不小的限制。

poYBAGDIFDaABYpSAAB-PiGJoeQ717.jpg

移動(dòng)GPU(Mobile GPU)。在移動(dòng)設(shè)備領(lǐng)域,隨著手機(jī)以及平板電腦等設(shè)備對(duì)圖形處理能力的需求越來越高,GPU也成為移動(dòng)處理器(SoC)的標(biāo)配,高通、Imagination和ARM等等都在這個(gè)領(lǐng)域大顯身手。我們?cè)谝郧暗奈恼绿岬竭^,蘋果拋棄Imagination的PowerVR IP,在新近的產(chǎn)品采用自研GPU,也成為一股不可忽視的力量。因?yàn)橐苿?dòng)設(shè)備散熱和電

供電的限制,功耗是GPU設(shè)計(jì)首要考慮的問題,所以移動(dòng)GPU相比其它GPU架構(gòu)方面會(huì)有不小差異。

以后談到GPU計(jì)算的時(shí)候,我們主要還是以高性能為訴求。所以如果上下文沒有特別說明,我們一般都是針對(duì)獨(dú)立GPU。

二,GPU繪制流水線

在這節(jié)我們會(huì)簡(jiǎn)單的介紹GPU的繪制流水線(Rendering Pipeline),GPU就是為圖形繪制加速而生,知道它的來龍去脈,有助于我們理解在其基礎(chǔ)之上衍生的GPGPU。GPU繪制的過程,類似我們生活中拍照和寫生,是有關(guān)如何把三維空間的場(chǎng)景在二維的屏幕上能盡量真實(shí)的呈現(xiàn)出來。我們以寫生來做譬喻,針對(duì)特定場(chǎng)景輸入,擇一視點(diǎn),取景構(gòu)圖,按照透視比例通過點(diǎn)線面勾勒出物體的邊界和輪廓,確定明暗色調(diào),注意遠(yuǎn)近關(guān)系多層次描繪。

與采用畫筆、相機(jī)等工具不同,3D圖形程序通過調(diào)用OpenGL(ES)、Direct3D或者Vulcan API的接口函數(shù)來同GPU硬件交互。為方便論述又不失代表性,下圖是一個(gè)相對(duì)目前GPU簡(jiǎn)化的繪制管線,基本上相當(dāng)于OpenGL(ES) 2.0或者Direct3D 9.0的規(guī)格,繪制管線主要有以下步驟構(gòu)成。值得注意的是,管線分為可編程單元以及固定功能(fixed function)單元,后者優(yōu)化處理管線中不容易并行化的工作,顯然各種Shader都在可編程單元執(zhí)行。

pYYBAGDIFECANH7EAAEECgnMG4A704.jpg

頂點(diǎn)數(shù)據(jù)輸入。3D程序需要的三維場(chǎng)景可以通過3ds Max、Maya等專業(yè)軟件來建模,生成的模型可以有成千上萬個(gè)三角面片網(wǎng)格構(gòu)成,其中不僅規(guī)定頂點(diǎn)的位置、顏色、紋理坐標(biāo)和法向量等等屬性也包括它們之間的連接信息。模型導(dǎo)入3D程序以后,就可以成為3D程序的頂點(diǎn)數(shù)據(jù)流,頂點(diǎn)數(shù)據(jù)為為后面的Vertex Shader等階段提供待處理的數(shù)據(jù)。

Vertex Shader(頂點(diǎn)著色器)。Vertex Shader的主要功能是對(duì)頂點(diǎn)屬性進(jìn)行變換,包括頂點(diǎn)位置的坐標(biāo)轉(zhuǎn)換,從局部坐標(biāo)統(tǒng)一到世界坐標(biāo)并切換到視點(diǎn)坐標(biāo)以至裁剪坐標(biāo)。以前也在Vertex Shader進(jìn)行光照顏色計(jì)算,但是由于不夠真實(shí),目前一般移到Fragment Shader階段才發(fā)生。Vertex Shader的輸入輸出都是頂點(diǎn)。

Primitive Setup(圖元裝配)和Rasterization(光柵化)。圖元裝配是將變換后的的頂點(diǎn)根據(jù)連接信息組裝成指定的圖元。圖元裝配階段會(huì)進(jìn)行裁剪(clip)和背面剔除(backface culling)相關(guān)的優(yōu)化,可以減少不必要的工作量。另外還需要透視除法(Perspective Division)達(dá)到透視效果,然后通過視口變化(Viewport Transformation)最終得到頂點(diǎn)的屏幕坐標(biāo)。在光柵化階段,基本圖元被轉(zhuǎn)換為一組二維的片元(fragment),片元表示將來可以被渲染到屏幕上的像素,它包含有位置,顏色,紋理坐標(biāo)等信息,這些屬性是由圖元的相關(guān)頂點(diǎn)信息進(jìn)行插值計(jì)算得到的。這些片元接著被送到Fragment Shader處理。

Fragment Shader(片元著色器)。片元著色器用來決定屏幕上潛在像素的最終顏色。在這個(gè)階段會(huì)依據(jù)紋理坐標(biāo)進(jìn)行紋理采樣、計(jì)算光照以及處理陰影等等,是繪制管線產(chǎn)生高級(jí)效果所在。

測(cè)試合成。測(cè)試合成是繪制管線的最后一個(gè)步驟。主要測(cè)試有裁剪測(cè)試(Scissor Test)、模板測(cè)試(Stencil Test)以及深度測(cè)試(Depth Test),深度測(cè)試就是確認(rèn)進(jìn)入的片元有沒有被Framebuffer(幀緩存)同樣位置的像素遮擋。通過最終測(cè)試的片元會(huì)進(jìn)入合成階段,就是進(jìn)入的片元和Framebuffer已有的像素進(jìn)行混合,根據(jù)顏色的Alpha值取代現(xiàn)有像素或混合產(chǎn)生半透明的效果。Alpha表示的是物體的透明度。測(cè)試合成階段不是可編程的,但是我們依舊可以通過3D API提供的接口函數(shù)進(jìn)行動(dòng)態(tài)配置,并進(jìn)一步定制測(cè)試和混合的方式。

poYBAGDIFEeAE_paAAB8TWEFoU0070.jpg

上面的步驟針對(duì)接口函數(shù)其中一個(gè)繪制命令,而一幀畫面一般需要很多個(gè)繪制命令才能完成,等一幀內(nèi)容結(jié)束以后,該Framebuffer就會(huì)作為新的Front Buffer交由顯示設(shè)備顯示,而先前顯示的Front Buffer會(huì)變成Back Buffer又開始下一幀的繪制之旅。這就是GPU的雙緩存(Double Buffering)策略。在上層應(yīng)用程序可以通過3D API的接口函數(shù)調(diào)用GPU功能,在底層GPU驅(qū)動(dòng)將這些接口函數(shù)轉(zhuǎn)化為各種GPU私有的命令執(zhí)行,它們可以完成繪制,狀態(tài)寄存器設(shè)置以及同步等任務(wù)。CPU和GPU通過Ring Buffer(環(huán)形緩存)來傳遞和接受這些命令,CPU承擔(dān)Ring Buffer生產(chǎn)者的角色,而GPU扮演消費(fèi)者的角色,因?yàn)镽ing Buffer大小有限,CPU和GPU需要同步。如果CPU老是要等GPU,我們說這個(gè)程序是GPU Bound,我們可能需要去優(yōu)化Shader程序,減少三角面片數(shù)量來提高性能。相反如果GPU老是要等CPU,我們就認(rèn)定這個(gè)程序是CPU Bound, 應(yīng)用程序可以考慮把一些CPU預(yù)處理移交給GPU解決,比如利用GPU繪制管線支持的Geometry Shader(幾何著色器)和Tessellation Shaders(細(xì)分曲面著色器)來生成額外頂點(diǎn)和圖元,而不是等待CPU輸入等等。

poYBAGDIFE-AZouDAABFieMF1x4289.jpg

三,GPU計(jì)算的演進(jìn)之旅

隨著真實(shí)感繪制進(jìn)一步發(fā)展,對(duì)圖形性能要求愈來愈高,GPU發(fā)展出前所未有的浮點(diǎn)計(jì)算能力以及可編程性。這種遠(yuǎn)超CPU的計(jì)算吞吐和內(nèi)存帶寬使得GPU不只是在圖形領(lǐng)域獨(dú)領(lǐng)風(fēng)騷,也開始涉足其它非圖形并行計(jì)算應(yīng)用。最早通過使用3D API OpenGL或者DirectX接口函數(shù),很多數(shù)據(jù)并行算法被移植到GPU,性能也獲得很好提升,但是這種利用模式面臨不少問題,下面具體看看一步步是如何解決的。

CUDA的發(fā)明。之前的GPGPU實(shí)現(xiàn)需要并行算法程序員很熟悉圖形API和GPU硬件,算法輸入輸出需要定義為圖形繪制的元素,比如頂點(diǎn)坐標(biāo),紋理,幀緩存等,而實(shí)際算法又必須著用著色程序(Shader Program)來表達(dá),極大增加了通用并行算法在GPU上移植開發(fā)的復(fù)雜度,另外受限圖形API的表達(dá)能力,很多并行問題沒辦法有效發(fā)揮GPU的潛力。2006年,Nvidia破天荒地推出CUDA,作為GPU通用計(jì)算的軟件平臺(tái)和編程模型,它將GPU視為一個(gè)數(shù)據(jù)并行計(jì)算的設(shè)備,可以對(duì)所進(jìn)行的計(jì)算分配和管理。在CUDA框架中,這些計(jì)算不像過去那樣必須映射到圖形API,因此對(duì)于開發(fā)者來說,基于CUDA的開發(fā)門檻大大降低了。CUDA編程語言基于標(biāo)準(zhǔn)的C語言,一般用戶也很容易上手開發(fā)CUDA的應(yīng)用程序。

統(tǒng)一可編程單元。早些時(shí)候的GPU繪制管線都是固定功能的,不存在可編程部分。后來出現(xiàn)了可編程的Vertex和Fragment處理,極大地豐富了繪制效果,但是Vetex和Fragment的處理單元還是分離的,很容易造成負(fù)載不均衡,性能的伸縮性也不好。伴隨著Direct3D 10(Shader Model 4.0)出現(xiàn),GPU開始用統(tǒng)一的處理單元運(yùn)行Vertex、Fragment以及Geomerty Shader。對(duì)通用并行計(jì)算而言,配合CUDA框架,只要增加GPU可編程處理器數(shù)量配置,這種統(tǒng)一處理方式就能夠最大限度地?cái)U(kuò)展性能,影響非常深遠(yuǎn)。

浮點(diǎn)計(jì)算的標(biāo)準(zhǔn)化。GPU的可編程處理單元是面向浮點(diǎn)運(yùn)算,但是浮點(diǎn)數(shù)的支持之前幾乎每個(gè)GPU廠商都有自己的解決方案,精度、舍入的處理都不一致,導(dǎo)致計(jì)算的準(zhǔn)確度存在明顯差異。比如繪制管線傾向于把溢出(overflow),下溢(underflow)和非規(guī)格化浮點(diǎn)數(shù)(denorms)截?cái)酁榭杀硎居幸饬x的最大值或者最小值?,F(xiàn)在GPU增加了對(duì)特殊數(shù)值(Special Values)Infinity和NaN的支持,計(jì)算過程的精度和準(zhǔn)確度也向IEEE 754標(biāo)準(zhǔn)要求靠攏,比如下圖演示的FMA。浮點(diǎn)計(jì)算除支持半精度和單精度以外,雙精度的支持也不可或缺。另外除了浮點(diǎn)數(shù),GPU也開始支持各種各樣的整形運(yùn)算。這些數(shù)據(jù)類型的支持對(duì)GPU通用計(jì)算的重要意義不言而喻。

隨機(jī)存取數(shù)據(jù)。傳統(tǒng)的GPU架構(gòu)只有非常有限的尋址能力,如通過提供紋理坐標(biāo)給紋理處理單元讀取紋理數(shù)據(jù),F(xiàn)ragment Shader把像素最終的顏色值輸出到對(duì)應(yīng)的幀緩存位置,這些讀寫過程用戶沒有辦法顯式控制,非常限制通用計(jì)算的數(shù)據(jù)交互能力?,F(xiàn)在的的GPU增加了額外的存取單元,在指令集中增加統(tǒng)一尋址存取指令,很大程度拓展了GPU通用計(jì)算應(yīng)用空間。

存儲(chǔ)支持ECC。隨著制程工藝不斷進(jìn)步,器件尺寸縮小,DRAM和SRAM的永久性故障(Hard Error)和瞬時(shí)間失效(Soft Error)錯(cuò)誤都會(huì)增加,尤其后者在電容儲(chǔ)存電荷量較小的情況下,問題會(huì)越來越嚴(yán)重。GPU當(dāng)然也不能幸免,從顯存,到多級(jí)cache以至寄存器文件(Register File)都暴露在這一風(fēng)險(xiǎn)之下。對(duì)圖形應(yīng)用來說,這一問題并不需要太多擔(dān)心,人們根本意識(shí)不到屏幕上幾百萬個(gè)像素中個(gè)別顏色值中一位或幾位bit出現(xiàn)了翻轉(zhuǎn),哪怕發(fā)生更嚴(yán)重的錯(cuò)誤,人類的視覺機(jī)制都有機(jī)會(huì)自我補(bǔ)償糾正。但在高性能計(jì)算領(lǐng)域,差之毫厘,謬以千里,這些存儲(chǔ)失效的問題都是不能承受之重。所以現(xiàn)在GPU廠商至少會(huì)針對(duì)HPC產(chǎn)品在整個(gè)存儲(chǔ)器層次結(jié)構(gòu)添加ECC(Error Correcting Code)支持,數(shù)據(jù)中心和服務(wù)器的客戶也才敢放心購(gòu)買使用。

有了以上一些改進(jìn)和其他措施,終于GPU作為通用計(jì)算平臺(tái)慢慢脫離原始階段,開始成熟起來,成為大規(guī)模并行計(jì)算市場(chǎng)的主力軍。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • 計(jì)算平臺(tái)
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    9598

原文標(biāo)題:近距離看GPU計(jì)算

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    CPU渲染和GPU渲染優(yōu)劣分析

    使用計(jì)算機(jī)進(jìn)行渲染時(shí),有兩種流行的系統(tǒng):基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計(jì)算機(jī)的CPU來執(zhí)行場(chǎng)景并將其渲染到接近完美。這也是執(zhí)行渲染的更傳統(tǒng)方式。然而,隨著
    的頭像 發(fā)表于 05-23 08:27 ?422次閱讀
    CPU渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    為什么GPU對(duì)AI如此重要?

    GPU在人工智能中相當(dāng)于稀土金屬,甚至黃金,它們?cè)诋?dāng)今生成式人工智能時(shí)代中的作用不可或缺。那么,為什么GPU在人工智能發(fā)展中如此重要呢?什么是GPU圖形處理器(GPU)是一種通常用于進(jìn)
    的頭像 發(fā)表于 05-17 08:27 ?557次閱讀
    為什么<b class='flag-5'>GPU</b>對(duì)AI如此重要?

    國(guó)產(chǎn)GPU搭配國(guó)產(chǎn)處理器平臺(tái)主機(jī)

    處理器gpu
    GITSTAR 集特工控
    發(fā)布于 :2024年03月27日 14:11:32

    NVLink技術(shù)之GPUGPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會(huì)產(chǎn)生較大延時(shí),影響GPU并行計(jì)算的效率和性能。
    發(fā)表于 03-27 09:40 ?2824次閱讀
    NVLink技術(shù)之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    基礎(chǔ)設(shè)施,人們?nèi)匀粵]有定論。如果 Mipsology 成功完成了研究實(shí)驗(yàn),許多正受 GPU 折磨的 AI 開發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此大的內(nèi)存和
    發(fā)表于 03-21 15:19

    gpu是什么和cpu的區(qū)別

    GPU和CPU是兩種常見的計(jì)算機(jī)處理器,它們?cè)诮Y(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPU和CPU的區(qū)別,并詳細(xì)介紹它們的原理、應(yīng)用領(lǐng)域和性能特點(diǎn)。 一、概述 1.1 GPU
    的頭像 發(fā)表于 02-20 11:24 ?1.5w次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別有哪些

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別 GPU服務(wù)器是一種專門用于處理圖形運(yùn)算的服務(wù)器,而CPU服務(wù)器則是一種處理通用計(jì)算任務(wù)的服務(wù)器。它們之間的主要區(qū)別在于服務(wù)器所
    的頭像 發(fā)表于 01-30 15:31 ?689次閱讀

    GPU技術(shù)、生態(tài)及算力分析

    對(duì)比AMD從2013年開始建設(shè)GPU生態(tài),近10年時(shí)間后用于通用計(jì)算的ROCm開放式軟件平臺(tái)才逐步有影響力,且還是在兼容CUDA的基礎(chǔ)上。因此我們認(rèn)為國(guó)內(nèi)廠商在軟件和生態(tài)層面與英偉達(dá)CUDA生態(tài)的差距較
    的頭像 發(fā)表于 01-14 10:06 ?1016次閱讀
    <b class='flag-5'>GPU</b>技術(shù)、生態(tài)及算力分析

    CPU與GPU散熱器設(shè)計(jì)的異同及其重要性

    CPU與GPU散熱器的設(shè)計(jì)異同及其重要性 在計(jì)算機(jī)的發(fā)展過程中,中央處理單元(CPU)和圖形處理單元(GPU)在性能和熱量產(chǎn)生方面的不斷提升和增加,使得其在長(zhǎng)時(shí)間工作時(shí)產(chǎn)生了大量的熱量
    的頭像 發(fā)表于 01-09 14:00 ?855次閱讀

    揭秘GPU: 高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

    計(jì)算領(lǐng)域,GPU(圖形處理單元)一直是性能飛躍的代表。眾所周知,高端GPU的設(shè)計(jì)充滿了挑戰(zhàn)。GPU的架構(gòu)創(chuàng)新,為軟件承接大模型訓(xùn)練和推理場(chǎng)景的人工智能
    的頭像 發(fā)表于 12-21 08:28 ?734次閱讀
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b>架構(gòu)設(shè)計(jì)的挑戰(zhàn)

    什么是第三代通用計(jì)算?既通用又高性能的計(jì)算存在嗎?

    對(duì)大芯片來說,通用是成功的必由之路。CPU是通用芯片,成就了Intel的成功;GPU通用芯片,成就了NVIDIA的成功。目前,還沒有看到做專用芯片非常成功的案例。
    發(fā)表于 12-12 10:16 ?503次閱讀
    什么是第三代<b class='flag-5'>通用計(jì)算</b>?既<b class='flag-5'>通用</b>又高性能的<b class='flag-5'>計(jì)算</b>存在嗎?

    ASIC和GPU,誰才是AI計(jì)算的最優(yōu)解?

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI計(jì)算開始有著風(fēng)頭蓋過通用計(jì)算開始,不少芯片廠商都將其視為下一輪技術(shù)革新。CPU、GPU、FPGA和ASIC紛紛投入到這輪AI革命中來,但斬獲的戰(zhàn)果卻是有多有少
    的頭像 發(fā)表于 12-03 08:31 ?1891次閱讀
    ASIC和<b class='flag-5'>GPU</b>,誰才是AI<b class='flag-5'>計(jì)算</b>的最優(yōu)解?

    CPU、GPU和內(nèi)存知識(shí)科普

    本文內(nèi)容包括CPU、內(nèi)存和GPU知識(shí),本期重點(diǎn)更新GPU和CPU部分知識(shí)。比如:GPU更新包括架構(gòu)演進(jìn),最新產(chǎn)品A100、選型策略、架構(gòu)分析、散熱和規(guī)格分類等。
    的頭像 發(fā)表于 11-13 11:47 ?1569次閱讀
    CPU、<b class='flag-5'>GPU</b>和內(nèi)存知識(shí)科普

    人工智能算力為什么需要GPU?

    GPU前面加一個(gè)“GP”,就變?yōu)镚eneral-Purpose Computing on Graphics Processing Units,即通用計(jì)算圖形處理器。我們?nèi)バg(shù)語化,可以直接說這是一種用于處理非特定需求(通用類型)
    發(fā)表于 11-10 14:48 ?5415次閱讀
    人工智能算力為什么需要<b class='flag-5'>GPU</b>?