在线观看黄a∨免费无毒网站,欧美精品一区二区三区四区,亚洲AV中文无码字幕五月

最近Imagination Technologies發(fā)布新一代IMG DXT架構(gòu)GPU IP——這次發(fā)布的DXT產(chǎn)品主要是面向手機(jī)設(shè)備的。如果你對(duì)Imagination的GPU IP熟的話，應(yīng)該知道2019年發(fā)布IMG A系列架構(gòu)，屬于這家公司產(chǎn)品和技術(shù)層面的一個(gè)分水嶺，去年的PowerVR架構(gòu)30周年回顧文章也談到過(guò)。AXT(A系列)的基本理念主要是超寬ALU設(shè)計(jì)，Imagination此前強(qiáng)調(diào)它在PPAB(power, performance, area, bandwidth)方面的貢獻(xiàn);而次年的BXT系列，則更多地開(kāi)始采用去中心化的多核、模塊化方案，通過(guò)彈性縮放達(dá)成了我們現(xiàn)在所說(shuō)的覆蓋從手機(jī)到數(shù)據(jù)中心的GPU設(shè)計(jì)，并且也開(kāi)始支持chiplet的設(shè)計(jì);CXT系列則帶來(lái)了PowerVR Photon架構(gòu)，也就是光追加速，在移動(dòng)市場(chǎng)上正式提出硬件級(jí)光追加速方案。
D系列的發(fā)布基本也是符合預(yù)期的。其實(shí)2019年Imagination的GPU計(jì)劃表上，D系列的發(fā)布時(shí)間是2022年——選在今年1月發(fā)布也差不多趕在了時(shí)間線上。最新發(fā)布的IMG DXT，除了性能提升外，從大方向來(lái)看應(yīng)該是進(jìn)一步提升可擴(kuò)展性、彈性的一代架構(gòu)，尤其表現(xiàn)在光追方面;而且通過(guò)某些特性(如FSR)達(dá)成了效率的進(jìn)一步提升。本文重點(diǎn)談?wù)凞系列引入的一些新特性，和部分改進(jìn)。
新一代DXT概覽：更彈性的設(shè)計(jì)
有關(guān)Imagination GPU架構(gòu)的常規(guī)構(gòu)成及組成元素，這里不再多做著墨，比如說(shuō)USC(Unified Shading Cluster)模塊、TPU(Texture Processing Unit)單元、Raster/Geometry模塊這些固定功能單元，和cache、固件處理器(firmware processor)。
總的來(lái)說(shuō)，相比于C系列，這次的DXT一個(gè)核心單元內(nèi)的ALU與TPU性能最多可以提升50%;更重要的是，額外搭配的光追模塊(RAC，Ray Acceleration Cluster)在規(guī)模和位置方面有了更大的彈性——這一點(diǎn)后文也會(huì)詳細(xì)提到。按照彈性擴(kuò)展方案，Imagination列舉了三種配置示例，如上圖所示。在Imagination的定位中，這三種配置分別面向主流機(jī)、高端機(jī)、旗艦機(jī)。每種配置有不同的FP32算力和紋理填充率，以及可選的光線追蹤加速硬件。(如DXT 8-256，8表示紋理填充率 8 GTexels/s，256表示FP32算力256 GFLOPS)基礎(chǔ)款DXT-8-256據(jù)說(shuō)達(dá)成了超過(guò)20%的性能密度提升，也就是單位面積性能表現(xiàn)更好。
DXT的彈性擴(kuò)展能力改進(jìn)，主要體現(xiàn)在：SPU(Scalable Processing Unit)作為規(guī)?；瘮U(kuò)展的基本單元，現(xiàn)在可以用上更多的ALU、TPU。所以這代產(chǎn)品能夠用更高密度的SPU設(shè)計(jì)，如上圖，可包含3個(gè)USC/TPU模塊，加上其他共享單元。比如說(shuō)上一代CXT-48-1536，是三個(gè)SPU的設(shè)計(jì)，那么每個(gè)SPU搭配一個(gè)RAC(光追加速集群)，也就構(gòu)成了CXTP-48-1536 RT3。而到了這一代，除了三個(gè)SPU這樣的設(shè)計(jì)(三個(gè)2x 8-256 SPU)，現(xiàn)在還可以搭配兩個(gè)SPU——但是每個(gè)SPU是3個(gè)USC/TPU單元(即兩個(gè)3x 8-256 SPU)。則基于每個(gè)SPU搭配1個(gè)RAC，那么就可以組合為DXT-48-1536 RT2。而且還能用一半的RAC，做成DXT-48-1356-0.5RT2。
也就是說(shuō)達(dá)成此前相同的浮點(diǎn)和紋理性能，現(xiàn)在可以搭配RT1、RT2、RT3不同的配置方案，最大規(guī)模單個(gè)核心可做RT4(單核最多4個(gè)SPU)。另外單個(gè)SPU規(guī)模做大，實(shí)則會(huì)比前代達(dá)成相同算力所需的面積更小，也就提升了性能密度。與此同時(shí)最高性能配置的算力也就提升了。
雖然發(fā)布會(huì)上，Imagination只提到了DXT-72-2304 RT3，但DXT技術(shù)白皮書(shū)上說(shuō)單核能夠從過(guò)去的CXT-64-2048，做到這一代的DXT-96-3072，性能也就提升了50%。具體的不同配置方案如下：光線追蹤與FSR
有關(guān)PowerVR Photon架構(gòu)的光追實(shí)現(xiàn)，我們此前也寫(xiě)過(guò)不止一篇文章了，包括Imagination定義的光追等級(jí)。移動(dòng)設(shè)備要用上光追GPU是手機(jī)AP SoC廠商的共識(shí)。
Imagination公司技術(shù)產(chǎn)品管理高級(jí)總監(jiān)Stephen Barton在采訪中說(shuō)：“我們把RAC單獨(dú)作為一個(gè)IP剝離出來(lái)，意味著可以不影響GPU本身的性能，光線追蹤可以獨(dú)立運(yùn)行，這對(duì)移動(dòng)端的應(yīng)用很重要。移動(dòng)端剛開(kāi)始做光線追蹤技術(shù)，一定會(huì)從混合模式開(kāi)始。剛開(kāi)始是大量光線運(yùn)算和少量光照，隨著光線追蹤技術(shù)越來(lái)越成熟，會(huì)走向更完整的光線追蹤。我們的架構(gòu)特別適合這樣的發(fā)展模式，每個(gè)階段都可以為客戶(hù)提供需要的光線追蹤性能?！?br />“我們的想法是，DXT可以更好地讓具有硬件級(jí)別、開(kāi)銷(xiāo)真正能夠在移動(dòng)端被接受的光線追蹤，鋪開(kāi)到更多的設(shè)備?！盜magination公司首席營(yíng)銷(xiāo)官David Harold說(shuō)，“只有這樣，那些針對(duì)光線追蹤進(jìn)行內(nèi)容開(kāi)發(fā)的開(kāi)發(fā)者才會(huì)愿意做這方面的開(kāi)發(fā)工作?！?img src="https://file1.elecfans.com//web2/M00/9D/64/wKgaomTn6UeATeVqAALlvw1ovOA570.png" alt="babd986a-978f-11ed-ad0d-dac502259ad0.png" />這說(shuō)的應(yīng)該是RAC的靈活性好——我們認(rèn)為，的確在移動(dòng)領(lǐng)域都還沒(méi)有像樣的光追游戲的情況下，為光追加速耗費(fèi)的晶體管會(huì)成為所謂的dark silicon。這代架構(gòu)上，Imagination強(qiáng)調(diào)“可擴(kuò)展的光線追蹤”，芯片設(shè)計(jì)企業(yè)可選配的RAC單元規(guī)模有了更大的選擇范圍，包括半個(gè)RAC(216 MRay/s，8 GBoxTests/s)。David說(shuō)，“哪怕先用0.5個(gè)RAC單元，也可以把更多光追能力盡可能地帶給更多主流機(jī)型，增加市場(chǎng)覆蓋率，讓更多開(kāi)發(fā)者加入進(jìn)來(lái)，讓這項(xiàng)技術(shù)成為真正意義上的主流技術(shù)?！?br />Imagination在DXT技術(shù)白皮書(shū)中說(shuō)，以前架構(gòu)的配置方案是2個(gè)ALU模塊共享RAC，而這一代可以由更多的ALU模塊共享一個(gè)RAC;而且RAC可以遷往GPU的不同層級(jí)——前文提及SPU模塊的靈活設(shè)計(jì)，本身就在影響RAC的布局。
另外Stephen還說(shuō)：“光線追蹤等級(jí)L1和L2，是目前市面上大家能夠看到的絕大多數(shù)光線追蹤技術(shù)達(dá)到的等級(jí)。而我們提供的L4。”L4等級(jí)的光追技術(shù)除了兩個(gè)重要的硬件加速支持，還需要考慮到移動(dòng)平臺(tái)的功耗敏感性。所以L4是在L3的BVH遍歷的基礎(chǔ)上，將具備相干性的光線做分類(lèi)和聚集(coherency sorting)，比如對(duì)某些材質(zhì)反射的同方向光線進(jìn)行sorting，達(dá)成更高的數(shù)據(jù)復(fù)用，提升并行ALU管線利用率。有關(guān)RAC的內(nèi)部構(gòu)成，我們此前也撰文談過(guò)了，這里不再細(xì)數(shù)。其中達(dá)成L4的關(guān)鍵是其中的PCG(Packet Coherency Gather)(另外“再加上RS、RTS等”)，就是將相干光線聚集起來(lái)做計(jì)算，“用相同的指令完成并行計(jì)算，節(jié)省了大量的功耗?！盜magination中國(guó)區(qū)技術(shù)總監(jiān)艾克說(shuō)。伴隨這次DXT架構(gòu)更新而來(lái)的另一項(xiàng)重要特性更新是FSR(Fragment Shading Rate)。這個(gè)FSR不是AMD FSR，而類(lèi)似于VRS可變速率著色。關(guān)注游戲和圖形技術(shù)發(fā)展的同學(xué)對(duì)此應(yīng)該不會(huì)陌生。簡(jiǎn)單來(lái)說(shuō)，是對(duì)畫(huà)面中不重要的區(qū)域(比如畫(huà)面的背景部分)，或者不需要高精度渲染的部分，不做原生分辨率級(jí)別的渲染，也就能起到降低功耗和負(fù)載的效果。
比如競(jìng)速游戲，在賽車(chē)高速行駛的時(shí)候，賽車(chē)周?chē)膶?duì)象實(shí)際上只需要低畫(huà)質(zhì)繪制即可，因?yàn)檫@些對(duì)象后續(xù)會(huì)被運(yùn)動(dòng)效果做模糊處理。
覆蓋兩個(gè)或更多像素，來(lái)降低shader執(zhí)行率，也就相當(dāng)于做了更少的工作、需求更低的帶寬和更少的功耗，帶來(lái)幀率提升的同時(shí)，對(duì)游戲體驗(yàn)又不會(huì)有太大的影響。DXT支持不同比例的多像素shader執(zhí)行復(fù)用。不同比例也就對(duì)應(yīng)了不同的畫(huà)質(zhì)。據(jù)說(shuō)如果以4x4陣列像素的shader執(zhí)行復(fù)用，則達(dá)成大約“93%左右的fragment運(yùn)算能力的節(jié)省”。Imagination表示，F(xiàn)SR能夠和光追做很好的搭配。感覺(jué)和桌面GPU市場(chǎng)參與者說(shuō)超分和光追做搭配是差不多的意思，大方向都是降低原生畫(huà)面的渲染精度，將更多資源應(yīng)用于光線追蹤，則能有效提升最終呈現(xiàn)的畫(huà)面幀率。不過(guò)這里還有個(gè)關(guān)鍵，F(xiàn)SR/VRS在整個(gè)流程里所處的位置，還是比DLSS這類(lèi)超分技術(shù)靠前許多的。
應(yīng)用FSR以后，也就意味著只需要更少的shader調(diào)用和光線發(fā)射，需要處理的光線也就更少，更大一片區(qū)域的像素結(jié)果可被復(fù)用。換句話說(shuō)，就是shader處理和光線數(shù)減少了，則顯著降低了整體開(kāi)銷(xiāo)。“沒(méi)有開(kāi)啟FSR的話，可能需要每幀6.9MRays的算力;但如果配上FSR計(jì)算，哪些區(qū)域運(yùn)算一次，哪些區(qū)域運(yùn)算兩次，哪些區(qū)域需要細(xì)節(jié)表現(xiàn)的，這樣一幀畫(huà)面只需要3.2MRays計(jì)算能力?！卑苏f(shuō)，“配合可擴(kuò)展的RAC，用更小的RAC就能夠?qū)崿F(xiàn)該場(chǎng)景下的游戲光追效果?！?br />其他關(guān)鍵特性更新
IMG DXT新架構(gòu)引入同時(shí)的其他特性主要還包括下圖這些。2D Dual-Rate Texturing強(qiáng)調(diào)的是提升TPU后處理效果的性能表現(xiàn)。Imagination說(shuō)他們觀察到許多游戲會(huì)花比較多的時(shí)間去執(zhí)行后處理(post-processing)算法，包括實(shí)現(xiàn)淺景深、bloom、模糊之類(lèi)的效果。其中很多負(fù)載的瓶頸在TPU吞吐上。但暴力增加TPU單元的硬件資源是不合理的。基于Imagination發(fā)現(xiàn)的后處理負(fù)載與圖像處理的一些典型特征，開(kāi)發(fā)團(tuán)隊(duì)實(shí)施了一種新的TPU模式，在檢測(cè)到這些特征以后達(dá)成后處理性能的翻番。具體的細(xì)節(jié)推薦去看DXT技術(shù)白皮書(shū)。據(jù)說(shuō)在特定處理類(lèi)型中，DXT-48-1536能夠達(dá)成96-1536的效果，每時(shí)鐘周期處理雙倍數(shù)量的雙線性過(guò)濾紋理采樣，也就達(dá)成了雙倍的執(zhí)行率。實(shí)際上，前述DXT架構(gòu)優(yōu)化方案(如光追處理更少的光線)也對(duì)后處理效果提出了更高的要求，2D Dual-Rate TPU也就顯得自然而然了。Pipelined Data Masters - 此前解析IMG A系列的文章里就提到過(guò)，GPU內(nèi)有個(gè)固件處理器(firmware processor)。這個(gè)固件處理器負(fù)責(zé)高層級(jí)調(diào)度和負(fù)載優(yōu)先級(jí)安排，與Data Master固定功能單元一起實(shí)現(xiàn)。GPU內(nèi)部有各種各樣的Data Master，什么2D Data Master、3D Data Master、Compute Data Master、Geometry Data Master...
這些Data Master負(fù)責(zé)各類(lèi)型的低層級(jí)工作。Imagination在技術(shù)白皮書(shū)中說(shuō)，之前的幾代架構(gòu)用的都是single-tasking單任務(wù)Data Master。也就是說(shuō)Data Master首先執(zhí)行某個(gè)特定工作，如果要改換工作就需要固件處理器來(lái)做設(shè)定。那么在固件處理器設(shè)定下一項(xiàng)工作、對(duì)寄存器做編程時(shí)，就會(huì)有個(gè)空閑時(shí)間;設(shè)定工作本身還需要數(shù)據(jù)訪問(wèn)和其他同步任務(wù)。
在GPU規(guī)模大、SPU數(shù)量多的情況下，這帶來(lái)的性能影響就會(huì)比較大，尤其在固件處理器規(guī)模不變的情況下。所以這一代新架構(gòu)實(shí)現(xiàn)了Data Master的流水線化(pipelining)——在GPU的上一個(gè)工作還在處理執(zhí)行的情況下，固件就可以設(shè)定下一個(gè)工作。從此前固件設(shè)定工作與渲染任務(wù)的串行化，到現(xiàn)在的并行化，提升了GPU的資源利用率。以前firmware processor工作導(dǎo)致性能損失現(xiàn)在，這部分工作實(shí)現(xiàn)了流水線化
此外這個(gè)RISC-V架構(gòu)的固件處理器本身也有40%的性能提升。白皮書(shū)上說(shuō)，DXT這代轉(zhuǎn)向了基于RISC-V的固件處理器——似乎此前A系列發(fā)布時(shí)就有消息提到這部分就是基于RISC-V的。而Imagination現(xiàn)如今異構(gòu)處理器策略中，做基于RISC-V的CPU IP其實(shí)也已經(jīng)是眾所周知的了。上述PPT中列出最后一項(xiàng)是ASTC HDR支持——實(shí)際上Vulkan API之前就強(qiáng)制ASTC(Adaptive Scalable Texture Compression)LDR紋理了，Imagination也持續(xù)好幾代架構(gòu)做出了支持。而ASTC HDR一直是個(gè)可選項(xiàng)。Imagination認(rèn)為，未來(lái)幾年HDR會(huì)發(fā)展起來(lái)，則基于ASTC算法來(lái)支持HDR輸入壓縮紋理，也是自然而然的。于是DTX實(shí)現(xiàn)了這一類(lèi)型的壓縮紋理。HDR紋理不用多解釋了，也就是畫(huà)面暗部和亮部的光比可以做到很大。
至于TBDR、PVR IC圖像壓縮、去中心化的多核架構(gòu)設(shè)計(jì)與模塊化擴(kuò)展等等都屬于Imagination的常規(guī)項(xiàng)目了。有興趣的讀者可以去看看我們之前撰寫(xiě)有關(guān)Imagination GPU IP的技術(shù)文章。最后談?wù)勆鷳B(tài)。生態(tài)問(wèn)題涉及的應(yīng)該是整個(gè)Imagination的IP產(chǎn)品，而不僅限于這次的DXT。DXT架構(gòu)具體變成芯片的未來(lái)計(jì)劃，Imagination在發(fā)布會(huì)上并未提及。不過(guò)艾克給出了一些生態(tài)方面的成果：“2021年，我們把光線追蹤技術(shù)應(yīng)用到手機(jī)領(lǐng)域，同時(shí)也推廣到O3DE(Open 3D Engine)，讓開(kāi)源社區(qū)開(kāi)發(fā)者感受到光線追蹤技術(shù)的演進(jìn)和發(fā)展?！?br />“我們也和Amazon發(fā)布了帶有光線追蹤效果的演示demo，可展示出全天候的光影變化效果，沉浸感很強(qiáng)?！卑苏f(shuō)，“除此之外，我們也和各大游戲開(kāi)發(fā)者介紹新功能，新游戲發(fā)布時(shí)我們會(huì)去參與測(cè)試，讓一些功能及時(shí)得到應(yīng)用;產(chǎn)品新特性也介紹給他們，在游戲開(kāi)發(fā)過(guò)程里能用起來(lái)，建立手機(jī)游戲開(kāi)發(fā)生態(tài)?！?br />開(kāi)發(fā)生態(tài)工具相關(guān)的部分，除了比較基本的對(duì)于Vulkan API等提供支持，Stephen提到如光追生態(tài)系統(tǒng)建設(shè)和儲(chǔ)備方面的工作很早就開(kāi)始了，“2021年CXT發(fā)布時(shí)也有發(fā)布相關(guān)的光線追蹤工具?！卑ǚ治龉ぞ?，以及SDK開(kāi)發(fā)包等。David則表示：“我們和包括完美世界、網(wǎng)易、騰訊、Unity，以及OPPO、vivo等在內(nèi)的合作伙伴都有合作。
現(xiàn)階段，Imagination要推廣自家GPU IP，尤其是最新幾代架構(gòu)的優(yōu)秀技術(shù)，難點(diǎn)仍然在生態(tài)擴(kuò)展上。期待在新的一年其GPU IP在更多類(lèi)型的設(shè)備形態(tài)上落地——比如產(chǎn)品之外，DXT架構(gòu)的應(yīng)用范圍應(yīng)該是不僅限于手機(jī)的，比如VR也會(huì)是其應(yīng)用方向之一——還有像汽車(chē)之上的產(chǎn)品應(yīng)用，能夠持續(xù)帶動(dòng)Imagination新戰(zhàn)略中四大應(yīng)用領(lǐng)域：Mobile、Consumer、Automotive、Data Center方向的全面開(kāi)花結(jié)果。
作者：黃燁鋒資深產(chǎn)業(yè)分析師

EET電子工程專(zhuān)輯

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
27

文章
4591

瀏覽量
128142
imagination

imagination

+關(guān)注

關(guān)注
1

文章
562

瀏覽量
61117

評(píng)論

相關(guān)推薦

Imagination推出性能最高且具有高等級(jí)功能安全性的汽車(chē)GPU IP

Imagination DXS GPU 進(jìn)一步擴(kuò)大其在汽車(chē)領(lǐng)域的領(lǐng)先地位

發(fā)表于 09-14 17:41 ?168次閱讀

Imagination GPU為邊緣智能提供高效率的加速

作者：Imagination

發(fā)表于 09-11 13:10 ?104次閱讀

<b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b>為邊緣智能提供高效率的加速

【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

力量關(guān)注算力芯片的發(fā)展，希望我們的國(guó)家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能算力芯片。內(nèi)容簡(jiǎn)介：本書(shū)介紹了超級(jí)計(jì)算機(jī)算力和AI算力的異同，從CPU流水線開(kāi)始，描述主要的眾核處理器架構(gòu)和功能部件設(shè)計(jì)。在GPU

發(fā)表于 09-02 10:09

ALINX FPGA+GPU異架構(gòu)視頻圖像處理開(kāi)發(fā)平臺(tái)介紹

Alinx 最新發(fā)布的新品 Z19-M 是一款創(chuàng)新的 FPGA+GPU 異構(gòu)架構(gòu)視頻圖像處理開(kāi)發(fā)平臺(tái)，它結(jié)合了 AMD Zynq UltraScale+ MPSoC（FPGA）與 NVIDIA Jetson Orin NX（

發(fā)表于 08-29 14:43 ?534次閱讀

手機(jī)光追大突破！天璣9400 GPU光追性能提升20%

近日，科技圈傳來(lái)新消息，聯(lián)發(fā)科旗下最新旗艦芯片天璣9400在圖形技術(shù)上取得重大突破。據(jù)悉，該芯片光追性能較前代產(chǎn)品提升近20%，并首發(fā)一項(xiàng)移動(dòng)端新光追技術(shù)，該技術(shù)堪比PC頂級(jí)光

發(fā)表于 08-27 13:33 ?158次閱讀

<b class='flag-5'>手機(jī)</b><b class='flag-5'>光</b><b class='flag-5'>追</b>大突破！天璣9400 <b class='flag-5'>GPU</b><b class='flag-5'>光</b><b class='flag-5'>追</b>性能提升20%

美光科技發(fā)布新一代GDDR7顯存

在近日舉行的臺(tái)北國(guó)際電腦展上，美國(guó)存儲(chǔ)芯片巨頭美光科技正式發(fā)布了其新一代GDDR7顯存。這款新型GPU顯卡內(nèi)存基于美光的1βDRAM架構(gòu)，將

發(fā)表于 06-06 09:24 ?317次閱讀

Arm發(fā)布針對(duì)旗艦智能手機(jī)的新一代CPU和GPU IP

全球領(lǐng)先的芯片設(shè)計(jì)公司Arm宣布了針對(duì)旗艦智能手機(jī)市場(chǎng)的全新CPU和GPU IP設(shè)計(jì)方案——Cortex-X925 CPU和Immortalis G925 GPU。這兩款產(chǎn)品均基于Armv9架

發(fā)表于 05-31 09:44 ?457次閱讀

大模型快速發(fā)展，GPU IP有何作用

。 ? Imagination ? Imagination的GPU IP產(chǎn)品包括IMG A系列、IMG CXT、IMG DXT等多

發(fā)表于 05-29 00:05 ?2100次閱讀

X-Silicon發(fā)布RISC-V新架構(gòu) 實(shí)現(xiàn)CPU/GPU一體化

X-Silicon 的芯片與其他架構(gòu)不同，其設(shè)計(jì)將 CPU 和 GPU 的功能整合到單核架構(gòu)中。這與英特爾和 AMD 的典型設(shè)計(jì)不同，前者有獨(dú)立的 CPU 內(nèi)核和 GPU 內(nèi)核。

發(fā)表于 04-08 11:34 ?456次閱讀

深入解讀AMD最新GPU架構(gòu)

GCN 取代了 Terascale，并強(qiáng)調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后，AMD 將其 GPU 架構(gòu)開(kāi)發(fā)分為單獨(dú)的 CDNA 和 RDNA 線路，分別專(zhuān)門(mén)用于計(jì)算和圖形。

發(fā)表于 01-08 10:12 ?960次閱讀

揭秘GPU：高端GPU架構(gòu)設(shè)計(jì)的挑戰(zhàn)

在計(jì)算領(lǐng)域，GPU（圖形處理單元）一直是性能飛躍的代表。眾所周知，高端GPU的設(shè)計(jì)充滿(mǎn)了挑戰(zhàn)。GPU的架構(gòu)創(chuàng)新，為軟件承接大模型訓(xùn)練和推理場(chǎng)景的人工智能計(jì)算提供了持續(xù)提升的硬件基礎(chǔ)。

發(fā)表于 12-21 08:28 ?734次閱讀

NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

在探討 NVIDIA GPU 架構(gòu)之前，我們先來(lái)了解一些相關(guān)的基本知識(shí)。GPU 的概念，是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時(shí)首先提出，從此

發(fā)表于 11-21 09:40 ?1152次閱讀

Imagination的桌面GPU來(lái)了：這次要攻堅(jiān)Windows游戲市場(chǎng)

近代圖形計(jì)算市場(chǎng)上，作為IP供應(yīng)商Imagination重返高性能桌面市場(chǎng)，應(yīng)該是2020年IMGB-seriesGPUIP的發(fā)布。關(guān)注Imagination的讀者應(yīng)該知道，在Imaginat

發(fā)表于 11-15 08:27 ?466次閱讀

Imagination宣布新DXD GPU架構(gòu)，支持完整的DX11

DXD架構(gòu)定位主流，支持完整的DX11 Feature Level 11_0，但是不支持最新的DX12，因此適合主流網(wǎng)游、電競(jìng)游戲中，不太適合最新3A大作。

發(fā)表于 11-10 11:46 ?494次閱讀

Imagination在OnCloud平臺(tái)上使用AI驅(qū)動(dòng)的Cadence Cerebrus優(yōu)化PPA結(jié)果，加快低功耗GPU的交付

Imagination 利用 Cadence Cerebrus 生成式 AI 技術(shù)自動(dòng)優(yōu)化其最新的 5nm GPU 設(shè)計(jì) 3 軟件即服務(wù)（SaaS）模型提供了一種經(jīng)濟(jì)實(shí)惠且快速的方式，用于訪問(wèn)大規(guī)模并行化計(jì)算

發(fā)表于 10-18 15:50 ?297次閱讀