0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PowerVR GPU采用PVR3C三重壓縮技術(shù)來解決問題

Dbwd_Imgtec ? 來源:未知 ? 作者:李倩 ? 2018-07-25 15:05 ? 次閱讀

由于屏幕分辨率的提高以及越來越復(fù)雜的渲染管道,使得游戲和其他應(yīng)用對于帶寬的要求也越來越高,大量的數(shù)據(jù)需要從內(nèi)存拷貝或者寫入?,F(xiàn)在用戶普遍認(rèn)為在無其他特殊情況下設(shè)備應(yīng)該能夠支持2K的屏幕分辨率,高端游戲則具有更大的幾何復(fù)雜性,真正在屏幕上顯示圖像之前渲染管道通常要涉及多個中間渲染目標(biāo)。即使一些休閑類游戲也可能具有一些全屏后的處理效果,需要幀緩存數(shù)據(jù)從片外存儲器中讀取和寫入。內(nèi)存訪問是非常消耗功率的,占用帶寬越大功耗則越高,這對于功率預(yù)算緊張的嵌入式系統(tǒng)尤其是個棘手的問題。

PowerVR GPU采用PVR3C三重壓縮技術(shù)來解決這個問題,這三重壓縮解決方案包括紋理壓縮(涉及PVRTC和ASTC)、幾何壓縮(PVRGC)和本文的主題圖像壓縮(PVRIC)。

PowerVR圖片壓縮(PVRIC)

如上文所說,在現(xiàn)代實時圖形應(yīng)用中內(nèi)存帶寬的最大壓力之一就是生成高質(zhì)量圖像所需的大量中間渲染對象。一個明顯的例子就是創(chuàng)建立方體環(huán)境貼圖(cube maps),通常用于反射效果。這包括從一個不動點向六個方向渲染一個場景,最后結(jié)果會形成一個立方體的貼圖紋理,然后對場景中的對象進(jìn)行類似反射的采樣。其他示例包括分辨率縮放、渲染小地圖或其他場景視點、渲染平面反射貼圖,更不用說無盡的屏幕空間和后期處理效果了,比如可分離模糊處理、SSAO、景深效果以及色調(diào)映射等。

一個立方體貼圖的六個面可用于汽車上的近似反射,在汽車的窗戶上可以看到天空的倒影。

PVRIC通過高效、無損的壓縮方案大大降低了內(nèi)存帶寬成本,這種壓縮方案通常會使得圖像大小減少50%(依賴于很多元素)。前文提到的目標(biāo)渲染在寫入GPU之前就進(jìn)行了壓縮,然后從內(nèi)存中讀取時會被解壓,因為這種壓縮是無損的,所以可以從解壓數(shù)據(jù)中重構(gòu)得到完美的原始圖像,這也意味著圖像的質(zhì)量不會降低。

上圖展示了與GPU的所有交互,但更有利的是這有可能會將PVRIC技術(shù)集成到SoC級別的顯示管道中,使得最終的渲染圖像在寫入內(nèi)存之前會進(jìn)行壓縮,然后在顯示控制器中進(jìn)行解壓,這將更有效地節(jié)省總體帶寬。

在許多移動游戲和App中,紋理資源通常都會采用眾所周知的格式進(jìn)行壓縮,比如ETC、PVRTC等,但是開發(fā)者會選擇保留一部分未經(jīng)壓縮的紋理資源,比如字體或UI紋理,這些紋理在縮放時需要保持清晰和不失真。PVRIC方案的另一個好處是它允許將相同的無損壓縮應(yīng)用到任何未經(jīng)壓縮的紋理上,然后上傳給GPU(如果紋理使用的是多種被支持的格式之一),根據(jù)不同的應(yīng)用,這可能會帶來更大幅度的帶寬減少。

應(yīng)用帶寬分析

我們在Synaptics BG5CT板卡(集成PowerVR Series8XE GE8310GPU,它采用了最新一代的PVRIC技術(shù)——PVRICv3)上運行API trace測試了多款流行的應(yīng)用,我們看到了這種壓縮方案所帶來的性能提升,尤其是帶寬消耗的顯著降低。

下面的表格展示了不同應(yīng)用的測試結(jié)果,需要注意的是,在這款器件上PVRIC并沒有集成到SoC的顯示管道中,如果集成了那么我們將會看到最后的幀緩存圖像會有更好的壓縮效果,正如前文所述。因為我們使用的是安卓平臺,幀緩存壓縮會應(yīng)用到最終的渲染操作,Android SurfaceFlinger會將這些壓縮幀寫入內(nèi)存,讀取到GPU中。如果是這樣,那么SoC顯示管道也將受益于SurfaceFlinger的最終合成結(jié)果。

那么這些結(jié)果到底意味著什么?這些數(shù)字可能有點兒誤導(dǎo)人。我們可以清楚的看到所有應(yīng)用占用的總帶寬都有所減少,但有些應(yīng)用比其他應(yīng)用帶寬的降低程度要大得多,正如上文所提到的PVRIC技術(shù)涵蓋了紋理的渲染和解壓縮,但這只是總帶寬的一部分,幾何圖形、著色器等等也會占用一定的帶寬,但是它們并不會受PVRIC操作的影響,所以對于整體帶寬的占用情況我們能做的只是降低,雖然系統(tǒng)范圍內(nèi)的數(shù)據(jù)保持在較高的水平,但是我們想隔離受PVRIC影響的相關(guān)帶寬參數(shù),借助我們的內(nèi)部分析工具可以讓我們更精確的完成這些操作(雖然我們不能消除一切——比如紋理壓縮)。

在這里,我們隔離的只是GPU在執(zhí)行渲染操作時占用的帶寬,而忽略了貼圖操作所需要的幾何處理。為了簡化這一過程,測試平臺上已經(jīng)禁止了這些任務(wù)的重復(fù)。我們還能夠識別和忽略其他進(jìn)程的任務(wù),現(xiàn)在我們需要分析為什么有些app會那樣運行,這需要我們了解app是如何在圖形API層工作的,不妨深入了解一下PVRTrace。

《minecraft》(《我的世界》)

我們使用PVRTrace對Minecraft這款應(yīng)用進(jìn)行分析,我們發(fā)現(xiàn)總體帶寬節(jié)省率比較低(大約2.42%),但是隔離圖片/紋理帶寬方面顯示帶寬節(jié)省率則更高(大約17.76%)。Minecraft采用的是完全未壓縮的紋理技術(shù),因此PVRIC的效果比較顯著,盡管這與典型場景中幾何圖形的數(shù)量(大約13萬4千個三角形)相比非常的少,更不用說很多紋理的尺寸非常的小,PVRIC只是完成了它所能實現(xiàn)的,但是對于Minecraft并沒有太多的事情可以做。請記住:通過集成到顯示管道中,我們可以看到發(fā)送給顯示控制器的幀緩存更好的優(yōu)化效果。

《憤怒的小鳥 2》

在憤怒的小鳥 2這款應(yīng)用中,幾何圖形(1萬6千個三角形)和紋理內(nèi)容各自占用的帶寬比例則更協(xié)調(diào)一些,因此我們能夠更加清晰的看到PVRIC所帶來的好處,系統(tǒng)整體帶寬節(jié)省43%,隔離帶寬節(jié)省56%。這款游戲既采用了壓縮的紋理格式也采用了一些未壓縮的紋理格式,因此PVRIC非常起作用。此外,整個場景在進(jìn)行最終的展示之前會采用渲染中間件的形式(很多應(yīng)用都使用這種技術(shù)來處理分辨率縮放或后續(xù)處理操作),這兩種因素的結(jié)合對于PVRIC技術(shù)是很好的展示。

《真實賽車 3》

真實賽車3是另一款使用大量幾何圖形(測試時顯示16萬個三角形)的應(yīng)用,而且紋理/曲面也占用了相當(dāng)一部分的帶寬。紋理壓縮技術(shù)(PowerVR的PVRTC技術(shù))在這款應(yīng)用中被廣泛采用,這非常棒,但是還有很多未壓縮的紋理需要借助PVRIC技術(shù)來處理,此外還涉及一組512 x 512的立方體環(huán)境貼圖和全屏幕紋理渲染。最后的百分比可能不太明顯,但是這很好的展示了PVRIC與PVRTC相結(jié)合所帶來的好處,PVRTC可用于處理大部分的紋理,PVRIC則用于處理其他內(nèi)容。

從這些工作負(fù)載中可以看出,無論圖像數(shù)據(jù)是否占用應(yīng)用程序的大部分帶寬,采用PVRIC技術(shù)后都會帶來顯著的影響,在很大程度上減少了圖像占用的帶寬。

功耗分析

為了能夠更清楚的了解PVRIC技術(shù)和降低帶寬對于功耗的影響,我們修改了平臺,使其支持功耗分析并連接了數(shù)據(jù)采集設(shè)備從而可以收集一些功耗數(shù)據(jù),下面的圖表就是我們的發(fā)現(xiàn):

在憤怒的小鳥2同一段5秒的運行過程中,我們發(fā)現(xiàn):使用PVRIC時內(nèi)存的功耗會更低一些,采用兩組數(shù)據(jù)之間的差值并進(jìn)行平滑處理,我們發(fā)現(xiàn)內(nèi)存功耗降低了18%。這個效果非常的顯著,對于采用電池驅(qū)動的設(shè)備比如移動手機(jī)可以在充電之前使用更長的時間,當(dāng)然對于功耗和電池壽命的影響還有很多其他因素,而且不同設(shè)備之間也會有所差別。

總結(jié)

總而言之,PVRIC技術(shù)是PVR3C壓縮策略關(guān)鍵的組成部分,對于使用的帶寬來說其壓縮比可高達(dá)(有時甚至超過)2:1。這會對設(shè)備存儲器的功耗產(chǎn)生實質(zhì)性的影響,通過對我們紋理和幾何壓縮方案的測試,很明顯可以得出PVR3C是全面的帶寬效率方案,能夠從整體上提高系統(tǒng)的效率,從而讓我們能夠?qū)崿F(xiàn)更加全面的低功耗解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7366

    瀏覽量

    163099
  • 壓縮技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    8362
  • powervr
    +關(guān)注

    關(guān)注

    0

    文章

    98

    瀏覽量

    31004

原文標(biāo)題:【原創(chuàng)】PVRIC:降低內(nèi)存帶寬

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    三重壓縮技術(shù)應(yīng)對PowerVR圖片方案

    作者:Robin Britton 由于屏幕分辨率的提高以及越來越復(fù)雜的渲染管道,使得游戲和其他應(yīng)用對于帶寬的要求也越來越高,大量的數(shù)據(jù)需要從內(nèi)存拷貝或者寫入?,F(xiàn)在用戶普遍認(rèn)為在無其他特殊情況下設(shè)備應(yīng)該能夠支持2K的屏幕分辨率,高端游戲則具有更大的幾何復(fù)雜性,真正在屏幕上顯示圖像之前渲染管道通常要涉及多個中間渲染目標(biāo)。即使一些休閑類游戲也可能具有一些全屏后的處理效果,需要幀緩存數(shù)據(jù)從片外存儲器中讀取和寫入。內(nèi)存訪問是非常消
    的頭像 發(fā)表于 08-30 09:48 ?3786次閱讀

    STM32F407三重ADC采樣設(shè)置死機(jī)怎么解決?

    使用STM32F407三重ADC,ADC1ADC2 ADC3分別分配8個通道(ADC1 把芯片測溫等個內(nèi)部通道算上),一個24個通道。定時器TIMER3定時觸發(fā)ADC1采樣。ADC
    發(fā)表于 07-26 06:43

    開工率不足20% 我國多晶硅產(chǎn)業(yè)面臨三重壓

    目前,90%產(chǎn)品依賴出口的中國光伏產(chǎn)業(yè)面臨著歐美終端市場關(guān)門、低價多晶硅進(jìn)口沖擊、新興市場仍待成熟等三重壓力。目前,多晶硅行業(yè)開工率不足20%。
    發(fā)表于 10-24 11:24 ?816次閱讀

    示波器的三重境界

    電路教程相關(guān)知識的資料,關(guān)于示波器的三重境界
    發(fā)表于 10-10 14:34 ?0次下載

    低功耗三重緩沖器-74AUP3G34

    低功耗三重緩沖器-74AUP3G34
    發(fā)表于 02-09 19:19 ?0次下載
    低功耗<b class='flag-5'>三重</b>緩沖器-74AUP<b class='flag-5'>3</b>G34

    三重低歐姆單刀雙擲模擬開關(guān)-XS3A4053

    三重低歐姆單刀雙擲模擬開關(guān)-XS3A4053
    發(fā)表于 02-10 18:47 ?0次下載
    <b class='flag-5'>三重</b>低歐姆單刀雙擲模擬開關(guān)-XS<b class='flag-5'>3</b>A4053

    三重緩沖區(qū)-74LVC3G34_Q100

    三重緩沖區(qū)-74LVC3G34_Q100
    發(fā)表于 02-15 19:49 ?0次下載
    <b class='flag-5'>三重</b>緩沖區(qū)-74LVC<b class='flag-5'>3</b>G34_Q100

    三重緩沖區(qū)-74LVC3G34

    三重緩沖區(qū)-74LVC3G34
    發(fā)表于 02-15 19:49 ?0次下載
    <b class='flag-5'>三重</b>緩沖區(qū)-74LVC<b class='flag-5'>3</b>G34

    三重逆變器-74LVC3G04_Q100

    三重逆變器-74LVC3G04_Q100
    發(fā)表于 02-16 20:48 ?0次下載
    <b class='flag-5'>三重</b>逆變器-74LVC<b class='flag-5'>3</b>G04_Q100

    三重逆變器-74LVC3G04

    三重逆變器-74LVC3G04
    發(fā)表于 02-16 20:48 ?0次下載
    <b class='flag-5'>三重</b>逆變器-74LVC<b class='flag-5'>3</b>G04

    低功耗三重施密特觸發(fā)器-74AUP3G17

    低功耗三重施密特觸發(fā)器-74AUP3G17
    發(fā)表于 02-17 18:36 ?0次下載
    低功耗<b class='flag-5'>三重</b>施密特觸發(fā)器-74AUP<b class='flag-5'>3</b>G17

    具有開漏輸出的三重緩沖器-74LVC3G07

    具有開漏輸出的三重緩沖器-74LVC3G07
    發(fā)表于 02-17 18:42 ?0次下載
    具有開漏輸出的<b class='flag-5'>三重</b>緩沖器-74LVC<b class='flag-5'>3</b>G07

    三重反相施密特觸發(fā)器-74AHC_AHCT3G14

    三重反相施密特觸發(fā)器-74AHC_AHCT3G14
    發(fā)表于 02-21 18:27 ?1次下載
    <b class='flag-5'>三重</b>反相施密特觸發(fā)器-74AHC_AHCT<b class='flag-5'>3</b>G14

    三重逆變器-74HC_HCT3G04_Q100

    三重逆變器-74HC_HCT3G04_Q100
    發(fā)表于 02-21 18:28 ?0次下載
    <b class='flag-5'>三重</b>逆變器-74HC_HCT<b class='flag-5'>3</b>G04_Q100

    三重逆變器-74HC_HCT3G04

    三重逆變器-74HC_HCT3G04
    發(fā)表于 02-21 18:29 ?0次下載
    <b class='flag-5'>三重</b>逆變器-74HC_HCT<b class='flag-5'>3</b>G04