0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

“玲瓏”編解碼融合架構助力視頻多元化需求

LiveVideoStack ? 來源:LiveVideoStack ? 2023-05-20 11:23 ? 次閱讀

隨著近年來 AI 技術的興起,視頻監(jiān)控、汽車、智能家居、移動設備及數(shù)據(jù)中心等對高清視頻處理有了越來越高的要求。安謀科技全新視頻處理器——“玲瓏”V6/V8,針對主流市場的視頻流媒體技術進行了大量投入,通過一系列智能權衡實現(xiàn)了極大優(yōu)化,為所有合作伙伴提供靈活的組合和選擇。LiveVideoStackCon 2022北京站邀請到了安謀科技多媒體產(chǎn)品經(jīng)理董峰,為我們分享“玲瓏”編解碼融合架構助力視頻多元化需求。

此次是安謀科技在LiveVideoStack大會的演講首秀。安謀科技是中國最大的芯片IP設計與服務供應商,在立足全球生態(tài)、深耕本土創(chuàng)新的基礎上,堅持以自研IP技術的創(chuàng)新發(fā)展與Arm IP相配合,為本土集成電路產(chǎn)業(yè)提供豐富的產(chǎn)品組合和解決方案。

自2018年獨立運營以來,安謀科技堅持開展自研IP和發(fā)展Arm IP業(yè)務,一方面是結(jié)合中國市場需求積極布局自研業(yè)務,堅持“全球標準,本土創(chuàng)新”,陸續(xù)推出“周易”NPU、“星辰”CPU、“山?!盨PU以及“玲瓏”ISP&VPU等自研IP成果,并全部實現(xiàn)了客戶相關芯片產(chǎn)品的流片和量產(chǎn)。另一方面,安謀科技也致力于將Arm 先進的架構和技術引進國內(nèi),滿足國內(nèi)公司開發(fā)具有全球競爭力產(chǎn)品的需求。在兩大支柱業(yè)務的合力之下,目前安謀科技已打造一體化、完整的異構計算IP核心矩陣,助力中國智能計算產(chǎn)業(yè)高速發(fā)展。

芯片IP廠商需要考慮多元化的需求,應當滿足不同場景下的不同訴求。對于視頻來說,無論是端、邊、云都有很大的視頻編解碼需求。端側(cè)手機、IPC、無人機等不同場景對視頻編解碼的需求存在較大差異。而云端和車載則是完全不同的方向。手機以及安防在編碼和解碼方面差異也較為明顯,手機客戶解碼需求更強,但是旗艦機對于一些圖傳也存在不同需求。作為IP廠商如何面對復雜多變的市場需求是首當其沖的問題。

57d7d058-ed66-11ed-90ce-dac502259ad0.png

安謀科技VPU團隊在2019年底成立,從2020年初開始研發(fā)自研產(chǎn)品。我們團隊從Arm Mali-V52的維護開始,逐漸完成兩代產(chǎn)品的研發(fā)。為了更好地滿足行業(yè)基本格式需求,我們新增了AVS2和AV1格式,“玲瓏”V5/V7花費了近三個季度完成,“玲瓏”V6/V8則花費了將近一年。除了增加格式之外,還增強了整體編碼能力。“玲瓏”V5/V7的HEVC編碼質(zhì)量與Arm Mali-V52/76相比提升了15%,“玲瓏”V6/V8的H.264編碼質(zhì)量也比“玲瓏”V5/V7提升了10%。面對多樣的產(chǎn)品需求,增加了復雜的前后處理,“玲瓏”V5/V7增加了Any ratio downscaling的后處理;“玲瓏”V6/V8增加了OSD的前處理,以及YUV到RGB的后處理。

57ec1090-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU支持全格式,整體面積較小。“玲瓏”V5全格式支持包括前后處理P&R之后是1.83。芯片IP行業(yè)一直在追求更高的性能、更小的功耗和更小的面積,產(chǎn)品在迭代過程中針對上述問題的改進還是頗有成效。在整體架構方面也有別于其它架構,“玲瓏”VPU以單核實現(xiàn)編解碼融合,既可以編碼也可以解碼,以適用于多樣場景的需求。不只是硬件格式的支持,還囊括了可編程的軟件部分,以滿足對多種場景變化的需求。

在硬件層面上,“玲瓏”VPU添加更多靈活可配的接口,其它能力通過軟件層面實現(xiàn)擴展。該產(chǎn)品整體是5個MCU的結(jié)構,不同的MCU對應控制不同的硬件加速器。在spec分析階段,需要考慮哪些可以固化、哪些可以通過靈活的軟件配置實現(xiàn),再將可固化的部分做成純硬件。

盡管端和云對處理器性能要求差異巨大,但是從芯片IP角度出發(fā),還是希望能用統(tǒng)一的方式來支撐不同場景的需求,基于多核的可拓展性對性能進行擴展,通過擴展核數(shù)以支持不同場景需求。例如,端側(cè)客戶單核即可滿足需求,而邊緣側(cè)大致需要四核,那云端基本需要八核。在7nm制程前提下,八核基本可以實現(xiàn)8k@60fps編碼或8k@120fps解碼。

58034724-ed66-11ed-90ce-dac502259ad0.png

除了上述的多核可拓展性之外,“玲瓏”VPU對于MCU本身也會有所考量。不同于Arm Cortex A和Cortex M的核,其單獨為視頻場景進行定制優(yōu)化,基本上仍然是5級的流水。而在頻率方面,和整個VPU同頻。16FF下至少可達到800MHz。由此可見,該核本身就可以保證其性能,在視頻場景下更側(cè)重于加速器的控制,所以不會讓其觸碰pixel內(nèi)容,在指令集方面也做了很多優(yōu)化。

除了6個加速器之外,“玲瓏”VPU還有兩個DMA相關的單元,一個是SDMA,另一個是VDMA。VDMA主要用于處理Frame級別的數(shù)據(jù),包括編碼的輸入數(shù)據(jù)和解碼的輸出數(shù)據(jù),前后處理也可以通過該單元靈活擴展。這幾代產(chǎn)品的迭代都是把功能分散到不同的加速器以及top層上。應對不同場景的需求,除了性能和基本功能之外,系統(tǒng)層面仍然有差異化的需求,多路的隔離、系統(tǒng)訪存延遲優(yōu)化、降帶寬、降延時等都屬于系統(tǒng)層面的優(yōu)化,也和Arm的生態(tài)保持一致。

58137d9c-ed66-11ed-90ce-dac502259ad0.png

在系統(tǒng)層面,通過降帶寬、降延時來應對大帶寬系統(tǒng)的需求,基于AFBC,可與Arm GPU以及Display搭配進行,內(nèi)部中間的參考幀使用AFBC壓縮,可讓帶寬在輸入和輸出都不壓縮的情況下降低35%。在GPU使用VPU解碼數(shù)據(jù)進行紋理渲染時,整體的帶寬可降低至原先的45%。在Display場景中,也可以達到類似的效果。除了整個數(shù)據(jù)流,中間的參考幀數(shù)據(jù)也可以單獨拿出來為后面的單元進行相對地管理,也可以有效降低帶寬?!傲岘嚒盫PU圍繞各個層面進行統(tǒng)一考量,以更好地降低帶寬需求。

581bc6a0-ed66-11ed-90ce-dac502259ad0.png

VPU不僅需要在視頻場景中考量系統(tǒng)層面的優(yōu)化,也需要從系統(tǒng)層面進行考量,內(nèi)部的并行也可以在top ram進行優(yōu)化,以減少多核之間的內(nèi)存訪存。VPU與CPU處理器、視頻、顯示的聯(lián)合也可以做到類似的效果。

582e866e-ed66-11ed-90ce-dac502259ad0.png

就AFBC本身而言,也分為不同的版本。AFBC是Arm Frame Buffer Compression的縮寫,簡單理解就是Arm系統(tǒng)層面上的無損壓縮,主要目的是帶寬的優(yōu)化。AFBC的能力是基于Arm整個IP層面來實現(xiàn)的,是在系統(tǒng)層面的整體優(yōu)化。對于ISP而言,Arm也有專用的AFBC模塊用來連接ISP,端側(cè)場景也可以在視頻里直接輸入AFBC數(shù)據(jù)以減少帶寬。AFBC的好處很多,尤其是對rotation十分友好,系統(tǒng)層面通過AFBC就可以繞過rotation這種耗帶寬的處理,從原始數(shù)據(jù)進行rotation的訪問,對于系統(tǒng)的總線來說存在不小的壓力。但通過AFBC的方式在內(nèi)部優(yōu)化rotation,能夠支持連續(xù)的訪問,這種方式更簡單高效。此外,AFBC的不同格式也對系統(tǒng)的隨機訪問有所支持。

58403b52-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU原生就支持多路,端側(cè)場景也需要多路,對于云端場景來說多路更是剛需。應對多路復雜多分辨率的場景,也是巨大的考驗?!傲岘嚒盫PU通過核心調(diào)度器負責多核調(diào)度,多核并行按照條帶級別劃分任務,任何核都可以通過核心調(diào)度器硬件直接調(diào)度?!傲岘嚒盫PU原生硬件可支持4個上下文,4路不同場景都可以通過核心調(diào)度器進行切換。而總線仲裁器則負責系統(tǒng)層面的訪問,與核互聯(lián)以整體判決,從而優(yōu)化緩存,在輸出時可通過AXI進行。三步結(jié)合,一起對訪存進行優(yōu)化。

585be532-ed66-11ed-90ce-dac502259ad0.png

為應對云端和邊緣場景,除了對核進行優(yōu)化之外,硬件也要進行優(yōu)化。低功率可以通過LPI接口得以實現(xiàn)。整體來看,多核、異步處理是優(yōu)化過程中的核心部分。不同的要求可以使用不同的管理策略,靈活配置能夠更好地服務客戶。

586d200e-ed66-11ed-90ce-dac502259ad0.png

REF主要用于處理參考幀的訪問,可通過隨機訪問以達到性能的優(yōu)化。

587b6100-ed66-11ed-90ce-dac502259ad0.png

“玲瓏”VPU內(nèi)部的算法十分靈活,ME的目標也很靈活。產(chǎn)品編碼的迭代更多是在ME層面上實現(xiàn)。

“玲瓏”VPU架構里的軟件控制同樣靈活,面對相應的需求可及時調(diào)整。實力強勁的廠商也可以使用自己的ME。對于ME的接口開放也是非常靈活的。

5888a0f4-ed66-11ed-90ce-dac502259ad0.png

盡管MC較為標準,但對于硬件的實現(xiàn)也較為靈活。

58938424-ed66-11ed-90ce-dac502259ad0.png

Transform在這里主要負責所有的變換,融合了不同的格式,也可以通過參數(shù)控制。

589e7b0e-ed66-11ed-90ce-dac502259ad0.png

58a96fbe-ed66-11ed-90ce-dac502259ad0.png

RASC主要負責整體的管理,數(shù)據(jù)流也是核間的IPC所控制管理的,具有較高的靈活調(diào)度性,可避免硬件本身的風險。RASC的設計比較考驗整體的設計能力,“玲瓏”VPU采用了一個小的MCU,基本上所有的代碼和數(shù)據(jù)都在ram里,緩存也與其它同類產(chǎn)品有所區(qū)別,我們擁有外部模塊的快速訪問接口。

58b59adc-ed66-11ed-90ce-dac502259ad0.png

MMU整體考量方向包括多路和安全,多路本身就需要完整的內(nèi)存層面的隔離,MMU VA32bit和PA40bit,基本上可以滿足所有場景的需求。

58c27662-ed66-11ed-90ce-dac502259ad0.png

在屬性管理方面, protect、可執(zhí)行等方面屬性與SMMU類似,但與Arm SMMU整體架構不同,此處MMU更像是GPU內(nèi)的MMU,想要應對每個處理單元的訪問,每個uTLB都應該有所配置,Micro uTLB和PTW也都有相應的優(yōu)化。

58d03b44-ed66-11ed-90ce-dac502259ad0.png

58dceb1e-ed66-11ed-90ce-dac502259ad0.png

SDMA是一個更為標準化的DMA。除了bitstream之外,還要應對多個硬件加速單元控制結(jié)構之間的傳輸。所以“玲瓏”VPU在硬件加速層面有很多細節(jié)處理,用以滿足整體系統(tǒng)層面的優(yōu)化。

58ebb57c-ed66-11ed-90ce-dac502259ad0.png

58f60798-ed66-11ed-90ce-dac502259ad0.png

Frame級別的控制管理都是由VDMA進行的??梢钥吹脚cFORMATTER相關的前處理都在FORMATTER里進行,前后處理也有各自的數(shù)據(jù)通路。最新一代的“玲瓏”VPU要比圖中所示增加了更多新的功能,前后處理層面也有更多的擴展。

5903c176-ed66-11ed-90ce-dac502259ad0.png

Deblock是濾波的模塊,用以應對不同格式filter的需求。

5910ac2e-ed66-11ed-90ce-dac502259ad0.png

Bitstream是編碼解碼碼流處理模塊,也是用于應對不同格式。在系統(tǒng)層面的 Bitstream會相對獨立,在系統(tǒng)層面劃分為“和流相關”或“和frame相關”,硬件控制會在系統(tǒng)層面進行兩步劃分,無論是編碼還是解碼,都要先MB在級別的劃分。

5921a0d8-ed66-11ed-90ce-dac502259ad0.png

這張圖是解碼的基本程序,碼流、MB、MV等信息都會進行保存。

59354cd2-ed66-11ed-90ce-dac502259ad0.png

編碼過程也與解碼過程類似。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • RGB
    RGB
    +關注

    關注

    4

    文章

    796

    瀏覽量

    58336
  • ARM處理器
    +關注

    關注

    6

    文章

    360

    瀏覽量

    41632
  • 視頻編解碼
    +關注

    關注

    2

    文章

    54

    瀏覽量

    11722
  • HEVC
    +關注

    關注

    1

    文章

    37

    瀏覽量

    23914
  • ai技術
    +關注

    關注

    1

    文章

    1250

    瀏覽量

    24200

原文標題:“玲瓏”編解碼融合架構助力視頻多元化需求

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    立訊精密獲評2024年度多元化供應商獎

    以“新質(zhì)生產(chǎn)力助力多元化采購”為主題的Minority Supplier Development in China (MSDC)年會暨頒獎晚宴在上海圓滿舉行。MSDC是中國首家倡導多元化采購理念并
    的頭像 發(fā)表于 09-27 11:38 ?437次閱讀

    安謀科技自研“玲瓏”多媒體家族再添新軍,加速超高清顯示和端邊云視頻應用落地

    9月19日,安謀科技在北京召開新品發(fā)布媒體溝通會,正式亮出本土自研多媒體產(chǎn)品矩陣的最新力作——首款“玲瓏”D8/D6/D2顯示處理器和新一代的“玲瓏”V510/V710視頻處理器,為當前終端市場超高畫質(zhì)顯示、超高清
    的頭像 發(fā)表于 09-25 15:00 ?2771次閱讀
    安謀科技自研“<b class='flag-5'>玲瓏</b>”多媒體家族再添新軍,加速超高清顯示和端邊云<b class='flag-5'>視頻</b>應用落地

    BK7256 WIFI+BLE音視頻低功耗芯片 ,支持小家電驅(qū)屏,ipc、可視門鎖,智能貓眼

    芯片,完整的降噪、回聲消除、均衡、Beamforming軟件方案。 4、集成JPEG硬件編解碼模塊,提供720P像素的編解碼能力; 5、支持WIFI4、WIFI6連接,支持低功耗?;罟δ?,DTIM10場景最低310UA。 6、芯片內(nèi)置LVGL圖形庫,為中控屏應用提供快速
    發(fā)表于 06-15 13:53

    UVLED面光源的未來發(fā)展:多元化、定制化成主流趨勢

    。多元化和定制將成為UVLED面光源未來發(fā)展的主流趨勢。 一、多元化:滿足不同領域的需求 隨著UVLED面光源技術的不斷成熟,其應用領域也在不斷擴大。從最初的印刷、電子、醫(yī)療等領域,
    的頭像 發(fā)表于 05-10 15:26 ?461次閱讀
    UVLED面光源的未來發(fā)展:<b class='flag-5'>多元化</b>、定制化成主流趨勢

    【RTC程序設計:實時音視頻權威指南】音視頻編解碼壓縮技術

    實現(xiàn)更高的壓縮比和更好的圖像質(zhì)量。兩種都是有損壓縮的技術,可以通過平衡壓縮比和圖像質(zhì)量,選擇不同的質(zhì)量級別。 視頻編解碼也是一種用于壓縮和解壓縮數(shù)字視頻數(shù)據(jù)的技術,期待視頻通信存儲
    發(fā)表于 04-28 21:04

    新一代人機交互:智能座艙的融合策略與趨勢

    從芯片架構來看, 智能座艙芯片的使用已經(jīng)呈多元化態(tài)勢。同時, 在汽車整體架構上,當前座艙產(chǎn)品正在從域架構向艙駕泊融合
    的頭像 發(fā)表于 03-27 12:29 ?741次閱讀

    編解碼一體機的主要應用場景是什么?

    編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備,廣泛應用于各個領域。以下是編解碼一體機的幾個主要應用場景: 來百度APP暢享高清圖片
    的頭像 發(fā)表于 01-31 14:57 ?571次閱讀
    <b class='flag-5'>編解碼</b>一體機的主要應用場景是什么?

    編解碼一體機相對于傳統(tǒng)的編解碼設備有哪些優(yōu)勢?

    編解碼一體機相對于傳統(tǒng)的編解碼設備具有多個優(yōu)勢。以下是編解碼一體機的幾個主要優(yōu)勢: 高效實時的視頻處理能力:編解碼一體機采用先進的
    的頭像 發(fā)表于 01-31 14:56 ?1248次閱讀
    <b class='flag-5'>編解碼</b>一體機相對于傳統(tǒng)的<b class='flag-5'>編解碼</b>設備有哪些優(yōu)勢?

    編解碼一體機:提高視頻處理效率的關鍵

    編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。相較于傳統(tǒng)的視頻處理方式,它能夠顯著提高視頻處理的效率。 傳統(tǒng)的
    的頭像 發(fā)表于 01-31 14:52 ?336次閱讀
    <b class='flag-5'>編解碼</b>一體機:提高<b class='flag-5'>視頻</b>處理效率的關鍵

    深入了解編解碼一體機:工作原理及應用

    、電視機、DVD等視頻源。 視頻編碼:采集到的原始視頻信號需要進行壓縮編碼,以減少存儲空間和傳輸帶寬的需求。編解碼一體機采用先進的
    的頭像 發(fā)表于 01-31 14:52 ?508次閱讀
    深入了解<b class='flag-5'>編解碼</b>一體機:工作原理及應用

    如何選擇最適合你的編解碼一體機?

    選擇最適合自己的編解碼一體機需要考慮以下幾個方面: 應用場景:首先需要明確編解碼一體機的應用場景,如視頻會議、安防監(jiān)控、教育錄播等。不同的應用場景對編解碼一體機的性能要求不同,需要根據(jù)
    的頭像 發(fā)表于 01-31 14:49 ?646次閱讀
    如何選擇最適合你的<b class='flag-5'>編解碼</b>一體機?

    編解碼一體機:技術、應用與挑戰(zhàn)

    編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。它基于云計算技術,具有高效、實時的視頻處理能力,廣泛應用于安防監(jiān)控、視頻
    的頭像 發(fā)表于 01-31 14:48 ?456次閱讀
    <b class='flag-5'>編解碼</b>一體機:技術、應用與挑戰(zhàn)

    編解碼一體機看視頻處理技術的未來

    編解碼一體機的發(fā)展趨勢來看,視頻處理技術未來將朝著以下幾個方向發(fā)展: 高效編解碼技術:隨著視頻分辨率和碼率的不斷提高,對編解碼效率的要求也
    的頭像 發(fā)表于 01-31 14:47 ?371次閱讀
    從<b class='flag-5'>編解碼</b>一體機看<b class='flag-5'>視頻</b>處理技術的未來

    什么是編解碼一體機?

    一體機還支持多平臺和多終端訪問,允許用戶通過PC、手機、平板等設備隨時隨地訪問和處理視頻內(nèi)容。 編解碼一體機具有許多優(yōu)勢。首先,它能夠?qū)崿F(xiàn)高效、實時的視頻處理,滿足各種應用場景的需求。
    的頭像 發(fā)表于 01-31 14:19 ?564次閱讀
    什么是<b class='flag-5'>編解碼</b>一體機?

    視頻編解碼器-晶振應用選型方案簡介

    隨著科技的日新月異,視頻編解碼技術也將迎來新的發(fā)展機遇,5G網(wǎng)絡的普及將進一步提升視頻傳輸速度和質(zhì)量,為視頻編解碼器的發(fā)展提供更廣闊的空間。
    的頭像 發(fā)表于 12-09 10:55 ?902次閱讀
    <b class='flag-5'>視頻</b><b class='flag-5'>編解碼</b>器-晶振應用選型方案簡介