国产欧美第一页,一区二区狠狠色丁香久久婷婷

隨著近年來 AI 技術的興起，視頻監(jiān)控、汽車、智能家居、移動設備及數(shù)據(jù)中心等對高清視頻處理有了越來越高的要求。安謀科技全新視頻處理器——“玲瓏”V6/V8，針對主流市場的視頻流媒體技術進行了大量投入，通過一系列智能權衡實現(xiàn)了極大優(yōu)化，為所有合作伙伴提供靈活的組合和選擇。LiveVideoStackCon 2022北京站邀請到了安謀科技多媒體產(chǎn)品經(jīng)理董峰，為我們分享“玲瓏”編解碼融合架構助力視頻多元化需求。

此次是安謀科技在LiveVideoStack大會的演講首秀。安謀科技是中國最大的芯片IP設計與服務供應商，在立足全球生態(tài)、深耕本土創(chuàng)新的基礎上，堅持以自研IP技術的創(chuàng)新發(fā)展與Arm IP相配合，為本土集成電路產(chǎn)業(yè)提供豐富的產(chǎn)品組合和解決方案。

自2018年獨立運營以來，安謀科技堅持開展自研IP和發(fā)展Arm IP業(yè)務，一方面是結(jié)合中國市場需求積極布局自研業(yè)務，堅持“全球標準，本土創(chuàng)新”，陸續(xù)推出“周易”NPU、“星辰”CPU、“山?！盨PU以及“玲瓏”ISP&VPU等自研IP成果，并全部實現(xiàn)了客戶相關芯片產(chǎn)品的流片和量產(chǎn)。另一方面，安謀科技也致力于將Arm 先進的架構和技術引進國內(nèi)，滿足國內(nèi)公司開發(fā)具有全球競爭力產(chǎn)品的需求。在兩大支柱業(yè)務的合力之下，目前安謀科技已打造一體化、完整的異構計算IP核心矩陣，助力中國智能計算產(chǎn)業(yè)高速發(fā)展。

芯片IP廠商需要考慮多元化的需求，應當滿足不同場景下的不同訴求。對于視頻來說，無論是端、邊、云都有很大的視頻編解碼需求。端側(cè)手機、IPC、無人機等不同場景對視頻編解碼的需求存在較大差異。而云端和車載則是完全不同的方向。手機以及安防在編碼和解碼方面差異也較為明顯，手機客戶解碼需求更強，但是旗艦機對于一些圖傳也存在不同需求。作為IP廠商如何面對復雜多變的市場需求是首當其沖的問題。

安謀科技VPU團隊在2019年底成立，從2020年初開始研發(fā)自研產(chǎn)品。我們團隊從Arm Mali-V52的維護開始，逐漸完成兩代產(chǎn)品的研發(fā)。為了更好地滿足行業(yè)基本格式需求，我們新增了AVS2和AV1格式，“玲瓏”V5/V7花費了近三個季度完成，“玲瓏”V6/V8則花費了將近一年。除了增加格式之外，還增強了整體編碼能力。“玲瓏”V5/V7的HEVC編碼質(zhì)量與Arm Mali-V52/76相比提升了15%，“玲瓏”V6/V8的H.264編碼質(zhì)量也比“玲瓏”V5/V7提升了10%。面對多樣的產(chǎn)品需求，增加了復雜的前后處理，“玲瓏”V5/V7增加了Any ratio downscaling的后處理；“玲瓏”V6/V8增加了OSD的前處理，以及YUV到RGB的后處理。

“玲瓏”VPU支持全格式，整體面積較小。“玲瓏”V5全格式支持包括前后處理P&R之后是1.83。芯片IP行業(yè)一直在追求更高的性能、更小的功耗和更小的面積，產(chǎn)品在迭代過程中針對上述問題的改進還是頗有成效。在整體架構方面也有別于其它架構，“玲瓏”VPU以單核實現(xiàn)編解碼融合，既可以編碼也可以解碼，以適用于多樣場景的需求。不只是硬件格式的支持，還囊括了可編程的軟件部分，以滿足對多種場景變化的需求。

在硬件層面上，“玲瓏”VPU添加更多靈活可配的接口，其它能力通過軟件層面實現(xiàn)擴展。該產(chǎn)品整體是5個MCU的結(jié)構，不同的MCU對應控制不同的硬件加速器。在spec分析階段，需要考慮哪些可以固化、哪些可以通過靈活的軟件配置實現(xiàn)，再將可固化的部分做成純硬件。

盡管端和云對處理器性能要求差異巨大，但是從芯片IP角度出發(fā)，還是希望能用統(tǒng)一的方式來支撐不同場景的需求，基于多核的可拓展性對性能進行擴展，通過擴展核數(shù)以支持不同場景需求。例如，端側(cè)客戶單核即可滿足需求，而邊緣側(cè)大致需要四核，那云端基本需要八核。在7nm制程前提下，八核基本可以實現(xiàn)8k@60fps編碼或8k@120fps解碼。

除了上述的多核可拓展性之外，“玲瓏”VPU對于MCU本身也會有所考量。不同于Arm Cortex A和Cortex M的核，其單獨為視頻場景進行定制優(yōu)化，基本上仍然是5級的流水。而在頻率方面，和整個VPU同頻。16FF下至少可達到800MHz。由此可見，該核本身就可以保證其性能，在視頻場景下更側(cè)重于加速器的控制，所以不會讓其觸碰pixel內(nèi)容，在指令集方面也做了很多優(yōu)化。

除了6個加速器之外，“玲瓏”VPU還有兩個DMA相關的單元，一個是SDMA，另一個是VDMA。VDMA主要用于處理Frame級別的數(shù)據(jù)，包括編碼的輸入數(shù)據(jù)和解碼的輸出數(shù)據(jù)，前后處理也可以通過該單元靈活擴展。這幾代產(chǎn)品的迭代都是把功能分散到不同的加速器以及top層上。應對不同場景的需求，除了性能和基本功能之外，系統(tǒng)層面仍然有差異化的需求，多路的隔離、系統(tǒng)訪存延遲優(yōu)化、降帶寬、降延時等都屬于系統(tǒng)層面的優(yōu)化，也和Arm的生態(tài)保持一致。

在系統(tǒng)層面，通過降帶寬、降延時來應對大帶寬系統(tǒng)的需求，基于AFBC，可與Arm GPU以及Display搭配進行，內(nèi)部中間的參考幀使用AFBC壓縮，可讓帶寬在輸入和輸出都不壓縮的情況下降低35%。在GPU使用VPU解碼數(shù)據(jù)進行紋理渲染時，整體的帶寬可降低至原先的45%。在Display場景中，也可以達到類似的效果。除了整個數(shù)據(jù)流，中間的參考幀數(shù)據(jù)也可以單獨拿出來為后面的單元進行相對地管理，也可以有效降低帶寬?！傲岘嚒盫PU圍繞各個層面進行統(tǒng)一考量，以更好地降低帶寬需求。

VPU不僅需要在視頻場景中考量系統(tǒng)層面的優(yōu)化，也需要從系統(tǒng)層面進行考量，內(nèi)部的并行也可以在top ram進行優(yōu)化，以減少多核之間的內(nèi)存訪存。VPU與CPU處理器、視頻、顯示的聯(lián)合也可以做到類似的效果。

就AFBC本身而言，也分為不同的版本。AFBC是Arm Frame Buffer Compression的縮寫，簡單理解就是Arm系統(tǒng)層面上的無損壓縮，主要目的是帶寬的優(yōu)化。AFBC的能力是基于Arm整個IP層面來實現(xiàn)的，是在系統(tǒng)層面的整體優(yōu)化。對于ISP而言，Arm也有專用的AFBC模塊用來連接ISP，端側(cè)場景也可以在視頻里直接輸入AFBC數(shù)據(jù)以減少帶寬。AFBC的好處很多，尤其是對rotation十分友好，系統(tǒng)層面通過AFBC就可以繞過rotation這種耗帶寬的處理，從原始數(shù)據(jù)進行rotation的訪問，對于系統(tǒng)的總線來說存在不小的壓力。但通過AFBC的方式在內(nèi)部優(yōu)化rotation，能夠支持連續(xù)的訪問，這種方式更簡單高效。此外，AFBC的不同格式也對系統(tǒng)的隨機訪問有所支持。

“玲瓏”VPU原生就支持多路，端側(cè)場景也需要多路，對于云端場景來說多路更是剛需。應對多路復雜多分辨率的場景，也是巨大的考驗?！傲岘嚒盫PU通過核心調(diào)度器負責多核調(diào)度，多核并行按照條帶級別劃分任務，任何核都可以通過核心調(diào)度器硬件直接調(diào)度?！傲岘嚒盫PU原生硬件可支持4個上下文，4路不同場景都可以通過核心調(diào)度器進行切換。而總線仲裁器則負責系統(tǒng)層面的訪問，與核互聯(lián)以整體判決，從而優(yōu)化緩存，在輸出時可通過AXI進行。三步結(jié)合，一起對訪存進行優(yōu)化。

為應對云端和邊緣場景，除了對核進行優(yōu)化之外，硬件也要進行優(yōu)化。低功率可以通過LPI接口得以實現(xiàn)。整體來看，多核、異步處理是優(yōu)化過程中的核心部分。不同的要求可以使用不同的管理策略，靈活配置能夠更好地服務客戶。

REF主要用于處理參考幀的訪問，可通過隨機訪問以達到性能的優(yōu)化。

“玲瓏”VPU內(nèi)部的算法十分靈活，ME的目標也很靈活。產(chǎn)品編碼的迭代更多是在ME層面上實現(xiàn)。

“玲瓏”VPU架構里的軟件控制同樣靈活，面對相應的需求可及時調(diào)整。實力強勁的廠商也可以使用自己的ME。對于ME的接口開放也是非常靈活的。

盡管MC較為標準，但對于硬件的實現(xiàn)也較為靈活。

Transform在這里主要負責所有的變換，融合了不同的格式，也可以通過參數(shù)控制。

RASC主要負責整體的管理，數(shù)據(jù)流也是核間的IPC所控制管理的，具有較高的靈活調(diào)度性，可避免硬件本身的風險。RASC的設計比較考驗整體的設計能力，“玲瓏”VPU采用了一個小的MCU，基本上所有的代碼和數(shù)據(jù)都在ram里，緩存也與其它同類產(chǎn)品有所區(qū)別，我們擁有外部模塊的快速訪問接口。

MMU整體考量方向包括多路和安全，多路本身就需要完整的內(nèi)存層面的隔離，MMU VA32bit和PA40bit，基本上可以滿足所有場景的需求。

在屬性管理方面， protect、可執(zhí)行等方面屬性與SMMU類似，但與Arm SMMU整體架構不同，此處MMU更像是GPU內(nèi)的MMU，想要應對每個處理單元的訪問，每個uTLB都應該有所配置，Micro uTLB和PTW也都有相應的優(yōu)化。

SDMA是一個更為標準化的DMA。除了bitstream之外，還要應對多個硬件加速單元控制結(jié)構之間的傳輸。所以“玲瓏”VPU在硬件加速層面有很多細節(jié)處理，用以滿足整體系統(tǒng)層面的優(yōu)化。

Frame級別的控制管理都是由VDMA進行的?？梢钥吹脚cFORMATTER相關的前處理都在FORMATTER里進行，前后處理也有各自的數(shù)據(jù)通路。最新一代的“玲瓏”VPU要比圖中所示增加了更多新的功能，前后處理層面也有更多的擴展。

Deblock是濾波的模塊，用以應對不同格式filter的需求。

Bitstream是編碼解碼碼流處理模塊，也是用于應對不同格式。在系統(tǒng)層面的 Bitstream會相對獨立，在系統(tǒng)層面劃分為“和流相關”或“和frame相關”，硬件控制會在系統(tǒng)層面進行兩步劃分，無論是編碼還是解碼，都要先MB在級別的劃分。

這張圖是解碼的基本程序，碼流、MB、MV等信息都會進行保存。

編碼過程也與解碼過程類似。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

RGB

RGB

+關注

關注
4

文章
796

瀏覽量
58336
ARM處理器

ARM處理器

+關注

關注
6

文章
360

瀏覽量
41632
視頻編解碼

視頻編解碼

+關注

關注
2

文章
54

瀏覽量
11722
HEVC

HEVC

+關注

關注
1

文章
37

瀏覽量
23914
ai技術

ai技術

+關注

關注
1

文章
1250

瀏覽量
24200

原文標題：“玲瓏”編解碼融合架構助力視頻多元化需求

文章出處：【微信號：livevideostack，微信公眾號：LiveVideoStack】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

立訊精密獲評2024年度多元化供應商獎

以“新質(zhì)生產(chǎn)力助力多元化采購”為主題的Minority Supplier Development in China (MSDC)年會暨頒獎晚宴在上海圓滿舉行。MSDC是中國首家倡導多元化采購理念并

發(fā)表于 09-27 11:38 ?437次閱讀

安謀科技自研“玲瓏”多媒體家族再添新軍，加速超高清顯示和端邊云視頻應用落地

9月19日，安謀科技在北京召開新品發(fā)布媒體溝通會，正式亮出本土自研多媒體產(chǎn)品矩陣的最新力作——首款“玲瓏”D8/D6/D2顯示處理器和新一代的“玲瓏”V510/V710視頻處理器，為當前終端市場超高畫質(zhì)顯示、超高清

發(fā)表于 09-25 15:00 ?2771次閱讀

安謀科技自研“<b class='flag-5'>玲瓏</b>”多媒體家族再添新軍，加速超高清顯示和端邊云<b class='flag-5'>視頻</b>應用落地

BK7256 WIFI+BLE音視頻低功耗芯片，支持小家電驅(qū)屏，ipc、可視門鎖，智能貓眼

芯片，完整的降噪、回聲消除、均衡、Beamforming軟件方案。 4、集成JPEG硬件編解碼模塊，提供720P像素的編解碼能力； 5、支持WIFI4、WIFI6連接，支持低功耗?；罟δ?，DTIM10場景最低310UA。 6、芯片內(nèi)置LVGL圖形庫，為中控屏應用提供快速

發(fā)表于 06-15 13:53

UVLED面光源的未來發(fā)展：多元化、定制化成主流趨勢

。多元化和定制化將成為UVLED面光源未來發(fā)展的主流趨勢。一、多元化：滿足不同領域的需求隨著UVLED面光源技術的不斷成熟，其應用領域也在不斷擴大。從最初的印刷、電子、醫(yī)療等領域，

發(fā)表于 05-10 15:26 ?461次閱讀

UVLED面光源的未來發(fā)展：<b class='flag-5'>多元化</b>、定制化成主流趨勢

【RTC程序設計：實時音視頻權威指南】音視頻的編解碼壓縮技術

實現(xiàn)更高的壓縮比和更好的圖像質(zhì)量。兩種都是有損壓縮的技術，可以通過平衡壓縮比和圖像質(zhì)量，選擇不同的質(zhì)量級別。視頻的編解碼也是一種用于壓縮和解壓縮數(shù)字視頻數(shù)據(jù)的技術，期待視頻通信存儲

發(fā)表于 04-28 21:04

新一代人機交互：智能座艙的融合策略與趨勢

從芯片架構來看, 智能座艙芯片的使用已經(jīng)呈多元化態(tài)勢。同時, 在汽車整體架構上，當前座艙產(chǎn)品正在從域架構向艙駕泊融合

發(fā)表于 03-27 12:29 ?741次閱讀

編解碼一體機的主要應用場景是什么？

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備，廣泛應用于各個領域。以下是編解碼一體機的幾個主要應用場景：來百度APP暢享高清圖片

發(fā)表于 01-31 14:57 ?571次閱讀

編解碼一體機相對于傳統(tǒng)的編解碼設備有哪些優(yōu)勢？

編解碼一體機相對于傳統(tǒng)的編解碼設備具有多個優(yōu)勢。以下是編解碼一體機的幾個主要優(yōu)勢：高效實時的視頻處理能力：編解碼一體機采用先進的

發(fā)表于 01-31 14:56 ?1248次閱讀

<b class='flag-5'>編解碼</b>一體機相對于傳統(tǒng)的<b class='flag-5'>編解碼</b>設備有哪些優(yōu)勢？

編解碼一體機：提高視頻處理效率的關鍵

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。相較于傳統(tǒng)的視頻處理方式，它能夠顯著提高視頻處理的效率。傳統(tǒng)的

發(fā)表于 01-31 14:52 ?336次閱讀

<b class='flag-5'>編解碼</b>一體機：提高<b class='flag-5'>視頻</b>處理效率的關鍵

深入了解編解碼一體機：工作原理及應用

、電視機、DVD等視頻源。視頻編碼：采集到的原始視頻信號需要進行壓縮編碼，以減少存儲空間和傳輸帶寬的需求。編解碼一體機采用先進的

發(fā)表于 01-31 14:52 ?508次閱讀

深入了解<b class='flag-5'>編解碼</b>一體機：工作原理及應用

如何選擇最適合你的編解碼一體機？

選擇最適合自己的編解碼一體機需要考慮以下幾個方面：應用場景：首先需要明確編解碼一體機的應用場景，如視頻會議、安防監(jiān)控、教育錄播等。不同的應用場景對編解碼一體機的性能要求不同，需要根據(jù)

發(fā)表于 01-31 14:49 ?646次閱讀

編解碼一體機：技術、應用與挑戰(zhàn)

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。它基于云計算技術，具有高效、實時的視頻處理能力，廣泛應用于安防監(jiān)控、視頻

發(fā)表于 01-31 14:48 ?456次閱讀

從編解碼一體機看視頻處理技術的未來

從編解碼一體機的發(fā)展趨勢來看，視頻處理技術未來將朝著以下幾個方向發(fā)展：高效編解碼技術：隨著視頻分辨率和碼率的不斷提高，對編解碼效率的要求也

發(fā)表于 01-31 14:47 ?371次閱讀

什么是編解碼一體機？

一體機還支持多平臺和多終端訪問，允許用戶通過PC、手機、平板等設備隨時隨地訪問和處理視頻內(nèi)容。 編解碼一體機具有許多優(yōu)勢。首先，它能夠?qū)崿F(xiàn)高效、實時的視頻處理，滿足各種應用場景的需求。

發(fā)表于 01-31 14:19 ?564次閱讀

視頻編解碼器-晶振應用選型方案簡介

隨著科技的日新月異，視頻編解碼技術也將迎來新的發(fā)展機遇，5G網(wǎng)絡的普及將進一步提升視頻傳輸速度和質(zhì)量，為視頻編解碼器的發(fā)展提供更廣闊的空間。

發(fā)表于 12-09 10:55 ?902次閱讀

搜索歷史

“玲瓏”編解碼融合架構助力視頻多元化需求

評論