0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

運動估計與運動補償?shù)腍.263壓縮算法分析和優(yōu)化研究

電子設(shè)計 ? 來源:電子技術(shù)應(yīng)用 ? 作者:余振建;周健;戴梅 ? 2020-11-11 10:45 ? 次閱讀

運動圖像遠程實時傳輸系統(tǒng)的網(wǎng)絡(luò)傳輸部分架構(gòu)在Internet之上,而現(xiàn)階段Internet的狀況是帶寬小、延遲大、不穩(wěn)定。所以為了獲得良好的實時傳輸效果,除了改善傳輸控制機制之外,還需要實現(xiàn)高壓縮比、低耗時、能達到實時壓縮和解壓縮效果的運動圖像壓縮方法。H.263是國際電信協(xié)會-電信標(biāo)準化部門ITU-T(The International Telecommunications Union-Telecommunication Standardization Sector)于1995年通過的用于低比特率實時傳輸?shù)?a target="_blank">視頻編解碼協(xié)議。其設(shè)計初衷是滿足帶寬低于64kbps的低帶寬視頻應(yīng)用需求,如視頻會議、可視電話等?,F(xiàn)在H.263也被應(yīng)用于運動圖像遠程實時傳輸系統(tǒng)中,但原始的H.263在實時性和壓縮比等方面還有不少可優(yōu)化余地。本文針對具體的運動圖像遠程實時傳輸系統(tǒng)應(yīng)用,在大量研究工作基礎(chǔ)上提出多個H.263的優(yōu)化策略,并取得了相當(dāng)好的效果。

1 H.263壓縮算法的分析概要

H.263的輸入視頻幀格式為QCIF(Quarter Common Intermediate Format,大小為176×144)、CIF(Common Intermediate Format,大小為352×288)等。將每個視頻幀分成許多宏塊(MB-Micro Block),每個宏塊由4個Y亮度塊、1個Cb色度塊和1個Cr色度塊組成。塊(Block)的大小為8×8。H.263以宏塊為單位進行視頻幀的壓縮。

H.263使用離散余弦變換DCT(Discrete Cosine Transform)減小空間冗余,使用運動估計和運動補償(Motion Estimation and Motion Compensation)減小時間冗余。H.263有兩種編碼方式,一種是Intra方式,幀內(nèi)編碼,產(chǎn)生的幀作為關(guān)鍵幀-I幀;另一種是Inter方式,幀間編碼,產(chǎn)生的幀作為非關(guān)鍵幀-P幀。

通過分析,將H.263壓縮算法的流程圖歸納為如圖1所示。

通過分析和測試表明,DCT、運動估計和運動補償是H.263最重要的部分,同時也是H.263實現(xiàn)中最耗時的運算環(huán)節(jié)。要提高H.263的運算速度,就要針對這些環(huán)節(jié)進行優(yōu)化。

2 轉(zhuǎn)換函數(shù)、DCT和運動估計環(huán)節(jié)的優(yōu)化

2.1 色彩空間轉(zhuǎn)換函數(shù)的優(yōu)化

CIF格式基于YUV色彩空間,而應(yīng)用程序中,大多數(shù)視頻采集程序只提供RGB色彩空間的視頻幀,因此需要建立從RGB色彩空間到Y(jié)UV色彩空間的轉(zhuǎn)換函數(shù)。

RGB到Y(jié)UV的轉(zhuǎn)換函數(shù)如下所示,其中Y為YUV色彩空間的亮度值,U(Cb)和V(Cr)為YUV色彩空間的色度值。

Y=0.299×R+0.587×G+0.114×B;

Cr=V=(R-Y)×127/179;

Cb=U=(B-Y)×127/226;

H.263原有的色彩空間轉(zhuǎn)換算法采用浮點運算,但浮點運算會消耗較多的CPU周期。為了加快視頻處理速度,采用整型乘法和向右移位來代替浮點乘除,從而有效縮短了轉(zhuǎn)換時間。

優(yōu)化后的轉(zhuǎn)換函數(shù)如下:

Y=((R×313524)》》20)+((G×615514)》》20)×((B×119538)》》20);

Cr=V=((R-Y)×743962))》》20;

Cb=U=((B-Y)×589244))》》20;

2.2 DCT、IDCT算法的優(yōu)化

二維DCT公式為:

通過分析得出,DCT快速算法的實現(xiàn)可以有兩種方式。一種方法是把已有的快速變換算法(如FFT、FHT等)映射到DCT計算中,這種方式多了一個映射環(huán)節(jié),增加了計算的復(fù)雜度;另一種方法是從DCT變換本身尋找規(guī)律進行改進。

在H.263應(yīng)用中,注意到兩條規(guī)律:一是能量集中在少部分DCT系數(shù)上;二是隨著量化步長的增大,被量化為零的DCT系數(shù)增多,而且對DCT計算的精度要求降低。于是,采用一種零系數(shù)預(yù)測策略,即根據(jù)量化步長,首先對DCT變換的輸入數(shù)據(jù)分類,對于給定的量化步長,如果輸入數(shù)據(jù)將要被量化為0,那么這些數(shù)據(jù)就不必做DCT運算,而直接將變換結(jié)果置為0。這樣只需對部分數(shù)據(jù)進行DCT變換,因此節(jié)省了大量無效運算。另外,利用DCT的局部并行性,使用Intel的多媒體處理指令集-MMX來實現(xiàn)DCT計算,大幅度提高了運算速度。

2.3 運動估計與運動補償算法的優(yōu)化

運動估計是指在參考幀中搜索一個與當(dāng)前幀圖像塊最相似的圖像塊,即最佳匹配塊,搜索結(jié)果用運動向量來表示。運動補償是指利用參考幀和已求得的運動向量重構(gòu)當(dāng)前幀,把重構(gòu)幀和當(dāng)前幀的差值作為當(dāng)前幀的補償值進行壓縮編碼。兩者互相配合,共同實現(xiàn)壓縮效果。

運動估計算法的研究從兩方面著手:快速搜索算法和塊匹配準則。

最簡單的搜索算法是全搜索法(FS),這種算法精度高,但計算量過于龐大。為了加快運算速度,保證精度,人們提出了很多快速搜索算法:三步法(TSS)及基于三步法的改進算法、二維對數(shù)法(LOGS)、交叉搜索法(CS)、四步法(4SS)、預(yù)測搜索法(PSA)、鉆石搜索法(DS)等。鉆石搜索法是迄今為止綜合性能最優(yōu)的快速搜索算法之一,用于本次項目研究中。

塊匹配準則決定何時找到最佳匹配塊,從而終止搜索進程。傳統(tǒng)的準則有絕對平均誤差函數(shù)(MAE)、互相關(guān)函數(shù)(CCF)、均方誤差函數(shù)(MSE)、最大誤差最小函數(shù)(MME)等。由于傳統(tǒng)方法沒有考慮人眼的視覺特性,所以判斷結(jié)果和人眼的感知相差較大。實際H.263采用的塊匹配準則為MSE的替代準則SAD(絕對差和),兩者的公式如下:

其中:F0和F-1分別代表當(dāng)前幀和重構(gòu)幀(參考幀);k,l為待編碼宏塊在當(dāng)前幀中的坐標(biāo);x,y為重構(gòu)幀中參考宏塊的坐標(biāo);N表示宏塊的尺寸,此處為16。從公式中可見,SAD用絕對值運算代替了MSE的乘方運算,明顯降低了運算量,從而可以加快計算速度。

測試表明,SAD的計算量要比MSE的計算量減少三分之一,而它們的圖像效果相當(dāng)。

此外,還可以利用硬件特性加速塊匹配準則的運算速度,Intel的MMX技術(shù)提供了這種特性。SAD等塊匹配準則主要針對短數(shù)據(jù)的重復(fù)計算,MMX增加了系統(tǒng)單個指令操作數(shù)據(jù)的數(shù)目(SIMD),從而可以在一個指令中完成多組數(shù)據(jù)的計算,實現(xiàn)并行機制,從而加快運算速度。

3 提高壓縮比的選擇

H.263提供了許多高級模式來提高視頻壓縮比。從對壓縮效率的貢獻角度看,大運動向量模式、高級預(yù)測模式、PB幀模式和增強PB幀模式是最重要的4個高級模式。

在大運動向量模式和高級預(yù)測模式下,運動向量可以指到圖像邊界以外,增大了運動向量的表達范圍,從而在本質(zhì)上提高了運動補償?shù)木纫愿纳凭幋a效率。

基本PB幀模式下,一個PB幀是一個P幀和一個B幀組成的整體。當(dāng)前P幀由前一個P幀預(yù)測得到,B幀則由前一個P幀和當(dāng)前P幀預(yù)測得到(見圖2)。PB幀模式在增加較少比特數(shù)的情況下,將幀率提高了近一倍。

增強PB幀模式的主要改進點在于預(yù)測方式的增強?;綪B幀模式對B幀圖像(或宏塊 )僅允許使用雙向預(yù)測,而增強的PB幀模式對B幀圖像則允許使用前向預(yù)測(見圖3)、后向預(yù)測(見圖4)和雙向預(yù)測(見圖2)三種手段。這樣,在壓縮過程中,有機會選擇更合適的預(yù)測方法處理B幀圖像(或宏塊),從而提高B幀的壓縮效率。基本PB幀模式的B幀只能通過雙向預(yù)測獲得,這對慢速運動圖像效果較好。當(dāng)輸入運動圖像存在快速不規(guī)則運動時,B幀質(zhì)量會急劇惡化,而增強PB幀模式的B幀有三種預(yù)測方式可選,可以解決這一難題。通過分析和測試表明,增強PB幀模式比基本PB幀模式有更強的魯棒性,更適用于運動圖像遠程實時傳輸。

大運動向量模式和高級預(yù)測模式由于增大了運動向量的表示范圍,可以增強運動補償?shù)木?,從而提高壓縮比;而增強PB幀模式引入B幀,有三種預(yù)測方式可以生成B幀,在相同幀率的情況下,將壓縮比提高近80%,壓縮效果明顯。在實際程序設(shè)計中,筆者配合傳輸環(huán)境測試模塊,在網(wǎng)絡(luò)帶寬較低時實現(xiàn)這三種方式的配合使用,發(fā)揮了更大的壓縮效率,達到更高的壓縮比。

4 實驗數(shù)據(jù)和性能分析

4.1 算法優(yōu)化測試

分別取100幀三種不同格式(SUB-QCIF:88×72,QCIF:178×144,CIF:352×288)的視頻幀,每20幀取1個關(guān)鍵幀,視頻幀質(zhì)量取6000,比較優(yōu)化前和優(yōu)化后算法的時間效率,結(jié)果如(圖5)所示。

縱軸單位為毫秒,表示壓縮完成所需時間??梢?,要處理的視頻幀越大,優(yōu)化后的算法取得的加速效果越明顯。

4.2 增強PB幀模式壓縮效果測試

分別取100幀三種不同格式(SUB-QCIF:88×72,QCIF:178×144,CIF:352×288)的視頻幀,每20幀取1個關(guān)鍵幀,視頻幀質(zhì)量取6000,比較使用增強PB幀模式前和使用增強PB幀模式后算法的壓縮效率,結(jié)果如(圖6)所示。

縱軸為壓縮比。要處理的視頻幀越大,冗余信息越多,增強PB幀模式的壓縮效果越明顯。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10813

    瀏覽量

    210880
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1930

    瀏覽量

    72778
  • 傳輸系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    149

    瀏覽量

    37145
收藏 人收藏

    評論

    相關(guān)推薦

    針對硬件實現(xiàn)的h.264視頻編碼算法改進

    針對硬件實現(xiàn)的h.264視頻編碼算法改進針對硬件實現(xiàn)的視頻編碼算法改進上海交通大學(xué)圖像通信與信息處理研究所 周怡吳昊方向忠摘要’ 從硬件實現(xiàn)的角度
    發(fā)表于 06-25 11:35

    H.263標(biāo)準中文版

    H.263標(biāo)準中文版建議說明了一個可以用來壓縮包含低比特率情況下的有運動圖象成分的視聽服務(wù)的編碼表示。視頻信號編碼的基本構(gòu)造是基于ITU-T的H.261建議,它是通過幀間預(yù)測編碼去除時
    發(fā)表于 06-25 12:49

    視頻通信中的一種視頻壓縮傳輸方案

    了一個基于H.263協(xié)議的視頻壓縮傳輸方案,其目標(biāo)是可移植性、低運算量和良好容錯性。1 問題的提出  基于H.263的視頻壓縮中,運動
    發(fā)表于 09-19 09:33

    H264視頻編碼技術(shù)

    H264視頻編碼技術(shù)  H.264壓縮算法采用與H.263和MPEG-4類似的基于塊的混和編碼方法,采用幀內(nèi)(Intra)和幀間(Inter
    發(fā)表于 08-10 14:53

    有關(guān) 基于FPGA的H264運動估計算法優(yōu)化與實現(xiàn) 的問題

    大家好我是剛剛來這的實習(xí)生(拱手)。最近在看 基于FPGA的H264運動估計算法優(yōu)化與實現(xiàn) 方面的東西,他提出了一個概念:運動矢量。這是如何
    發(fā)表于 04-28 11:51

    介紹一種基于H.264標(biāo)準的快速運動估計算法

    本文介紹了一種基于H.264標(biāo)準的快速運動估計算法。
    發(fā)表于 06-03 06:27

    h.263協(xié)議中文版

    ITU-T H.263建議ITU的電訊標(biāo)準化組織 ITU電訊標(biāo)準化部門是國際電訊聯(lián)合會的一個永久性部門。ITU-T負責(zé)從使世界范圍的電訊標(biāo)準化的角度出發(fā),來研究、操作和回答問題以及
    發(fā)表于 06-25 12:24 ?0次下載

    h.264碼流結(jié)構(gòu)/H.263的碼流結(jié)構(gòu)

    、H.264的碼流結(jié)構(gòu)H.264的碼流結(jié)構(gòu)和H.263的有很大的區(qū)別,它采用的不再是嚴格的分級結(jié)構(gòu)。 a、H.263的碼流結(jié)構(gòu)H.263
    發(fā)表于 08-19 13:46 ?59次下載
    <b class='flag-5'>h</b>.264碼流結(jié)構(gòu)/<b class='flag-5'>H.263</b>的碼流結(jié)構(gòu)

    運動估計綜述

    視頻序列圖像在時間上存在很強的相關(guān)性,采用運動估計運動補償技術(shù)可以消除時間冗余以提高編碼效率,這種技術(shù)廣泛用于視頻壓縮的一些國際標(biāo)準中,如
    發(fā)表于 08-25 13:09 ?24次下載

    基于H.264壓縮域的鏡頭運動信息提取

    本文根據(jù) H.264 編碼特點,提出了一種從 H.264 壓縮域中快速有效地進行鏡頭運動參數(shù)估計算法
    發(fā)表于 08-28 11:16 ?23次下載

    基于ADSP-BF561的H.263編解碼器實現(xiàn)

    本文在ADI 公司的ADSP-BF561 芯片上完成了壓縮編碼標(biāo)準H.263 的編程實現(xiàn)。首先簡要介紹了H.263 的性能和技術(shù)特點,詳細討論了H.263 編解碼器在
    發(fā)表于 09-02 08:54 ?25次下載

    基于DSP技術(shù)的H.263視頻編碼協(xié)議算法

    摘 要:對H.263編碼原理進行了簡單介紹,對運動估值中幾種主要搜索算法的性能進行了分析比較,完成了H.263
    發(fā)表于 03-03 22:36 ?25次下載

    H.264視頻壓縮快速運動估計算法 DCS算法

    H.264是現(xiàn)有最重要數(shù)據(jù)壓縮編碼國際標(biāo)準之一。 快速運動估計算法一直是視頻壓縮中的研究熱點。
    發(fā)表于 06-25 11:50 ?1744次閱讀
    <b class='flag-5'>H</b>.264視頻<b class='flag-5'>壓縮</b>快速<b class='flag-5'>運動</b><b class='flag-5'>估計算法</b> DCS<b class='flag-5'>算法</b>

    基于UMHexagonS的運動估計算法優(yōu)化

    針對UMHexagonS算法冗余搜索的問題,使用大十字搜索判定結(jié)果,改進原有的運動估計算法。改進算法判斷最優(yōu)點可能分布區(qū)域,使用相應(yīng)改進搜索模板搜索,降低搜索點個數(shù),達到避免冗余搜索的
    發(fā)表于 11-24 10:51 ?2次下載
    基于UMHexagonS的<b class='flag-5'>運動</b><b class='flag-5'>估計算法</b><b class='flag-5'>優(yōu)化</b>

    一種基于H.264標(biāo)準的快速運動估計算法

    關(guān)鍵詞:估計算法 , 快速運動 H.264是現(xiàn)有最重要數(shù)據(jù)壓縮編碼國際標(biāo)準之一。同時快速運動估計算法
    發(fā)表于 10-08 07:00 ?479次閱讀