0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于數(shù)字信號處理器實現(xiàn)MPEG4視頻編碼器的軟硬件設(shè)計

電子設(shè)計 ? 來源:郭婷 ? 作者:電子設(shè)計 ? 2019-07-29 08:14 ? 次閱讀

1 引 言

近年來,隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,視頻信息通信的重要性和需求急劇增長,而其中的關(guān)鍵就在于視頻壓縮編碼技術(shù)的應(yīng)用。提出了一種基于TMS320DM642 DSP的視頻編碼方案,實現(xiàn)了H.264算法。同H.264相比,MPEG4具有軟硬件開發(fā)成本低和更容易實現(xiàn)的優(yōu)勢,是目前視頻編碼應(yīng)用的主流。本文提出了一種基于TMS320DM642 DSP的MPEG4視頻編碼器的實現(xiàn)方法,該方案可用于遠程視頻監(jiān)控、視頻會議等諸多領(lǐng)域。

MPEG4是由國際運動圖像專家組(MPEG)開發(fā)制定的國際通用視頻壓縮編碼標(biāo)準(zhǔn),目前已經(jīng)發(fā)展成為可適應(yīng)不同傳輸帶寬、可用最少的數(shù)據(jù)來獲得最佳質(zhì)量圖像的高效壓縮算法和工具。MPEG采用了DCT、量化、熵編碼等算法,通過對形狀、運動、紋理等信息的分析,消除圖像數(shù)據(jù)在時間和空間上的相關(guān)性,具有高效壓縮性及普遍適用性等獨特優(yōu)勢,為視頻信息高效存儲、傳輸提供了方便。

MPEG4為不同的應(yīng)用對應(yīng)的碼率、分辨率、質(zhì)量和服務(wù)定義了編碼器和碼流的不同框架和級別,其中的簡單框架提供了對矩形視頻對象的編碼功能。本文所實現(xiàn)的就是MPEG4視頻編碼算法的簡單框架。

2 MPEG4編碼器硬件平臺

實現(xiàn)MPEG4編碼器的硬件平臺以TMS320DM642DSP為核心,并配合以適當(dāng)?shù)耐獠看鎯ζ?a target="_blank">SDRAM,F(xiàn)LASH等外圍設(shè)備。

2.1 TMS320DM642特性

TMS320DM642是TI為多媒體應(yīng)用而開發(fā)的基于C64x內(nèi)核的高性能定點數(shù)字信號處理器,時鐘頻率600 MHz,最高處理能力可達4 800 MIPS。DM642具有C6000系列DSP的公共定點指令集,增加了多媒體擴展指令,可以更加方便快速地執(zhí)行圖像處理中的算法。DM642的這些特點,使其非常適合于視頻圖像處理,是實現(xiàn)MPEG4視頻編碼器的理想硬件平臺。

2.2 硬件系統(tǒng)結(jié)構(gòu)

DM642作為整個系統(tǒng)的核心,對視頻數(shù)據(jù)進行高速處理,完成MPEG4編碼算法;可編程視頻格式轉(zhuǎn)換電路將輸入的原始視頻數(shù)據(jù)進行預(yù)處理,轉(zhuǎn)換成編碼器可接受的視頻格式的數(shù)字信號;E2PROM和FLASH用來固化應(yīng)用程序和初始化參數(shù),SDRAM作為片外存儲器,在編碼過程中存儲待處理的視頻數(shù)據(jù),以上三者通過EMIF總線與DM642連接;通過JTAG接口,利用CCS,可方便地實現(xiàn)系統(tǒng)軟硬件仿真與調(diào)試;實時時鐘為數(shù)字視頻提供實時時間基準(zhǔn)信息。

基于數(shù)字信號處理器實現(xiàn)MPEG4視頻編碼器的軟硬件設(shè)計

3 MPEG4編碼器的軟件實現(xiàn)和優(yōu)化

3.1 MPEG4的軟件實現(xiàn)

MPEG4是一個開放的框架標(biāo)準(zhǔn),并沒有規(guī)定具體的算法和程序,用戶可根據(jù)需要自行開發(fā)代碼,我們采用了XVID 1.1.0開放源碼來實現(xiàn)MPEG4編碼器。XVID代碼實現(xiàn)了MPEG4的簡單框架算法,不需要形狀編碼,只對I-VOP和P-VOP進行編碼。但XVID是針對PC機應(yīng)用而設(shè)計開發(fā)的,要將他移植到DSP中,必須對代碼進行分析,結(jié)合DSP的指令結(jié)構(gòu)和特點進行修改。

XVID代碼實現(xiàn)的MPEG4編碼器,以原始視頻數(shù)據(jù)中的每一幀作為一個視頻對象,首先判斷是I幀還是P幀,I幀需要對整幀圖像數(shù)據(jù)進行編碼存儲,P幀則進行運動估計和補償,只編碼當(dāng)前幀與參考幀之間的圖像殘差和運動矢量。每幀數(shù)據(jù)都被分為16×16宏塊,每個宏塊又分為8×8子塊,在宏塊和子塊的基礎(chǔ)上進行DCT、量化、VLC編碼?;诓桓叩膱D像質(zhì)量需求,我們減化了XVID的某些功能,如GMC(全局運動補償)、RVLC等,減少了代碼運算量,降低了復(fù)雜度。

3.2 代碼優(yōu)化

為提高代碼執(zhí)行效率,必須結(jié)合DSP的特點對代碼進行優(yōu)化,優(yōu)化主要分為3個層次:

3.2.1 項目級優(yōu)化

TI提供了功能強大的集成開發(fā)環(huán)境CCS,包含了各種高效的編譯工具,在代碼編譯過程中,通過使用編譯器提供的編譯選項(如-o3和-pm等),編譯器可自動改善代碼結(jié)構(gòu),減少代碼中指令的相關(guān)性,通過軟件流水等方法,提高指令并行性,改善循環(huán)性能,并可以優(yōu)化代碼的尺寸。

基于數(shù)字信號處理器實現(xiàn)MPEG4視頻編碼器的軟硬件設(shè)計

3.2.2 C語言程序級優(yōu)化

通過使用CCS中的profile工具,對C代碼進行評估,找出運算量最大的程序段,如DCT、量化、運動估計等,這部分代碼的優(yōu)化對提高編碼器性能有顯著影響,我們采用了以下C程序級優(yōu)化方法:

(1) 使用C6000 DSP特有的關(guān)鍵字和內(nèi)聯(lián)函數(shù)來改寫C代碼,如使用關(guān)鍵字restrict可消除數(shù)據(jù)間的相關(guān)性以提高代碼并行執(zhí)行能力,而使用內(nèi)聯(lián)函數(shù)(如_add2(),nassert())可快速優(yōu)化C代碼,作為直接映射為內(nèi)聯(lián)C6000指令的特殊函數(shù),可提高代碼在DSP中的執(zhí)行效率。

(2) 使用整型訪問短型數(shù)據(jù),使用32位整型一次訪問2個16位短型數(shù)據(jù),分別存放在32位寄存器的高、低16位字段,可減少對內(nèi)存的訪問次數(shù),將程序讀取數(shù)據(jù)的效率提高一倍,再使用能同時對2個寄存器對應(yīng)高低16位進行操作的內(nèi)聯(lián)函數(shù),如add2();mpy2()等,可大大提高代碼執(zhí)行效率。

(3) 采用循環(huán)展開的方法,將多循環(huán)變?yōu)樯傺h(huán)甚至單循環(huán),減少循環(huán)嵌套,消除冗余循環(huán),可以提高指令并行執(zhí)行的程度。

(4) DSP沒有專門的硬件除法運算單元,除法都用連續(xù)減法實現(xiàn),運算量比較大,所以要盡量減少除法運算,不能減少的除法用移位運算來實現(xiàn),可減少運算耗時。

(5)使用TI圖像庫函數(shù)。TI提供了功能強大的IM-AGE庫支持,包括了很多圖像處理常用函數(shù),如8×8子塊的DCT變換(IMG_fdct_8×8)、SAD計算(IMG_sad_8×8),這些函數(shù)都是優(yōu)化過的,代碼效率很高,可直接應(yīng)用到程序中。

3.2.3 匯編程序級優(yōu)化

線性匯編語言是C6000系列DSP所特有的一種編程語言,類似匯編,但不需要給出指令使用的功能單元、寄存器、并行性等細節(jié)信息,匯編優(yōu)化器可根據(jù)代碼情況自動確定。我們將代碼中運算量大、調(diào)用頻率高的關(guān)鍵部分用線性匯編進行了改寫,如量化、DCT、SAD等模塊,進一步優(yōu)化了循環(huán)迭代、提高了指令的并行性效果。表2給出了改寫前后幾個函數(shù)模塊程序?qū)?幀foreman.qcif測試序列編碼時消耗的時鐘周期數(shù)對比。

3.3 存儲空間的配置

DSP的片上存儲空間有限,編碼器要處理的大量視頻數(shù)據(jù)(包括當(dāng)前幀和參考幀等圖像)必須放在片外,而CPU訪問片外的速度要比訪問片內(nèi)慢很多。利用DM642的EDMA功能,CPU對前一幀數(shù)據(jù)編碼的同時,通過ED-MA通道提前將片外的數(shù)據(jù)搬移到片上內(nèi)存,二者并行工作,提高了數(shù)據(jù)由片外傳輸至片內(nèi)的效率,可減少CPU等待時間。

3.4 實驗結(jié)果

使用編碼器對標(biāo)準(zhǔn)qcif格式(176×144)測試序列進行編碼來測試編碼器性能,其中news序列300幀,suzie序列150幀,foreman序列400幀,通過TI的集成開發(fā)環(huán)境CCS 2.0進行硬件仿真實驗,在設(shè)定碼率為100 b/s的條件下。

通過分析測試序列編碼結(jié)果,編碼器的編碼速率達到25 fps以上,可以滿足實時編碼的要求。在傳輸碼率降低的情況下,編碼速率還可以進一步提高。從編碼結(jié)果可以發(fā)現(xiàn),不同測試序列編碼前后的壓縮比不同,這是由于測試序列圖像的運動情況、背景變換造成的,如suzie序列背景單一,運動緩和,壓縮比較高,而news序列由于背景不斷變換,壓縮比就相對較低。通過對比編碼前和編碼后解碼得到的圖像,畫面無失真現(xiàn)象,圖像質(zhì)量并沒有明顯下降。

基于數(shù)字信號處理器實現(xiàn)MPEG4視頻編碼器的軟硬件設(shè)計

4 結(jié) 語

本文探討了MPEG4編碼器在DM642上的實現(xiàn)方案和優(yōu)化的方法,實現(xiàn)了MPEG4編碼的簡單框架算法。實驗結(jié)果表明,本文所提出的方案具有較高的易實現(xiàn)性和實用性,增加和改進的代碼優(yōu)化方法是有效的,性能測試獲得了滿意的效果。在此基礎(chǔ)上,我們還可進一步對實現(xiàn)MPEG4高級框架和代碼優(yōu)化方法的改進,進行更深入地研究,以滿足更高的應(yīng)用要求。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19103

    瀏覽量

    228829
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3574

    瀏覽量

    133992
  • 數(shù)字信號處理器

    關(guān)注

    5

    文章

    456

    瀏覽量

    27323
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)字信號處理器和 ARM 微處理器平臺——DaVinci 數(shù)字視頻處理

    的音視頻算法。H.264,WMV9, H.263, MPEG4, MPEG2, JPEG, AAC,MP3,G.729, G.711,支持SXGA,720P,D1 編解碼與以往的數(shù)字視頻處理器
    發(fā)表于 09-14 10:06

    基于DSP的MPEG2的視頻編碼器設(shè)計與實現(xiàn)

    要做課程設(shè)計,題目就是:基于DSP的MPEG2的視頻編碼器設(shè)計與實現(xiàn),不知道該怎么下手,望高手給個思路,指導(dǎo)一下,學(xué)校有ICETEK-DM642-P
    發(fā)表于 07-02 20:34

    怎么實現(xiàn)基于C6000系列DSP的MPEG-4視頻編碼卡的軟硬件設(shè)計?

    本文介紹了基于C6000系列DSP的MPEG-4視頻編碼卡的軟硬件實現(xiàn)。利用DSP的VLIW和流水線結(jié)構(gòu)設(shè)計程序可以使
    發(fā)表于 06-02 07:03

    基于ARM的MPEG 4視頻編碼器

    分析了ARM7TDMI的結(jié)構(gòu)特點,根據(jù)處理器結(jié)構(gòu)對MPEG4編碼算法進行了優(yōu)化。通過采用雙Block DCT、優(yōu)化的VLC編~ NGDS運動估計算法等方法,大幅度提高了
    發(fā)表于 12-01 14:28 ?37次下載

    MPEG-4 ASP視頻編碼器的軟件優(yōu)化設(shè)計

    本文介紹了 TMS320C6416 DSP 和MPEG-4ASP (Advanced Simple Profile )視頻編碼器在SP基礎(chǔ)上新增的工具,詳細闡述了基于該平臺實現(xiàn)
    發(fā)表于 12-02 17:07 ?15次下載

    基于MPEG4硬件編碼視頻監(jiān)控系統(tǒng)的實現(xiàn)

    本文介紹了基于 Faraday 公司FA526 處理器硬件編解碼FMTCP100 的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)。文章詳述了實時網(wǎng)絡(luò)
    發(fā)表于 01-07 14:11 ?50次下載

    嵌入式MPEG4視頻服務(wù)設(shè)計和實現(xiàn)

    本文提出并設(shè)計嵌入式MPEG4視頻服務(wù)視頻監(jiān)控系統(tǒng),以雙核嵌入式處理器BF561為硬件平臺,搭
    發(fā)表于 02-23 15:17 ?15次下載

    MPEG4視頻編碼卡的設(shè)計與實現(xiàn)

    摘 要:本文介紹了一塊基于PCI總線的單路MPEG4視頻編碼卡的設(shè)計與實現(xiàn)。該卡實現(xiàn)了音視頻
    發(fā)表于 03-11 13:18 ?1764次閱讀
    <b class='flag-5'>MPEG4</b>音<b class='flag-5'>視頻</b><b class='flag-5'>編碼</b>卡的設(shè)計與<b class='flag-5'>實現(xiàn)</b>

    MPEG4圖像壓縮

    MPEG4圖像壓縮  與前兩者不同,MPEG4于1998 年11 月公布,原預(yù)計1999 年1月投入使用的國際標(biāo)準(zhǔn)MPEG4不僅是針對一定比特率下的視頻、音頻
    發(fā)表于 01-07 10:11 ?1163次閱讀

    視頻處理器軟硬件協(xié)同設(shè)計

    為了提高 視頻圖像處理 速度與硬件資源利用,針對一種基于精簡指令集處理器數(shù)字信號處理器(RIS
    發(fā)表于 08-04 17:54 ?38次下載
    <b class='flag-5'>視頻處理器</b><b class='flag-5'>軟硬件</b>協(xié)同設(shè)計

    基于MPEG-4視頻DCT編碼器實現(xiàn)

    提出并實現(xiàn)了一個基于MPEG4的快速高效存儲的DCT視頻編碼器,用它把H.261視頻數(shù)據(jù)流轉(zhuǎn)換為低比特率、低空間分辨率的
    發(fā)表于 09-02 16:26 ?59次下載
    基于<b class='flag-5'>MPEG-4</b>的<b class='flag-5'>視頻</b>DCT<b class='flag-5'>編碼器</b>的<b class='flag-5'>實現(xiàn)</b>

    詳解數(shù)字信號處理軟硬件實現(xiàn)

    詳解數(shù)字信號處理的量化效應(yīng)、軟件實現(xiàn)硬件實現(xiàn)
    發(fā)表于 07-07 14:57 ?0次下載
    詳解<b class='flag-5'>數(shù)字信號</b><b class='flag-5'>處理</b>的<b class='flag-5'>軟硬件</b><b class='flag-5'>實現(xiàn)</b>

    采用數(shù)字信號處理器實現(xiàn)MPEG-4視頻編碼卡的設(shè)計

    存儲空間分配、數(shù)據(jù)傳輸還是運算速度對DSP來說都是挑戰(zhàn)。本文介紹了基于C6000系列DSP的MPEG-4視頻編碼卡的軟硬件實現(xiàn)。利用DSP的
    的頭像 發(fā)表于 03-17 14:31 ?1844次閱讀
    采用<b class='flag-5'>數(shù)字信號</b><b class='flag-5'>處理器</b><b class='flag-5'>實現(xiàn)</b><b class='flag-5'>MPEG-4</b><b class='flag-5'>視頻</b><b class='flag-5'>編碼</b>卡的設(shè)計

    ADV8002:帶位圖OSD、雙HDMI TX和視頻編碼器視頻信號處理器

    ADV8002:帶位圖OSD、雙HDMI TX和視頻編碼器視頻信號處理器
    發(fā)表于 05-27 20:22 ?2次下載
    ADV8002:帶位圖OSD、雙HDMI TX和<b class='flag-5'>視頻</b><b class='flag-5'>編碼器</b>的<b class='flag-5'>視頻信號</b><b class='flag-5'>處理器</b>

    數(shù)字信號處理器概論

    作為數(shù)字信號處理的一個實際任務(wù)就是要求能夠快速、高效、實時完成處理任務(wù),這就要通過通用或?qū)S玫?b class='flag-5'>數(shù)字信號處理器來完成。因此,
    的頭像 發(fā)表于 08-07 16:58 ?3676次閱讀