基于DSP的數(shù)碼相機(jī)中的MPEG-4壓縮方案
雖然數(shù)碼相機(jī)(DSC)投入市場僅幾年時間,但已經(jīng)使消費(fèi)類電子成像業(yè)發(fā)生了翻天覆地的變化。目前,全球售出的相機(jī)中大約有三分之一是數(shù)碼相機(jī),而且其份額還在穩(wěn)步上升。隨著多兆象素DSC生成分辨率越來越高的圖像而開始挑戰(zhàn)傳統(tǒng)的膠卷像機(jī),消費(fèi)類DSC也正提供智能化操作模式,幫助用戶在各種條件下都能拍攝出更好的照片。視頻模式也已經(jīng)成為消費(fèi)類DSC的標(biāo)準(zhǔn)功能,使用戶能夠快速拍攝多個照片,以便選擇更好的快照,同時也使他們能夠保存重大事件的簡短剪輯。此外,DSC也開始與手機(jī)集成在一起,實現(xiàn)靜止圖片與剪輯隨時隨地的快速傳輸。
隨著瞬息萬變的DSC市場不斷分化,開發(fā)商必須不斷充分利用技術(shù)創(chuàng)新的優(yōu)勢來細(xì)分其產(chǎn)品。當(dāng)今其中一項創(chuàng)新就是在基于高性能數(shù)字信號處理器(DSP)的消費(fèi)類DSC中引入MPEG-4視頻壓縮技術(shù)。MPEG-4標(biāo)準(zhǔn)使DSC能夠有效提供視頻及其他操作模式,增加所存儲視頻剪輯的數(shù)量,并支持視頻圖像強(qiáng)大可靠的傳輸。DSP可以提供低價位相機(jī)產(chǎn)品中MPEG-4編碼以及解碼所需要的計算性能,尤其那些具備支持快速圖像處理架構(gòu)的DSP更是如此???a target="_blank">編程性使開發(fā)商在整個DSC產(chǎn)品線中使用相同的DSP平臺,從而通過軟件優(yōu)化不同產(chǎn)品的成像管道(imagepipe)。
新的壓縮標(biāo)準(zhǔn)
DSC傳統(tǒng)依賴于JPEG壓縮標(biāo)準(zhǔn),其設(shè)計用于存儲靜止圖像,并且已通過互聯(lián)網(wǎng)而廣為流行。在壓縮中,JPEG采用離散余弦變換(DCT)與量化技術(shù)有效地從包含8×8象素陣列的最小編碼單元(MCU)的數(shù)據(jù)描述中消除大部分空間冗余。然后此算法采用熵或可變長度編碼(VLC)技術(shù)進(jìn)一步減少存儲與傳輸?shù)膱D像數(shù)據(jù)。圖像解壓的步驟則與此相反。根據(jù)圖像內(nèi)容,盡管壓縮比隨圖像的不同而不同,但是JPEG算法一般情況下可以將象素數(shù)據(jù)壓縮一個數(shù)量級而不丟失視覺完整性。
用于動畫與視頻的各種MPEG標(biāo)準(zhǔn)采用與JPEG相同的幀內(nèi)技術(shù)入手來壓縮基本的靜止圖像或I幀,然后采用附加的幀間技術(shù)以消除隨后幀中的暫時冗余。幀間技術(shù)事實上涉及將每個連續(xù)幀的16×16象素宏塊壓縮到上一個幀的宏塊,然后采用運(yùn)動估計與補(bǔ)償技術(shù)來描述宏塊的幀到幀移動。這些預(yù)測幀或P幀只需要描述其從上一幀的改變。然后以應(yīng)用所決定的間隔定期對I幀進(jìn)行編碼。
圖1說明了一般MPEG視頻壓縮中所涉及的步驟。圖像頂部從輸入到輸出的幀內(nèi)壓縮步驟(DCT、量化與VLC)足以生成I幀。為了創(chuàng)建P幀,剛編碼的幀必須在本地幀緩沖器中被解碼并存儲,以便實現(xiàn)過去幀的逐塊壓縮到未來幀(即運(yùn)動估計),從而實現(xiàn)幀間壓縮。視頻解碼涉及圖下部的步驟(逆量子化、反向DCT、運(yùn)動補(bǔ)償)。除了圖中所示之外,MPEG標(biāo)準(zhǔn)還具有采用獨(dú)立流程的音頻壓縮-解壓算法。
圖1:MPEG視頻壓縮流程圖。
MPEG-4:多媒體標(biāo)準(zhǔn)
MPEG標(biāo)準(zhǔn)在不斷發(fā)展,以適應(yīng)新興的視頻應(yīng)用。最初的MPEG-1標(biāo)準(zhǔn)開發(fā)用于大容量存儲與系統(tǒng)檢索,例如:交互式CD-ROM以及VCD。此后,在MPEG-2中對該標(biāo)準(zhǔn)進(jìn)行了修改,以支持更高的分辨率、更廣泛的格式以及與HDTV相關(guān)的數(shù)字編碼。由于在DVD中的應(yīng)用,MPEG-2更受青睞。在視頻數(shù)據(jù)庫的要求所驅(qū)動下,MPEG-7標(biāo)準(zhǔn)規(guī)定了用于信息搜索的內(nèi)容表述。
MPEG-4開發(fā)用于交互式多媒體應(yīng)用,其中包括那些通過無線連接提供的多媒體應(yīng)用。它與基本H。263視頻壓縮標(biāo)準(zhǔn)共享算法。與早期的MPEG標(biāo)準(zhǔn)相比,MPEG-4為更高密度的圖像提供了更好的壓縮,并為更強(qiáng)大可靠的傳輸提供了更高的容錯彈性(errorresilience)。另外,MPEG-4支持在幀中引入對象類型,從而可以獨(dú)立規(guī)定、壓縮、傳輸和重新組合不同的圖像及圖形單元。但是,該標(biāo)準(zhǔn)的對象支持功能仍有待開發(fā)切實可行的實施方案。到那時,包括DSC在內(nèi)的大部分MPEG-4應(yīng)用可以繼續(xù)基于通常情況下與圖像的完整矩形幀對應(yīng)的單個對象。
高壓縮效率
特定剪輯的壓縮比隨主題的不同而千差萬別,不過一般情況下MPEG壓縮技術(shù)可以將JPEG幀的后續(xù)形式-運(yùn)動JPEG(M-JPEG)的壓縮比在相同分辨率下提高一個數(shù)量級。進(jìn)一步的壓縮源自幀間技術(shù)的采用。視頻幀一般大約為10萬象素(352×288象素,CIF分辨率)或大約2。5萬象素(176×144象素,QCIF分辨率),而不是一般情況下與JPEG相關(guān)的2~5兆象素。盡管分辨率的這種降低在高質(zhì)量照片中是不能接受的,但是對于許多消費(fèi)類DSC產(chǎn)品來說卻足夠了,尤其是考慮到它實現(xiàn)了寫真視頻的采集。
MPEG-4算法充分利用壓縮技術(shù)中的精化功能,將早先的MPEG比率降低了大約20%。高級MPEG-4壓縮可以將每秒15幀(fps)的QCIF視頻圖像從原始視頻數(shù)據(jù)的4。5Mbps壓縮為不到6?kbps,同時還可以保持適當(dāng)?shù)臑g覽質(zhì)量。在DSC中,MPEG-4壓縮使相機(jī)能夠在內(nèi)存中存儲比M-JEPG大幾倍的視頻圖像。
更佳的容錯彈性
MPEG-4集成了多種提高容錯彈性的新技術(shù),容錯彈性是很有用的特性,因為人們正越來越多地傳輸利用DSC采集的照片與剪輯。隨著DSC手機(jī)的日益流行,強(qiáng)大可靠的傳輸成為了必不可少的要求。MPEG-4的容錯彈性技術(shù)包括:
1)更多的再同步標(biāo)記,其可將所傳輸?shù)臄?shù)據(jù)分成小視頻包,從而使接收方能夠在最小化數(shù)據(jù)丟失情況下恢復(fù)各種傳輸錯誤;
2)報頭擴(kuò)展代碼,其指示每個數(shù)據(jù)包的報頭,以防止由于包含重要報頭信息的視頻幀中第一個視頻包的破壞而導(dǎo)致潛在的報頭信息丟失;
3)將視頻數(shù)據(jù)分成運(yùn)動與紋理(空間)數(shù)據(jù),通過提高該部分?jǐn)?shù)據(jù)被接收到的幾率而促進(jìn)從錯誤恢復(fù);
4)可逆VLC,允許接收方從再同步標(biāo)記后向與前向進(jìn)行解碼,以便在發(fā)生傳輸錯誤后恢復(fù)盡可能多的圖像;
5)用于空間及時間錯誤的差錯隱藏技術(shù)(在MPEG-4中規(guī)定了幾種技術(shù),這些技術(shù)是對該算法的補(bǔ)充,而并非其組成部分)。
對DSP性能與靈活性的需求
由于幀間運(yùn)動估計及補(bǔ)償中涉及其他步驟,因此MPEG-4壓縮與解壓算法比JPEG需要強(qiáng)得多的處理能力。所以,DSC中的圖像處理引擎必須能夠達(dá)到更高的性能水平。盡管ASIC能夠?qū)崿F(xiàn)此項任務(wù),但是它不易于結(jié)合到不同DSC產(chǎn)品的成像管道中;另一方面,可編程DSP不但能夠提供MPEG-4算法所需的性能,而且還可以通過軟件優(yōu)化不同系統(tǒng)。另外,還可以對相同的DSP進(jìn)行編程,使其執(zhí)行JPEG算法,以便在更高分辨率的DSC中推廣使用。因此,整個DSC產(chǎn)品線可以基于單個DSP平臺,從而在節(jié)約大量開發(fā)時間與成本的同時還能促進(jìn)產(chǎn)品的細(xì)分。
帶成像架構(gòu)的DSP示例
TI推出的TMS320DM270數(shù)字媒體處理器就是一種為DSC等成像應(yīng)用而專門設(shè)計的高性能DSP。DM270是基于多處理器架構(gòu)之上的,其采用一個ARM732位RISC微控制器來處理非成像功能,并用作整個系統(tǒng)的主控制器,同時采用可編程的C54×DSP核心處理音頻編碼與解碼。另外,DM270還集成了專門設(shè)計用于處理大部分高計算要求成像任務(wù)的可編程協(xié)處理器。其中一個協(xié)處理器-SIMD圖像處理引擎(iM×)執(zhí)行DCT、反向DCT以及眾多其他處理運(yùn)算中的運(yùn)動估計與補(bǔ)償。其他協(xié)處理器執(zhí)行可變長度編碼/解碼、量化與逆量子化。
圖2展示了DM270的主要功能塊與流程。除了主要的處理器之外,該器件還通過各種通用I/O引腳集成了高速緩沖存儲器、圖像塊緩沖器、以及用于外部存儲器、CCD、LCD或TV輸出及其他通信接口的控制器。專用的圖像預(yù)處理硬件可以消除主處理器的某些任務(wù)負(fù)擔(dān),如:白平衡、自動曝光以及自動調(diào)焦。
圖2:DM270架構(gòu)。
在外部只需要SDRAM來完善DSC的圖像處理引擎。由于MPEG必須保持附加幀以進(jìn)行運(yùn)動估計與補(bǔ)償,因而在QCIF(176×144)分辨率下,編碼需要大約110千字節(jié)SDRAM。憑借其高度集成與專用架構(gòu),DM270能夠在CIF(352×288)分辨率下處理超過30fps的MPEG-4編碼,同時能夠在HVGA(6?0×240)分辨率、超過30fps的解碼期間處理超過50%的象素。該器件還支持多媒體中所采用的其他主要視頻、音頻與語音標(biāo)準(zhǔn),而且可以與設(shè)計用作手機(jī)引擎的DSP一起結(jié)合使用。
DSC手機(jī)與其他新興應(yīng)用
在瞬息萬變的視頻成像消費(fèi)類電子產(chǎn)品市場中,怎么高估編程靈活性的重要性都不為過。DSC正迅速發(fā)展并融入新的應(yīng)用。其中之一是帶有集成相機(jī)的手機(jī),提供靜止圖像與視頻剪輯的采集與傳輸功能。該系統(tǒng)現(xiàn)已投放市場。MPEG-4數(shù)據(jù)可以嵌入多媒體信息服務(wù)(MMS)協(xié)議棧中,從而可以采用無線IP網(wǎng)絡(luò)信息的行業(yè)標(biāo)準(zhǔn)在無線網(wǎng)中輕松傳輸視頻數(shù)據(jù)包。
開發(fā)商可能也希望具備DSP所帶來的靈活性,以便設(shè)計那些在無線產(chǎn)品中也具備的、其他類型的相機(jī)系統(tǒng),例如:支持基于H。324的視頻會議的系統(tǒng)。該視頻會議無線電話采用H。263或MPEG-4來對視頻進(jìn)行編碼與解碼。另外,可能還需要將訊息發(fā)送功能與可視會議融為一體的、對會話初始化協(xié)議(SIP)的支持。MPEG-4的未來發(fā)展,如:對象功能,可能會需要對已經(jīng)投入應(yīng)用的單元以及正在開發(fā)中的單元進(jìn)行重新編程。其中一項發(fā)展便是新出現(xiàn)的MPEG-4AVC(高級視頻編碼)標(biāo)準(zhǔn)(又稱為H。26?標(biāo)準(zhǔn))的更高壓縮密度??删幊痰腄SP實現(xiàn)了對所有這些標(biāo)準(zhǔn)及其他標(biāo)準(zhǔn)的支持,從而可以有助于成像系統(tǒng)開發(fā)商細(xì)分其產(chǎn)品,并激發(fā)新的市場需求。
在成像質(zhì)量方面,DSC仍然需要一定時間才能與最高質(zhì)量的傳統(tǒng)膠卷相機(jī)抗衡。但是,在低端市場中,DSC卻可以提供傳統(tǒng)相機(jī)所無法與之匹敵的視頻與其他功能。目前,DSC開發(fā)商正從更高的壓縮比與更高的容錯彈性探索MPEG-4,以幫助其提供消費(fèi)者所期望的更多功能。而可編程DSP可以提供在低成本DSC上實現(xiàn)MPEG-4算法所需要的性能,在高度分化市場中,它們?yōu)殚_發(fā)商提供了可滿足各種需求而需要的靈活性?;贒SP的MPEG-4壓縮還為在未來把DSC與無線設(shè)備集成并支持其他新型應(yīng)用打開了機(jī)遇之門。利用MPEG-4與DSP,低成本消費(fèi)類DSC將會繼續(xù)迎來輝煌的未來。讓我們放眼展望吧!
評論
查看更多