JPEG2000 標(biāo)準(zhǔn)是利用了離散小波變換技術(shù)和嵌入式編碼技術(shù)一EBCOT,它不但提高了壓縮比,而且提供了很多新編碼方法。感興趣區(qū)域編碼(ROI)便是新編碼方法之一。ROI 編碼不僅較好地保持了圖像的視覺效果,而且更大限度地壓縮了圖像,這非常有利于解決信道擁擠,和存儲(chǔ)空間過大的問題。
在使用圖像過程中,人們通常只對(duì)圖像的某一區(qū)域關(guān)注較多,我們稱之為感興趣區(qū)域,而對(duì)其他區(qū)域關(guān)注較少,我們稱之為背景區(qū)域。于是我們?cè)趫D像編碼過程中,可以對(duì)關(guān)注較多的感興趣區(qū)域進(jìn)行高質(zhì)量的編碼,而對(duì)背景區(qū)域較低質(zhì)量的編碼,從而提高圖像壓縮比,這就能更進(jìn)一步地協(xié)調(diào)好圖像質(zhì)量與壓縮比的矛盾,這就是ROI 編碼技術(shù)。
1 JPEG2000 標(biāo)準(zhǔn)中的兩種感興趣區(qū)域編碼方法JPEG2000 中給出了兩種感興趣區(qū)域編碼算法:一般位移法和最大位移法。
1.1 一般位移法一般位移法就是對(duì)于一個(gè)位移因子S,就是背景區(qū)域內(nèi)的系數(shù)右移S 位,這樣做是使得感興趣區(qū)域的一部分系數(shù)比背景區(qū)域的系數(shù)的位平面要高,如圖1(c)。在編碼時(shí),位平面高的會(huì)先于位平面低的先編碼,于是感興趣區(qū)域的一部分系數(shù)就會(huì)先編碼和傳輸,然后才是剩余一部分感興趣區(qū)域位平面和背景區(qū)域位平面一起編碼傳輸。
在一般位移法中,位移因子的選擇范圍是非常大的,可以根據(jù)不同的需要來確定S 的值。當(dāng)位移因子較大時(shí),感興趣區(qū)域位平面和背景區(qū)域位平面相對(duì)較分離,編碼時(shí)幾乎是感興趣區(qū)域都編碼完了才開始編碼背景區(qū)域的位平面。當(dāng)位移因子較小時(shí),將會(huì)有較多的感興趣區(qū)位平面和背景區(qū)域位平面一起編碼傳輸。
一般位移法也有它的不足之處,就是編碼時(shí),需要把感興趣區(qū)域的形狀參數(shù)一起編碼和傳輸出去,這就增加了編解碼的難度,而且形狀參數(shù)的編碼也會(huì)擠占信道,也就降低了編碼效率。JPEG2000 標(biāo)準(zhǔn)中,只能滿足對(duì)橢圓和矩形的感興趣區(qū)域編碼,這在一定程度上限制了感興趣編碼的廣泛應(yīng)用。
1.2 最大位移法最大位移法中,所有量化系數(shù)輸入到編碼器后,編碼器根據(jù)輸入的量化系數(shù),生產(chǎn)一個(gè)特定的位移因子S,次位移因子S 可以能使得感興趣區(qū)域位平面和背景區(qū)域位平面完全分離開,沒有任何重疊部分,如圖1(b)。也就是此時(shí)位移因子得滿足:S逸max(Mb),Mb是所有位平面幅度的最大值。
最大位移法中,不需要對(duì)形狀信息進(jìn)行編碼,所以可以節(jié)約一些碼流。但是由于位移因子S 的值是唯一固定的,所以不能調(diào)節(jié)感興趣區(qū)域和背景區(qū)域的相對(duì)圖像質(zhì)量。
2 通用的部分位平面偏移方法正是由于標(biāo)準(zhǔn)中的兩種ROI 編碼都有一定不足,于是廣大學(xué)者對(duì)ROI 編碼進(jìn)行了很多的研究,探索出了一下新的編碼算法。本文下面就要介紹一種新的感興趣編碼算法:通用的部分位平面偏移方法[4](Generalized PartialBitplanes Shift Method,GPBShift)。
標(biāo)準(zhǔn)方法中是一次完成位平面的移動(dòng),但GPBShift方法是將ROI 的位平面系數(shù)分割為兩段,將BG 的位平面系數(shù)也劃分為兩段,編碼時(shí)按照不同的圖片質(zhì)量需要對(duì)四個(gè)位平面段進(jìn)行相應(yīng)的移動(dòng)。
圖2 是GPBShift 方法的位平面偏移示意圖。其中S1=3,表示ROI 系數(shù)中被劃分較高位平面的個(gè)數(shù);S2=6,是BG 系數(shù)中被劃分較高位平面的個(gè)數(shù)。在圖2 中,位平面的由上到下的序號(hào)依次為1,2,3,4,5,……。在編碼時(shí),GPBShift的位平面偏移方法為:淤對(duì)于ROI 系數(shù)中的某一位平面b:如果b臆S1,則不偏移;否則,下移到位平面b+S1。
于對(duì)于BG 系數(shù)中的某一位平面b:如果b臆S2,下移到位平面b+S1;否則,下移到位平面b+S1+[max(Mb)-S2]。
解碼時(shí),操作剛好與上述位移方法相反。
在運(yùn)用此方法時(shí),盡管理論上S1 和S2 可以自由地取0 到max(Mb)之間的任意整數(shù),但取值不當(dāng),會(huì)影響編碼效率和系統(tǒng)的可靠性。例如:當(dāng)S1》S2,位平面就出現(xiàn)“空閑”的狀態(tài),如圖3 所示。這樣就擴(kuò)大了系數(shù)的變化范圍,降低了系數(shù)的準(zhǔn)確性,而且會(huì)影響編碼的速度。所以實(shí)際應(yīng)用中要求S1臆S2。GPBShift 方法運(yùn)用JPEG2000 的ROI 編碼,兼顧了其他改進(jìn)算法的優(yōu)點(diǎn),其主要優(yōu)點(diǎn)如下:淤對(duì)ROI 的形狀沒有要求,不用進(jìn)行形狀編/解碼,降低了對(duì)編/解碼的要求,節(jié)約了數(shù)據(jù)量;于可以對(duì)分辨率不同ROI,運(yùn)用不同的小波子帶;盂通過設(shè)定不同的S 值,能自由地調(diào)節(jié)ROI 和BG 重建圖像的相對(duì)質(zhì)量;榆多個(gè)不同分辨率的ROI 可以存在于同一副圖像中。
一種新的ROI編碼算法——PSBShift算法,它結(jié)合了JPEG2000中定義的兩種標(biāo)準(zhǔn)RIO編碼算法的優(yōu)點(diǎn)。 關(guān)鍵詞:圖像編碼 JPEG2000 感興趣區(qū)域編碼 JPEG2000是由ISO(國際標(biāo)準(zhǔn)化組織)和IEC(國際電工協(xié)會(huì))聯(lián)合開發(fā)的新興圖像壓縮標(biāo)準(zhǔn)。JPEG2000因?yàn)椴捎昧穗x散小波變換和最新的嵌入式編碼技術(shù),所以具備了傳統(tǒng)的JPEG所無法比擬的優(yōu)勢(shì)。
它具有以下主要特點(diǎn):
(1)良好的低比特率壓縮性能,其壓縮率比JPEG高約30%左右;
?。?)支持無損和有損壓縮;
(3)按圖像質(zhì)量或分辨率漸進(jìn)傳輸;
?。?)對(duì)碼流的隨機(jī)存取和感興趣區(qū)域(ROI)的編碼;
(5)較強(qiáng)的抗誤碼性能。
? ? ? ? ? 圖像壓縮
?
JPEG2000圖像壓縮標(biāo)準(zhǔn)共有12部分,其中PART1是JPEG2000的核心系統(tǒng),已在2000年12月成為國際標(biāo)準(zhǔn),其目標(biāo)是提供一個(gè)最小化的無知識(shí)產(chǎn)權(quán)問題的JPEG2000可用系統(tǒng);PART2是擴(kuò)展系統(tǒng),與PART1比較,它采用的技術(shù)更復(fù)雜,性能也更優(yōu)良。圖1、21 JPEG2000 PART1的基本系統(tǒng) 圖1和圖2所示分別是JPEG2000的編碼系統(tǒng)和解碼系統(tǒng)。 由于解碼只是編碼的逆過程,這里只介紹編碼系統(tǒng)。 如果壓縮圖像,首先進(jìn)行預(yù)處理:對(duì)圖像的無符號(hào)分量進(jìn)行DC電平位移,多分量圖像還要進(jìn)行分量變換,再把每個(gè)分量都分割成不重疊的矩形區(qū)域,稱為貼片(tiles)。分別對(duì)每個(gè)貼片進(jìn)行壓縮,主要分為四步。
第一步,計(jì)算小波變換,得到小波系數(shù)子帶;標(biāo)準(zhǔn)規(guī)定了整數(shù)和浮點(diǎn)兩種小波變換;有L+1個(gè)子帶分辨率層,其中L由編碼器決定。
第二步,如果用戶指定了目標(biāo)碼率,則量化小波系數(shù),碼率越低,小波系數(shù)的量化就越粗糙。
第三步,用MQ編碼器對(duì)小波系數(shù)進(jìn)行算術(shù)編碼,采用EBCOT算法。該算法的原理將每個(gè)子帶分成塊,稱為碼塊(code-blocks),分別編碼。將幾個(gè)碼塊的編碼結(jié)果打成一個(gè)包(packet)是位流的分量。
第四步,比特流組織,將包連同許多標(biāo)記(markers)一起寫進(jìn)位流。 2 感興趣區(qū)域的編碼 感興趣區(qū)域(ROI)編碼是JPEG2000標(biāo)準(zhǔn)中的一個(gè)新特點(diǎn),即允許感興趣區(qū)域(ROI)比圖像的其他區(qū)域(BG)有更高的質(zhì)量編碼。ROI編碼在某些應(yīng)用中很重要,其圖像中的某一部分比其他部分顯得重要,
例如: (1)客房機(jī)/服務(wù)器模式:服務(wù)器一開始只傳輸一幅圖像的低質(zhì)量或低分辨率的版本,客房機(jī)選擇圖像的一塊區(qū)域作為ROI區(qū)域,這樣服務(wù)器就只需要傳輸能夠細(xì)化(也就是提高空間分辨率或質(zhì)量)ROI區(qū)域的數(shù)據(jù)了。在瀏覽圖像數(shù)據(jù)庫時(shí)這是一個(gè)很有用的功能,特別是當(dāng)存儲(chǔ)的圖像的分辨率很高和圖像很大(大于2兆像素)時(shí),客戶機(jī)不需要以最高的分辨率下載整幅圖像。圖3(2)人臉圖像:在瀏覽數(shù)碼相冊(cè)時(shí),人們通常最感興趣的只是照片中的人臉部分。采用一種自動(dòng)人臉檢測(cè)算法,一幅圖像中人臉部分就能被編碼成ROI區(qū)域,并且能比背景區(qū)域更精確地存儲(chǔ)。這種方法也能用于客房機(jī)/服務(wù)器模式瀏覽圖像,或者用于數(shù)碼照相機(jī)中減少存儲(chǔ)人臉圖像的比特?cái)?shù)。 JPEG2000標(biāo)準(zhǔn)中定義了兩種ROI算法:Maxshift算法和一般位移法。其中,Maxshift算法被JPEG2000的PART1所采納,一般位移法被JPEG2000的PART2所采納。 一般位移法(Generic scaling based method)是選擇一個(gè)適當(dāng)?shù)奈灰埔蜃觭,使位于ROI區(qū)域之外的背景(BG)系數(shù)都右移s位。這樣ROI區(qū)域的最有效的位平面就高于背景系數(shù)的所有位平面,如圖3(b)。在嵌入式編碼/解碼過程中,這些ROI區(qū)域的位平面會(huì)先于BG區(qū)域的位平面被編碼、傳輸和解碼(仍有一些ROI區(qū)域的位平面會(huì)與BG區(qū)域的位平面一起編碼、傳輸和解碼,這取決于位移因子s)。如果碼流被截?cái)嗷蛘呔幋a/解碼過程沒有全部完成,ROI區(qū)域的重建圖像質(zhì)量會(huì)優(yōu)于BG區(qū)域。
在ROI區(qū)域的重建質(zhì)量得到保證的前提下,ROI技術(shù)可以節(jié)約帶寬,減少計(jì)算開銷。 由于可以自由地選擇位移因子,一般位移法能夠很好地控制ROI區(qū)域與BG區(qū)域之間的質(zhì)量的相對(duì)重要性。但是,一般位移法必須對(duì)ROI的形狀信息進(jìn)行編碼,現(xiàn)有標(biāo)準(zhǔn)限制了ROI的形狀只能是矩形或橢圓形。另一方面,在一般位移法中,不同的小波子帶必須使用同一個(gè)ROI區(qū)域的定位,這在某些應(yīng)用中是不希望出現(xiàn)的。 在Maxshift算法(Maxshift method)中,位移因子s不是預(yù)先選定的。在編碼端,所有經(jīng)量化的小波系數(shù)被逐一掃描。位移因子s的選擇必須使ROI區(qū)域的最小系數(shù)大于BG區(qū)域的最大系數(shù),如圖3(c)。
在解碼端,接收到的比s小的系數(shù)都是BG區(qū)域的系數(shù),反之則是ROI區(qū)域的系數(shù)。 當(dāng)一般位移法中的位移因子增大到BG位平面與ROI平面沒有重疊的時(shí)候,axshift算法可以看作是一般位移法的特例,也就是位移因子必須滿足: s≥max(Mb) Mb通常是子帶b中的幅度位平面的最大值,max(Mb)就是所有系數(shù)的最大幅度。在Maxshift算法中ROI的形狀信息隱含在解碼器中,這樣任意形狀的ROI它都能支持。而且,它能靈活地處理不同的小波子帶。Maxshift算法最主要的局限在于,它不能通過調(diào)整位移因子而靈活地控制ROI區(qū)域與BG區(qū)域之間的質(zhì)量的相對(duì)重要性。圖43 一種新的ROI編碼算法——PSBShitf算法 考慮到這兩種標(biāo)準(zhǔn)ROI編碼方法的各自局限性,本文介紹了一種新的、靈活地位移方法,可以稱為PSBShift算法(Partial Significant Bitplanes Shift),它結(jié)合了兩種標(biāo)準(zhǔn)算法的優(yōu)點(diǎn),能夠有效地壓縮多個(gè)優(yōu)先級(jí)別不同的感興趣區(qū)域。 此方法主要基于這樣一個(gè)事實(shí),即在高比特率下,ROI區(qū)域和BG區(qū)域都能以高質(zhì)量進(jìn)行編碼,并且兩者的區(qū)別并不太值得注意;而在低比特率下,圖像中的ROI區(qū)域希望有比BG區(qū)域更高的編碼質(zhì)量。因此只要在ROI區(qū)域的最高有效位平面中分離出部分位平面,就能調(diào)整ROI區(qū)域與BG區(qū)域之間的質(zhì)量的相對(duì)重要性了。也就是說只需要位移ROI系數(shù)最高有效位平面中的一部分,而不用像標(biāo)準(zhǔn)中的方法那樣位移所有的位平面。圖3(d)中說明了PSBShift算法(這里s=6)。ROI系數(shù)的所有位平面被分成了兩部分:最高有效位平面(themost significant bitplanes)和剩余有效位平面(the residual significant bitplanes)。最高有效位平面的數(shù)量與位移因子的大小相等,剩余有效位平面的數(shù)量Nlsbs表示為:
在編碼端,ROI系數(shù)的最高有效位平面不位移,而ROI系數(shù)的剩余有效平面與BG系數(shù)一起右移(即向LSB方向移)。在解碼端,可以像Maxshift算法一樣識(shí)別ROI系數(shù)。低于第s個(gè)位平面的所有位平面提升s個(gè)位平面,再結(jié)合高于第s個(gè)位平面的所有位平面。這就是與Maxshift算法不同的地方,在Maxshift算法中沒有“結(jié)合”這一步操作。既然BG系數(shù)的高于第s個(gè)位平面的所有位都是0,那么這種修改過的解碼器也可以用于處理由Maxshift算法生成的標(biāo)準(zhǔn)代碼流。
?。?)PSBShift ROI編碼 PSBShift 算法能夠編碼使一幅圖像中的ROI區(qū)域比BG區(qū)域的質(zhì)量高,或者使ROI區(qū)域與BG區(qū)域的質(zhì)量一樣。如圖3(d)所示,如果在編碼/解碼第2s個(gè)最高有效位平面之前,編碼位流被截?cái)嗷蛘呔幋a/解碼過程被終止,ROI區(qū)域?qū)?huì)有比BG區(qū)域更高的質(zhì)量。在第2s個(gè)最高有效位平面被編碼/解碼后(ROI區(qū)域的位平面和BG區(qū)域的位平面重疊時(shí)),ROI區(qū)域和BG區(qū)域?qū)⒁韵嗤馁|(zhì)量編碼。位移因子s控制著ROI區(qū)域和BG區(qū)域的相對(duì)質(zhì)量。 例如,對(duì)一幅“Barbara”圖像(720%26;#215;576,8bpp)應(yīng)用不同的位移因子(s=0、5、9、13),采用可逆的編碼模式編碼,在臉部定義一個(gè)矩形的ROI區(qū)域。如圖4所示,隨著比特率的增加,ROI區(qū)域和BG區(qū)域的失真減少(distortion reduction)。當(dāng)s很小時(shí),例如s=5,ROI區(qū)域和BG區(qū)域的質(zhì)量沒有太大的不同(圖4(b))。隨著位移因子的增加,例如s=9(圖4(c)),在比特率的較大變換范圍內(nèi),ROI區(qū)域都有比BG區(qū)域更高的編碼質(zhì)量。當(dāng)所有位平面都被解碼,就達(dá)到了無損解碼。當(dāng)s≥馬max(Mb)(這里max(Mb)=12),結(jié)果與Maxshift算法一樣,如圖4(d)中s=13。因此PSBShitf算法在某種程度上能概括Maxshift算法,而不同于一般位移位。
與一般移法相比,一般位移法只支持矩形和橢圓的ROI形狀,PSBShift算法可以編碼任意形狀的ROI而不需要對(duì)形狀信息進(jìn)行編碼。PSBShift算法能夠像Maxshift算法一樣,在不同的小波子帶定義不同的ROI。與Maxshift算法不同的是,Maxshift 算法也能通過使用不同的位移因子靈活地調(diào)整ROI區(qū)域與BG區(qū)域之間的質(zhì)量的相對(duì)重要性,這種靈活性夠針對(duì)不同的應(yīng)用改善ROI區(qū)域的編碼質(zhì)量。例如,圖5中所示的“Barbara”圖像,它是可逆編碼(在所有子帶中都有ROI/BG的區(qū)域)的,并且以0.5bpp的比特率分別用Maxshift算法(s=12)和Maxshift 算法(s=10)解碼。可以看到在ROI區(qū)域兩種方法沒有視覺上的區(qū)別,而在BG區(qū)域Maxshift算法比Maxshift算法提供了更好的質(zhì)量。如果ROI區(qū)域需要比BG區(qū)域更高的質(zhì)量,可以使用更大的位移因子,結(jié)構(gòu)將會(huì)更接近Maxshift算法,因此,Maxshift算法可以針對(duì)不同的應(yīng)用,設(shè)計(jì)出有效和靈活的ROI編碼。
?。?)多個(gè)ROI區(qū)域的編碼 多個(gè)ROI區(qū)域的編碼需要根據(jù)多個(gè)ROI區(qū)域在一幅圖像中不同的優(yōu)先級(jí)采用不同的質(zhì)量對(duì)它們進(jìn)行編碼。一般位移法也支持多個(gè)ROI區(qū)域的編碼,但是需要對(duì)ROI形狀的信息編碼并且對(duì)形狀有限制。Maxshift算法也可以支持多個(gè)ROI區(qū)域的編碼,不過它要通過大幅度提高小波系數(shù)的動(dòng)態(tài)范圍來實(shí)現(xiàn),這樣將會(huì)明顯地降低壓縮效率。Maxshift算法能夠有效地支持多個(gè)ROI區(qū)域的編碼,它通過對(duì)不同的ROI區(qū)域采用位移不同數(shù)量的最高有效位平面來實(shí)現(xiàn)。
例如,“Bike”圖像(2048%26;#215;2560,8bpp)中定義了三個(gè)ROI區(qū)域,如圖6所示的ROI-1、ROI-2和ROI-3。選擇最高有效位平面的提升數(shù)量s1》s2》s3,例如s1=10,s2=8,s3=6,存貯在碼流里的位移因子是s=max(s1,s2,s3)。 JPEG2000是一個(gè)非常有用的新一代靜止圖像的壓縮標(biāo)準(zhǔn)。本文主要介紹了JPEG2000標(biāo)準(zhǔn)的基本系統(tǒng)和它的一個(gè)重要特點(diǎn):感興趣區(qū)域編碼。在分析了兩種標(biāo)準(zhǔn)算法(Maxshift算法和一般位移法)的優(yōu)缺點(diǎn)后,介紹了一種新的ROI編碼算法——Maxshift算法。
這種算法有四個(gè)基本優(yōu)點(diǎn):
?。?)它支持任意形狀的ROI編碼,而不需要編碼形狀的信息;
?。?)它允許不同的小波子帶有不同的ROI定義;
(3)采用合適的位移因子可以控制ROI區(qū)域與BG區(qū)域的之間的相對(duì)重要性;
?。?)在低比特率下,能夠?qū)σ环鶊D像中的具有不同優(yōu)先級(jí)的多個(gè)ROI區(qū)域進(jìn)行有效的編碼。
評(píng)論
查看更多