作者:Alex Zatsman, Mark Rossman, Rich Greene, Will Hooper, Phil Halmark, Bill Valentine, and David Skolnick
ADV601是一款低成本、單芯片、全數(shù)字、專用功能CMOS VLSI芯片,用于實(shí)時壓縮和解壓縮數(shù)字視頻信號。它可以支持高達(dá) 350:1 的壓縮率,對自然圖像進(jìn)行基本上無損的 4:1 壓縮。ADV601支持所有常見的隔行掃描視頻格式(見表1)。該器件針對要求以低成本實(shí)時壓縮的視頻應(yīng)用進(jìn)行了優(yōu)化,并具有廣播級質(zhì)量的應(yīng)用,如非線性視頻編輯、視頻捕獲系統(tǒng)、遠(yuǎn)程閉路電視監(jiān)控、便攜式攝像機(jī)、高質(zhì)量電話會議和視頻分發(fā)系統(tǒng)、視頻插入設(shè)備、圖像和視頻存檔系統(tǒng)以及數(shù)字錄像帶。除壓縮和解壓縮外,ADV601的子帶編碼架構(gòu)還提供視頻縮放和空間濾波的固有支持。
表 1.ADV601 場速率和尺寸
標(biāo)準(zhǔn) | 活動區(qū)域 | 場速率 | 像素率 | |
水平 | 垂直 | (赫茲) | (兆赫) | |
CCIR-601/525 |
720 | 243 | 59.94 | 13.50 |
CCIR-601/625 |
720 | 288 | 50.00 | 13.50 |
平方像素/525 |
640 | 243 | 59.94 | 12.27 |
平方像素/625 |
768 | 288 | 50.00 | 14.75 |
由于具有里程碑意義的標(biāo)準(zhǔn)已經(jīng)以JPEG,H.261,MPEG 1和MPEG 2的形式存在,我們是否需要新的壓縮范式?簡而言之,是的。在許多封閉系統(tǒng)應(yīng)用中,成本、圖像質(zhì)量和靈活性比互操作性(標(biāo)準(zhǔn)的優(yōu)勢)更重要。對于不需要互操作性的應(yīng)用程序,壓縮解決方案的選擇應(yīng)由這些因素的評估以及對稱性(編碼(壓縮)和解碼(解壓縮)的低成本和復(fù)雜性來驅(qū)動。以下對小波壓縮及其在ADV601中的作用的概述應(yīng)該有助于理解它可以為視頻壓縮應(yīng)用帶來的價值。
圖1
圖1顯示,在編碼模式下,ADV601通過其視頻接口接受分量數(shù)字視頻,并通過主機(jī)接口輸出壓縮比特流。在解碼模式下,情況正好相反:ADV601在其主機(jī)接口上將壓縮的比特流轉(zhuǎn)換為視頻接口上的分量數(shù)字視頻。主機(jī)可通過主機(jī)接口訪問ADV601的所有控制和狀態(tài)寄存器。
ADV601編解碼器的壓縮算法基于雙正交小波變換,由7抽頭高通和9抽頭低通濾波器組成,并實(shí)現(xiàn)與場無關(guān)的子帶編碼。子帶編碼器將二維空間視頻數(shù)據(jù)轉(zhuǎn)換為空間頻率濾波子帶。然后使用可調(diào)量化和熵編碼過程來提供壓縮(見圖2)。
圖2
ADV601基于小波理論,小波理論是一種新的數(shù)學(xué)工具,在1980年代中期Morlet和Grossman的地球物理學(xué)著作中首次明確引入。[1]這一理論很快在理論物理和應(yīng)用數(shù)學(xué)中流行起來;80年代末和90年代,小波在信號和圖像處理中的應(yīng)用急劇增長。
了解小波內(nèi)核是理解小波在視頻應(yīng)用中的優(yōu)勢的關(guān)鍵。設(shè)備的這一部分包含濾波器和抽取器,可在水平和垂直方向上處理圖像。濾波器基于精心挑選的分段小波基函數(shù),如圖 3 所示。這些基函數(shù)具有 3 個主要優(yōu)點(diǎn):與傅里葉變換的正弦波相比,它們與圖像的寬帶性質(zhì)的相關(guān)性更好;ADV601可以通過簡單、緊湊的7抽頭和9抽頭FIR濾波器(低成本硅的關(guān)鍵)實(shí)現(xiàn)這些功能;這些功能提供全圖像過濾,從而消除壓縮圖像中出現(xiàn)的塊狀偽影,當(dāng)圖像被分解成更小的區(qū)域進(jìn)行單獨(dú)壓縮時(在某些應(yīng)用程序中,JPEG 和 MPEG* 都可能受到此偽影的影響)。
圖3
*壓縮基于聯(lián)合圖像專家組和電影專家組的標(biāo)準(zhǔn)。
濾波樹涉及二維(x 和 y)數(shù)據(jù)的連續(xù)高通和低通濾波,每一步抽取 2(圖 4a),從而產(chǎn)生連續(xù)更小的數(shù)據(jù)塊,組合在 Mallat 圖 (4b) 中。所有三個組件(例如,Y,Cb,Cr)的彩色視頻信號場交替通過過濾器樹,以創(chuàng)建總共42個新圖像(14個代表Y,14個代表Cr,C 為 14b).
圖 4a
圖 4b
圖 5 顯示了變換對黑白圖像(僅亮度)執(zhí)行的操作示例。在這種情況下,ADI公司總部映像已轉(zhuǎn)換為14個新映像,每個映像包含有關(guān)原始映像的不同信息集。人們可以清楚地看到塊A中高通x濾波產(chǎn)生的垂直邊緣,塊D中高通y濾波產(chǎn)生的水平邊緣,以及塊N中抽取和低通濾波產(chǎn)生的縮小尺寸的原始圖像。 用于描述顯示的 14 個塊的數(shù)據(jù)點(diǎn)總數(shù)與原始圖像中使用的數(shù)據(jù)點(diǎn)總數(shù)相同。.但是現(xiàn)在圖像已經(jīng)轉(zhuǎn)換,我們可以做一些有用的事情:1)實(shí)現(xiàn)幾乎無損的壓縮,2)以恒定質(zhì)量或恒定比特率實(shí)現(xiàn)有損壓縮,3)在沒有計算開銷的情況下創(chuàng)建高質(zhì)量的縮放圖像,以及4)創(chuàng)建容錯的壓縮位流,因?yàn)槊總€塊都包含有關(guān)整個圖像的信息。
圖 5b
圖6顯示了在無損模式下使用ADV601的方案。在這種情況下,42 個轉(zhuǎn)換后的塊被發(fā)送到 2 種類型的無損熵編碼器。熵編碼器受益于在轉(zhuǎn)換后的塊中發(fā)現(xiàn)的相關(guān)性增加。在這種操作模式下,壓縮性能與原始的復(fù)雜程度有關(guān)。如果原始圖像是簡單的斜坡,則除左上角最小的塊 (N) 外,所有塊都將包含零。這將產(chǎn)生超過 300:1 的無損壓縮(對于每秒 0 場的 5:4:2 編碼 CCIR2 分辨率視頻,需要不到 601.60M 位/秒)。但是,如果圖像是白噪聲,則沒有相關(guān)機(jī)會,并且壓縮必須接近1:1(需要大約168M位/秒)。在典型的真實(shí)視頻應(yīng)用中,壓縮范圍從 2:1 (84Mb/s) 到 5:1 (16Mb/s),具體取決于每個場的復(fù)雜性。在需要近乎無損壓縮的應(yīng)用中,如果允許比特率大幅波動,ADV601可以在此模式下使用。
圖6
圖7顯示了如何在有損壓縮模式下使用ADV601。在轉(zhuǎn)換圖像時,將提取所有 42 個塊的一組統(tǒng)計信息,包括每個塊的平方和(或能量)、最小像素值和最大像素值。這些信息進(jìn)入量化器,并與人類視覺模型耦合,該模型將每個塊的重要性與人類視覺系統(tǒng)聯(lián)系起來。量化器算法獲取所有這些信息,加上用戶編程的比特率,并為每個字段計算 42 個值“箱寬度”;它們可以被認(rèn)為是每個塊的精度預(yù)算。當(dāng)輕微量化(即許多小量子)時,這個數(shù)字會很大。重量化(很少有大量子)導(dǎo)致數(shù)量少得多。下面有兩個示例來幫助說明其工作原理。實(shí)際量化器位于ADV601上,但主機(jī)或外部DSP執(zhí)行箱寬計算。
圖7
第一種情況是高質(zhì)量的應(yīng)用程序,需要視覺無損壓縮,同時保持準(zhǔn)確的比特率。在這種情況下,所有低頻段(較小的塊)都將被賦予最大的箱寬,以確保完美的重建。根據(jù)圖像的復(fù)雜性,高頻帶(最大的塊)將獲得可以分配的盡可能多的箱寬度。在這種情況下,為了保持所需的比特率,會放棄少量的高頻信息精度。這并不構(gòu)成一個難題,因?yàn)槿祟愐曈X系統(tǒng)無法將高空間頻率分辨到與低空間頻率相同的水平。已經(jīng)表明,人眼無法檢測到具有光量化的頻率塊(即使使用廣播級質(zhì)量的視頻播放設(shè)備也是如此)。
在第二種情況下,需要極高的壓縮率(超過 100 比 1)。這意味著必須消除每個字段中99%的位!在這里,只有最小的塊才能獲得較大的箱寬。剩余的位預(yù)算散布在其余塊上,由箱寬分配器確定。僅基于每個字段中的信息的典型壓縮方案通常在高壓縮時失敗;因此,ADV601保持圖像相關(guān)信息的能力非常出色。當(dāng)該算法以350:1的足球序列進(jìn)行測試時,可以清楚地識別動作,甚至可以讀取球員制服上的數(shù)字。如此高的壓縮比下的視頻質(zhì)量并不適合所有應(yīng)用,但對于視頻序列識別和監(jiān)控來說綽綽有余。
那么,當(dāng)壓縮比太高而無法準(zhǔn)確渲染圖像時,使用小波的偽像是什么樣子的呢?隨著壓縮比的增加,越來越多的噪聲被注入高空間頻率;由于描述高頻的精度較低,這些頻段的噪聲會增加。因此,小波視頻壓縮會像傳統(tǒng)的廣播模擬視頻一樣降低。雖然視頻中的偽像從來都不令人愉悅,但人類已經(jīng)高度習(xí)慣于接受這種類型的偽影。由于ADV601允許控制每個子頻段的增益,因此可以通過使圖像“柔和”來降低噪聲。大多數(shù)其他壓縮方案將圖像分解為更小的塊,每個塊都單獨(dú)處理。隨著壓縮的增加,出現(xiàn)的第一個偽影是放置在圖像頂部的塊的固定網(wǎng)格。人們普遍認(rèn)為,這種阻塞偽像比高頻噪聲或圖像柔化更能引起人類視覺系統(tǒng)的反感。
圖8
圖8是ADV601的功能框圖,圖9顯示了如何在典型的基于主機(jī)的ADV601應(yīng)用中使用它。ADV601視頻接口設(shè)計用于所有常用的模擬視頻解碼器和編碼器,包括ADI公司、飛利浦、布魯克特里和雷神公司的解碼器和編碼器。視頻接口還能夠直接連接到所有符合CCIR656標(biāo)準(zhǔn)的并行設(shè)備(也稱為“D1”)。表1顯示了ADV601支持的場速率和鏡像尺寸。DRAM管理器為256Kx16快速頁面模式DRAM提供無膠合接口,這是在編碼和解碼模式下支持ADV601所必需的。通用主機(jī)接口的寬度可配置為 8 位、16 位和 32 位。主機(jī)接口還包括一個 512x32 位 FIFO,有助于實(shí)現(xiàn)壓縮視頻數(shù)據(jù)的流暢傳輸。
圖9
ADI公司為支持ADV601而開發(fā)的完整Windows視頻驅(qū)動程序包中,基于主機(jī)的軟件驅(qū)動程序包可幫助ADV601計算每個場的42個箱寬值。ADI公司還為Windows 95開發(fā)了一款名為Videolab的即插即用PCI板,用于評估ADV601的視頻質(zhì)量。
ADV601還可用于獨(dú)立應(yīng)用,借助ADSP21xx類DSP計算每個字段的箱寬值。ADV601 DSP串行接口支持與ADI公司所有DSP的無縫接口。
ADV601JS采用160引腳PQFP封裝,工作溫度范圍為0至+70°C商用溫度范圍。
審核編輯:郭婷
-
濾波器
+關(guān)注
關(guān)注
160文章
7703瀏覽量
177486 -
寄存器
+關(guān)注
關(guān)注
31文章
5294瀏覽量
119816 -
編解碼器
+關(guān)注
關(guān)注
0文章
250瀏覽量
24196
發(fā)布評論請先 登錄
相關(guān)推薦
評論