以激光掃描為代表的主動(dòng)采集裝備在易操作性、機(jī)動(dòng)靈活性、智能化、高效化等方面日益成熟,利用三維成像技術(shù)采集密集點(diǎn)的空間坐標(biāo)、色彩紋理和反射強(qiáng)度等信息,可高保真且快速重建被測(cè)目標(biāo)的三維實(shí)體,在工程測(cè)量、生物醫(yī)學(xué)、智慧城市、虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)等科學(xué)與工程研究中發(fā)揮十分重要的作用[1-4]。
隨著多平臺(tái)、多分辨率采集設(shè)備的性能逐漸提高,三維成像傳感器能夠從三維場(chǎng)景中獲取具有空間位置和屬性信息的海量點(diǎn)集,得到多細(xì)節(jié)層次的點(diǎn)云模型,給用戶以生動(dòng)逼真的可視化體驗(yàn),具有極強(qiáng)的交互式和沉浸式效果。點(diǎn)云模型通常包含幾十萬至數(shù)千萬空間域的點(diǎn),在不經(jīng)壓縮的情況下,對(duì)于每幀100萬個(gè)點(diǎn)的點(diǎn)云模型,30幀/s的傳輸速率占用總帶寬為每秒3 600兆位,這給存儲(chǔ)空間容量和網(wǎng)絡(luò)傳輸帶寬帶來了負(fù)擔(dān)與挑戰(zhàn)[5],因此對(duì)點(diǎn)云數(shù)據(jù)壓縮編碼的研究具有重要意義。
過去由于計(jì)算機(jī)計(jì)算能力和點(diǎn)云采集效率的限制,基本沿用構(gòu)建網(wǎng)格的方法,或按需采樣來實(shí)現(xiàn)對(duì)點(diǎn)云模型的壓縮與傳輸,導(dǎo)致時(shí)空壓縮性能較低和幾何屬性特征信息丟失。
現(xiàn)在研究人員主要以計(jì)算機(jī)圖形學(xué)和數(shù)字信號(hào)處理為出發(fā)點(diǎn),通過對(duì)點(diǎn)云數(shù)據(jù)實(shí)施分塊操作[6-10]或結(jié)合視頻編碼技術(shù)[11-13]對(duì)點(diǎn)云壓縮方法進(jìn)行優(yōu)化。運(yùn)動(dòng)圖像專家組(MPEG)于2017年發(fā)出了點(diǎn)云壓縮的提案征集邀請(qǐng),并于2018年發(fā)布統(tǒng)一的點(diǎn)云模型壓縮編碼研究框架。
目前還沒有一種方法能適應(yīng)指數(shù)級(jí)增加的點(diǎn)云數(shù)據(jù)容量,以及在高壓縮比、低失真率和計(jì)算成本三者之間達(dá)到平衡。因此,有效提升點(diǎn)云幾何信息和屬性信息壓縮編碼的效率,既能有效應(yīng)對(duì)海量點(diǎn)云數(shù)據(jù)的存儲(chǔ)和傳輸,也能按需保留宏觀信息和細(xì)節(jié)特征,在點(diǎn)云數(shù)據(jù)處理與應(yīng)用中貫穿始終。
本文圍繞點(diǎn)云壓縮編碼的核心,重點(diǎn)闡述點(diǎn)云幾何和屬性壓縮研究進(jìn)展、點(diǎn)云壓縮公開數(shù)據(jù)集、點(diǎn)云壓縮公開基準(zhǔn)算法性能評(píng)價(jià)等3個(gè)方面,并對(duì)點(diǎn)云壓縮的重要發(fā)展方向予以展望。
01 點(diǎn)云壓縮研究進(jìn)展
點(diǎn)云壓縮編碼方案的需求與日俱增,全球最具影響力的MPEG和國內(nèi)外學(xué)者共同致力于研究點(diǎn)云壓縮標(biāo)準(zhǔn)框架,力求建立完善的點(diǎn)云壓縮系統(tǒng),有效應(yīng)對(duì)多源、多尺度場(chǎng)景點(diǎn)云數(shù)據(jù)的壓縮任務(wù)。文獻(xiàn)[15-16]分別從空間維度壓縮技術(shù)和MPEG標(biāo)準(zhǔn)化框架角度出發(fā),對(duì)當(dāng)前的點(diǎn)云壓縮方法進(jìn)行調(diào)研與概述。
1.1 點(diǎn)云壓縮方法分類
點(diǎn)云壓縮任務(wù)按照不同的標(biāo)準(zhǔn)可以將方法劃分成不同的類型,主要有以下標(biāo)準(zhǔn):(1)根據(jù)還原質(zhì)量分類;(2)根據(jù)處理方法分類;(3)根據(jù)空間維度分類;(4)根據(jù)信息類型分類。表 1根據(jù)不同的分類標(biāo)準(zhǔn)對(duì)當(dāng)前點(diǎn)云壓縮方法進(jìn)行了匯總。
表1 點(diǎn)云壓縮方法分類匯總 根據(jù)信息還原質(zhì)量的高低,點(diǎn)云壓縮分為無損壓縮和有損壓縮。無損壓縮通過識(shí)別并消除統(tǒng)計(jì)冗余,使數(shù)據(jù)結(jié)構(gòu)更加緊湊,解碼后的點(diǎn)云與原始點(diǎn)云相同,包括點(diǎn)的數(shù)量、各點(diǎn)關(guān)聯(lián)的屬性信息。這種方法為盡可能地保持原有數(shù)據(jù)的特征,使得壓縮性能較有限。有損壓縮通過量化刪除了非必要、視覺上無用的信息,從而減小了數(shù)據(jù)量,使得原始點(diǎn)云數(shù)據(jù)和解碼后的點(diǎn)云數(shù)據(jù)之間存在一些差異。這種方法使用了適當(dāng)?shù)穆适д婵刂?,因而在感知?shù)據(jù)質(zhì)量和比特率之間進(jìn)行了平衡。
根據(jù)處理方法的不同,點(diǎn)云壓縮分為傳統(tǒng)壓縮方法和基于深度學(xué)習(xí)的壓縮方法。首先,傳統(tǒng)方法基于點(diǎn)云的結(jié)構(gòu)劃分進(jìn)行一系列的預(yù)測(cè)編碼去除了一部分冗余;然后,通過變換與量化將空間域的點(diǎn)云變換到頻域并壓縮變換系數(shù);最后,經(jīng)過熵編碼進(jìn)一步壓縮得到比特流。這類方法在表示過程中仍然隱藏著大量的冗余信息,如重復(fù)的局部結(jié)構(gòu)、形狀特征明顯的物體類別,期望在壓縮過程中利用此冗余信息來進(jìn)一步降低比特率。深度學(xué)習(xí)方法通過卷積神經(jīng)網(wǎng)絡(luò)將點(diǎn)云數(shù)據(jù)編碼為隱藏表示,再量化隱藏特征,基于學(xué)習(xí)熵模型和熵編碼將上下文輸入的情況下每個(gè)符號(hào)出現(xiàn)的概率壓縮并產(chǎn)生比特流,因而需要訓(xùn)練大量的點(diǎn)云數(shù)據(jù)樣本以獲得編碼器端和解碼器端非線性變換。基于深度學(xué)習(xí)的點(diǎn)云壓縮方法可以更好地適應(yīng)局部結(jié)構(gòu)復(fù)雜性,因此具有作為未來基準(zhǔn)編碼工具的潛力。
根據(jù)空間維度的特點(diǎn),點(diǎn)云壓縮分為一維遍歷壓縮、二維映射壓縮和三維去相關(guān)壓縮,基于維度的劃分方法直接決定了點(diǎn)數(shù)據(jù)的訪問容易度,從而影響壓縮效率。首先,一維壓縮方法通過利用各點(diǎn)之間的距離鄰域關(guān)系來構(gòu)建基于樹的連接;然后,順序遍歷生成樹各節(jié)點(diǎn)將幾何數(shù)據(jù)轉(zhuǎn)換為一維,適應(yīng)預(yù)測(cè)的信號(hào)。這種方法提供了相對(duì)簡單的實(shí)現(xiàn)方式,但未完全考慮三維空間相關(guān)性使壓縮性能受到很大限制。二維壓縮方法將點(diǎn)云解釋為3D空間中的二維離散流形,通過映射、網(wǎng)格劃分和圖像編碼對(duì)點(diǎn)云進(jìn)行編碼,這種壓縮方法涉及到映射過程,導(dǎo)致信息部分失真。三維壓縮方法采用穩(wěn)定結(jié)構(gòu)對(duì)點(diǎn)云所在的空間進(jìn)行分解,再對(duì)該結(jié)構(gòu)進(jìn)行預(yù)測(cè)與變換以減少冗余,并對(duì)上述結(jié)果進(jìn)一步編碼即可實(shí)現(xiàn)點(diǎn)云壓縮,這種方法考慮了點(diǎn)云的分布特性、獲取與應(yīng)用,已成為壓縮方法的最主要研究方向。
根據(jù)信息類型的差異,點(diǎn)云壓縮分為幾何信息壓縮和屬性信息壓縮,其中后者通常涉及預(yù)處理,且需要與幾何信息建立對(duì)應(yīng)關(guān)系。首先基于不同的數(shù)據(jù)結(jié)構(gòu)對(duì)點(diǎn)云進(jìn)行結(jié)構(gòu)化處理,如樹、線元、面元和塊等;然后進(jìn)行一系列的預(yù)測(cè)編碼、變換編碼、量化、熵編碼操作;最后獲得比特流。
1.2 幾何信息壓縮
點(diǎn)云幾何壓縮方法多基于樹結(jié)構(gòu)或塊結(jié)構(gòu)組織劃分點(diǎn)云,通過對(duì)結(jié)構(gòu)化的點(diǎn)云進(jìn)行描述與編碼,文獻(xiàn)[24]提出了一種基于八叉樹的幾何編碼方法,首先,在相鄰幀之間作異或運(yùn)算;然后,用八叉樹編碼運(yùn)算的結(jié)果。該方法既能取得較高的壓縮效率,也能有效降低編碼計(jì)算復(fù)雜度,是點(diǎn)云庫(PCL)中推薦的點(diǎn)云壓縮框架算法。文獻(xiàn)[50]利用二叉樹結(jié)構(gòu)將無序點(diǎn)云劃分為子空間,通過旅行商算法預(yù)測(cè)各子空間內(nèi)部的幾何信息,通過淺層神經(jīng)網(wǎng)絡(luò)的無損壓縮算法PAQ完成預(yù)測(cè)殘差編碼。但是僅使用樹結(jié)構(gòu)或塊結(jié)構(gòu)的編碼方式壓縮未充分利用點(diǎn)云之間的空間相關(guān)性,導(dǎo)致大量冗余信息被編碼,大大限制了壓縮性能。
改進(jìn)方法沿用樹結(jié)構(gòu)或塊結(jié)構(gòu)編碼近似值的核心思想,加入三角形表面模型[77]、平面表面模型[51, 70]或聚類算法[71]對(duì)層間預(yù)測(cè)和殘差計(jì)算進(jìn)行指導(dǎo)。為了提高壓縮計(jì)算效率,文獻(xiàn)[69]提出了分層壓縮的概念,首先,利用八叉樹結(jié)構(gòu)實(shí)現(xiàn)點(diǎn)云的粗粒度編碼和表達(dá);然后,在加強(qiáng)層通過圖形傅里葉變換實(shí)現(xiàn)點(diǎn)云細(xì)節(jié)的壓縮和重建,是目前壓縮效率最高的點(diǎn)云幾何信息壓縮方法。此外,文獻(xiàn)[33]提出針對(duì)城市大場(chǎng)景的點(diǎn)云壓縮框架,首先,對(duì)整個(gè)點(diǎn)云中最大的平面進(jìn)行迭代檢測(cè);然后,使用Delaunay三角剖分法對(duì)平面進(jìn)行分解;最后,對(duì)三角形以及平面的面積和點(diǎn)數(shù)進(jìn)行編碼。
文獻(xiàn)[66]將幾何形狀隱式表示為符號(hào)距離函數(shù)的水平集,對(duì)近乎平坦的表面采用較少系數(shù)表示,為復(fù)雜的曲面保留更多系數(shù),對(duì)基系數(shù)進(jìn)行量化和熵編碼。
參考深度神經(jīng)網(wǎng)絡(luò)在圖像和視頻壓縮方面取得的進(jìn)展,從理論上講,可以在壓縮過程中利用基于超先驗(yàn)引導(dǎo)與隱空間表達(dá)冗余信息來進(jìn)一步降低比特率。文獻(xiàn)[75, 84]提出了基于深度學(xué)習(xí)的點(diǎn)云幾何壓縮方法,首先,利用神經(jīng)網(wǎng)絡(luò)編碼器學(xué)習(xí)點(diǎn)云的高階隱含向量;然后,利用算數(shù)編碼、行程長度編碼等熵編碼方法對(duì)隱含向量進(jìn)行編碼;最后,利用神經(jīng)網(wǎng)絡(luò)解碼器重建三維點(diǎn)云?;诰矸e神經(jīng)網(wǎng)絡(luò)(CNN)已廣泛用于特征提取、目標(biāo)檢測(cè)、圖像編碼等,文獻(xiàn)[86]提出CNN與自動(dòng)編碼器結(jié)合的壓縮方法,能有效利用相鄰點(diǎn)之間的冗余,并表示出對(duì)數(shù)據(jù)編碼的適應(yīng)性。為了提高隱含向量編碼的壓縮比,文獻(xiàn)[86]提出基于變分編碼器(VAE)的點(diǎn)云壓縮方法,通過學(xué)習(xí)隱含向量的超先驗(yàn),使得熵模型的編碼概率與隱含向量的邊緣概率更加吻合,從而減少算術(shù)編碼的內(nèi)存消耗。
1.3 屬性信息壓縮
屬性壓縮以減少點(diǎn)云屬性之間的冗余為目的,主要依靠重建后的幾何信息來進(jìn)行,首先,基于幾何信息在三維空間層次劃分;然后,在壓縮性能和保真度之間達(dá)到平衡,進(jìn)行后續(xù)的預(yù)測(cè)、變換編碼。在壓縮時(shí),根據(jù)實(shí)際需要選擇合適的預(yù)測(cè)、變換算法非常關(guān)鍵,學(xué)者們的研究方向大致分為兩類:基于信號(hào)處理技術(shù),結(jié)合圖像視頻編碼技術(shù)對(duì)點(diǎn)云進(jìn)行去相關(guān)操作;基于圖變換的思想,對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行分塊、分層來處理。
以信號(hào)處理為主導(dǎo)的點(diǎn)云屬性壓縮通常參考信號(hào)處理方法及圖像視頻編碼技術(shù),以實(shí)現(xiàn)點(diǎn)云數(shù)據(jù)的預(yù)測(cè)編碼和變換編碼。文獻(xiàn)[37]基于視頻編碼中幀內(nèi)預(yù)測(cè)的平面模式進(jìn)行點(diǎn)云屬性編碼,首先,將點(diǎn)云空間劃分為基本單元塊;然后,沿著被預(yù)測(cè)塊的3個(gè)正交基方向?qū)ふ亦徑拥膯卧獕K,根據(jù)鄰接塊中點(diǎn)云的屬性結(jié)合最近鄰算法,得到被預(yù)測(cè)塊鄰接面上的屬性值;最后,借鑒planar模式求出被預(yù)測(cè)塊內(nèi)各點(diǎn)的屬性預(yù)測(cè)值。文獻(xiàn)[41]在幾何編碼的前提下引入基于聯(lián)合圖像專家組的壓縮方法,首先,按照深度優(yōu)先遍歷的順序?qū)Ⅻc(diǎn)云屬性值映射到結(jié)構(gòu)化的網(wǎng)格上;然后,進(jìn)行屬性預(yù)測(cè)編碼、離散余弦變換和熵編碼。
為了提升信號(hào)處理點(diǎn)云模型的壓縮性能,學(xué)者提出利用圖形學(xué)的方法,以進(jìn)一步利用點(diǎn)云數(shù)據(jù)的相關(guān)性進(jìn)行編碼。基于圖變換的研究內(nèi)容包括空間劃分合理性和各子圖維度均勻性,文獻(xiàn)?[32]提出了基于圖變換(GT)的點(diǎn)云屬性壓縮方法,首先,通過樹結(jié)構(gòu)對(duì)點(diǎn)云空間進(jìn)行體素劃分,并利用體素的相鄰關(guān)系構(gòu)造圖形拉普拉斯矩陣;然后,對(duì)拉普拉斯矩陣做特征值分解獲得圖變換矩陣GT,并利用GT對(duì)屬性冗余信息進(jìn)行去相關(guān)性處理實(shí)現(xiàn)點(diǎn)云屬性壓縮。為了降低GT方法的復(fù)雜度,文獻(xiàn)[40]提出了一種區(qū)域自適應(yīng)分層變換的壓縮算法,通過在子帶中對(duì)系數(shù)進(jìn)行壓縮編碼取得與GT相當(dāng)?shù)姆逯敌旁氡?,同時(shí)顯著降低了計(jì)算復(fù)雜度。為了進(jìn)一步探索點(diǎn)云屬性的統(tǒng)計(jì)特性,文獻(xiàn)[44]采用平穩(wěn)高斯過程對(duì)點(diǎn)云屬性建模,顯著提高了點(diǎn)云屬性壓縮的性能。文獻(xiàn)[56-57]為了減小屬性預(yù)測(cè)的殘差,分別使用了K-均值聚類算法和均值漂移算法對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行聚類,由于在聚類時(shí)將屬性信息相似的點(diǎn)集中在一起,從而優(yōu)化屬性預(yù)測(cè)的殘差大小,提高預(yù)測(cè)的準(zhǔn)確性。
深度學(xué)習(xí)的快速發(fā)展帶動(dòng)了數(shù)據(jù)壓縮方面技術(shù)的發(fā)展,且有部分表現(xiàn)效果在圖像和視頻壓縮方面遠(yuǎn)超過傳統(tǒng)方法,為點(diǎn)云壓縮帶來極大的借鑒意義。文獻(xiàn)[92]提出了基于深度學(xué)習(xí)網(wǎng)絡(luò)的點(diǎn)云屬性方法,首先,將點(diǎn)云屬性映射到一個(gè)折疊的二維流形空間;然后,利用傳統(tǒng)的熵編碼算法進(jìn)行壓縮;最后,利用神經(jīng)網(wǎng)絡(luò)解碼器恢復(fù)三維點(diǎn)云。基于深度學(xué)習(xí)的點(diǎn)云屬性壓縮方法可以更好地適應(yīng)局部幾何復(fù)雜性,因此具有作為未來基準(zhǔn)編碼工具的潛力。
02 點(diǎn)云壓縮公開數(shù)據(jù)集
MPEG點(diǎn)云壓縮標(biāo)準(zhǔn)框架公布了3種通用的點(diǎn)云測(cè)試數(shù)據(jù)集[100]:用于表示靜態(tài)對(duì)象和場(chǎng)景的靜態(tài)點(diǎn)云,用于沉浸式視頻和VR應(yīng)用的動(dòng)態(tài)點(diǎn)云,用于自動(dòng)駕駛與導(dǎo)航的動(dòng)態(tài)獲取點(diǎn)云。所有的測(cè)試序列均可在MPEG的官方網(wǎng)站下載獲取。
對(duì)于靜態(tài)點(diǎn)云和動(dòng)態(tài)點(diǎn)云,主要由微軟公司和8i公司,采用激光掃描儀、紅外線深度攝影機(jī)等手段獲取目標(biāo)的幾何信息,多個(gè)傳感器或成像攝像機(jī)以每秒傳輸幀數(shù)30的速度獲取目標(biāo)的屬性信息,包括捕獲顏色信息并計(jì)算立體深度。靜態(tài)點(diǎn)云和動(dòng)態(tài)點(diǎn)云數(shù)據(jù)示意如圖 1所示。
圖 1 靜態(tài)點(diǎn)云和動(dòng)態(tài)點(diǎn)云數(shù)據(jù)示意圖
對(duì)于動(dòng)態(tài)獲取點(diǎn)云,采用安裝有慣性傳感器(IMU)、全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS)、激光雷達(dá)和顏色空間RGB攝像機(jī)的移動(dòng)式測(cè)繪系統(tǒng)。其中,GNSS和IMU用于確定車輛的實(shí)時(shí)位置,激光雷達(dá)用于捕獲目標(biāo)的幾何信息,而顏色空間RGB攝像機(jī)則通過拍攝圖像或視頻序列獲得目標(biāo)的屬性信息。通過多源數(shù)據(jù)融合、冗余點(diǎn)和離群點(diǎn)去除等預(yù)處理步驟,獲得的點(diǎn)云數(shù)據(jù)包括三維坐標(biāo)代表的幾何信息以及與每個(gè)點(diǎn)相關(guān)聯(lián)的顏色、反射率等屬性信息,動(dòng)態(tài)獲取點(diǎn)云數(shù)據(jù)見圖 2。
圖2 動(dòng)態(tài)獲取點(diǎn)云數(shù)據(jù)示意圖
03 點(diǎn)云壓縮評(píng)價(jià)指標(biāo)
壓縮效率和重建質(zhì)量是點(diǎn)云壓縮算法性能評(píng)價(jià)的兩項(xiàng)重要指標(biāo)。在壓縮效率方面,根據(jù)壓縮文件比特?cái)?shù)進(jìn)行衡量,針對(duì)點(diǎn)云數(shù)據(jù)通常使用存儲(chǔ)每個(gè)點(diǎn)所占的比特位數(shù)(BPP)來比較,BPP越低,壓縮效率越高。
在重建質(zhì)量評(píng)價(jià)方面,采用點(diǎn)云在三維空間中的坐標(biāo)(x,y,z)和顏色屬性(顏色RGB或空間YUV)及其他可選屬性來評(píng)價(jià)原始點(diǎn)云和解碼點(diǎn)云之間幾何位置或?qū)傩员磉_(dá)的相似性。其中主觀評(píng)價(jià)主要指目視評(píng)價(jià),客觀評(píng)價(jià)包括幾何信息評(píng)價(jià)和屬性信息評(píng)價(jià)。主觀評(píng)價(jià)主要采用點(diǎn)到點(diǎn)(C2C)獲得的峰值信噪對(duì)解碼點(diǎn)云的幾何質(zhì)量進(jìn)行評(píng)估[101],客觀評(píng)價(jià)將原始點(diǎn)云的屬性值與解碼后的點(diǎn)云中最近點(diǎn)的屬性值進(jìn)行比較,獲得對(duì)應(yīng)的峰值信噪比[102]。
1)對(duì)稱均方根(root mean square,RMS)距離。以原始點(diǎn)云為參考,計(jì)算解碼點(diǎn)云基于幾何距離的平均距離誤差的最大值:
式中,和分別表示原始點(diǎn)云和解碼點(diǎn)云;和分別表示原始點(diǎn)云和對(duì)應(yīng)的最鄰近解碼點(diǎn)云;是原始點(diǎn)云中的點(diǎn)數(shù);||?||表示兩個(gè)值之間的歐氏距離;為最近點(diǎn)之間的平均距離。針對(duì)原始點(diǎn)云中所有點(diǎn)計(jì)算,也針對(duì)對(duì)應(yīng)解碼點(diǎn)云中所有點(diǎn)計(jì)算,因此有必要計(jì)算對(duì)稱距離。
2) 對(duì)稱Hausdorff距離。表示要評(píng)估的兩個(gè)互為鄰域的點(diǎn)云之間最大的幾何距離:
3) 幾何信息峰值信噪比(PSNR)。以原始點(diǎn)云作參考,考慮了原始點(diǎn)云的邊界框最大寬度和對(duì)稱均方根距離,計(jì)算基于幾何形狀的位置偏差:
式中,為原始點(diǎn)云邊界框的最大寬度;為幾何信息峰值信噪比。越大,壓縮失真越小。此外,幾何信息評(píng)價(jià)也會(huì)用到點(diǎn)到表面(C2S)質(zhì)量評(píng)估指標(biāo)和點(diǎn)到平面(C2P)質(zhì)量評(píng)估指標(biāo),前者通過考慮與原始點(diǎn)云關(guān)聯(lián)的一些參考曲面來評(píng)估解碼后的點(diǎn)云質(zhì)量,后者通過考慮與原始點(diǎn)云關(guān)聯(lián)的一些參考曲面來評(píng)估解碼后的點(diǎn)云質(zhì)量。C2S和C2P質(zhì)量評(píng)估指標(biāo)均考慮到被比較的點(diǎn)對(duì)相關(guān)聯(lián)表面的相關(guān)性,主要缺點(diǎn)是它們?nèi)Q于所使用的特定表面重構(gòu)算法。
4) 屬性信息峰值信噪比。以顏色為例,將原始點(diǎn)云的每個(gè)顏色分量與解碼后的云中最近點(diǎn)的顏色進(jìn)行比較,從而得出YUV顏色空間中每個(gè)分量的峰值信噪比:
式中,默認(rèn)采用8位顏色表示,式(4)使用255作為峰值信號(hào);表示原始云和解碼后的云之間在平均顏色誤差方面的差異;變量是每個(gè)點(diǎn)的亮度值;屬性信息峰值信噪比越大,壓縮失真越小。
圖像壓縮質(zhì)量評(píng)價(jià)會(huì)用到信息保真度準(zhǔn)則(IFC)[103]、視覺信息保真度(VIF)[104]和結(jié)構(gòu)相似性(SSIM)[105]作為評(píng)估指標(biāo),其中IFC和VIF在信息保真度上引入了圖像與人眼之間的聯(lián)系,SSIM則從綜合亮度、對(duì)比度和結(jié)構(gòu)3方面評(píng)估解壓縮后圖像的失真情況,是符合人眼視覺系統(tǒng)特性的客觀評(píng)判標(biāo)準(zhǔn)。
04 點(diǎn)云壓縮基準(zhǔn)算法性能測(cè)試
4.1 實(shí)驗(yàn)數(shù)據(jù)
為了測(cè)試PCL、MPEG、Draco這3種開源點(diǎn)云壓縮算法的性能,本實(shí)驗(yàn)在MPEG提供的點(diǎn)云測(cè)試序列中選擇了4個(gè)具有顏色屬性的單幀點(diǎn)云模型進(jìn)行測(cè)試,包括:安德魯(http://plenodb.jpeg.org/pc/microsoft)、士兵、紅黑裙子女士和長裙子女士(http://plenodb.jpeg.org/pc/8ilabs),所選模型均以.ply文件格式存儲(chǔ)。圖 3展示了所用的部分測(cè)試序列,不同的模型具有不同的采集特點(diǎn)和表面特征。點(diǎn)云數(shù)據(jù)具有平滑的表面和均勻的區(qū)域,沒有明顯的孔區(qū)域。
圖 3 MPEG單幀點(diǎn)云測(cè)試序列示意圖
4.2 基準(zhǔn)算法介紹
目前國內(nèi)外開源的點(diǎn)云壓縮算法主要包括PCL庫中基于八叉樹的點(diǎn)云壓縮框架[55]、Chrome Media團(tuán)隊(duì)的Draco開源3D圖形壓縮庫[107]及MPEG提出的G-PCC點(diǎn)云壓縮平臺(tái)[68]。
4.2.1 PCL點(diǎn)云壓縮框架
PCL庫提供了點(diǎn)云壓縮方案,它允許對(duì)所有文件格式的點(diǎn)云進(jìn)行壓縮編碼。如圖 4所示,PCL壓縮過程包括讀取、采樣、編碼、解碼、存儲(chǔ)等。首先,方法使用八叉樹數(shù)據(jù)結(jié)構(gòu)在空間上劃分點(diǎn)云來進(jìn)行初始化;其次,對(duì)單位塊之間的數(shù)據(jù)進(jìn)行相關(guān)性分析,通過二進(jìn)制流對(duì)該結(jié)構(gòu)進(jìn)行序列化;然后,使用點(diǎn)位置編碼來編碼點(diǎn)的附加信息,如顏色、法線等;最后,采用熵編碼進(jìn)行進(jìn)一步壓縮獲得比特流。
圖4 PCL靜態(tài)點(diǎn)云編碼流程
4.2.2 Draco點(diǎn)云壓縮框架
Google的Chrome Media團(tuán)隊(duì)于2017-01發(fā)布了Draco開源壓縮庫,旨在改善三維圖形的存儲(chǔ)和傳輸。Draco為兩種格式的數(shù)據(jù)提供壓縮方案,只包含頂點(diǎn)信息的.ply文件格式和包含頂點(diǎn)信息及面信息的.obj文件格式。其中,頂點(diǎn)信息指該點(diǎn)的物體坐標(biāo)、法線向量、紋理坐標(biāo)等;面信息指的是由頂點(diǎn)圍成面,即一系列頂點(diǎn)索引的集合,包括各頂點(diǎn)及連接信息、紋理坐標(biāo)、顏色信息、法線和其他與幾何相關(guān)的任何通用屬性。
如圖 5所示,Draco整體思路是網(wǎng)格的連接信息和頂點(diǎn)的幾何屬性信息分別進(jìn)行編碼,針對(duì)面信息采用Edge Breaker算法壓縮連接信息[106],對(duì)于各頂點(diǎn)的基本信息寫入緩沖區(qū),其中幾何信息采用K維樹結(jié)構(gòu)組織并序列化,屬性信息采用平行四邊形差分方式壓縮。對(duì)頂點(diǎn)的幾何信息、屬性信息及面信息進(jìn)行預(yù)測(cè)編碼、變換編碼、量化、熵編碼,其中熵編碼采用非對(duì)稱數(shù)字系統(tǒng)的范圍變體(rANS)算法[107]。
4.2.3 G-PCC點(diǎn)云壓縮框架
MPEG于2019年提出了G-PCC標(biāo)準(zhǔn)框架,該方法分為幾何壓縮和屬性壓縮兩部分,其中,屬性壓縮是要依靠重建后的幾何信息來進(jìn)行,因此基于G-PCC框架的點(diǎn)云壓縮是首先進(jìn)行幾何壓縮,包括坐標(biāo)變換、體素化、基于八叉樹的幾何結(jié)構(gòu)分析,以及對(duì)所得結(jié)構(gòu)進(jìn)行算術(shù)編碼;然后進(jìn)行屬性壓縮,包括區(qū)域自適應(yīng)層次轉(zhuǎn)換、預(yù)測(cè)轉(zhuǎn)換和提升轉(zhuǎn)換。如圖 6所示,G-PCC壓縮涉及3部分操作:預(yù)處理、幾何壓縮和屬性壓縮。
圖6 G-PCC點(diǎn)云編碼流程
4.3 性能比較與分析
本文實(shí)驗(yàn)采用MPEG中的4個(gè)具有顏色屬性的靜態(tài)點(diǎn)云測(cè)試序列,采用2.20 GHz、i7-8750 ?CPU以及8GB RAM的筆記本電腦,分別實(shí)現(xiàn)PCL庫、Draco 3D圖形庫以及G-PCC平臺(tái)的靜態(tài)點(diǎn)云壓縮方法。
1) 本文嘗試對(duì)MPEG提供的點(diǎn)云測(cè)試序列進(jìn)行無損壓縮,即不對(duì)幾何信息和屬性信息進(jìn)行近似或量化,具體表現(xiàn)為:
(1)在PCL壓縮中選擇細(xì)節(jié)編碼模式,且不對(duì)屬性信息進(jìn)行量化;
(2)在G-PCC壓縮模式選擇Octree-Predictive模式,將參數(shù)設(shè)置為Lossless Geometry?–?Lossless Attributes默認(rèn)值;
(3)在Draco壓縮中選擇最高壓縮等級(jí)和不進(jìn)行量化壓縮模式。采用耗時(shí)、各點(diǎn)所占比特位數(shù)作為編碼性能的衡量指標(biāo),得到的分析結(jié)果如表 2。
安德魯可視化結(jié)果如圖 7。
表2 3種點(diǎn)云無損壓縮算法的性能比較
圖7 無損壓縮重建點(diǎn)云的主觀比較圖
2) 為了測(cè)試3種開源方法在不同幾何信息有損條件下的性能,本文嘗試對(duì)PCL、G-PCC和Draco方法在相似的比特率范圍內(nèi)進(jìn)行實(shí)驗(yàn),表現(xiàn)為:
(1)在PCL壓縮中不進(jìn)行細(xì)節(jié)編碼且不對(duì)屬性信息進(jìn)行量化,將八叉樹分辨率參數(shù)設(shè)置為2~16;
(2)在G-PCC壓縮模式中選擇Octree-Predictive模式,將位置量化比例設(shè)置為0.5~0.05,將其他參數(shù)設(shè)為默認(rèn)值;
(3)在Draco中坐標(biāo)量化保留位數(shù)設(shè)置為8~14。
得到點(diǎn)云測(cè)試序列在幾何形狀與位置的率失真性能曲線結(jié)果如圖 8所示,其橫軸表征點(diǎn)云數(shù)據(jù)平均每點(diǎn)幾何信息編碼的碼率,縱軸表征各點(diǎn)云壓縮的幾何峰值信噪比。
圖8 點(diǎn)云在幾何有損壓縮后的速率失真曲線
3) 為了測(cè)試3種開源方法在不同屬性信息有損條件下的性能,本文嘗試對(duì)PCL、G-PCC和Draco方法在相似的比特率范圍內(nèi)進(jìn)行實(shí)驗(yàn)。
1) 在PCL壓縮中進(jìn)行細(xì)節(jié)編碼,將屬性量化保留位數(shù)設(shè)置為3~6。
2) 在G-PCC壓縮模式中選擇Octree-Predictive模式,將量化步長設(shè)置為10~40,將其他參數(shù)設(shè)置為默認(rèn)值。
3) 在Draco中屬性量化保留位數(shù)設(shè)置為3~6。
得到點(diǎn)云測(cè)試序列在Y通道下率失真性能曲線的結(jié)果如圖 9所示,其橫軸表征點(diǎn)云數(shù)據(jù)平均每點(diǎn)屬性信息編碼的碼率,縱軸表征各點(diǎn)云壓縮的屬性峰值信噪比。
圖9 點(diǎn)云在屬性有損壓縮后的速率失真曲線
由實(shí)驗(yàn)結(jié)果得出如下結(jié)論:從壓縮效率來看,在3種實(shí)驗(yàn)條件下G-PCC表現(xiàn)出明顯優(yōu)勢(shì),在有損壓縮條件下壓縮效率Draco較PCL高,而在無損壓縮條件下PCL比Draco更優(yōu);從信息失真情況來看,G-PCC和Draco在不同有損壓縮的條件下也能夠保持一定的重建精度,它們?cè)趲缀涡畔⒑蛯傩孕畔⒎矫姹憩F(xiàn)出的保真性能較PCL更好;從壓縮、解壓縮耗時(shí)來看,Draco均優(yōu)于另外兩種壓縮方法,PCL次之,而G-PCC有較大的提升空間。
綜上所述,G-PCC點(diǎn)云壓縮方法擁有更優(yōu)越的率失真性能,而相比G-PCC點(diǎn)云壓縮而言,Draco的壓縮效率比較低,但是壓縮、解壓速度方面更占優(yōu)勢(shì)。由此可見,G-PCC和Draco能為不同任務(wù)提供具有競(jìng)爭力的解決方案,以滿足各種應(yīng)用要求,其中G-PCC更適合用在存儲(chǔ)空間有限且高保真度要求的情況下,Draco更能應(yīng)對(duì)實(shí)時(shí)性要求高的任務(wù)。
05 點(diǎn)云壓縮展望
在三維采集技術(shù)、傳感器技術(shù)及計(jì)算機(jī)處理技術(shù)綜合化、多樣化的背景下,點(diǎn)云數(shù)據(jù)獲取的效率與質(zhì)量逐步提高,采集的成本不斷降低,得以對(duì)三維場(chǎng)景進(jìn)行精細(xì)數(shù)字化,從而廣泛應(yīng)用于增強(qiáng)現(xiàn)實(shí)、遠(yuǎn)程通信、智能交通、數(shù)字地球等新興產(chǎn)業(yè)。一方面,點(diǎn)云數(shù)據(jù)容量呈指數(shù)級(jí)增加;另一方面,點(diǎn)云的非結(jié)構(gòu)化、密度不均以及真實(shí)場(chǎng)景中目標(biāo)實(shí)體間的相似性等現(xiàn)象使得點(diǎn)云大數(shù)據(jù)的存儲(chǔ)管理、計(jì)算分析等面臨更大的挑戰(zhàn),推動(dòng)點(diǎn)云壓縮編碼算法的改進(jìn)和創(chuàng)新。
針對(duì)點(diǎn)云壓縮過程中存在計(jì)算復(fù)雜度高、無法精細(xì)刻畫數(shù)據(jù)分布、難以利用場(chǎng)景先驗(yàn)信息做針對(duì)性壓縮、重建點(diǎn)云存在細(xì)節(jié)丟失和全局形變等問題,未來有以下幾種發(fā)展趨勢(shì):
(1)顧及特征同質(zhì)與信息均衡的點(diǎn)云超體素生成方法,在特征同質(zhì)與信息均衡的損失函數(shù)約束下,完成點(diǎn)云等信息熵的超體素劃分,并以此代替等尺寸的單位體素作為點(diǎn)云壓縮的基本單元,既提高點(diǎn)云壓縮的效率,又降低點(diǎn)云壓縮的失真率。
(2)創(chuàng)建基于局部細(xì)節(jié)差分和全局相似性約束的漸進(jìn)式點(diǎn)云壓縮方法,針對(duì)點(diǎn)云的空間分布情況,自適應(yīng)劃分點(diǎn)云空間域,通過不同分辨率的層次結(jié)構(gòu)提高細(xì)節(jié)重構(gòu)能力,有效降低解碼后的數(shù)據(jù)失真率。
(3)發(fā)展融合超先驗(yàn)引導(dǎo)與稀疏編碼的點(diǎn)云隱含空間表達(dá)方法,利用高維空間隱含向量的稀疏編碼表達(dá)點(diǎn)云,并利用超先驗(yàn)知識(shí)指導(dǎo)點(diǎn)云編碼過程,使得熵模型的編碼概率與隱含向量的邊緣概率更加吻合,從而減少算術(shù)編碼的內(nèi)存消耗,以此提升數(shù)據(jù)壓縮比。
(4)創(chuàng)建基于空間連續(xù)函數(shù)的點(diǎn)云表達(dá)與壓縮方法,對(duì)點(diǎn)云的幾何和屬性信息采用合適的體積函數(shù)進(jìn)行表達(dá),并對(duì)其進(jìn)行量化和熵編碼,從而充分結(jié)合點(diǎn)云數(shù)據(jù)的幾何信息和屬性信息,實(shí)現(xiàn)兼顧點(diǎn)云幾何和屬性的聯(lián)合壓縮。
(5)提出更加合理的點(diǎn)云質(zhì)量評(píng)價(jià)指標(biāo),計(jì)算點(diǎn)云壓縮產(chǎn)生的幾何信息和屬性信息損耗,既能從主觀上評(píng)價(jià)壓縮對(duì)點(diǎn)云可視化效果的影響,也能從客觀角度反映壓縮對(duì)下游任務(wù)(如場(chǎng)景理解、模型重建等)的影響。
(6)豐富點(diǎn)云壓縮測(cè)試數(shù)據(jù)集(如手持式、地面基站、車載測(cè)量系統(tǒng)、無人機(jī)測(cè)量系統(tǒng)等),完善點(diǎn)云壓縮算法在沉浸式遠(yuǎn)程實(shí)時(shí)通信、交互式VR、文化遺產(chǎn)展示與修復(fù)、動(dòng)態(tài)地圖與智能交通等科學(xué)與工程研究等案例的應(yīng)用研究。
(7)改進(jìn)預(yù)測(cè)編碼、變換編碼及熵編碼技術(shù)方案,合理選擇量化參數(shù)和碼率控制模式,從而實(shí)現(xiàn)率失真優(yōu)化的點(diǎn)云壓縮標(biāo)準(zhǔn)框架,有效填補(bǔ)國標(biāo)和行標(biāo)的空白。
(8)點(diǎn)云深度學(xué)習(xí)方法和理論仍處于發(fā)展階段,如何應(yīng)對(duì)小規(guī)模數(shù)據(jù)集和點(diǎn)云的非結(jié)構(gòu)化性質(zhì)、提高網(wǎng)絡(luò)的卷積效率、解耦高低頻信息等也是點(diǎn)云數(shù)據(jù)壓縮的未來發(fā)展方向。
在可預(yù)見的未來,在人工智能、云計(jì)算、5G通訊等技術(shù)的支撐下,相信點(diǎn)云壓縮不但可以保證高壓縮比和低失真率,還可以結(jié)合GPU并行計(jì)算能力加速點(diǎn)的選取,使得高效、實(shí)時(shí)地渲染和傳輸密集點(diǎn)云成為可能,從而為測(cè)繪應(yīng)用、地球科學(xué)研究、智慧城市、數(shù)字地球、AR/VR等提供更有力的數(shù)據(jù)支撐。
06 結(jié)語
三維成像技術(shù)的迅速發(fā)展,使得快速生成高精度、高密度的點(diǎn)云模型成為可能,為有限的存儲(chǔ)空間和傳輸帶寬帶來巨大壓力,學(xué)術(shù)界和工業(yè)界對(duì)標(biāo)準(zhǔn)點(diǎn)云壓縮編碼方案的需求與日俱增。
如何在保證低失真率、高壓縮比的情況下,提升點(diǎn)云壓縮編碼的效率,成為當(dāng)前點(diǎn)云模型壓縮編碼的研究目標(biāo)。
本文圍繞點(diǎn)云壓縮的核心,重點(diǎn)對(duì)國內(nèi)外點(diǎn)云壓縮算法的研究工作進(jìn)行總結(jié)與說明,并在常用的測(cè)試數(shù)據(jù)上對(duì)3種開源點(diǎn)云壓縮框架進(jìn)行比較分析,對(duì)點(diǎn)云壓縮的重要發(fā)展方向予以展望。
審核編輯 :李倩
-
云計(jì)算
+關(guān)注
關(guān)注
39文章
7714瀏覽量
137129 -
人工智能
+關(guān)注
關(guān)注
1791文章
46698瀏覽量
237190 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1201瀏覽量
24622 -
點(diǎn)云
+關(guān)注
關(guān)注
0文章
58瀏覽量
3776
原文標(biāo)題:點(diǎn)云壓縮研究進(jìn)展與趨勢(shì)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論