少妇内射兰兰久久,久久亚洲精品成人无码网站夜色 ,97视频视频在线观看视频

【背景介紹】

數(shù)據(jù)壓縮與關(guān)系數(shù)據(jù)庫的結(jié)合，早已不是一個新鮮的話題，當前我們已經(jīng)看到了各種各樣數(shù)據(jù)庫壓縮的產(chǎn)品和解決方案。對于 GaussDB 來說，在今天引入數(shù)據(jù)壓縮，究竟能夠給客戶帶來什么不一樣的價值，是過去一段時間我們一直在思考的問題。為了回答這個問題，我們首先對各種通用壓縮算法進行了廣泛的測試，從性能最好的 LZ4/Snappy，到性能與壓縮率均衡的 Zstd/Zlib，再到強調(diào)壓縮率的 LZMA/BZip。我們發(fā)現(xiàn)：即使是性能最好的壓縮算法，仍然無法做到對一個在線數(shù)據(jù)庫的性能不產(chǎn)生顯著影響。我們也調(diào)研了數(shù)據(jù)庫領(lǐng)域的各種編碼方法，包括近幾年學(xué)術(shù)界發(fā)布的一些基于預(yù)測和線性擬合的編碼方法，從研究發(fā)布的測試結(jié)果及實測來看，數(shù)據(jù)庫編碼用于解決特定數(shù)值分布的可壓縮性問題，與壓縮算法的成熟度相比，當前并沒有一種通用的數(shù)據(jù)庫編碼方法，能夠在大多數(shù)真實數(shù)據(jù)集中的場景下提供穩(wěn)定的壓縮率。

這是我們對于數(shù)據(jù)庫壓縮這個領(lǐng)域的一個基本技術(shù)判斷。過去的產(chǎn)品實踐也驗證了這一點，我們看到很多商業(yè)數(shù)據(jù)庫和開源數(shù)據(jù)庫都提供了對于壓縮的支持，絕大多數(shù)時候，留給客戶的選擇就是決定要不要在特定的表上開啟壓縮。開啟壓縮意味著空間節(jié)省，但同時意味著性能下降，這個看似簡單的選擇恰恰是客戶最難做的。這也是為什么有了這么多數(shù)據(jù)庫壓縮的產(chǎn)品，我們卻很少能看到數(shù)據(jù)壓縮真正廣泛應(yīng)用在數(shù)據(jù)庫在線業(yè)務(wù)中的根本原因。這給了我們更多的啟示。我們相信，真正可被應(yīng)用的數(shù)據(jù)庫壓縮技術(shù)，能夠去兼顧壓縮率與業(yè)務(wù)影響的平衡，應(yīng)該是選擇性的。即我們能夠基于技術(shù)去判定數(shù)據(jù)的溫度，并基于這樣的判定，去選擇性地壓縮業(yè)務(wù)中相對較冷的數(shù)據(jù)，而不去碰那些相對較熱的數(shù)據(jù)。這樣的技術(shù)選擇意味著我們無法去滿足所有業(yè)務(wù)場景，我們要求業(yè)務(wù)的數(shù)據(jù)溫度分布，必須滿足 80-20 分布規(guī)則。即我們?nèi)嚎s那些占用 80% 存儲需求、但只占用 20% 計算需求的冷數(shù)據(jù)，而不去碰那些只占用 20% 存儲需求、但卻占用 80% 計算需求的熱數(shù)據(jù)。幸運的是，我們發(fā)現(xiàn)絕大多數(shù)對于容量控制有需求的業(yè)務(wù)，都具備這樣的特征。

【場景及目標選擇】

通過對大量業(yè)務(wù)場景的分析，我們發(fā)現(xiàn)業(yè)務(wù)對于數(shù)據(jù)庫壓縮技術(shù)的需求是多元化的，有在線交易業(yè)務(wù)（OLTP）存儲壓縮的場景，有分析業(yè)務(wù)（OLAP）存儲壓縮的場景，有歷史業(yè)務(wù)存儲壓縮的場景，也有容災(zāi)業(yè)務(wù)傳輸壓縮的場景。不同的場景，對于壓縮技術(shù)的訴求，如果從壓縮性能、壓縮率、解壓性能的三維指標去看，從對業(yè)務(wù)侵入的容忍度去看，是完全不同的。這意味著如果我們想要打造一個全場景的 GaussDB 高級壓縮特性，它應(yīng)該是多個技術(shù)的組合，包括不同的壓縮算法、不同的冷熱判定模型及方法、不同的數(shù)據(jù)存儲組織等，通過不同的技術(shù)組合及應(yīng)用去滿足不同的場景需求。這同時意味著我們在不同壓縮適用場景的支持上需要有個優(yōu)先級的取舍。我們的答案是選擇去優(yōu)先支持 OLTP 存儲壓縮場景，這是我們認為數(shù)據(jù)庫壓縮技術(shù)最有價值的業(yè)務(wù)領(lǐng)域，當然也是技術(shù)挑戰(zhàn)最大的領(lǐng)域。

確定場景之后，接下來是確定技術(shù)目標，我們面向這個場景，究竟要打造什么樣的核心競爭力，這取決于我們對于典型客戶場景的分析。我們識別了兩類典型客戶場景：場景 A：客戶業(yè)務(wù)來自于 IBM 小機，單庫容量 50TB，遷移到開放平臺后，面臨容量過大和運維窗口過長問題。選擇拆庫意味著分布式改造，對于一個已經(jīng)穩(wěn)定運行許多年的存量關(guān)鍵業(yè)務(wù)來說，這種技術(shù)選擇風險過高。選擇壓縮可以顯著降低容量風險，但業(yè)務(wù)最初的設(shè)計并沒有考慮冷熱分離（比如基于時間維度建立分區(qū)），需要一種零侵入的壓縮技術(shù)支持，同時對業(yè)務(wù)性能影響足夠低。場景 B：客戶業(yè)務(wù)基于分布式集群部署，單集群容量已經(jīng)超過 1PB，并且仍在快速增長，需要定期擴容。選擇壓縮可以降低擴容頻率，顯著降低業(yè)務(wù)的軟硬件成本，并減少變更風險。但業(yè)務(wù)的數(shù)據(jù)分布設(shè)計是面向擴展性的（比如基于用戶維度建立分區(qū)），沒有考慮冷熱分離，因此同樣的，業(yè)務(wù)需要一種零侵入的壓縮技術(shù)支持，同時對性能影響足夠低。通過對客戶典型場景的需求梳理，我們確定了 GaussDB OLTP 存儲壓縮的基本設(shè)計目標：1）冷熱判定對業(yè)務(wù)應(yīng)該是零侵入的，不應(yīng)對業(yè)務(wù)的已有數(shù)據(jù)分布、邏輯模型有任何依賴；2）對業(yè)務(wù)影響必須足夠低，我們定義目標低于 10%，并挑戰(zhàn) 5%；3）提供合理的壓縮率，我們定義目標不低于 2：1。基本設(shè)計目標的定義，使得我們能夠?qū)⒑罄m(xù)每個具體場景中的技術(shù)選擇都變成一個確定性問題。

【冷熱判定】

確定設(shè)計目標后，我們開始進行工程落地。有三個問題需要解決：1）如何實現(xiàn)對數(shù)據(jù)的冷熱判定；2）如何實現(xiàn)壓縮后數(shù)據(jù)的存儲組織；3）如何實現(xiàn)有競爭力的壓縮算法。對于冷熱判定，首先要確定判定的粒度。數(shù)據(jù)的冷熱判定可以基于不同粒度實現(xiàn)，行級、塊級或表 / 分區(qū)級，粒度越粗，實現(xiàn)的復(fù)雜度越低，但對業(yè)務(wù)的侵入也越大?；谠O(shè)計目標，很自然的，我們選擇行級的冷熱判定，這是對業(yè)務(wù)數(shù)據(jù)分布依賴最小的方案，我們需要解決的，是如何控制引入冷熱判定的代價。我們利用 GaussDB 存儲引擎已有的機制巧妙地解決了這一問題。具體來說，GaussDB 存儲引擎在每行數(shù)據(jù)的元數(shù)據(jù) Meta 中記錄了最近一次修改該行的事務(wù) ID（XID），該信息被用來支持事務(wù)的可見性判定，從而實現(xiàn)多版本并發(fā)控制（MVCC）。對于特定行來說，如果其 XID 足夠 “老”，老到它對所有當前已經(jīng)活躍的事務(wù)都可見，那么這時候我們實際上已經(jīng)不關(guān)注 XID 的具體值，我們可以通過引入一個特定的標志位（FLG）來記錄這一點，而原來 XID 中填充的值可以被一個物理時間來代替，這個物理時間就表征了其所屬行最后一次修改時間的上限（LMT，Last Modified Time）。很顯然，LMT 可以用來支持冷熱判定（具體見圖 1）：

圖 1：行級冷熱判定上述方案的好處是引入 LMT 并沒有增加額外開銷，對業(yè)務(wù)的邏輯模型也沒有任何依賴，在大多數(shù)時候，如果不是特別嚴格要求，業(yè)務(wù)可以定義一個簡單的規(guī)則來實現(xiàn)冷熱判定，比如：

AFTER 3 MONTHS OF NO MODIFICATION

此時系統(tǒng)會掃描目標表，對于所有滿足當前時間減去 LMT 超過 3 個月的行進行壓縮。注意在上述方案中，我們實際上只識別了行的寫熱點，但并沒有識別行的讀熱點，我們只知道滿足條件的行 3 個月內(nèi)未發(fā)生任何更新，但我們無法確認這些行在 3 個月內(nèi)是否被頻繁讀取。維護行的讀熱點，目前從技術(shù)上沒有低成本的解決方案。對于像訂單明細這樣的流水類業(yè)務(wù)，這個方案可以很好地工作，因為數(shù)據(jù)的讀和寫呈現(xiàn)出相同的溫度特征，其訪問頻率隨著未修改時間的增加不斷衰減。但對于像手機相冊這樣的收藏類業(yè)務(wù)，僅識別寫可能是不夠的，因為一個很早建立的收藏關(guān)系仍然可能被頻繁訪問。這意味著，即使系統(tǒng)進行了冷熱判定，我們?nèi)匀恍枰?yōu)化業(yè)務(wù)可能訪問壓縮數(shù)據(jù)的場景，我們把這個問題留給了存儲組織和壓縮算法，對于壓縮算法來說，我們更關(guān)注其解壓性能。另一個問題是在某些場景下，使用默認的冷熱判定可能是不夠的，比如對于某些類型的交易而言，其產(chǎn)生的訂單明細可能在 3 個月內(nèi)確實不會被修改，但會在達到一個特定的觸發(fā)條件后被更新（比如解凍擔保交易）。這種場景在實際業(yè)務(wù)中并不常見，但如果業(yè)務(wù)確實關(guān)注性能，那么我們支持在默認的冷熱判定規(guī)則以外，允許業(yè)務(wù)自定義規(guī)則，比如：

AFTER 3 MONTHS OF NO MODIFICATION ON (order_status = "finished")

此時系統(tǒng)會僅壓縮 3 個月未修改、且訂單狀態(tài)已經(jīng)完結(jié)的數(shù)據(jù)。當前我們支持的自定義規(guī)則，是任意合法的行表達式，業(yè)務(wù)可以寫任意復(fù)雜的表達式來表征數(shù)據(jù)的冷熱判定規(guī)則，但表達式中所引用的任何字段，只能是目標表上的合法字段。通過這種默認和自定義規(guī)則的組合使用，我們提供了業(yè)務(wù)足夠低的使用門檻和更好的靈活性。

【存儲組織】

當滿足冷熱判定條件的行被壓縮時，我們需要決定如何存儲這些壓縮后的數(shù)據(jù)，基于設(shè)計目標，我們選擇了對業(yè)務(wù)侵入最小的存儲組織實現(xiàn) —— 塊內(nèi)壓縮。我們知道關(guān)系數(shù)據(jù)庫的存儲組織都是基于固定長度的分塊的，在 GaussDB 數(shù)據(jù)庫中，典型的數(shù)據(jù)塊大小為 8KB，選擇更大的數(shù)據(jù)塊顯然有利于壓縮，但對業(yè)務(wù)性能會造成更大的影響。所謂塊內(nèi)壓縮，是指：1）單個塊內(nèi)所有滿足冷熱判定條件的行，會作為一個整體進行壓縮；2）壓縮后形成的數(shù)據(jù)就存放在當前的數(shù)據(jù)塊中，存放區(qū)域稱為 BCA（Block Compressed Area），它通常位于塊的尾部。塊內(nèi)壓縮的設(shè)計意味著解壓任何數(shù)據(jù)只依賴于當前塊，而不需要訪問其它的數(shù)據(jù)塊，從壓縮率的視角看，這樣的設(shè)計并不是最友好的，但它非常有利于控制業(yè)務(wù)影響。注意在我們前面的討論中，即使業(yè)務(wù)定義了冷熱判定條件，仍然存在一定的概率會訪問壓縮數(shù)據(jù)，我們希望這個訪問代價能夠有一個確定性的上限。圖 2 給出了塊內(nèi)壓縮的詳細流程：首先，當壓縮被觸發(fā)時，系統(tǒng)掃描數(shù)據(jù)塊中的所有行，根據(jù)指定的冷熱判定條件，識別出 R1 和 R3 是冷數(shù)據(jù)（圖 2 (a)）；接著，系統(tǒng)將 R1 和 R3 作為一個整體進行壓縮，將壓縮后的數(shù)據(jù)就存放在該數(shù)據(jù)塊的 BCA 中（圖 2 (b)）；如果業(yè)務(wù)后續(xù)需要更新 R1，那么系統(tǒng)會為更新后的數(shù)據(jù)生成一個新的拷貝 R4，并標識 BCA 中的 R1 已經(jīng)被刪除（如圖 2 (c)）；最后，當系統(tǒng)在該數(shù)據(jù)塊上需要更多空間時，可以回收 BCA 中屬于 R1 的空間（圖 2 (d)）。

圖 2：塊內(nèi)壓縮在整個設(shè)計中有兩點需要注意：1）我們實際上只壓縮了用戶數(shù)據(jù) Data，并沒有壓縮相應(yīng)的元數(shù)據(jù) Meta，后者通常用來支持事務(wù)的可見性；2）我們支持將冷數(shù)據(jù)重新變?yōu)闊釘?shù)據(jù)，以消除因為冷熱誤判而帶來的影響。同樣地，從壓縮率的視角，這樣的設(shè)計并不是最友好的，但它極大地減少了對業(yè)務(wù)的侵入。簡單來說，業(yè)務(wù)對于壓縮數(shù)據(jù)的訪問，與正常數(shù)據(jù)完全相同，在功能上沒有任何限制，在事務(wù)語義上也沒有任何差別。這是非常重要的原則：我們的 OLTP 存儲壓縮對于業(yè)務(wù)是完全透明的，這是當前這個特性，以及后續(xù) GaussDB 高級壓縮系列所有特性都將遵循的基本原則。

【壓縮算法】

基于設(shè)計目標，如果從壓縮率、壓縮性能、解壓性能的三維指標來看，我們實際上需要的是一個能夠提供合理的壓縮率、合理的壓縮性能、但是極致的解壓性能的壓縮算法，這是我們壓縮算法設(shè)計的基礎(chǔ)。我們首先測試了直接使用 LZ4 進行壓縮，LZ4 是目前已知的壓縮性能和解壓性能最好的開源三方庫，從實測結(jié)果看，LZ4 的壓縮率是偏低的。我們仔細分析了其算法原理，LZ4 是基于 LZ77 算法的一種實現(xiàn)，LZ77 算法的思想非常簡單，就是把要壓縮的數(shù)據(jù)看成一個字節(jié)流，算法從字節(jié)流的當前位置開始，前向?qū)ふ液彤斍拔恢孟嗤钠ヅ渥址缓笥闷ヅ涞降淖址拈L度以及與當前位置的偏移，用來表示被匹配的字符串，從而達到壓縮的效果。從算法原理上看，LZ77 算法對于長文本會有比較好的壓縮效果，但是對于結(jié)構(gòu)化數(shù)據(jù)中大量的短文本以及數(shù)值類型，效果就有限，我們實際的測試也驗證了這一點。

接下來，我們將壓縮算法分為了兩層：第一層，我們按列對一些數(shù)值類型進行了編碼，我們選擇了簡單的差值編碼，這種編碼足夠輕量級，解壓特定字段不需要依賴其它字段的值；第二層，我們將編碼后的數(shù)據(jù)再調(diào)用 LZ4 進行壓縮。注意在第一層中，我們實際上是按列編碼、按行存儲，這和業(yè)界的一般實現(xiàn)（按列編碼并存儲）有很大不同，按列存儲對壓縮率會更加友好，但是按列存儲意味著同一行的數(shù)據(jù)會被分散到 BCA 的不同區(qū)域，這種傳統(tǒng)的設(shè)計無法支持我們后續(xù)希望實現(xiàn)的部分解壓，我們將在結(jié)束語中更詳細地說明這一問題。通過實測，我們發(fā)現(xiàn)這種列編碼 + 通用壓縮的實現(xiàn)方式有效地提升了壓縮率，同時控制了業(yè)務(wù)影響的明顯增加，但兩層實現(xiàn)之間是松耦合的，這引入了許多額外的開銷。因此我們在仔細權(quán)衡之后，決定放棄 LZ4，而是完全基于 LZ77 算法，重新實現(xiàn)一個緊耦合的壓縮算法。

這在當時看來是一個非常冒險的嘗試，事實上，在我們之前，還沒有任何數(shù)據(jù)庫內(nèi)核團隊，會選擇自己去實現(xiàn)一個通用壓縮算法。但從最后取得的收益來看，我們實際上是打開了一扇全新的大門。當列編碼與 LZ77 算法之間的邊界被打破時，我們引入了一系列的優(yōu)化創(chuàng)新，考慮篇幅原因，我們無法展現(xiàn)全部技術(shù)細節(jié)，在這里，我們只介紹兩個小的優(yōu)化：第一個優(yōu)化是內(nèi)置行邊界。我們發(fā)現(xiàn)，當系統(tǒng)采用兩層壓縮算法后，我們需要額外地保存每一行數(shù)據(jù)在編碼后的長度，因為我們需要在 LZ77 算法解壓后找到每一行的邊界，這是一個不小的開銷。為了消除這個開銷，我們選擇在 LZ77 的編碼格式中嵌入一個行邊界的標記，這個標記只占用了 1 個位，其開銷較現(xiàn)有方案大幅降低。當然，這個標記位被占用后，LZ77 前向搜索的最大窗口長度減少了一半，但在我們這個場景中，這并不是什么問題，因為我們的典型頁面長度只有 8KB。第二個優(yōu)化是 2 字節(jié)短編碼。原有 LZ4 的實現(xiàn)中，為了提高壓縮性能，系統(tǒng)使用 3 字節(jié)編碼來描述一個匹配，這意味著系統(tǒng)能夠識別的最短匹配為 4 字節(jié)。

但是在結(jié)構(gòu)化數(shù)據(jù)中，3 字節(jié)的匹配是非常普遍的，參考下面一個例子： A = 1 … B = 2 其中，A 和 B 是同一行數(shù)據(jù)中的兩個整數(shù)型字段，它們的值分別為 1 和 2，基于當前的字節(jié)序，該行數(shù)據(jù)實際在內(nèi)存中存放的形式如下所示： 01 00 00 00 … 02 00 00 00 注意上面標紅的部分，很明顯，這里面有一個 3 字節(jié)的匹配，但是它無法被 LZ4 識別。我們通過在 LZ77 算法中額外引入 2 字節(jié)短編碼來解決這一問題，2 字節(jié)短編碼可以識別最小 3 字節(jié)的匹配，從而相對 LZ4 能夠提升壓縮率。當然，引入短編碼會有額外的開銷：1）壓縮性能會有一定程度的下降，因為我們需要建立兩個獨立的 HASH 表，幸運的是，在我們這個場景中，極致壓縮性能并不是我們追求的目標；2）2 字節(jié)編碼減少了表達匹配串與被匹配串之間距離的位寬，這意味著 3 字節(jié)的匹配必須離得更近才能被識別，在我們這個場景中，這并不是什么問題，因為相對于這個限制，一個典型數(shù)據(jù)行的長度已經(jīng)是足夠小的。

【效果評估】

我們使用標準的 TPCC 測試來評估啟用 OLTP 存儲壓縮特性對業(yè)務(wù)的影響。TPCC 模型共包含 9 張表，其中空間會動態(tài)增長的流水表共有 3 張，在這 3 張表中，訂單明細表（Orderline 表）的空間增長比其它表多一個數(shù)量級，因此我們選擇在這張表上開啟壓縮?；?TPCC 的業(yè)務(wù)語義，每筆訂單一旦完成配送，其訂單狀態(tài)就進入完結(jié)狀態(tài)，完結(jié)的訂單不會再被修改，但仍有一定的概率被查詢。基于這個語義，我們選擇冷熱判定原則為只壓縮已經(jīng)完結(jié)的訂單。我們分別測試了在不開啟壓縮和開啟壓縮狀態(tài)下系統(tǒng)的性能值，結(jié)果如圖 3 所示：

圖 3：業(yè)務(wù)影響評估測試結(jié)果表明：在 TPCC 測試場景下，開啟壓縮與不開啟壓縮相比，系統(tǒng)性能大概降低了 1.5%。這是一個非常不錯的結(jié)果，這意味著即使在超過百萬 tpmC 的業(yè)務(wù)峰值場景中，系統(tǒng)也可以開啟壓縮。我們不知道在此之前，業(yè)內(nèi)是否有其它數(shù)據(jù)庫產(chǎn)品也能夠達到這一水平。我們測試了 Orderline 表的壓縮率，作為更豐富的數(shù)據(jù)集，我們同時選擇了 TPCH 模型中的 4 張表（Lineitem、Orders、Customer、Part 表）進行測試。為了便于比較，對于每個數(shù)據(jù)集，我們同時測試了 LZ4、ZLIB 和我們的壓縮算法的壓縮率表現(xiàn)，其中 ZLIB 是強調(diào)壓縮解壓性能和壓縮率均衡的算法，其壓縮解壓性能較 LZ4 低了 5-10 倍。最終結(jié)果如圖 4 所示：

圖 4：壓縮率評估測試結(jié)果與我們預(yù)期的相符，在數(shù)值型字段較多時，我們的壓縮算法的壓縮率要高于所有通用壓縮算法，但在文本型字段較多時，我們的壓縮算法的壓縮率會介于 LZ 類和 LZ + Huffman 組合類的壓縮算法之間。

【運維 TIPS】

注意我們的壓縮方案實際上是離線的，也就是數(shù)據(jù)剛生成時必然是熱數(shù)據(jù)，它們不會觸發(fā)壓縮，業(yè)務(wù)訪問這些數(shù)據(jù)的性能也不會受任何影響；隨著時間的推移，這些數(shù)據(jù)的溫度會逐漸降低，最終被獨立的壓縮任務(wù)識別為冷數(shù)據(jù)并進行壓縮。選擇在業(yè)務(wù)低峰期運行這些壓縮任務(wù)、并控制其資源消耗是運維端需要關(guān)注的問題。在這塊我們提供了豐富的運維手段，包括指定運維窗口、壓縮任務(wù)的并行度、每個壓縮任務(wù)的壓縮數(shù)據(jù)量等。對于絕大多數(shù)業(yè)務(wù)來說，單位時間內(nèi)新增的數(shù)據(jù)量實際是比較有限的，因此業(yè)務(wù)也可以選擇一個特定的時間段集中完成壓縮任務(wù)，比如每個月第一天的凌晨兩點到四點，完成 3 個月前新增冷數(shù)據(jù)的壓縮。

業(yè)務(wù)在決定開啟壓縮之前，可能希望先了解開啟壓縮后的收益，并根據(jù)收益大小做出決策。為此我們提供了一個壓縮率評估工具，能夠?qū)δ繕吮淼臄?shù)據(jù)進行采樣，并使用和實際壓縮過程完全相同的算法對采樣數(shù)據(jù)進行壓縮，計算壓縮率，但不會實際生成 BCA，不會修改任何數(shù)據(jù)。如果業(yè)務(wù)將壓縮數(shù)據(jù)遷移到另一個表，可能會導(dǎo)致所有數(shù)據(jù)從壓縮狀態(tài)變?yōu)榉菈嚎s狀態(tài)，從而導(dǎo)致空間膨脹，這并非我們的方案引入的，而是所有壓縮方案都需要解決的問題。如果冷熱判定規(guī)則非常確定，那么業(yè)務(wù)可以手動執(zhí)行壓縮任務(wù)使壓縮立即生效；對于耗時較長的大容量壓縮表的遷移，業(yè)務(wù)仍然可以選擇定期地開啟自動壓縮任務(wù)來完成。最后，對于壓縮的開啟和關(guān)閉，我們提供最細粒度的控制，無論是普通表、普通分區(qū)表中的單個分區(qū)，還是二級分區(qū)中的任意單個分區(qū)、子分區(qū)，業(yè)務(wù)都可以單獨開啟或關(guān)閉壓縮。這使得對于業(yè)務(wù)本身已經(jīng)對數(shù)據(jù)區(qū)分了冷熱（比如基于時間分區(qū)）的場景，仍然可以和我們的壓縮特性很好地配合。

【結(jié)束語】

在 OLTP 表壓縮這個特性中，我們引入了一系列的技術(shù)創(chuàng)新，包括全新的壓縮算法、細粒度的自動冷熱判定和塊內(nèi)壓縮支持等，可以在提供合理壓縮率的同時，大幅度降低對業(yè)務(wù)的影響，我們希望這個特性能夠在支持關(guān)鍵在線業(yè)務(wù)的容量控制中發(fā)揮重要價值。接下來我們還將在降低引入壓縮對業(yè)務(wù)的影響、部分解壓特性、OLTP 索引壓縮等方面持續(xù)創(chuàng)新迭代，我們希望能夠有開創(chuàng)性的技術(shù)突破來解決相關(guān)的問題，為業(yè)務(wù)創(chuàng)造更大價值。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3574

瀏覽量
133990
存儲器

存儲器

+關(guān)注

關(guān)注
38

文章
7435

瀏覽量
163525
壓縮機

壓縮機

+關(guān)注

關(guān)注
11

文章
662

瀏覽量
79223
LMT

LMT

+關(guān)注

關(guān)注
0

文章
7

瀏覽量
5963
MVCC

MVCC

+關(guān)注

關(guān)注
0

文章
13

瀏覽量
1459

原文標題：GaussDB技術(shù)解讀丨高級壓縮

文章出處：【微信號：OSC開源社區(qū)，微信公眾號：OSC開源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

GaussDB 數(shù)據(jù)類型介紹

GaussDB 數(shù)據(jù)庫 GaussDB 是華為基于 openGauss 自研生態(tài)推出的云化企業(yè)級分布式關(guān)系型數(shù)據(jù)庫，它支持多種數(shù)據(jù)類型，包括數(shù)值、字符、日期等。在使用 GaussDB 時，可能需要

發(fā)表于 06-05 16:40 ?1602次閱讀

<b class='flag-5'>GaussDB</b> 數(shù)據(jù)類型介紹

根技術(shù)突破！華為云重磅發(fā)布GaussDB數(shù)據(jù)庫全面替代海外大廠同類產(chǎn)品

華為云CEO張平安宣布，華為云新一代分布式數(shù)據(jù)庫GaussDB正式發(fā)布，GaussDB是華為基于統(tǒng)一架構(gòu)，打造的企業(yè)級AI-Native分布式數(shù)據(jù)庫。在整體架構(gòu)設(shè)計上，GaussDB底層是分布式存儲，中間是每個DB特有的數(shù)據(jù)結(jié)構(gòu)

發(fā)表于 06-08 18:19 ?2714次閱讀

根<b class='flag-5'>技術(shù)</b>突破！華為云重磅發(fā)布<b class='flag-5'>GaussDB</b>數(shù)據(jù)庫全面替代海外大廠同類產(chǎn)品

EMC技術(shù)：基礎(chǔ)概念到應(yīng)用的解讀？|深圳比創(chuàng)達電子.

EMC技術(shù)：基礎(chǔ)概念到應(yīng)用的解讀？|深圳比創(chuàng)達電子電磁兼容性（Electromagnetic Compatibility，簡稱EMC）作為一項重要的技術(shù)領(lǐng)域，在現(xiàn)代電子設(shè)備中扮演著至關(guān)重要的角色

發(fā)表于 03-11 11:59

技術(shù)大咖免費教你解讀“EMI”

`直播鏈接：http://t.elecfans.com/live/572.html直播簡介：以全自主研發(fā)國產(chǎn)EMI設(shè)備生產(chǎn)商的視角，從測量儀器內(nèi)部原理出發(fā)，為大家解讀EMI測試。直播內(nèi)容大綱

發(fā)表于 10-08 14:17

阿里云數(shù)據(jù)庫POLARDB核心功能物理復(fù)制技術(shù)解讀

深入解讀阿里云數(shù)據(jù)庫POLARDB核心功能物理復(fù)制技術(shù)

發(fā)表于 06-02 10:16

【6.2】技術(shù)解讀（框架、場景案例解讀）

`技術(shù)解讀（框架、場景案例解讀）`

發(fā)表于 06-04 17:12

手機射頻技術(shù)和手機射頻模塊解讀

手機射頻技術(shù)和手機射頻模塊解讀

發(fā)表于 01-12 21:57 ?67次下載

GaussDB(openGauss)的關(guān)鍵特性、成功案例

GaussDB(openGauss)在華為云上擁有兩種部署形態(tài)：集中式和分布式，分別面向企業(yè)核心交易和未來海量事務(wù)型場景，打造差異化競爭力。

發(fā)表于 11-02 17:10 ?2764次閱讀

<b class='flag-5'>GaussDB</b>(openGauss)的關(guān)鍵特性、成功案例

華為云推出云原生分布式數(shù)據(jù)庫GaussDB(for Redis)

華為云開發(fā)者社區(qū)聯(lián)合華為云數(shù)據(jù)庫架構(gòu)與規(guī)劃團隊聯(lián)合出品，與開發(fā)者分享華為云GaussDB(for Redis)十年自研內(nèi)核修煉之路。包括GaussDB(for Redis)架構(gòu)設(shè)計、硬核性能、技術(shù)實踐，聚焦數(shù)據(jù)庫領(lǐng)域的現(xiàn)實問題解

發(fā)表于 04-20 09:51 ?1523次閱讀

GaussDB數(shù)據(jù)庫存儲過程介紹

華為云數(shù)據(jù)庫 GaussDB 是一款高性能、高安全性的云原生數(shù)據(jù)庫，在數(shù)據(jù)庫領(lǐng)域處于領(lǐng)先地位。而在 GaussDB 中，存儲過程是一個不容忽視的重要功能。本文將深入介紹 GaussDB 存儲過程

發(fā)表于 05-30 09:52 ?1186次閱讀

GaussDB存儲過程介紹

華為云數(shù)據(jù)庫 GaussDB 是一款高性能、高安全性的云原生數(shù)據(jù)庫，在數(shù)據(jù)庫領(lǐng)域處于領(lǐng)先地位。而在 GaussDB 中，存儲過程是一個不容忽視的重要功能。本文將深入介紹 GaussDB 存儲過程的使用場景、使用優(yōu)缺點、示例及示例

發(fā)表于 06-05 16:30 ?717次閱讀

GaussDB如何給世界一個更優(yōu)選擇？

11 月 7 日,華為全聯(lián)接大會 2022 第一天,華為云 CEO 張平安在主題演講中,專門有一頁 PPT 談到了 GaussDB 信息量很大,不僅特別強調(diào)“GaussDB 云原生交易數(shù)據(jù)庫,給世界一個更優(yōu)選擇”,同時,還分享了 2 個案例和一些數(shù)據(jù)。

發(fā)表于 06-05 16:30 ?462次閱讀

華為云數(shù)據(jù)庫GaussDB：數(shù)字化轉(zhuǎn)型的可信之選

華為云數(shù)據(jù)庫GaussDB，以其獨特的技術(shù)優(yōu)勢和卓越的性能，正在為世界提供一個更優(yōu)選擇。作為一種全棧自研、技術(shù)領(lǐng)先、性能出眾、承載核心業(yè)務(wù)的數(shù)據(jù)庫產(chǎn)品，GaussDB一次性解決了金融客

發(fā)表于 06-14 23:01 ?441次閱讀

華為云數(shù)據(jù)庫<b class='flag-5'>GaussDB</b>：數(shù)字化轉(zhuǎn)型的可信之選

華為云 GaussDB 重磅亮相華為全球智慧金融峰會，產(chǎn)品能力全新升級

。華為云數(shù)據(jù)庫服務(wù)產(chǎn)品部總經(jīng)理蘇光牛在現(xiàn)場分享了華為云 GaussDB 的商業(yè)進展和技術(shù)創(chuàng)新能力。華為云 GaussDB 歷經(jīng)真實場景考驗已經(jīng)非常成熟會上，蘇光牛首先介紹了華為云 Gaus

發(fā)表于 06-29 16:45 ?487次閱讀

EMC技術(shù)：基礎(chǔ)概念到應(yīng)用的解讀？

EMC技術(shù)：基礎(chǔ)概念到應(yīng)用的解讀？|深圳比創(chuàng)達電子

發(fā)表于 03-11 11:55 ?505次閱讀

搜索歷史

GaussDB技術(shù)解讀

評論