0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為云數(shù)據(jù)庫GaussDB(for Influx)揭秘:數(shù)據(jù)分級存儲

路過的憨憨 ? 來源:路過的憨憨 ? 作者:路過的憨憨 ? 2022-12-02 17:28 ? 次閱讀

華為云數(shù)據(jù)庫GaussDB揭秘:數(shù)據(jù)分級存儲

“只存儲這些數(shù)據(jù)一年就要花費(fèi)200多萬?”

面對老板的質(zhì)疑,小王又重新講解了一遍評估方案。為了支撐生產(chǎn)分析和系統(tǒng)運(yùn)維,一個設(shè)備就需要幾十個檢測點(diǎn)數(shù)據(jù),所有設(shè)備24小時不斷采集數(shù)據(jù),一天的數(shù)據(jù)量就會達(dá)到TB級,這些數(shù)據(jù)至少存儲2年,再加上高可用的3副本,總的數(shù)據(jù)量會達(dá)到PB級。

小王又展示了當(dāng)前云廠商存儲價格和性能對比的調(diào)研結(jié)果:

磁盤類型

SATA——NVME

成本100G/月

9.9——100

IOPS

2200——50000

吞吐量

50M/s——350M/s

訪問時延

5ms~10ms——1ms

不同存儲其性能差異很大。例如NVME盤的吞吐量是SATA盤的7倍,IOPS超過了20倍,當(dāng)然對應(yīng)的成本也高出10倍左右。根據(jù)測試評估,低成本的存儲性能無法滿足大量數(shù)據(jù)的寫入和實(shí)時業(yè)務(wù)的監(jiān)控,只得使用性能高的SSD盤,因此導(dǎo)致存儲的成本提高。

成本提高,老板自然不滿意。那如何才能既滿足性能需求,又能控制成本呢?小王想,“實(shí)際上,不是所有的數(shù)據(jù)處理都需要很高的性能,如果把價值高的數(shù)據(jù)放在高性能磁盤上滿足業(yè)務(wù)需求,價值低的數(shù)據(jù)放在低成本磁盤上降低成本,這樣不就既能滿足需求,又能降低成本了么?”

不過,想法很美好,現(xiàn)實(shí)很殘酷,要實(shí)現(xiàn)這個方案,小王面臨著更多的難題:

(1)怎么在一套系統(tǒng)中既能使用高性能存儲,又能使用低成本存儲?

(2)怎么區(qū)分高價值數(shù)據(jù)?

(3)高價值數(shù)據(jù)變成低價值數(shù)據(jù)后怎么自動轉(zhuǎn)儲?

(4)當(dāng)前業(yè)務(wù)改造量要盡量少。

1.GaussDB(for Influx)解決方案

企業(yè)的數(shù)字化轉(zhuǎn)型,數(shù)據(jù)是基礎(chǔ)。為了能實(shí)時掌握設(shè)備、系統(tǒng)狀態(tài),需要采集大量的數(shù)據(jù)并進(jìn)行實(shí)時處理。這些數(shù)據(jù)都屬于時序數(shù)據(jù),帶有明顯的特點(diǎn),如時間戳、更新少、數(shù)據(jù)源唯一等。除了數(shù)據(jù)本身的特點(diǎn),在業(yè)務(wù)應(yīng)用上還具有如下特點(diǎn):

  • 隨著時間的推移,其被查詢和分析的概率越來越低。
  • 隨著時間的推移,對數(shù)據(jù)分析的實(shí)時性要求越來越低。
  • 隨著時間的推移,數(shù)據(jù)的精度要求越來越低。
  • 數(shù)據(jù)只保留一段時間,到期后會刪除。

如何結(jié)合時序數(shù)據(jù)的特點(diǎn),實(shí)現(xiàn)小王既滿足業(yè)務(wù)性能,又控制成本的美好愿望呢?華為云GaussDB(for Influx)時序數(shù)據(jù)庫的數(shù)據(jù)分級存儲功能完美解決了困擾小王的問題。

  1. 華為云GaussDB(for Influx)依托云原生能力,實(shí)現(xiàn)了計算存儲分離的分布式架構(gòu),其中存儲基于華為分布式存儲DFV和對象存儲OBS,解決了在一套系統(tǒng)中既能使用高性能存儲,又能使用低成本存儲的問題,其具體架構(gòu)如下圖:

1669973295015vi4fcrdq2w

分布式DFV存儲屬于高性能存儲,熱數(shù)據(jù)放在DFV中確保業(yè)務(wù)性能要求;OBS存儲屬于低成本存儲,冷數(shù)據(jù)存儲在OBS中,降低客戶成本。

  1. 提供了冷熱數(shù)據(jù)自動分離的方案,用戶在創(chuàng)建保留策略時,可以指定冷熱數(shù)據(jù)的劃分時間,系統(tǒng)根據(jù)用戶的指定,自動將數(shù)據(jù)分為熱數(shù)據(jù)和冷數(shù)據(jù),解決了數(shù)據(jù)如何劃分的問題。
  2. 隨著時間的推移,熱數(shù)據(jù)轉(zhuǎn)冷,系統(tǒng)會自動將數(shù)據(jù)轉(zhuǎn)儲到冷存儲上。
  3. 上述過程中只有在創(chuàng)建RP時需要指定冷熱數(shù)據(jù)策略。對于業(yè)務(wù)側(cè)是不感知的,避免業(yè)務(wù)的適配和改造。

2.GaussDB(for Influx)冷熱存儲的使用

GaussDB(for Influx)存儲分級功能使用十分方便,在購買冷存儲后,設(shè)置RP策略時指定冷存儲的時間即可,系統(tǒng)會根據(jù)RP策略,自動將冷數(shù)據(jù)轉(zhuǎn)儲到底成本存儲上。業(yè)務(wù)在訪問冷數(shù)據(jù)時,系統(tǒng)會自動去冷存儲上讀取,整個過程業(yè)務(wù)是不感知的,對業(yè)務(wù)無影響。

2.1購買冷存儲

GaussDB(for Influx)支持一鍵購買冷存儲空間,可以在購買實(shí)例時選擇是否夠買冷存儲,選擇“是”,可以根據(jù)業(yè)務(wù)需求選擇冷存儲的大小,具體如下圖:

1669973295338j8ospjaw2x

也可以在購買實(shí)例后,獨(dú)立購買冷存儲。進(jìn)入實(shí)例詳情頁面,點(diǎn)擊創(chuàng)建冷存儲空間,如下圖:

1669973295632l6yi64pf2z

跳轉(zhuǎn)到如下頁面,按照業(yè)務(wù)需求進(jìn)行存儲空間大小選擇:

1669973295907s8g3mt11po

冷存儲空也支持在線擴(kuò)容,擴(kuò)容過程中不影響業(yè)務(wù)。

2.2設(shè)置冷數(shù)據(jù)規(guī)則

在購買了冷存儲空間后,就可以按照業(yè)務(wù)需求設(shè)置冷數(shù)據(jù)的規(guī)則,系統(tǒng)會根據(jù)規(guī)則,自動劃分冷熱數(shù)據(jù),并將冷數(shù)據(jù)存儲在冷存儲空間上??梢酝ㄟ^創(chuàng)建RP來指定冷熱數(shù)據(jù)規(guī)則,具體示例如下:

//在db名為mydb上創(chuàng)建名為myrp的RP,顯示指定WARM DURATION為6d,表示6天前的數(shù)據(jù)是冷數(shù)據(jù)。

create retention policy myrp on mydb duration 30d replication 1 warm duration 6d shard duration 3d

//在db名為mydb上創(chuàng)建名為myrp的RP,沒有指定WARM DURATION,表示沒有冷數(shù)據(jù)。

create retention policy myrp on mydb duration 30d replication 1 shard duration 3d

//創(chuàng)建名為mydb的db,并帶有名為myrp的RP,顯示指定WARM DURATION為3d,表示3天前的數(shù)據(jù)是冷數(shù)據(jù)。

create database mydb with duration 6d warm duration 3d name myrp

//修改WARM DURATION為7d,表示7天前的數(shù)據(jù)是冷數(shù)據(jù)。

alter retention policy myrp on mydb warm duration 7d

規(guī)則設(shè)置完成后,系統(tǒng)會根據(jù)指定的規(guī)則,自動判斷哪些數(shù)據(jù)屬于冷數(shù)據(jù),并自動將數(shù)據(jù)轉(zhuǎn)儲到冷存儲上。

2.3使用效果驗(yàn)證

冷數(shù)據(jù)規(guī)則設(shè)置好,插入數(shù)據(jù)一段時間后,系統(tǒng)會自動判斷數(shù)據(jù)是否轉(zhuǎn)為冷數(shù)據(jù),如果已經(jīng)成為冷數(shù)據(jù),系統(tǒng)會自動將數(shù)據(jù)轉(zhuǎn)儲到冷存儲上??梢酝ㄟ^show shards命令來查看數(shù)據(jù)的狀態(tài),如下圖所示:

> show shards

name: hsdb

id database retention_policy shard_group start_time end_time expiry_time owners tier

-- -------- ---------------- ----------- ---------- -------- ----------- ------ ----

5 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 4 cold

6 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 5 moving

7 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 6 warm

8 hsdb myrp 2 2019-08-12T00:00:00Z 2019-08-19T00:00:00Z 2019-08-19T00:00:00Z 7 cold

cold:表示數(shù)據(jù)為冷數(shù)據(jù),已存儲在冷存儲中;

moving:表示數(shù)據(jù)為冷數(shù)據(jù),該數(shù)據(jù)正在轉(zhuǎn)儲到冷存儲中;

warm:表示數(shù)據(jù)為熱數(shù)據(jù)。

3.總結(jié)

在應(yīng)用了GaussDB(for Influx)的冷熱分級存儲方案后,存儲100T的數(shù)據(jù)量一年,按照1個月內(nèi)的數(shù)據(jù)是熱數(shù)據(jù),其余是冷數(shù)據(jù),其總體的存儲成本從250萬降至37.5萬,可節(jié)省85%的存儲成本。

GaussDB(for Influx)除了冷熱分級存儲功能外,在集群化、讀寫性能、壓縮率、高可用方面也做了深度優(yōu)化,能更好地滿足時序應(yīng)用的各種場景。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4127

    瀏覽量

    85290
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2357

    瀏覽量

    17107
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?122次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    基于分布式存儲WDS的金融信創(chuàng)承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用

    基于分布式存儲WDS的金融信創(chuàng)承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?139次閱讀
    基于分布式<b class='flag-5'>存儲</b>WDS的金融信創(chuàng)<b class='flag-5'>云</b>承載<b class='flag-5'>數(shù)據(jù)庫</b>類關(guān)鍵應(yīng)用

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統(tǒng)服務(wù)器使用。windows系統(tǒng)服務(wù)器內(nèi)運(yùn)行了Sql Server數(shù)據(jù)庫,存儲空間在操作系統(tǒng)層面劃分
    的頭像 發(fā)表于 05-08 11:43 ?398次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—raid5陣列上層Sql Server<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    華為GaussDB數(shù)據(jù)庫基礎(chǔ)版發(fā)布:旗艦性能、價格下降超60%

    高性價比:相比企業(yè)版,華為 GaussDB 基礎(chǔ)版價格大幅下調(diào)(降幅達(dá) 60%-70%),且支持全場景數(shù)據(jù)壓縮,具有“超高壓縮比”,性能影響僅為 5%-10%,
    的頭像 發(fā)表于 05-07 14:21 ?346次閱讀

    華為多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問答實(shí)錄

    多模數(shù)據(jù)庫作為一種新興的數(shù)據(jù)管理解決方案,正在受到越來越多的關(guān)注。而華為多模數(shù)據(jù)庫 GeminiDB 基于云原生
    的頭像 發(fā)表于 04-08 18:25 ?1060次閱讀

    華為云原生多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    近日,2023 全球分布式大會·深圳站順利召開,華為 NoSQL 數(shù)據(jù)庫研發(fā)總監(jiān)余汶龍?jiān)跁习l(fā)表了題為《華為云原生多模
    的頭像 發(fā)表于 04-08 18:23 ?1080次閱讀
    <b class='flag-5'>華為</b>云原生多模<b class='flag-5'>數(shù)據(jù)庫</b> GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    選擇 KV 數(shù)據(jù)庫最重要的是什么?

    最后我也沒問清楚他們業(yè)務(wù)存啥(推測是這塊業(yè)務(wù)數(shù)據(jù)比較機(jī)密),但確實(shí)業(yè)務(wù)本身對可靠性要求非常高,開源 Redis 自身的可靠性無法滿足他們的要求,最終該用戶選擇使用 GaussDB(for Redis)數(shù)據(jù)庫,當(dāng)前
    的頭像 發(fā)表于 03-28 22:11 ?597次閱讀
    選擇 KV <b class='flag-5'>數(shù)據(jù)庫</b>最重要的是什么?

    GaussDB(for Redis) 特性揭秘:多租戶管理

    華為 GaussDB(for Redis)持續(xù)完善企業(yè)級增強(qiáng)特性,是名副其實(shí)的 "Redis Plus" ,其中很經(jīng)典的企業(yè)級特性是 多租戶能力 ,支持添加只讀賬號、讀寫賬號,且具備強(qiáng)大的 DB
    的頭像 發(fā)表于 03-28 22:06 ?666次閱讀
    <b class='flag-5'>GaussDB</b>(for Redis) 特性<b class='flag-5'>揭秘</b>:多租戶管理

    華為存儲攜手優(yōu)炫軟件,共促中國多主數(shù)據(jù)庫加速發(fā)展

    2023年12月5日,華為數(shù)據(jù)存儲與優(yōu)炫軟件共同發(fā)布“數(shù)據(jù)庫存算分離聯(lián)合解決方案”。此次發(fā)布內(nèi)容包含滿足金融、運(yùn)營商、能源、制造、政務(wù)等多個行業(yè)不同業(yè)務(wù)場景的三大
    的頭像 發(fā)表于 12-11 09:12 ?587次閱讀

    常見的存儲Idea數(shù)據(jù)庫的地方

    Idea的數(shù)據(jù)庫存儲在許多不同的地方,取決于應(yīng)用程序和使用的技術(shù)。下面將詳細(xì)描述一些常見的存儲Idea數(shù)據(jù)庫的地方。 關(guān)系型數(shù)據(jù)庫(RDB
    的頭像 發(fā)表于 12-06 14:15 ?800次閱讀

    NoSQL 數(shù)據(jù)庫如何選型

    數(shù)據(jù)庫。不管它是“nonSQL”的縮寫,還是“notonlySQL”的縮寫,大多數(shù)人都同意,NoSQL數(shù)據(jù)庫是以關(guān)系表之外的格式存儲數(shù)據(jù)的。NoSQL
    的頭像 發(fā)表于 11-26 08:05 ?361次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫介紹和數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫是文檔數(shù)據(jù)存儲,將文檔存儲在集合之中,不是像MySQL一樣的關(guān)系型數(shù)據(jù)庫。
    的頭像 發(fā)表于 11-08 15:04 ?783次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>介紹和<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    Access數(shù)據(jù)庫案例:Labview數(shù)據(jù)存儲

     在數(shù)據(jù)庫領(lǐng)域,Access是由Microsoft開發(fā)的一款基于Windows平臺的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)。它提供了一個使用簡便的用戶界面,可用于創(chuàng)建、管理和查詢數(shù)據(jù)庫。
    發(fā)表于 10-26 16:23 ?9次下載

    什么是數(shù)據(jù)庫?除了MySQL還有哪些數(shù)據(jù)庫?

    對于大多數(shù)項(xiàng)目,用 MySQL 等關(guān)系型數(shù)據(jù)庫存儲數(shù)據(jù)就足夠了。但關(guān)系型數(shù)據(jù)庫不是銀彈!在某些場景下,比如要存儲
    發(fā)表于 10-13 10:20 ?536次閱讀
    什么是<b class='flag-5'>數(shù)據(jù)庫</b>?除了MySQL還有哪些<b class='flag-5'>數(shù)據(jù)庫</b>?

    解讀VLDB 2023華為GaussDB論文:國產(chǎn)數(shù)據(jù)庫,要做就做領(lǐng)頭羊

    數(shù)據(jù)庫
    腦極體
    發(fā)布于 :2023年09月26日 19:39:11