0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為PB級時序數(shù)據(jù)庫Gauss DB,助力海量數(shù)據(jù)處理

禿頭也愛科技 ? 來源:禿頭也愛科技 ? 作者:禿頭也愛科技 ? 2022-10-15 19:15 ? 次閱讀

??近年來,時序數(shù)據(jù)的應(yīng)用更為廣泛,包括物聯(lián)網(wǎng)、金融領(lǐng)域、監(jiān)控領(lǐng)域、醫(yī)學(xué)領(lǐng)域、農(nóng)業(yè)生產(chǎn)領(lǐng)域等各方面,都在大量使用時序數(shù)據(jù),通過數(shù)據(jù)來研究對象的趨勢性、規(guī)律性、異常性;并且在 5G人工智能的浪潮下,時序數(shù)據(jù)作為大數(shù)據(jù)、機器學(xué)習、實時預(yù)測的基礎(chǔ)數(shù)據(jù),作用更加顯著。因此,對時序數(shù)據(jù)的研究與應(yīng)用應(yīng)當更為深入。

??近 5 年來,時序數(shù)據(jù)庫發(fā)展十分迅猛,各大互聯(lián)網(wǎng)企業(yè)包括 Google、阿里、Amazon 都推出自己的時序數(shù)據(jù)。

PB1.png

圖 1 DB-Engines 統(tǒng)計不同類別數(shù)據(jù)庫關(guān)注度趨勢

??圖 1 為 DB-Engines 統(tǒng)計從2018年1月到2019 年 12 月截至 24 月各類數(shù)據(jù)庫的關(guān)注度趨勢,可以看到時序數(shù)據(jù)庫關(guān)注度同比 2017 年 12 月上漲 77.3%,相比第二名的圖形數(shù)據(jù)庫上漲近兩倍。圖 2 為 DB-Engines 統(tǒng)計從2013年12月到2019 年 12 月截至 6年來業(yè)內(nèi)流行的時序數(shù)據(jù)庫的關(guān)注度和使用度排名。

PB2.png

圖 2 DB-Engines 統(tǒng)計時序數(shù)據(jù)庫關(guān)注度趨勢

??從圖中可以看到,從 2015 年開始,各種時序數(shù)據(jù)庫如雨后春筍般涌現(xiàn)。

??GaussDB(for Influx)時序數(shù)據(jù)庫依靠華為在數(shù)據(jù)存儲領(lǐng)域多年的實踐經(jīng)驗,整合華為云的計算、存儲、服務(wù)保障和安全等方面的能力,在架構(gòu)、性能和數(shù)據(jù)壓縮等方面進行了突破性的技術(shù)創(chuàng)新,達到了較好的效果,對內(nèi)支撐了華為云基礎(chǔ)設(shè)施服務(wù),對外以服務(wù)的形式開放,幫助上云企業(yè)解決相關(guān)業(yè)務(wù)問題。

??GaussDB(for Influx) 具有支持億級時間線、極致寫入性能、低存儲成本、高性能多維聚合查詢和極致彈性擴縮容等5大特性。以下為特性的大致介紹:

PB3.png

??由于在時序數(shù)據(jù)庫系統(tǒng)中,無時無刻存在大量并發(fā)查詢和寫入操作,因此合理控制內(nèi)存的使用量就顯得十分重要。而GaussDB(for Influx)便在這一問題上做了進一步優(yōu)化:

??l 在內(nèi)存分配與回收上,使用內(nèi)存池復(fù)用技術(shù)降低內(nèi)存碎片,并實現(xiàn)算法動態(tài)調(diào)整GC頻率,加快內(nèi)存回收。

??l 在單查詢上,實行Quota控制,避免單查詢耗盡內(nèi)存。

??l 在緩存中,針對不同節(jié)點規(guī)格提供不同最優(yōu)配置。

2 、極致寫入性能

??GaussDB(for Influx)支持每天萬億條數(shù)據(jù)寫入,在工程實現(xiàn)上有以下優(yōu)化:

??l 利用所有節(jié)點并行寫入,充分發(fā)揮集群優(yōu)勢。

??l Shard節(jié)點采用針對場景優(yōu)化的LSM-Tree布局

??l 在大規(guī)模寫入場景下,GaussDB(for Influx)的寫入性能線性擴展度大于80%。

3 、低存儲成本

??GaussDB(for Influx)對數(shù)據(jù)采用列式存儲,相同類型的數(shù)據(jù)被集中存儲,更有利于數(shù)據(jù)壓縮。采用自研的時序數(shù)據(jù)自適應(yīng)壓縮算法,在壓縮前對數(shù)據(jù)進行抽樣分析,根據(jù)數(shù)據(jù)量、數(shù)據(jù)分布以及數(shù)據(jù)類型選擇最合適的數(shù)據(jù)壓縮算法。同時提供了時序數(shù)據(jù)的分級存儲,支持用戶自定義冷熱數(shù)據(jù),實現(xiàn)數(shù)據(jù)的冷熱分離。熱數(shù)據(jù)相對數(shù)據(jù)量小,訪問頻繁,被存儲在性能更好、成本較高的存儲介質(zhì)上;冷數(shù)據(jù)相對數(shù)據(jù)量大,訪問概率低,保存時間較久,被存儲在成本較低的存儲介質(zhì)上,進而達到節(jié)約存儲成本的目的。

4 、高性能多維聚合查詢

??在提升聚合查詢整體性能方面,GaussDB(for Influx)做了如下優(yōu)化:

??l 采用MPP架構(gòu):一條查詢語句可以在多節(jié)點及多核并發(fā)執(zhí)行。

??l 向量化查詢引擎:在查詢結(jié)果數(shù)據(jù)量很大時,GaussDB(for Influx)內(nèi)部實現(xiàn)了向量化查詢引擎,每次迭代批量返回數(shù)據(jù),大大減少了額外開銷。

??l 增量聚合引擎:基于滑動窗口的聚合查詢,大部分從聚合結(jié)果緩存中直接命中,僅需要聚合增量數(shù)據(jù)部分即可。

??l 多維倒排索引:支持多維多條件組合查詢,加快數(shù)據(jù)查詢中過濾無關(guān)數(shù)據(jù)。

5 、極致彈性擴縮容

??在時序數(shù)據(jù)庫的運行過程中,隨著業(yè)務(wù)量的增加,常常需要對數(shù)據(jù)庫進行在線擴容,以滿足業(yè)務(wù)的要求。

??l 傳統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)存儲在本地,擴容后往往需要遷移數(shù)據(jù)。當數(shù)據(jù)量達到一定規(guī)模時,數(shù)據(jù)遷移所耗費的時間往往按天計算,給運維帶來了很大的困難。

??l GaussDB(for Influx)相比于傳統(tǒng)的數(shù)據(jù)庫,最大的特點就是將計算與存儲分離,能夠輕松實現(xiàn)分鐘級擴容。

??此外,在能源、制造、IOT、互聯(lián)網(wǎng)等行業(yè)的監(jiān)控統(tǒng)計及分析的應(yīng)用場景中,時序洞察提供了針對時序數(shù)據(jù)的可視化功能。在監(jiān)控領(lǐng)域,我們??吹侥軐崟r反映整個系統(tǒng)運行情況的絢麗監(jiān)控大屏,這便是數(shù)據(jù)庫的監(jiān)控看板功能,可以高效地運用監(jiān)控數(shù)據(jù)輔助定位故障、性能調(diào)優(yōu)、容量規(guī)劃;可以查看各產(chǎn)品的監(jiān)控數(shù)據(jù)走勢及對比;跨產(chǎn)品展示關(guān)鍵指標的實時數(shù)據(jù)、歷史數(shù)據(jù)和整體走勢。業(yè)務(wù)人員可以根據(jù)該信息對業(yè)務(wù)進行及時調(diào)整。

??通過對時序數(shù)據(jù)庫的發(fā)展分析,時序數(shù)據(jù)庫的發(fā)展空間巨大,但也存在很多問題,GaussDB(for Influx)針對其存在的問題,都進行了針對性的創(chuàng)新與發(fā)展,可以說GaussDB(for Influx)為時序數(shù)據(jù)庫的發(fā)展提供了巨大推動力。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    215

    文章

    34162

    瀏覽量

    249644
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3716

    瀏覽量

    64046
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?163次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    小米試點業(yè)務(wù)系統(tǒng)上線OceanBase,數(shù)據(jù)庫性能飛躍新高度

    在科技日新月異的今天,小米集團作為全球領(lǐng)先的智能設(shè)備制造商,其業(yè)務(wù)的快速發(fā)展對底層技術(shù)架構(gòu)提出了前所未有的挑戰(zhàn)。特別是在數(shù)據(jù)庫領(lǐng)域,面對海量數(shù)據(jù)處理、高并發(fā)訪問以及嚴苛的故障應(yīng)對需求,傳統(tǒng)數(shù)據(jù)
    的頭像 發(fā)表于 07-03 15:39 ?572次閱讀

    時序數(shù)據(jù)庫是什么?時序數(shù)據(jù)庫的特點

    時序數(shù)據(jù)庫是一種在處理時間序列數(shù)據(jù)方面具有高效和專門化能力的數(shù)據(jù)庫。它主要用于存儲和處理時間序列數(shù)據(jù)
    的頭像 發(fā)表于 04-26 16:02 ?537次閱讀

    華為云原生多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實踐

    近日,2023 全球分布式云大會·深圳站順利召開,華為云 NoSQL 數(shù)據(jù)庫研發(fā)總監(jiān)余汶龍在會上發(fā)表了題為《華為云原生多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實踐》的精彩演講。 余汶龍
    的頭像 發(fā)表于 04-08 18:23 ?1083次閱讀
    <b class='flag-5'>華為</b>云原生多模<b class='flag-5'>數(shù)據(jù)庫</b> GeminiDB 架構(gòu)與應(yīng)用實踐

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】Oracle數(shù)據(jù)庫ASM實例無法掛載的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫ASM磁盤組掉線,ASM實例不能掛載。數(shù)據(jù)庫管理員嘗試修復(fù)數(shù)據(jù)庫,但是沒有成功。
    的頭像 發(fā)表于 02-01 17:39 ?379次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】Oracle<b class='flag-5'>數(shù)據(jù)庫</b>ASM實例無法掛載的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    虹科干貨丨無模式數(shù)據(jù)庫的利與弊

    數(shù)據(jù)管理需求日益多樣,無論是金融服務(wù)、游戲還是社交媒體行業(yè),都要求支持實時數(shù)據(jù)處理和快速迭代,無模式數(shù)據(jù)庫因其靈活性和易用性而逐漸成為開發(fā)者的新選擇。那么,無模式數(shù)據(jù)庫到底有哪些特性呢
    的頭像 發(fā)表于 12-20 09:44 ?278次閱讀

    無模式數(shù)據(jù)庫的利與弊

    數(shù)據(jù)管理需求日益多樣,無論是金融服務(wù)、游戲還是社交媒體行業(yè),都要求支持實時數(shù)據(jù)處理和快速迭代,無模式數(shù)據(jù)庫因其靈活性和易用性而逐漸成為開發(fā)者的新選擇。那么,無模式數(shù)據(jù)庫到底有哪些特性呢
    的頭像 發(fā)表于 12-16 08:04 ?393次閱讀
    無模式<b class='flag-5'>數(shù)據(jù)庫</b>的利與弊

    關(guān)于JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運作,它為應(yīng)用程序開發(fā)者帶來了哪些價值呢?
    的頭像 發(fā)表于 12-06 13:46 ?719次閱讀
    關(guān)于JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    oracle數(shù)據(jù)庫的基本操作

    Oracle數(shù)據(jù)庫是一種關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),廣泛應(yīng)用于企業(yè)應(yīng)用中。它具有強大的功能和靈活的配置選項,可以滿足復(fù)雜的數(shù)據(jù)處理需求。本文將介紹Oracle
    的頭像 發(fā)表于 12-06 10:14 ?554次閱讀

    oracle數(shù)據(jù)庫的使用方法

    Oracle數(shù)據(jù)庫是一種關(guān)系型數(shù)據(jù)庫管理系統(tǒng),它由Oracle公司開發(fā)和維護。它提供了安全、可靠和高性能的數(shù)據(jù)庫管理解決方案,被廣泛應(yīng)用于企業(yè)應(yīng)用和大型
    的頭像 發(fā)表于 12-06 10:10 ?1057次閱讀

    什么是JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運作,它為應(yīng)用程序開發(fā)者帶來了哪些價值呢?文章速覽:什么是JSON什么是JSON
    的頭像 發(fā)表于 12-02 08:04 ?697次閱讀
    什么是JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    NoSQL 數(shù)據(jù)庫如何選型

    什么是NoSQL數(shù)據(jù)庫?為什么要使用NoSQL數(shù)據(jù)庫?鍵值數(shù)據(jù)庫內(nèi)存鍵值數(shù)據(jù)庫文檔數(shù)據(jù)庫列式數(shù)據(jù)庫
    的頭像 發(fā)表于 11-26 08:05 ?364次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫介紹和數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫是文檔數(shù)據(jù)存儲,將文檔存儲在集合之中,不是像MySQL一樣的關(guān)系型數(shù)據(jù)庫。
    的頭像 發(fā)表于 11-08 15:04 ?787次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>介紹和<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    TDengine+OpenVINO+AIxBoard助力時序數(shù)據(jù)分類

    時間序列數(shù)據(jù)分析在工業(yè),能源,醫(yī)療,交通,金融,零售等多個領(lǐng)域都有廣泛應(yīng)用。其中時間序列數(shù)據(jù)分類是分析時序數(shù)據(jù)的常見任務(wù)之一。本文將通過一個具體的案例,介紹 Intel 團隊
    的頭像 發(fā)表于 10-27 11:08 ?532次閱讀
    TDengine+OpenVINO+AIxBoard<b class='flag-5'>助力</b><b class='flag-5'>時序數(shù)據(jù)</b>分類

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)-oracle數(shù)據(jù)庫報錯無法打開的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器,底層由12塊硬盤組成一組磁盤陣列,上層操作系統(tǒng)上運行oracle數(shù)據(jù)庫。 oracle數(shù)據(jù)庫故障:
    的頭像 發(fā)表于 10-12 14:00 ?709次閱讀