0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析時序數據庫的流計算支持

OSC開源社區(qū) ? 來源:KaiwuDB ? 2023-03-23 09:24 ? 次閱讀

01

時序數據及其特點

時序數據(Time Series Data)是基于相對穩(wěn)定頻率持續(xù)產生的一系列指標監(jiān)測數據,比如一年內的道瓊斯指數、一天內不同時間點的測量氣溫等。時序數據有以下幾個特點:

●歷史數據的不變性

● 數據的有效性

● 數據的時效性

● 結構化的數據

● 數據的大量性

02

時序數據庫基本架構

b7896dea-c8e0-11ed-bfe3-dac502259ad0.png

針對時序數據的特點,時序數據庫一般具有以下特性:

● 高速的數據入庫

● 數據的生命周期管理

● 數據的流處理

● 高效的數據查詢

● 定制的數據壓縮

03

流計算介紹

流計算主要是指針對實時獲取來自不同數據源的海量數據,經過實時分析處理,從而獲得有價值的信息。常見的業(yè)務場景包括實時事件的快速反應,市場變化的實時告警,實時數據的交互分析等。流計算一般包括如下幾方面的功能:

1)過濾和轉換 (filter & map)

2)聚合以及窗口函數 (reduce,aggregation/window)

3)多數據流合并以及模式匹配 (joining & pattern detection)

4)從流到塊處理

04

時序數據庫對流計算的支持

案例一:使用定制化的流計算 API,如下面例子所示:

?

from(bucket: "mydb")  
|> range(start: -1h)  
|> filter(fn: (r) => r["_measurement"] == "mymeasurement")  
|> map(fn: (r) => ({ r with value: r.value * 2 }))  
|> filter(fn: (r) => r.value > 100)  
|> aggregateWindow(every: 1m, fn: sum, createEmpty: false)  
|> group(columns: ["location"])  
|>join(tables:{stream1:{bucket:"mydb",measurement:"stream1",start:-1h},stream2:{bucket:"mydb",measurement:"stream2",start:-1h}},on:["location"])
|>alert(name:"value_above_threshold",message:"Valueisabovethreshold",crit:(r)=>r.value>100)
|>to(bucket:"mydb",measurement:"output",tagColumns:["location"])

案例二:使用類 SQL 指令,創(chuàng)建流計算以及定義流計算規(guī)則,如下:

CREATE STREAM current_stream        
TRIGGER AT_ONCE        
INTO current_stream_output_stb AS        
SELECT
_wstartasstart,
_wendasend,
max(current)asmax_current
FROMmeters        
WHERE voltage <= 220        
?INTEVAL (5S) SLIDING (1s);





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SQL
    SQL
    +關注

    關注

    1

    文章

    751

    瀏覽量

    43913
  • 數據庫
    +關注

    關注

    7

    文章

    3716

    瀏覽量

    64046
  • API接口
    +關注

    關注

    1

    文章

    81

    瀏覽量

    10402

原文標題:時序數據庫的流計算支持

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    時間序列數據的存儲和計算 - 開源時序數據庫解析

    摘要: Prometheus 開源時序數據庫解析的系列文章在之前已經完成了幾篇,對比分析了Hbase系的OpenTSDB、Cassandra系的KairosDB、BlueFlood及Heroic
    發(fā)表于 01-25 14:53

    時序數據庫HiTSDB的深度解析!

    深度解讀!時序數據庫HiTSDB:分布式流式聚合引擎
    發(fā)表于 07-22 13:22

    關于時序數據庫的內容

    簡介: 這是一篇無法一口氣讀完的、文字過萬[正文字數14390]的長文,這是一個無法中途不上廁所就看完的、關于時序數據庫的視頻[時長111分鐘]分享的文字整理..大家好,很開心能夠和大家一起交流時序數據庫
    發(fā)表于 07-12 08:00

    什么是時序數據庫?

    本文根據演講視頻以及PPT整理而成。本文將主要圍繞以下四個方面進行分享:時序數據時序數據庫時序數據庫的演變時序數據庫對比總結一、時序數據
    發(fā)表于 07-12 08:35

    TableStore時序數據存儲 - 架構篇

    Schema設計以及索引設計方案。最后還會有計算篇,會提供幾個時序數據流計算時序分析的方案設計。?什么是時序數據
    發(fā)表于 08-08 16:17 ?528次閱讀
    TableStore<b class='flag-5'>時序數據</b>存儲 - 架構篇

    工業(yè)互聯(lián)網時代,我們?yōu)槭裁葱枰粋€時序數據庫?

    、管理、查詢、處理上述二元函數數據數據庫,則可以稱之為時序數據庫。時序數據庫主要以解決下面幾個問題:時序數據的寫入:如何
    的頭像 發(fā)表于 01-28 13:02 ?6106次閱讀
    工業(yè)互聯(lián)網時代,我們?yōu)槭裁葱枰粋€<b class='flag-5'>時序數據庫</b>?

    工業(yè)互聯(lián)網時代,我們?yōu)槭裁葱枰?b class='flag-5'>時序數據庫之二:適合的就是最好的

    。至此,我們得出的結論就一個:選擇到底用什么數據庫支持時序數據,還是需要對時序數據的需求進行透徹的分析,然后根據時序數據的特點,來選擇適合
    的頭像 發(fā)表于 04-28 19:08 ?2965次閱讀
    工業(yè)互聯(lián)網時代,我們?yōu)槭裁葱枰?b class='flag-5'>時序數據庫</b>之二:適合的就是最好的

    時序數據庫的前世今生

    ? 時序數據庫忽然火了起來。Facebook開源了beringei時序數據庫,基于PostgreSQL打造的時序數據庫TimeScaleDB也開源了。時序數據庫作為物聯(lián)網方向一個非常重
    的頭像 發(fā)表于 12-17 17:51 ?3490次閱讀

    工業(yè)互聯(lián)網時代:我們?yōu)槭裁葱枰?b class='flag-5'>時序數據庫之二

    作為資深“杠精”,當然需要先知道要“杠”的到底是什么?就時序數據庫而言,就是要“杠”兩個東西:1、“杠”數據;2、“杠”數據庫。
    的頭像 發(fā)表于 12-25 18:04 ?774次閱讀

    華為時序數據庫為智慧健康養(yǎng)老行業(yè)貢獻應用之道

    隨著 IoT 技術的快速發(fā)展,物聯(lián)網設備產生的數據呈爆炸式增長。這些數據通常隨時間產生,稱之為時序數據。這樣的一種專門用于管理時序數據數據庫
    的頭像 發(fā)表于 11-07 15:10 ?5779次閱讀

    華為PB級時序數據庫Gauss DB,助力海量數據處理

    ,時序數據作為大數據、機器學習、實時預測的基礎數據,作用更加顯著。因此,對時序數據的研究與應用應當更為深入。 ??近 5 年來,時序數據庫發(fā)
    的頭像 發(fā)表于 10-15 19:15 ?1042次閱讀
    華為PB級<b class='flag-5'>時序數據庫</b>Gauss DB,助力海量<b class='flag-5'>數據</b>處理

    華為自研分布式時序數據庫集群:初始GaussDB(for Influx)

    要處理的指標數據達到TB級,一年的數據同樣達到PB級,并且數據需要永久存儲。傳統(tǒng)的關系型數據庫很難支撐這么大的數據量和寫入壓力,Hadoop
    的頭像 發(fā)表于 12-02 09:08 ?862次閱讀
    華為自研分布式<b class='flag-5'>時序數據庫</b>集群:初始GaussDB(for Influx)

    CeresDB 1.0正式發(fā)布,Rust高性能云原生時序數據庫

    在經典的時序數據庫中,Tag 列(InfluxDB 稱之為 Tag,Prometheus 稱之為 Label)通常會對其生成倒排索引,但在實際使用中,Tag 的基數在不同的場景中是不一樣的 ———— 在某些場景下
    的頭像 發(fā)表于 03-06 10:22 ?609次閱讀

    涂鴉推出NekoDB時序數據庫,助力全球客戶實現(xiàn)低成本部署

    隨著IoT技術逐漸成熟,眾多設備產出的數據呈現(xiàn)指數級增長。企業(yè)亟需用行之有效的方式管理海量時序數據。由此,各類時序數據庫開始成為市場寵兒。與市場需求相悖的是,時序數據庫水平參差不齊??v
    的頭像 發(fā)表于 07-24 10:08 ?2016次閱讀
    涂鴉推出NekoDB<b class='flag-5'>時序數據庫</b>,助力全球客戶實現(xiàn)低成本部署

    時序數據庫是什么?時序數據庫的特點

    時序數據庫是一種在處理時間序列數據方面具有高效和專門化能力的數據庫。它主要用于存儲和處理時間序列數據,比如傳感器數據、監(jiān)控
    的頭像 發(fā)表于 04-26 16:02 ?537次閱讀