0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)倉庫和多維數(shù)據(jù)庫的區(qū)別在哪里

PoisonApple ? 來源:網(wǎng)絡整理 ? 2018-02-24 13:46 ? 次閱讀

數(shù)據(jù)倉庫

數(shù)據(jù)倉庫,英文名稱為Data Warehouse,可簡寫為DW或DWH。數(shù)據(jù)倉庫,是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。 為需要業(yè)務智能的企業(yè),提供指導業(yè)務流程改進、監(jiān)視時間、成本、質(zhì)量以及控制。

數(shù)據(jù)倉庫是決策支持系統(tǒng)(dss)和聯(lián)機分析應用數(shù)據(jù)源的結構化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。數(shù)據(jù)倉庫 ,由數(shù)據(jù)倉庫之父比爾·恩門(Bill Inmon)于1990年提出,主要功能仍是將組織透過資訊系統(tǒng)之聯(lián)機事務處理(OLTP)經(jīng)年累月所累積的大量資料,透過數(shù)據(jù)倉庫理論所特有的資料儲存架構,作一有系統(tǒng)的分析整理,以利各種分析方法如聯(lián)機分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)之進行,并進而支持如決策支持系統(tǒng)(DSS)、主管資訊系統(tǒng)(EIS)之創(chuàng)建,幫助決策者能快速有效的自大量資料中,分析出有價值的資訊,以利決策擬定及快速回應外在環(huán)境變動,幫助建構商業(yè)智能(BI)。

多維數(shù)據(jù)庫

多維數(shù)據(jù)庫(Multi Dimensional Database,MDD)可以簡單地理解為:將數(shù)據(jù)存放在一個n維數(shù)組中,而不是像關系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。

多維數(shù)據(jù)庫是指將數(shù)據(jù)存放在一個門維數(shù)組中,而不是像關系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)據(jù)庫增加了一個時間維,與關系數(shù)據(jù)庫相比,它的優(yōu)勢在于可以提高數(shù)據(jù)處理速度,加快反應時間,提高查詢效率。

數(shù)據(jù)倉庫和多維數(shù)據(jù)庫的區(qū)別在哪里

數(shù)據(jù)倉庫和多維數(shù)據(jù)庫的區(qū)別

數(shù)據(jù)倉庫中廣泛采用的數(shù)據(jù)庫設計模型有兩種:關系型和多維型。普遍認為在數(shù)據(jù)倉庫的設計方法中關系模型是“Inmon”方法而多維模型是“Kimball”方法。

先來看下關系模型,關系型數(shù)據(jù)以一種稱為“標準化”的形式存在。數(shù)據(jù)標準化是指數(shù)據(jù)庫設計會使數(shù)據(jù)分解成非常低的粒度級,標準化數(shù)據(jù)以一種孤立模式 存在,這種情況下對數(shù)據(jù)表里的數(shù)據(jù)關系要求很嚴格。一般遵循3NF范式。采用關系型設計的數(shù)據(jù)庫一般具有較強的靈活性和多功能性(可以支持數(shù)據(jù)的多種視 圖)。

再來看下多維模型,多維模型一般有星型模式、雪花模式、混雜模式(又叫星系模式)。多維模型設計的最大優(yōu)點在于訪問的高效性。

兩種模型的區(qū)別

作為數(shù)據(jù)倉庫設計的基礎,星形連接和關系型結構兩者之間存在很多不同。最重要的區(qū)別是在靈活性和性能方面。關系模型具有高靈活性,但是對用戶來說在性能方面卻不是很理想的。多維模型在滿足用戶需求方面是非常高效的,但是靈活性不好。

另一重要區(qū)別在于設計的范圍不同。必然地,多維設計只能在有限的范圍內(nèi)進行,也就是說,數(shù)據(jù)庫設計只能在一組請求過程下得到最優(yōu)化。如果所有不同組請求全部加入到設計當中,最優(yōu)化變得毫無意義。

當使用關系模型時,在性能方面沒有特別的優(yōu)化方法。既然關系模型要求數(shù)據(jù)以最低粒度級存儲,那么就可以無限制地添加新數(shù)據(jù)。很顯然,添加數(shù)據(jù)到關系 模型永遠也不會停止。正因為這樣,關系模式適合大范圍數(shù)據(jù)(如一個企業(yè)模型),而多維模型適用于小范圍數(shù)據(jù)(如一個部門或甚至一個子部門)。

區(qū)別的起源:

數(shù)據(jù)倉庫和多維數(shù)據(jù)庫的區(qū)別在哪里

關系環(huán)境是通過起源數(shù)據(jù)模型設計出來的。多維模型是根據(jù)最終用戶的請求塑造的。換句話說,關系模型通過純數(shù)據(jù)模型和其他模式設計,而多維模型通過處理請求塑造。

在適用性方面:由于關系模型通過抽象數(shù)據(jù)形成,所以模型自身非常靈活。但這種靈活性,對于直接數(shù)據(jù)訪問的執(zhí)行卻不是最優(yōu)化的。如果想得到一個高性能的關系模型,最佳方法是從模型中抽取出數(shù)據(jù),并重新構造一種適合于快速訪問的模式。

多維模型在直接訪問數(shù)據(jù)方面是快速而高效的。從體系結構觀點來看,在數(shù)據(jù)倉庫設計基礎方面關系模型是更好地支持數(shù)據(jù)倉庫的模式,其原因是,數(shù)據(jù)倉庫需要根 據(jù)不同的議程和多種觀察數(shù)據(jù)的方式來支持許多不同的用戶組。也就是說,數(shù)據(jù)倉庫對于訪問已給定的用戶并不是最佳的。相反,數(shù)據(jù)倉庫可以以多種方式支持多個 不同的用戶。

關系模式,數(shù)據(jù)以最低粒度級和標準化形式存儲;關系表間的關系已經(jīng)定義好并且包含一個含有外鍵的關鍵字表;新表可以對關系表中的基本數(shù)據(jù)集定義新的 匯總和篩選標準;也就是說可以很簡單以一種形式創(chuàng)建關系表,再以另一種形式重新塑造這些表,這樣做對于數(shù)據(jù)倉庫環(huán)境來說是非常理想的。

此外,關系模式支持將來未知的需求、支持適度變化的需求方面具有多維模型無法比擬的優(yōu)勢。

因此根據(jù)上面討論過的原因可以看出:關系模型對數(shù)據(jù)倉庫是理想的基礎,而星形連接對于數(shù)據(jù)集市是最佳的。

獨立集市和從屬集市的區(qū)別:

獨立集市是指直接通過歷史應用創(chuàng)建的數(shù)據(jù)集市。建立獨立數(shù)據(jù)集市不需要有“全局思想”考慮。

與獨立數(shù)據(jù)集市相對應的是從屬數(shù)據(jù)集市。從屬數(shù)據(jù)集市是利用來自數(shù)據(jù)倉庫的數(shù)據(jù)建立的。它的數(shù)據(jù)源不依賴與歷史數(shù)據(jù)或操作型數(shù)據(jù),只依賴于數(shù)據(jù)倉庫??傊瑥膶贁?shù)據(jù)集市要求有預先的計劃、長期的觀察、全局的分析和企業(yè)各不同部門對需求分析的合作與協(xié)調(diào)。

建立多個獨立數(shù)據(jù)集市后,很快用戶就會發(fā)現(xiàn)數(shù)據(jù)集市之間的信息不統(tǒng)一,也不同步,而且每增加一個數(shù)據(jù)集市就會出現(xiàn)不斷增長的細節(jié)數(shù)據(jù)冗余的問題,需要大量的資源來建立接口程序,維護這些程序也變成了負擔。因此獨立數(shù)據(jù)集市不適合與解決企業(yè)中的信息問題。

當然,如果企業(yè)采用了從屬數(shù)據(jù)集市,并在建立任何數(shù)據(jù)集市之前先創(chuàng)建了一個數(shù)據(jù)倉庫,那么,獨立數(shù)據(jù)集市固有的哪些體系結構方面的問題就不會出現(xiàn)了。

換句話說,獨立數(shù)據(jù)集市表示的是不需要顧及全局及全景的一個短期的、有限范圍的解決方法。另一方面,從屬數(shù)據(jù)集市則要求一個長期和全局的展望。但是獨立數(shù)據(jù)集市不能為企業(yè)信息提供一個堅實的基礎,而從屬數(shù)據(jù)集市確能為信息決策提供了一個真正的長期基礎。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    什么是數(shù)據(jù)倉庫數(shù)據(jù)倉庫的優(yōu)勢分析

    數(shù)據(jù)倉庫,有一個被廣泛接受的定義:數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的
    發(fā)表于 11-01 10:57 ?9565次閱讀

    多版本數(shù)據(jù)倉庫模型設計

    針對數(shù)據(jù)倉庫多維模式結構的進化問題提出一種多版本數(shù)據(jù)倉庫模型,給出模型結構、模型對象以及對象之間指派關系的定義。多版本數(shù)據(jù)倉庫基于“版本控制”策略管理
    發(fā)表于 04-21 09:39 ?0次下載

    銀行數(shù)據(jù)倉庫的系統(tǒng)設計與實現(xiàn)

    企業(yè)中的數(shù)據(jù)存在于各個異構的傳統(tǒng)數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)倉庫是企業(yè)整合數(shù)據(jù)的一種有效途徑。數(shù)據(jù)倉庫使得企業(yè)的信息變得易于獲取并且為企業(yè)決策提供可靠
    發(fā)表于 09-26 08:47 ?10次下載

    數(shù)據(jù)庫數(shù)據(jù)倉庫區(qū)別

    數(shù)據(jù)庫已經(jīng)在信息技術領域有了廣泛的應用,我們社會生活的各個部門,幾乎都有各種各樣的數(shù)據(jù)庫保存著與我們的生活息息相關的各種數(shù)據(jù)。作為數(shù)據(jù)庫的一個分支,
    發(fā)表于 02-16 18:02 ?3434次閱讀

    數(shù)據(jù)倉庫的OLAP多維展現(xiàn)技術的研究與應用

    基于數(shù)據(jù)倉庫以及聯(lián)機分析的相關知識,采用ETL和Analysis Services相關技術,通過在線銷售系統(tǒng)中的實驗,分析在線銷售系統(tǒng)的多維數(shù)據(jù)集,利用OLAP多維展現(xiàn)技術,將OLAP
    發(fā)表于 08-08 11:21 ?0次下載
    <b class='flag-5'>數(shù)據(jù)倉庫</b>的OLAP<b class='flag-5'>多維</b>展現(xiàn)技術的研究與應用

    保護MySQL數(shù)據(jù)倉庫的最佳實踐

    數(shù)據(jù)倉庫中最常見的數(shù)據(jù)庫管理系統(tǒng)可能就是開源的MySQL數(shù)據(jù)庫。以下5個小技巧重點介紹了一些保護MySQL數(shù)據(jù)倉庫的最佳實踐。 1.限制訪問 確保MySQL
    發(fā)表于 09-27 14:10 ?0次下載

    數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫的特點_數(shù)據(jù)倉庫數(shù)據(jù)庫區(qū)別

    本文開始介紹了數(shù)據(jù)倉庫是什么,其次詳細介紹了數(shù)據(jù)倉庫的特點、數(shù)據(jù)倉庫的基本架構與數(shù)據(jù)倉庫用途,最后介紹了數(shù)據(jù)倉庫的五大好處,闡述了
    的頭像 發(fā)表于 02-11 10:42 ?2.5w次閱讀
    <b class='flag-5'>數(shù)據(jù)倉庫</b>是什么_<b class='flag-5'>數(shù)據(jù)倉庫</b>的特點_<b class='flag-5'>數(shù)據(jù)倉庫</b>與<b class='flag-5'>數(shù)據(jù)庫區(qū)別</b>

    多維數(shù)據(jù)庫有哪些

    多維數(shù)據(jù)庫可以簡單地理解為:將數(shù)據(jù)存放在一個n維數(shù)組中,而不是像關系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖
    的頭像 發(fā)表于 02-24 11:14 ?7041次閱讀
    <b class='flag-5'>多維</b><b class='flag-5'>數(shù)據(jù)庫</b>有哪些

    數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫有什么特點_數(shù)據(jù)庫數(shù)據(jù)倉庫區(qū)別分析

    數(shù)據(jù)倉庫是一個面向主題的、集成的、不可更新的、隨時間不斷變化的數(shù)據(jù)集合,它用于支持企業(yè)或組織的決策分析處理。數(shù)據(jù)倉庫是一個過程而不是一個項目。
    發(fā)表于 02-24 14:04 ?1.9w次閱讀
    <b class='flag-5'>數(shù)據(jù)倉庫</b>是什么_<b class='flag-5'>數(shù)據(jù)倉庫</b>有什么特點_<b class='flag-5'>數(shù)據(jù)庫</b>和<b class='flag-5'>數(shù)據(jù)倉庫區(qū)別</b>分析

    如何建設企業(yè)級數(shù)據(jù)倉庫_多維數(shù)據(jù)庫模型的設計你知道多少

    ,但是這些數(shù)據(jù)往往還是很有價值的。數(shù)據(jù)庫計算能力也有限,如果要做一些數(shù)據(jù)分析,則會浪費寶貴的計算資源。事實星座模式是數(shù)據(jù)倉庫最長使用的數(shù)據(jù)
    發(fā)表于 02-24 14:42 ?2465次閱讀
    如何建設企業(yè)級<b class='flag-5'>數(shù)據(jù)倉庫</b>_<b class='flag-5'>多維</b><b class='flag-5'>數(shù)據(jù)庫</b>模型的設計你知道多少

    如何搭建數(shù)據(jù)倉庫

    數(shù)據(jù)倉庫是所有產(chǎn)品的數(shù)據(jù)中心,公司體系下的所有產(chǎn)品產(chǎn)生的所有數(shù)據(jù)最終都流向數(shù)據(jù)倉庫,可以說數(shù)據(jù)倉庫不產(chǎn)生
    發(fā)表于 06-25 15:41 ?2086次閱讀

    RTK和GPS定位的區(qū)別在哪里?

    RTK和GPS定位的區(qū)別在哪里?
    發(fā)表于 05-08 10:08 ?76次下載

    數(shù)據(jù)庫發(fā)展史2--數(shù)據(jù)倉庫

    回顧數(shù)據(jù)倉庫的發(fā)展歷程,大致可以將其分為幾個階段:萌芽探索到全企業(yè)集成時代、企業(yè)數(shù)據(jù)集成時代、混亂時代--"數(shù)據(jù)倉庫之父"間的論戰(zhàn)、理論模型確認時代以及數(shù)據(jù)倉庫產(chǎn)品百家爭鳴時代。
    的頭像 發(fā)表于 09-19 15:29 ?1222次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b>發(fā)展史2--<b class='flag-5'>數(shù)據(jù)倉庫</b>

    數(shù)據(jù)倉庫概述及特點

    數(shù)據(jù)庫已經(jīng)在信息技術領域有了廣泛的應用,我們社會生活的各個部門,幾乎都有各種各樣的數(shù)據(jù)庫保存著與我們的生活息息相關的各種數(shù)據(jù)。作為數(shù)據(jù)庫的一個分支,
    發(fā)表于 08-11 14:33 ?3419次閱讀

    數(shù)據(jù)倉庫數(shù)據(jù)庫的主要區(qū)別

    數(shù)據(jù)倉庫數(shù)據(jù)庫是兩個在信息技術領域中常見的概念,它們在數(shù)據(jù)管理和分析方面發(fā)揮著重要作用。盡管它們在某些方面有相似之處,但它們在設計、目的和功能上存在顯著差異。本文將介紹數(shù)據(jù)倉庫
    的頭像 發(fā)表于 07-05 14:57 ?263次閱讀