0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)分析技術架構的通用模塊

h1654155282.3538 ? 來源:加米谷大數(shù)據(jù)張衡 ? 作者:加米谷大數(shù)據(jù)張衡 ? 2020-10-29 15:13 ? 次閱讀

對于企業(yè)而言,坐擁龐大的數(shù)據(jù)資源,想要實現(xiàn)大數(shù)據(jù)分析,首要的就是要搭建起自身的大數(shù)據(jù)系統(tǒng)平臺,而每個公司都有自己特定的業(yè)務場景,因此在大數(shù)據(jù)平臺上的需求是不一樣的。今天我們僅從通用的角度,來聊聊大數(shù)據(jù)分析需要什么技術架構?

我們熟悉的以BAT為首的互聯(lián)網(wǎng)大廠,都擁有自身的大數(shù)據(jù)系統(tǒng)平臺,但是各自面臨的業(yè)務場景是不同的,比如說騰訊,主要是社交業(yè)務場景;百度,主要是搜索業(yè)務場景;而阿里,主要是電商業(yè)務場景。

這樣不同的業(yè)務場景下,需要根據(jù)實際的業(yè)務需求,選擇適合自己的技術框架,來搭建自己的大數(shù)據(jù)架構體系。但是從技術架構體系的共性來說,是可以從通用的技術模塊去理解,來幫助我們更好地學習和掌握大數(shù)據(jù)技術架構的。

數(shù)據(jù)收集模塊:主要負責收集各種數(shù)據(jù)源的數(shù)據(jù),包括日志文件、網(wǎng)絡請求、數(shù)據(jù)庫、消息隊列等,并將這些數(shù)據(jù)轉(zhuǎn)換為文件或者消息向后傳遞。

數(shù)據(jù)轉(zhuǎn)存模塊:主要負責將數(shù)據(jù)定時傳遞到分布式存儲或者實時傳遞給下游的數(shù)據(jù)處理程序。

ETL模塊:主要負責數(shù)據(jù)的清洗、格式和內(nèi)容的處理和轉(zhuǎn)換、數(shù)據(jù)分級分揀、加載至數(shù)據(jù)倉庫等。

數(shù)據(jù)倉庫模塊:這是整個架構的核心,數(shù)據(jù)倉庫是數(shù)據(jù)有組織的集中存儲的地方,負責數(shù)據(jù)的存取和管理。

元數(shù)據(jù)管理模塊:主要負責記錄和約束數(shù)據(jù)倉庫中數(shù)據(jù)的含義和格式,控制著數(shù)據(jù)的生命周期和數(shù)據(jù)質(zhì)量。

分析引擎模塊:數(shù)據(jù)分析師交互最多的模塊,主要負責執(zhí)行各種分析語句或代碼,完成各種分析任務。

作業(yè)管理與調(diào)度模塊:負責分析作業(yè)的管理和定時調(diào)度,包括作業(yè)的增刪改查、查看修改歷史、設置調(diào)度定時和執(zhí)行引擎等。

資源分配與調(diào)度模塊:主要負責在多作業(yè)同時運行的場景下,有效協(xié)調(diào)和分配集群的資源,使資源利用率最大化。
責任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    emc技術大數(shù)據(jù)分析中的角色

    大數(shù)據(jù)分析通常涉及來自多個來源和格式的數(shù)據(jù)。這些數(shù)據(jù)可能包括結構化數(shù)據(jù)(如數(shù)據(jù)庫中的表格數(shù)據(jù)
    的頭像 發(fā)表于 11-01 15:22 ?192次閱讀

    云計算在大數(shù)據(jù)分析中的應用

    云計算在大數(shù)據(jù)分析中的應用廣泛且深入,它為用戶提供了存儲、計算、分析和預測的強大能力。以下是對云計算在大數(shù)據(jù)分析中應用的介紹: 一、存儲和處理海量數(shù)據(jù) 云計算提供了強大的存儲和計算能力
    的頭像 發(fā)表于 10-24 09:18 ?250次閱讀

    IP 地址大數(shù)據(jù)分析如何進行網(wǎng)絡優(yōu)化?

    一、大數(shù)據(jù)分析在網(wǎng)絡優(yōu)化中的作用 1.流量分析 大數(shù)據(jù)分析可以對網(wǎng)絡中的流量進行實時監(jiān)測和分析,了解網(wǎng)絡的使用情況和流量趨勢。通過對流量數(shù)據(jù)
    的頭像 發(fā)表于 10-09 15:32 ?145次閱讀
    IP 地址<b class='flag-5'>大數(shù)據(jù)分析</b>如何進行網(wǎng)絡優(yōu)化?

    數(shù)據(jù)分析除了spss還有什么

    數(shù)據(jù)分析是當今世界中一個非常重要的領域,它涉及到從大量數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)模式和趨勢,并為決策提供支持。SPSS(Statistical Package for the Social
    的頭像 發(fā)表于 07-05 15:01 ?502次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個過程中,使用正確的工具至關重要。以下是一些主要的數(shù)據(jù)分析工具,以及它們的功能和用途的介紹。 Excel Exc
    的頭像 發(fā)表于 07-05 14:54 ?724次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性分析、診斷性
    的頭像 發(fā)表于 07-05 14:51 ?469次閱讀

    機器學習在數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數(shù)據(jù)中學習規(guī)律,為企業(yè)和組織提供了更高效、更準確的
    的頭像 發(fā)表于 07-02 11:22 ?515次閱讀

    大數(shù)據(jù)分析平臺網(wǎng)站

    大數(shù)據(jù)分析平臺是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價值的信息和洞察。以下是大數(shù)據(jù)分析平臺的主要功能和應用場景: 主
    的頭像 發(fā)表于 06-28 15:46 ?546次閱讀

    求助,關于AD采集到的數(shù)據(jù)分析問題

    問題描述:使用AD采集一個10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時間,幅值和占空比。 備注:在分析的時候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    態(tài)勢數(shù)據(jù)分析系統(tǒng)軟件

    智慧華盛恒輝態(tài)勢分析軟件系統(tǒng)的功能描述、部署環(huán)境、界面使用、技術支持及一些常見問題及其解決辦法等。為數(shù)據(jù)態(tài)勢分析軟件系統(tǒng)的管理人員和使用人員提供說明。 智慧華盛恒輝態(tài)勢
    的頭像 發(fā)表于 04-22 11:36 ?392次閱讀

    廣告投放公司運用大數(shù)據(jù)分析,實現(xiàn)精準投放

    廣告投放公司運用大數(shù)據(jù)分析,實現(xiàn)精準投放 隨著大數(shù)據(jù)技術的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場需求,而大數(shù)據(jù)分析則為廣告投放帶來了精準、高效
    的頭像 發(fā)表于 04-11 11:23 ?718次閱讀

    大數(shù)據(jù)技術如何為精益管理賦能?

    管理提供數(shù)據(jù)支持 精益管理強調(diào)以數(shù)據(jù)為基礎,通過數(shù)據(jù)分析和挖掘,發(fā)現(xiàn)企業(yè)運營中的問題和瓶頸,進而優(yōu)化流程、提高效率。大數(shù)據(jù)技術能夠?qū)崟r收集、
    的頭像 發(fā)表于 12-19 09:58 ?572次閱讀

    Get職場新知識:做分析,用大數(shù)據(jù)分析工具

    綜合分析。但現(xiàn)在有了大數(shù)據(jù)分析工具,一切問題都可迎刃而解。 大數(shù)據(jù)分析工具,顧名思義就是專門為分析海量數(shù)據(jù)而開發(fā)的一類工具。這類工具具有極強
    發(fā)表于 12-05 09:36

    使用Minitab的跨行業(yè)模塊提升您的數(shù)據(jù)分析

    如今,數(shù)據(jù)就是一切。從預測未來結果到提高產(chǎn)品質(zhì)量,數(shù)據(jù)分析對于任何想要保持競爭力的組織都是必不可少的。然而,大多數(shù)數(shù)據(jù)是收集的,從來沒有分析過,當涉及到
    的頭像 發(fā)表于 11-27 11:44 ?422次閱讀

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)平臺是什么意思?

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)化平臺是將電梯的使用時間和管理中的各項數(shù)據(jù)進行采集,整合及利用大數(shù)據(jù)分析能力和計算機視覺技術、結合關聯(lián)分析、空間
    的頭像 發(fā)表于 11-23 11:01 ?769次閱讀