0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

集成電路應(yīng)用雜志 ? 來源:cc ? 2019-02-14 14:45 ? 次閱讀

1 引言

大數(shù)據(jù)處理系統(tǒng)始終是分析大數(shù)據(jù)的基礎(chǔ),因?yàn)榇髷?shù)據(jù)本身具有信息量繁多冗雜、擴(kuò)展速度極快、信息多樣性且價(jià)值密度高等特點(diǎn),所以要求大數(shù)據(jù)處理系統(tǒng)具有極強(qiáng)的專業(yè)性和高效性,能夠合理并有效的處理大規(guī)模的數(shù)據(jù)并形成可用的數(shù)據(jù)體系[1-3]。目前較為典型的大數(shù)據(jù)處理系統(tǒng)有三種。分別為大數(shù)據(jù)實(shí)時(shí)流式處理系統(tǒng)、離線批量處理系統(tǒng)、交互式處理系統(tǒng)以及大數(shù)據(jù)可視化處理系統(tǒng),本文將依次介紹這三種大數(shù)據(jù)處理系統(tǒng)的概念及其特點(diǎn)并分析其應(yīng)用場(chǎng)景。

2 實(shí)時(shí)流式處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)流式大數(shù)據(jù)概念及其特點(diǎn)。流式大數(shù)據(jù)又被稱為實(shí)時(shí)大數(shù)據(jù),流式處理系統(tǒng)是以分析實(shí)時(shí)數(shù)據(jù)為基礎(chǔ),是基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理,一般處理時(shí)間是在數(shù)百毫秒到數(shù)秒之間。

(2)大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)的技術(shù)架構(gòu)。根據(jù)大數(shù)據(jù)實(shí)時(shí)流式處理的特點(diǎn)可以總結(jié)出,這種數(shù)據(jù)處理系統(tǒng)其實(shí)就是數(shù)據(jù)的收集、傳輸、處理和展現(xiàn)的過程。其中數(shù)據(jù)的處理中涉及數(shù)據(jù)的聚合,而且整個(gè)過程需要能夠在秒級(jí)或毫秒級(jí)得到相應(yīng)的響應(yīng)。目前針對(duì)這一系列特點(diǎn)形成了 Flume + kafka + Storm / Spark + Hbase / Redis 的技術(shù)框架。

(3)大數(shù)據(jù)實(shí)時(shí)流式處理系統(tǒng)的應(yīng)用場(chǎng)景。流式大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)主要廣泛應(yīng)用于金融、公安、電信、交通等領(lǐng)域,在金融行業(yè),流式大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)在金融風(fēng)控反欺詐方面發(fā)揮著重要作用,能夠搜集融合眾多專家知識(shí)以及機(jī)器研究結(jié)果的數(shù)百條規(guī)則,作為對(duì)每筆交易的風(fēng)險(xiǎn)評(píng)估依據(jù),判斷該筆交易是否能夠安全進(jìn)行。

3 離線處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)大數(shù)據(jù)離線處理系統(tǒng)概念及其特點(diǎn)。根據(jù)數(shù)據(jù)分析的時(shí)效性,我們可以把大數(shù)據(jù)分析處理系統(tǒng)分為實(shí)時(shí)處理和離線處理兩種類型。

(2)大數(shù)據(jù)離線處理處理系統(tǒng)的常用工具。相對(duì)于在線處理系統(tǒng)所呈現(xiàn)的技術(shù)架構(gòu),大數(shù)據(jù)離線處理系統(tǒng)已經(jīng)相對(duì)成熟,大數(shù)據(jù)離線處理的流程通常是利用 Hdfs 存儲(chǔ)數(shù)據(jù),確保數(shù)據(jù)有效存儲(chǔ)之后,再利用 MapReduce 進(jìn)行離線數(shù)據(jù)的批量運(yùn)算,批量計(jì)算所得出的數(shù)據(jù)如果需要進(jìn)入數(shù)據(jù)倉庫進(jìn)行存儲(chǔ),可以直接接入 Hive,用過 Hive 進(jìn)行展示。① Hdfs 是一種分布式的文件系統(tǒng),可以對(duì)數(shù)據(jù)進(jìn)行多次備份。② MapReduce 是一種批量計(jì)算技術(shù)框架,同樣是分布式布局,分為兩個(gè)階段:Map 階段和 Reduce 階段。③ Hive 中的數(shù)據(jù)存儲(chǔ)于文件系統(tǒng)中,并且大部分?jǐn)?shù)據(jù)是使用 Hdfs 來存儲(chǔ)的。Hive 為方便訪問數(shù)據(jù)倉庫中的數(shù)據(jù)提供了一種方法,HQL 方法,該方法能夠滿足大數(shù)據(jù)離線處理中需要對(duì)批量處理的數(shù)據(jù)結(jié)果進(jìn)行查詢的要求。

(3)大數(shù)據(jù)離線處理系統(tǒng)目前較常見的應(yīng)用場(chǎng)景是,大數(shù)據(jù)團(tuán)隊(duì)通過統(tǒng)一計(jì)算引擎入口,降低用戶接入門檻。充分利用集群本身數(shù)據(jù),有效促進(jìn)集群本身的建設(shè),加強(qiáng)對(duì)隊(duì)列、任務(wù)及主機(jī)失敗率的監(jiān)控,使用戶能夠自主分析任務(wù)性能并進(jìn)行自主調(diào)整。

4 交互可視化處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)大數(shù)據(jù)交互可視化處理的概念及其特點(diǎn)。大數(shù)據(jù)交互可視化處理是將大數(shù)據(jù)形象化,可視化也就是將數(shù)據(jù)呈現(xiàn)出可視效果。大數(shù)據(jù)交互可視化處理具有兩個(gè)特點(diǎn):首先表現(xiàn)方式多樣化,包括圖形、地圖、故事情節(jié)圖、結(jié)構(gòu)化插圖等。其次是適用范圍廣泛,具有領(lǐng)域創(chuàng)新性,隨著大數(shù)據(jù)的發(fā)展,傳統(tǒng)的數(shù)據(jù)表現(xiàn)形式已經(jīng)不能滿足需要,就要求對(duì)數(shù)據(jù)進(jìn)行可視化處理。

(2)大數(shù)據(jù)交互可視化處理的主要手段。① D3 經(jīng)常出現(xiàn)在表格插件中,是目前最受歡迎的可視化庫之一。D3 可以將數(shù)據(jù)綁定到 DOM 并將其驅(qū)動(dòng)轉(zhuǎn)移應(yīng)用到 Document 之中。同時(shí) D3 是繪制交互桑葚圖的一種非常簡(jiǎn)單的工具,桑葚圖也就是桑葚能量分流圖,它作為一種類型獨(dú)特的流程圖,一般多用于能源、金融等大數(shù)據(jù)的可視化分析。另外,D3 也可以作為對(duì) Sunburst Partition 的可視化工具,主要用來描述用戶群體的路徑點(diǎn)擊狀況。② ECharts 即商業(yè)級(jí)數(shù)據(jù)圖表,可以在 PC 端和移動(dòng)設(shè)備上流暢運(yùn)行的純 Javascript 圖表庫,為我們提供生動(dòng)形象,可交互,可個(gè)性定制的大數(shù)據(jù)可視化圖表,能夠高效增強(qiáng)用戶體驗(yàn)效果。③ R 語言是目前功能比較強(qiáng)大的大數(shù)據(jù)可視化解決路徑,R 語言基本可以獨(dú)立自主地完成數(shù)據(jù)處理、可視化分析、建模以及模型分析等工作,同時(shí)可以作為配合完成與其他工具的數(shù)據(jù)交互。

除此之外,R 語言能夠完成頂尖的制圖工作,不僅可以完成lattcie 包、ggplot2 包的復(fù)雜數(shù)據(jù)可視化,還可以完成rCharts 包、recharts 包、plotly 包的數(shù)據(jù)交互可視化。

(3)大數(shù)據(jù)交互可視化處理的應(yīng)用場(chǎng)景。大數(shù)據(jù)作為一個(gè)新的研究領(lǐng)域在近幾年受到越來越多的關(guān)注,大數(shù)據(jù)可視化也正成為一大熱點(diǎn)。以下將介紹三種大數(shù)據(jù)交互可視化較典型的應(yīng)用場(chǎng)景。

第一是應(yīng)用于社會(huì)關(guān)系的可視化,隨著移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)已成為十分重要的數(shù)據(jù)資源,社會(huì)網(wǎng)絡(luò)分析就是利用這些數(shù)據(jù)資源分析各種網(wǎng)絡(luò)現(xiàn)象。另外,用戶社交性設(shè)計(jì)在最近幾年的移動(dòng)端網(wǎng)游中也受到越來越多的關(guān)注和重視,用戶社交型設(shè)計(jì)就需要以數(shù)據(jù)交互可視化為基礎(chǔ),從而建立并美化游戲模式,增強(qiáng)用戶游戲體驗(yàn)。

第二個(gè)應(yīng)用場(chǎng)景是地理信息的可視化。例如百度遷移圖,就是基于大數(shù)據(jù)可視化的地理信息可視化的典型例子,可以通過分析處理動(dòng)態(tài)數(shù)據(jù),將數(shù)據(jù)進(jìn)行動(dòng)態(tài)連線處理,從而形成流向圖,一目了然。除此之外也可以利用 Remap 實(shí)現(xiàn)天氣預(yù)報(bào)的功能,也可以實(shí)現(xiàn)會(huì)議在地圖上的可視化,如中國 2015 年 R 語言會(huì)議在各個(gè)城市舉行情況的可視化展示。近幾年較為流行的另外一種地理信息可視化方式是城市熱力圖,圖示以不同深淺的顏色來表示各個(gè)地區(qū)的實(shí)際數(shù)據(jù)。

第三是美國大選的大數(shù)據(jù)可視化,在美國大選期間,美國媒體產(chǎn)出大量選舉相關(guān)的數(shù)據(jù)報(bào)道,通過對(duì)這些大數(shù)據(jù)的可視化,選民可以清晰了解選舉動(dòng)態(tài)。通過以上幾種大數(shù)據(jù)可視化的典型例子,我們可以看出,大數(shù)據(jù)可視化是一個(gè)具有多種可能,且并不難以實(shí)現(xiàn)的大數(shù)據(jù)處理系統(tǒng),而且具有極大的發(fā)展空間。

5 結(jié)語

大數(shù)據(jù)處理系統(tǒng)會(huì)隨著大數(shù)據(jù)研究的深入以及數(shù)據(jù)處理技術(shù)的發(fā)展而更加多元更加完善,也將會(huì)在更多行業(yè)或領(lǐng)域中被實(shí)際應(yīng)用。大數(shù)據(jù)已經(jīng)深入到我們生活的方方面面,如何能夠更有效更充分挖掘大數(shù)據(jù)中的價(jià)值仍需要不斷地研究和探索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    92

    瀏覽量

    16633
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136991

原文標(biāo)題:大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

文章出處:【微信號(hào):appic-cn,微信公眾號(hào):集成電路應(yīng)用雜志】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電源模塊測(cè)試系統(tǒng)ATE的數(shù)據(jù)報(bào)告與數(shù)據(jù)分析功能

    自動(dòng)化測(cè)試與數(shù)據(jù)收集分析于一體的綜合測(cè)試軟件,打破了傳統(tǒng)測(cè)試系統(tǒng)數(shù)據(jù)處理系統(tǒng)分散獨(dú)立的限制,提供了一站式自動(dòng)化測(cè)試服務(wù)體驗(yàn),讓電源模塊測(cè)試更智能高效。
    的頭像 發(fā)表于 09-10 18:34 ?95次閱讀
    電源模塊測(cè)試<b class='flag-5'>系統(tǒng)</b>ATE的<b class='flag-5'>數(shù)據(jù)</b>報(bào)告與<b class='flag-5'>數(shù)據(jù)分析</b>功能

    如何構(gòu)建一個(gè)基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測(cè)數(shù)據(jù)處理系統(tǒng)

    如何構(gòu)建一個(gè)基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測(cè)數(shù)據(jù)處理系統(tǒng) 構(gòu)建一個(gè)綜合性的數(shù)據(jù)處理和存儲(chǔ)系統(tǒng),該系統(tǒng)將集成郵件監(jiān)控、數(shù)據(jù)解析、文件
    的頭像 發(fā)表于 09-10 18:14 ?105次閱讀

    探秘IO分布式模塊設(shè)計(jì):讓大數(shù)據(jù)處理更高效

    隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)逐漸成為時(shí)代的主流。在這個(gè)數(shù)據(jù)爆炸的時(shí)代,如何高效地處理海量數(shù)據(jù)成為企業(yè)面臨的重大挑戰(zhàn)。IO分布式模塊設(shè)計(jì)作為一種有效的解決方案,越
    的頭像 發(fā)表于 07-26 13:54 ?450次閱讀
    探秘IO分布式模塊設(shè)計(jì):讓<b class='flag-5'>大數(shù)據(jù)處理</b>更高效

    推動(dòng)智慧交通建設(shè),邊緣計(jì)算賦能交通信號(hào)燈數(shù)據(jù)處理與決策能力

    隨著智慧城市建設(shè)的快速發(fā)展,智慧交通已成為城市發(fā)展的重要組成項(xiàng)目。智慧交通旨在通過大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等先進(jìn)技術(shù),實(shí)現(xiàn)交通系統(tǒng)的全面感知、智能分析、主動(dòng)服務(wù)和協(xié)同管理。邊緣計(jì)算在交通信號(hào)燈物聯(lián)網(wǎng)
    的頭像 發(fā)表于 07-25 16:04 ?545次閱讀
    推動(dòng)智慧交通建設(shè),邊緣計(jì)算賦能交通信號(hào)燈<b class='flag-5'>數(shù)據(jù)處理</b>與決策能力

    信號(hào)采集與處理系統(tǒng)通常由哪些模塊組成

    信號(hào)采集與處理系統(tǒng)是一種廣泛應(yīng)用于工業(yè)、科研、醫(yī)療等領(lǐng)域的電子系統(tǒng),它能夠?qū)Ω鞣N類型的信號(hào)進(jìn)行采集、處理分析。一個(gè)完整的信號(hào)采集與處理系統(tǒng)
    的頭像 發(fā)表于 07-15 14:12 ?339次閱讀

    基于MATLAB的信號(hào)處理系統(tǒng)分析

    基于MATLAB的信號(hào)處理系統(tǒng)分析,包括信號(hào)的導(dǎo)入、預(yù)處理分析、特征提取以及頻譜分析等關(guān)鍵步驟,并通過實(shí)例展示MATLAB在信號(hào)
    的頭像 發(fā)表于 05-17 14:24 ?665次閱讀

    如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇

    SSD速度通過NVMe接口得到了大幅提升,并且網(wǎng)絡(luò)傳輸速率也進(jìn)入了新的高度,但CPU主頻發(fā)展并未保持同等步調(diào),3GHz左右的核心頻率已成為常態(tài)。 在當(dāng)前背景下Apache Spark等大數(shù)據(jù)處理工具中,盡管存儲(chǔ)和網(wǎng)絡(luò)性能的提升極大地減少了數(shù)據(jù)讀取和傳輸?shù)臅r(shí)間消耗,但
    的頭像 發(fā)表于 04-02 13:45 ?835次閱讀
    如何利用DPU加速Spark<b class='flag-5'>大數(shù)據(jù)處理</b>? | 總結(jié)篇

    上位機(jī)組成部分及工作原理圖

    上位機(jī)通常是指上層的控制系統(tǒng)或者數(shù)據(jù)處理系統(tǒng),是對(duì)下位機(jī)進(jìn)行監(jiān)控、控制和數(shù)據(jù)處理的設(shè)備。
    的頭像 發(fā)表于 03-05 16:33 ?2797次閱讀
    上位機(jī)組成部分及工作原理圖

    數(shù)字圖像處理系統(tǒng)及應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《數(shù)字圖像處理系統(tǒng)及應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 02-23 14:49 ?0次下載

    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的數(shù)據(jù)處理分析方法探討

    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的數(shù)據(jù)處理分析方法探討 在工程監(jiān)測(cè)領(lǐng)域,振弦采集儀是常用的一種設(shè)備,用于測(cè)量和記錄結(jié)構(gòu)物的振動(dòng)數(shù)據(jù)。數(shù)據(jù)處理分析
    的頭像 發(fā)表于 01-10 14:44 ?317次閱讀
    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的<b class='flag-5'>數(shù)據(jù)處理</b>與<b class='flag-5'>分析</b>方法探討

    工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究

    工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究 工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究是針對(duì)振弦采集儀所采集到的數(shù)據(jù)進(jìn)行分析處理,以獲得需要的監(jiān)測(cè)
    的頭像 發(fā)表于 01-09 15:10 ?268次閱讀
    工程監(jiān)測(cè)中振弦采集儀的<b class='flag-5'>數(shù)據(jù)處理</b>方法研究

    數(shù)據(jù)處理

    初學(xué)者想請(qǐng)教一下大家,采集的噪聲信號(hào),想要對(duì)采集到的數(shù)據(jù)累計(jì)到一定數(shù)量再進(jìn)行處理,計(jì)劃每隔0.2秒進(jìn)行一次數(shù)據(jù)處理,(得到均方根值等一些特征值)請(qǐng)問大家有什么方法可以實(shí)現(xiàn)
    發(fā)表于 01-07 10:11

    配網(wǎng)行波故障預(yù)警與定位裝置的數(shù)據(jù)處理

    今天江蘇宇拓電力來為大家說明一下配網(wǎng)行波故障預(yù)警與定位裝置的數(shù)據(jù)處理。 一、引言 隨著電力系統(tǒng)規(guī)模的擴(kuò)大和復(fù)雜性的增加,對(duì)配電網(wǎng)的可靠性和穩(wěn)定性提出了更高的要求。在此背景下,配網(wǎng)行波故障預(yù)警與定位
    的頭像 發(fā)表于 12-22 11:51 ?1265次閱讀

    數(shù)據(jù)處理器:DPU編程入門》+初步熟悉這本書的結(jié)構(gòu)和主要內(nèi)容

    之一。隨著人們對(duì)云計(jì)算和大數(shù)據(jù)處理需求的增加,數(shù)據(jù)中心的計(jì)算負(fù)載也不斷增加。傳統(tǒng)的中央處理器(CPU)在處理這些工作負(fù)載時(shí)可能會(huì)遇到瓶頸,難以提供足夠的性能和效率。DPU通過提供專門的
    發(fā)表于 12-08 18:03

    Get職場(chǎng)新知識(shí):做分析,用大數(shù)據(jù)分析工具

    、多維動(dòng)態(tài)分析,業(yè)務(wù)人隨時(shí)按需分析,更靈活,更高效。 3、指標(biāo)計(jì)算能力極強(qiáng),能很好地完成計(jì)算組合多變、計(jì)算量極大的財(cái)務(wù)分析指標(biāo)計(jì)算。 現(xiàn)在登錄奧威BI SaaS平臺(tái),即可享受在線連接系統(tǒng)
    發(fā)表于 12-05 09:36