0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hadoop的Nuts和Bolts大數(shù)據(jù)分析

倩倩 ? 來源:IT168 ? 2020-03-20 14:16 ? 次閱讀

用于數(shù)據(jù)分析的開源Hadoop架構(gòu)的巨大增長是由其結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)量的增長所驅(qū)動(dòng)的,并且很多權(quán)威組織也預(yù)測(cè),未來Hadoop架構(gòu)還將繼續(xù)增長,并需要復(fù)雜的可訪問工具來從數(shù)據(jù)中提取業(yè)務(wù)和市場(chǎng)信息。

對(duì)于Hadoop來說,前景很樂觀——開源框架旨在促進(jìn)巨大數(shù)據(jù)集的分布式處理。Hadoop對(duì)企業(yè)越來越具有吸引力,因?yàn)樗瓤梢垣@取大數(shù)據(jù)的好處,同時(shí)又避免了基礎(chǔ)架構(gòu)費(fèi)用。

聯(lián)合市場(chǎng)研究部門最近的一份報(bào)告表明,Hadoop市場(chǎng)將實(shí)現(xiàn)從2013年到2020年的復(fù)合年增長率為58.2%,到2020年整個(gè)市場(chǎng)將達(dá)到502億美元,而2012年為15億美元。

大數(shù)據(jù)到底有多“大”?根據(jù)IBM的說法,每天都會(huì)產(chǎn)生2.5萬億字節(jié)的數(shù)據(jù),世界上所有數(shù)據(jù)的90%都是在過去兩年中創(chuàng)建的。意識(shí)到這個(gè)巨大的信息商店的價(jià)值就需要數(shù)據(jù)分析工具,這些數(shù)據(jù)分析工具足夠復(fù)雜,價(jià)格便宜,而且對(duì)于各種規(guī)模的公司來說都很容易使用。

許多企業(yè)認(rèn)為其專有數(shù)據(jù)太重要,無法在其他場(chǎng)合存儲(chǔ)和處理。然而,云服務(wù)現(xiàn)在提供與內(nèi)部系統(tǒng)相同的安全性和可用性。通過訪問云中的數(shù)據(jù)庫,企業(yè)也意識(shí)到可承受和可擴(kuò)展的云架構(gòu)的優(yōu)勢(shì)。

Morpheus數(shù)據(jù)庫即服務(wù)提供企業(yè)對(duì)其數(shù)據(jù)智能操作所需的安全性,高可用性和可擴(kuò)展性。通過Morpheus使用100%的裸機(jī)SSD托管和性能最大化。該服務(wù)為Amazon Web Services和其他對(duì)等點(diǎn)以及云托管平臺(tái)提供超低延遲。

Hadoop的Nuts和Bolts大數(shù)據(jù)分析

Hadoop架構(gòu)將數(shù)據(jù)存儲(chǔ)和處理都分配到網(wǎng)絡(luò)上的所有節(jié)點(diǎn)。 通過將處理數(shù)據(jù)的小程序放置在具有更大數(shù)據(jù)集的節(jié)點(diǎn)中,不需要將數(shù)據(jù)流傳輸?shù)教幚砟K。Hadoop調(diào)度和資源管理框架執(zhí)行映射并減少集群環(huán)境中的階段步驟。

Hadoop分布式文件系統(tǒng)(HDFS)數(shù)據(jù)存儲(chǔ)層使用副本來克服節(jié)點(diǎn)故障,并針對(duì)順序讀取進(jìn)行了優(yōu)化,以支持大規(guī)模并行處理。當(dāng)框架擴(kuò)展到支持Amazon Web Services S3和其他云存儲(chǔ)文件系統(tǒng)時(shí),Hadoop的市場(chǎng)真的要起飛了。

盡管由于設(shè)置和運(yùn)行Hadoop集群的復(fù)雜性、框架的成本低和可擴(kuò)展性等優(yōu)勢(shì),在中小型企業(yè)中采用Hadoop仍然很難。新服務(wù)通過提供受管理并可以使用的Hadoop集群來消除復(fù)雜性:無需在集群節(jié)點(diǎn)上配置或安裝任何服務(wù)。

Netflix數(shù)據(jù)倉庫將Hadoop和Amazon S3結(jié)合在一起,實(shí)現(xiàn)無限可擴(kuò)展性

Netflix針對(duì)其PB級(jí)數(shù)據(jù)倉庫,通過Hadoop分布式文件系統(tǒng)選擇亞馬遜的存儲(chǔ)服務(wù)(S3),以實(shí)現(xiàn)基于云服務(wù)的動(dòng)態(tài)可擴(kuò)展性和無限數(shù)據(jù)計(jì)算能力。Netflix從來自電視,計(jì)算機(jī)和移動(dòng)設(shè)備的數(shù)十億個(gè)流媒體事件中收集數(shù)據(jù)。

以S3作為其數(shù)據(jù)倉庫,可以為具有數(shù)百個(gè)節(jié)點(diǎn)的Hadoop集群配置各種工作負(fù)載,所有這些都能夠訪問相同的數(shù)據(jù)。Netflix使用Amazon的彈性MapReduce分發(fā)Hadoop,并開發(fā)了自己的Hadoop平臺(tái)即服務(wù),它稱之為Genie。Genie允許用戶從Hadoop,Pig,Hive和其他工具提交作業(yè),而無需通過RESTful API來配置新的集群或安裝新的客戶端。

▲Netflix Hadoop-S3數(shù)據(jù)倉庫在廣泛分布的網(wǎng)絡(luò)中提供了無與倫比的數(shù)據(jù)和計(jì)算能力。

Wired的Marco Visibelli在2014年8月13日的文章中解釋說,結(jié)合Hadoop和云服務(wù)有顯著的潛力。Visibelli描述了公司如何利用Big Data進(jìn)行預(yù)測(cè),通過Amazon Web Services從小型項(xiàng)目擴(kuò)展,并在小項(xiàng)目取得成功的同時(shí)進(jìn)行擴(kuò)展。例如,一家歐洲汽車制造商使用Hadoop將幾個(gè)供應(yīng)商數(shù)據(jù)庫結(jié)合到一個(gè)單一的15TB數(shù)據(jù)庫中,兩年內(nèi)節(jié)省了1600萬美元。

Hadoop為各種規(guī)模的組織打開了“大數(shù)據(jù)”大門。 利用Morpheus數(shù)據(jù)庫作為服務(wù)的云服務(wù)的可擴(kuò)展性,安全性,可訪問性和可承受性的項(xiàng)目有更大的成功機(jī)會(huì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    15914
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136992
  • 大數(shù)據(jù)分析

    關(guān)注

    1

    文章

    129

    瀏覽量

    16836
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    SLM片內(nèi)監(jiān)控IP數(shù)據(jù)分析顯著減少測(cè)試成本

    SLM片內(nèi)監(jiān)控IP數(shù)據(jù)分析為高價(jià)值應(yīng)用提供了更為自動(dòng)化的數(shù)據(jù)分析手法。
    的頭像 發(fā)表于 07-16 15:05 ?228次閱讀
    SLM片內(nèi)監(jiān)控IP<b class='flag-5'>數(shù)據(jù)分析</b>顯著減少測(cè)試成本

    網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析

    電子發(fā)燒友網(wǎng)站提供《網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析.pdf》資料免費(fèi)下載
    發(fā)表于 07-13 09:27 ?0次下載

    數(shù)據(jù)分析除了spss還有什么

    數(shù)據(jù)分析是當(dāng)今世界中一個(gè)非常重要的領(lǐng)域,它涉及到從大量數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)模式和趨勢(shì),并為決策提供支持。SPSS(Statistical Package for the Social
    的頭像 發(fā)表于 07-05 15:01 ?362次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個(gè)涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個(gè)過程中,使用正確的工具至關(guān)重要。以下是一些主要的數(shù)據(jù)分析工具,以及它們的功能和用途的介紹。 Excel Exc
    的頭像 發(fā)表于 07-05 14:54 ?521次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價(jià)值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性分析、診斷性
    的頭像 發(fā)表于 07-05 14:51 ?324次閱讀

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的
    的頭像 發(fā)表于 07-02 11:22 ?303次閱讀

    大數(shù)據(jù)分析平臺(tái)網(wǎng)站

    大數(shù)據(jù)分析平臺(tái)是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價(jià)值的信息和洞察。以下是大數(shù)據(jù)分析平臺(tái)的主要功能和應(yīng)用場(chǎng)景: 主
    的頭像 發(fā)表于 06-28 15:46 ?305次閱讀

    大數(shù)據(jù)在軍事方面的應(yīng)用有哪些

    大數(shù)據(jù)技術(shù)為戰(zhàn)爭(zhēng)決策提供了全新的思路和工具。軍事機(jī)關(guān)指揮系統(tǒng)通過搜集和分析大量的戰(zhàn)場(chǎng)數(shù)據(jù),可以建立復(fù)雜的決策模型,快速分析敵我態(tài)勢(shì),評(píng)估作戰(zhàn)可行性,并推薦最優(yōu)的戰(zhàn)術(shù)方案。 利用
    的頭像 發(fā)表于 06-23 10:34 ?553次閱讀

    首批!數(shù)勢(shì)科技SwiftAgent完成中國信通院大模型驅(qū)動(dòng)的智能數(shù)據(jù)分析工具專項(xiàng)測(cè)試

    驅(qū)動(dòng)的智能數(shù)據(jù)分析工具》 標(biāo)準(zhǔn)及測(cè)試簡(jiǎn)介 中國信通院云計(jì)算與大數(shù)據(jù)研究所依托中國通信標(biāo)準(zhǔn)化協(xié)會(huì)大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì)(CCSA TC601),聯(lián)合50余家企業(yè)的100余位專家共同編制完成了《大模型驅(qū)動(dòng)的智能
    的頭像 發(fā)表于 05-24 19:04 ?263次閱讀
    首批!數(shù)勢(shì)科技SwiftAgent完成中國信通院大模型驅(qū)動(dòng)的智能<b class='flag-5'>數(shù)據(jù)分析</b>工具專項(xiàng)測(cè)試

    求助,關(guān)于AD采集到的數(shù)據(jù)分析問題

    問題描述:使用AD采集一個(gè)10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時(shí)間,幅值和占空比。 備注:在分析的時(shí)候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    態(tài)勢(shì)數(shù)據(jù)分析系統(tǒng)軟件

    智慧華盛恒輝態(tài)勢(shì)分析軟件系統(tǒng)的功能描述、部署環(huán)境、界面使用、技術(shù)支持及一些常見問題及其解決辦法等。為數(shù)據(jù)態(tài)勢(shì)分析軟件系統(tǒng)的管理人員和使用人員提供說明。 智慧華盛恒輝態(tài)勢(shì)數(shù)據(jù)分析系統(tǒng)軟件
    的頭像 發(fā)表于 04-22 11:36 ?334次閱讀

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放 隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場(chǎng)深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場(chǎng)需求,而大數(shù)據(jù)分析則為廣告投放帶來了精準(zhǔn)、高效的解決方案
    的頭像 發(fā)表于 04-11 11:23 ?530次閱讀

    Get職場(chǎng)新知識(shí):做分析,用大數(shù)據(jù)分析工具

    綜合分析。但現(xiàn)在有了大數(shù)據(jù)分析工具,一切問題都可迎刃而解。 大數(shù)據(jù)分析工具,顧名思義就是專門為分析海量數(shù)據(jù)而開發(fā)的一類工具。這類工具具有極強(qiáng)
    發(fā)表于 12-05 09:36

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)是什么意思?

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)化平臺(tái)是將電梯的使用時(shí)間和管理中的各項(xiàng)數(shù)據(jù)進(jìn)行采集,整合及利用大數(shù)據(jù)分析能力和計(jì)算機(jī)視覺技術(shù)、結(jié)合關(guān)聯(lián)分析、空間分析和多維
    的頭像 發(fā)表于 11-23 11:01 ?653次閱讀

    基于大數(shù)據(jù)分析的5G智能工廠如何實(shí)現(xiàn)

    隨著科技的快速發(fā)展,大數(shù)據(jù)分析和5G智能工廠已經(jīng)成為當(dāng)今社會(huì)的熱門話題。它們?cè)诤芏囝I(lǐng)域都有著廣泛的應(yīng)用,如工業(yè)制造、醫(yī)療保健、交通運(yùn)輸?shù)?。在本文中,我們將探?b class='flag-5'>大數(shù)據(jù)分析和5G智能工廠的概念
    的頭像 發(fā)表于 09-25 17:08 ?461次閱讀