0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

未來大數(shù)據(jù)時(shí)代,Hadoop會(huì)被Spark取代?

倩倩 ? 來源:IT168 ? 2020-03-20 14:12 ? 次閱讀

由雅虎為工程師和數(shù)據(jù)科學(xué)家打造的Apache Hadoop曾因巨大的潛力而備受稱贊,但如今它卻受到了更快的產(chǎn)品的影響,而這些產(chǎn)品往往來自于它本身的生態(tài)系統(tǒng)——Spark就是其中之一。今年早些,H20.ai的創(chuàng)始人Sri Ambati對(duì)Datanami 曾說:“Spark將會(huì)使Hadoop處于絕地”。

但在過去的幾年中,Hadoop似乎并沒有出現(xiàn)過任何衰退的跡象。在2015年Atscale的調(diào)查報(bào)告中顯示:“在未來3個(gè)月內(nèi),已經(jīng)有超過 76%的人使用Hadoop來做更多的工作。”這些受訪者中大約有一半聲稱他們利用Hadoop工作中獲得了一定的價(jià)值。Hadoop作為一個(gè)十多年的老品牌,在產(chǎn)品的采用方面并沒有減緩下降的趨勢(shì),Spark也并沒有做到真正取代Hadoop??湛跓o憑,下面我們從以下幾個(gè)方面來分析一下Spark在未來的幾年之內(nèi)到底能不能真正的取代Hadoop。

按行業(yè)劃分的市場(chǎng)滲透率

毫無疑問,為專家設(shè)計(jì)的產(chǎn)品一般都會(huì)停留在原來的軌道上,在其他方面不會(huì)有所涉及。但Spark在各個(gè)行業(yè)都存在一些有意義的分布,這可能要?dú)w功于各種市場(chǎng)上的大數(shù)據(jù)的泛濫。所以,雖然Spark可能有更廣泛的應(yīng)用,但Hadoop仍然支配著原本預(yù)期的用戶群。

主要地理市場(chǎng)

在全球范圍內(nèi),我們可以看到Informatica處于中心位置——在歐洲和美洲整體市場(chǎng)份額占比達(dá)32%。在兩年半的時(shí)間里,我們跟蹤了Informatica在云市場(chǎng)和工業(yè)領(lǐng)域的增長(zhǎng),結(jié)果顯示達(dá)到了50%的增長(zhǎng),而且在高等教育領(lǐng)域也處于領(lǐng)先地位。上周, Informatica被Gartner評(píng)為主數(shù)據(jù)管理解決方案2017年魔力象限的領(lǐng)導(dǎo)者。而Hadoop仍然停留于過去成功的地理市場(chǎng)中。

公司規(guī)模的采用趨勢(shì)

在企業(yè)客戶中Spark也沒有大范圍的涉及。我們注意到世界上大多數(shù)公司規(guī)模較小,一般都為1-50名員工,所以Spark似乎并不是任何規(guī)模公司的唯一選擇。對(duì)于那些已經(jīng)使用Hadoop的人來說,這個(gè)產(chǎn)品也對(duì)企業(yè)和公司起到了一定的作用,而且 Hadoop并不僅限于一種用戶。而Hadoop無論在何種規(guī)模的公司中,使用率相對(duì)于Spark還是非常高的。

寫在最后

此外,在調(diào)查的過程中,傳統(tǒng)的科技公司像eBay、Verizon、惠普和亞馬遜等主流廠商已經(jīng)開始使用Spark,但是Hadoop還沒有被大規(guī)模的拋棄。相反,用戶使用Spark作為系統(tǒng)的介紹,利用這個(gè)程序來突破Hadoop的障礙,兩者的結(jié)合,使得工作更高效的完成。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    15914
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136992
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    spark為什么比mapreduce快?

    減少的是磁盤I/O次數(shù)(相比于mapreduce計(jì)算模型而言),而不是shuffle次數(shù),因?yàn)閟huffle是根據(jù)數(shù)據(jù)重組的次數(shù)而定,所以shuffle次數(shù)不能減少 ? 所以總結(jié)spark
    的頭像 發(fā)表于 09-06 09:45 ?108次閱讀

    spark運(yùn)行的基本流程

    前言: 由于最近對(duì)spark的運(yùn)行流程非常感興趣,所以閱讀了《Spark大數(shù)據(jù)處理:技術(shù)、應(yīng)用與性能優(yōu)化》一書。通過這本書的學(xué)習(xí),了解了spark的核心技術(shù)、實(shí)際應(yīng)用場(chǎng)景以及性能優(yōu)化的
    的頭像 發(fā)表于 07-02 10:31 ?251次閱讀
    <b class='flag-5'>spark</b>運(yùn)行的基本流程

    Spark基于DPU的Native引擎算子卸載方案

    ?和 R?等多種高級(jí)編程語言,這使得Spark可以應(yīng)對(duì)各種復(fù)雜的大數(shù)據(jù)應(yīng)用場(chǎng)景,例如金融、電商、社交媒體等。 Spark 經(jīng)過多年發(fā)展,作為基礎(chǔ)的計(jì)算框架,不管是在
    的頭像 發(fā)表于 06-28 17:12 ?323次閱讀
    <b class='flag-5'>Spark</b>基于DPU的Native引擎算子卸載方案

    如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇

    SSD速度通過NVMe接口得到了大幅提升,并且網(wǎng)絡(luò)傳輸速率也進(jìn)入了新的高度,但CPU主頻發(fā)展并未保持同等步調(diào),3GHz左右的核心頻率已成為常態(tài)。 在當(dāng)前背景下Apache Spark大數(shù)據(jù)處理工具中,盡管存儲(chǔ)和網(wǎng)絡(luò)性能的提升極大地減少了
    的頭像 發(fā)表于 04-02 13:45 ?837次閱讀
    如何利用DPU加速<b class='flag-5'>Spark</b><b class='flag-5'>大數(shù)據(jù)</b>處理? | 總結(jié)篇

    Spark基于DPU Snappy壓縮算法的異構(gòu)加速方案

    一、總體介紹 1.1 背景介紹 Apache Spark是專為大規(guī)模數(shù)據(jù)計(jì)算而設(shè)計(jì)的快速通用的計(jì)算引擎,是一種與 Hadoop 相似的開源集群計(jì)算環(huán)境,但是兩者之間還存在一些不同之處,這些不同之處使
    的頭像 發(fā)表于 03-26 17:06 ?588次閱讀
    <b class='flag-5'>Spark</b>基于DPU Snappy壓縮算法的異構(gòu)加速方案

    RDMA技術(shù)在Apache Spark中的應(yīng)用

    背景介紹 在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,Apache?Spark已經(jīng)成為了處理大規(guī)模數(shù)據(jù)集的首選框架。作為一個(gè)開源的分布式計(jì)算系統(tǒng),Spark因其高
    的頭像 發(fā)表于 03-25 18:13 ?1351次閱讀
    RDMA技術(shù)在Apache <b class='flag-5'>Spark</b>中的應(yīng)用

    基于DPU和HADOS-RACE加速Spark 3.x

    、Python、Java、Scala、R)等特性在大數(shù)據(jù)計(jì)算領(lǐng)域被廣泛使用。其中,Spark SQL 是 Spark 生態(tài)系統(tǒng)中的一個(gè)重要組件,它允許用戶以結(jié)構(gòu)化數(shù)據(jù)的方式進(jìn)行
    的頭像 發(fā)表于 03-25 18:12 ?1152次閱讀
    基于DPU和HADOS-RACE加速<b class='flag-5'>Spark</b> 3.x

    解鎖電梯大數(shù)據(jù)平臺(tái)的商業(yè)價(jià)值與未來展望

    在智能建筑領(lǐng)域,電梯大數(shù)據(jù)平臺(tái)作為關(guān)鍵技術(shù)之一,正逐漸成為行業(yè)的焦點(diǎn)。本文深圳梯云物聯(lián)科技有限公司小編將深入探討電梯大數(shù)據(jù)平臺(tái)的商業(yè)價(jià)值以及未來展望,為您揭示這一領(lǐng)域的無限可能。
    的頭像 發(fā)表于 03-25 10:51 ?300次閱讀
    解鎖電梯<b class='flag-5'>大數(shù)據(jù)</b>平臺(tái)的商業(yè)價(jià)值與<b class='flag-5'>未來</b>展望

    淺析大數(shù)據(jù)時(shí)代下的數(shù)據(jù)中心運(yùn)維管理

    淺析大數(shù)據(jù)時(shí)代下的數(shù)據(jù)中心運(yùn)維管理 張穎姣 安科瑞電氣股份有限公司?上海嘉定201801 摘要:本文將從數(shù)據(jù)中心運(yùn)維管理的角度,聯(lián)系現(xiàn)實(shí)情況,對(duì)運(yùn)維管理進(jìn)行研究,期望通過本項(xiàng)目的研究,
    的頭像 發(fā)表于 02-22 14:40 ?247次閱讀
    淺析<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>時(shí)代</b>下的<b class='flag-5'>數(shù)據(jù)</b>中心運(yùn)維管理

    銅纜會(huì)被光纖完全取代嗎?為什么光纖目前取代不了銅纜?

    銅纜會(huì)被光纖完全取代嗎?為什么光纖目前取代不了銅纜? 隨著科技的進(jìn)步和互聯(lián)網(wǎng)的迅猛發(fā)展,數(shù)字通信技術(shù)也取得了巨大的突破。銅纜作為傳統(tǒng)的網(wǎng)絡(luò)連接媒介,在過去幾十年里扮演了重要的角色,但隨著光纖技術(shù)
    的頭像 發(fā)表于 02-04 10:25 ?841次閱讀

    米哈游大數(shù)據(jù)云原生實(shí)踐

    近年來,容器、微服務(wù)、Kubernetes 等各項(xiàng)云原生技術(shù)的日漸成熟,越來越多的公司開始選擇擁抱云原生,并開始將 AI、大數(shù)據(jù)等類型的企業(yè)應(yīng)用部署運(yùn)行在云原生之上。以 Spark 為例,在云上運(yùn)行
    的頭像 發(fā)表于 01-09 10:41 ?466次閱讀
    米哈游<b class='flag-5'>大數(shù)據(jù)</b>云原生實(shí)踐

    GPU:大數(shù)據(jù)時(shí)代的強(qiáng)力引擎

    現(xiàn)如今,我們正身處于數(shù)據(jù)爆炸的時(shí)代,大規(guī)模的數(shù)據(jù)正在重新定義著科技和商業(yè)的規(guī)則。GPU(GraphicsProcessingUnit,圖形處理單元)技術(shù)已經(jīng)成為科技創(chuàng)新的關(guān)鍵利器,極大地提高了系統(tǒng)
    的頭像 發(fā)表于 01-04 08:27 ?609次閱讀
    GPU:<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>時(shí)代</b>的強(qiáng)力引擎

    藍(lán)牙會(huì)被取代?NFC、WiFi是潛在威脅

    電子發(fā)燒友網(wǎng)站提供《藍(lán)牙會(huì)被取代?NFC、WiFi是潛在威脅.pdf》資料免費(fèi)下載
    發(fā)表于 11-10 15:01 ?0次下載
    藍(lán)牙<b class='flag-5'>會(huì)被</b><b class='flag-5'>取代</b>?NFC、WiFi是潛在威脅

    千兆光模塊是否會(huì)被萬兆光模塊完全取代

    近年來,隨著云計(jì)算和大數(shù)據(jù)等大規(guī)模應(yīng)用的興起,網(wǎng)絡(luò)規(guī)模和帶寬需求不斷增加,萬兆以太網(wǎng)技術(shù)應(yīng)運(yùn)而生。那么,在這個(gè)場(chǎng)景下,千兆光模塊是否會(huì)被萬兆光模塊完全取代呢?
    的頭像 發(fā)表于 10-30 11:32 ?343次閱讀
    千兆光模塊是否<b class='flag-5'>會(huì)被</b>萬兆光模塊完全<b class='flag-5'>取代</b>

    數(shù)據(jù)的基本概念!大數(shù)據(jù)時(shí)代的新術(shù)語

    大數(shù)據(jù)平臺(tái)下,預(yù)處理的數(shù)據(jù)量非常大,而處理后的有效數(shù)據(jù)量往往比較小,因此,數(shù)據(jù)的生命周期管理顯得非常重要。數(shù)據(jù)生命周期管理(data li
    的頭像 發(fā)表于 10-11 11:41 ?1935次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>的基本概念!<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>時(shí)代</b>的新術(shù)語