0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)入門分享:Hive應(yīng)用場(chǎng)景

454398 ? 來(lái)源:加米谷學(xué)院 ? 作者:加米谷 ? 2020-12-08 12:25 ? 次閱讀

在大數(shù)據(jù)的發(fā)展當(dāng)中,大數(shù)據(jù)技術(shù)生態(tài)的組件,也在不斷地拓展開來(lái),而其中的Hive組件,作為Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具,可以實(shí)現(xiàn)對(duì)Hadoop集群當(dāng)中的大規(guī)模數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)處理。今天我們的大數(shù)據(jù)入門分享,就主要來(lái)講講,Hive應(yīng)用場(chǎng)景。

關(guān)于Hive,首先需要明確的一點(diǎn)就是,Hive并非數(shù)據(jù)庫(kù),Hive所提供的數(shù)據(jù)存儲(chǔ)、查詢和分析功能,本質(zhì)上來(lái)說(shuō),并非傳統(tǒng)數(shù)據(jù)庫(kù)所提供的存儲(chǔ)、查詢、分析功能。

Hive數(shù)據(jù)倉(cāng)庫(kù)工具將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表,并提供SQL查詢功能,能將SQL語(yǔ)句轉(zhuǎn)變成MapReduce任務(wù)來(lái)執(zhí)行。通過(guò)類SQL語(yǔ)句實(shí)現(xiàn)快速M(fèi)apReduce統(tǒng)計(jì),使MapReduce編程變得更加簡(jiǎn)單易行。

Hive應(yīng)用場(chǎng)景

總的來(lái)說(shuō),Hive是十分適合數(shù)據(jù)倉(cāng)庫(kù)的統(tǒng)計(jì)分析和Windows注冊(cè)表文件。

Hive在Hadoop中扮演數(shù)據(jù)倉(cāng)庫(kù)的角色。Hive添加數(shù)據(jù)的結(jié)構(gòu)在HDFS(Hive superimposes structure on data in HDFS),并允許使用類似于SQL語(yǔ)法進(jìn)行數(shù)據(jù)查詢。

Hive更適合于數(shù)據(jù)倉(cāng)庫(kù)的任務(wù),主要用于靜態(tài)的結(jié)構(gòu)以及需要經(jīng)常分析的工作。Hive與SQL相似促使其成為Hadoop與其他BI工具結(jié)合的理想交集。

Hive使用

Hive在Hadoop之上,使用Hive的前提是先要安裝Hadoop。

Hive要分析的數(shù)據(jù)存儲(chǔ)在HDFS,Hive為數(shù)據(jù)創(chuàng)建的表結(jié)構(gòu)(schema),存儲(chǔ)在RDMS(relevant database manage system關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),比如mysql)。

Hive構(gòu)建在基于靜態(tài)批處理的Hadoop之上,Hadoop通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷。因此,Hive并不能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢,例如,Hive在幾百M(fèi)B的數(shù)據(jù)集上執(zhí)行查詢一般有分鐘級(jí)的時(shí)間延遲。

Hive查詢操作過(guò)程嚴(yán)格遵守Hadoop MapReduce的作業(yè)執(zhí)行模型,Hive將用戶的HiveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)換為MapReduce作業(yè)提交到Hadoop集群上,Hadoop監(jiān)控作業(yè)執(zhí)行過(guò)程,然后返回作業(yè)執(zhí)行結(jié)果給用戶。Hive的最佳使用場(chǎng)合是大數(shù)據(jù)集的批處理作業(yè),例如,網(wǎng)絡(luò)日志分析。

Hive優(yōu)缺點(diǎn)

優(yōu)點(diǎn):

操作接口采用類SQL語(yǔ)法,提供快速開發(fā)的能力(簡(jiǎn)單、容易上手)。

Hive的執(zhí)行延遲比較高,因此Hive常用于數(shù)據(jù)分析,對(duì)實(shí)時(shí)性要求不高的場(chǎng)合。

Hive優(yōu)勢(shì)在于處理大數(shù)據(jù),對(duì)于處理小數(shù)據(jù)沒(méi)有優(yōu)勢(shì),因?yàn)镠ive的執(zhí)行延遲比較高。

Hive支持用戶自定義函數(shù),用戶可以根據(jù)自己的需求來(lái)實(shí)現(xiàn)自己的函數(shù)。

缺點(diǎn):

1.Hive的HQL表達(dá)能力有限

(1)迭代式算法無(wú)法表達(dá)遞歸算法

(2)數(shù)據(jù)挖掘方面不擅長(zhǎng)(數(shù)據(jù)挖掘和算法機(jī)器學(xué)習(xí)

2.Hive的效率比較低

(1)Hive自動(dòng)生成的MapReduce作業(yè),通常情況下不夠智能

(2)Hive調(diào)優(yōu)比較困難,粒度較粗(快)

關(guān)于大數(shù)據(jù)培訓(xùn),Hive應(yīng)用場(chǎng)景,以上就為大家做了大致的介紹了。在大數(shù)據(jù)應(yīng)用場(chǎng)景下,Hive更多是作為Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,并不直接存儲(chǔ)數(shù)據(jù),但是卻不可或缺。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136992
  • hive
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    3820
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    LCR數(shù)字電橋的技術(shù)原理和應(yīng)用場(chǎng)景

    LCR數(shù)字電橋是一種高精度的電子測(cè)量?jī)x器,其技術(shù)原理和應(yīng)用場(chǎng)景可以詳細(xì)闡述如下:技術(shù)原理LCR數(shù)字電橋基于電學(xué)濾波理論和數(shù)字技術(shù),通過(guò)信號(hào)源、自動(dòng)調(diào)諧電路、比例放大器以及A/D轉(zhuǎn)換器等部分實(shí)現(xiàn)電學(xué)量
    發(fā)表于 09-19 16:47

    請(qǐng)問(wèn)risc-v芯片的主要應(yīng)用場(chǎng)景是哪里?

    如題,我想請(qǐng)教一下risc-v芯片與其他的芯片在應(yīng)用場(chǎng)景上有哪些不一樣?
    發(fā)表于 07-30 21:23

    RISC-V適合什么樣的應(yīng)用場(chǎng)景

    設(shè)計(jì)的理想工具,有助于培養(yǎng)更多的計(jì)算機(jī)專業(yè)人才。 綜上所述,RISC-V適合的應(yīng)用場(chǎng)景非常廣泛,包括物聯(lián)網(wǎng)、嵌入式系統(tǒng)、人工智能、自動(dòng)駕駛、汽車電子、數(shù)據(jù)中心和云計(jì)算以及教育和研究等多個(gè)領(lǐng)域。隨著RISC-V生態(tài)系統(tǒng)的不斷完善和技術(shù)的不斷進(jìn)步,相信RISC-V將在更多領(lǐng)域
    發(fā)表于 07-29 17:16

    FPGA與MCU的應(yīng)用場(chǎng)景

    FPGA的應(yīng)用場(chǎng)景有這些: 快速原型設(shè)計(jì) FPGA可以快速配置成多種定制數(shù)字電路,允許在不需要昂貴且耗時(shí)的制造過(guò)程的情況下進(jìn)行快速部署和修改。 硬件加速 在需要高性能和低延遲的應(yīng)用中,F(xiàn)PGA的并行
    發(fā)表于 07-29 15:45

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲(chǔ)數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集方法和應(yīng)
    的頭像 發(fā)表于 07-01 15:44 ?1036次閱讀

    工業(yè)物聯(lián)網(wǎng)平臺(tái)的應(yīng)用場(chǎng)景有哪些

    數(shù)據(jù),實(shí)現(xiàn)設(shè)備聯(lián)網(wǎng)與數(shù)據(jù)共享,從而為各種工業(yè)場(chǎng)景提供可靠應(yīng)用。對(duì)此,數(shù)之能提供高效可靠的工業(yè)物聯(lián)網(wǎng)平臺(tái),助力企業(yè)的數(shù)字化轉(zhuǎn)型。 應(yīng)用場(chǎng)景 1、實(shí)時(shí)監(jiān)測(cè) 通過(guò)接入PLC、儀器儀表、工業(yè)機(jī)
    的頭像 發(fā)表于 06-13 10:51 ?236次閱讀
    工業(yè)物聯(lián)網(wǎng)平臺(tái)的應(yīng)<b class='flag-5'>用場(chǎng)景</b>有哪些

    “Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(24版)DPU部分節(jié)選

    在奇點(diǎn)云2024年版《OLAP數(shù)據(jù)庫(kù)引擎選型白皮書》中,中科馭數(shù)聯(lián)合奇點(diǎn)云針對(duì)Spark+Hive這類大數(shù)據(jù)計(jì)算場(chǎng)景下的主力引擎,測(cè)評(píng)DPU環(huán)境下對(duì)比CPU環(huán)境下的性能提升效果。特此節(jié)
    的頭像 發(fā)表于 05-30 16:09 ?318次閱讀
    “Spark+<b class='flag-5'>Hive</b>”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP<b class='flag-5'>數(shù)據(jù)</b>庫(kù)引擎選型白皮書(24版)DPU部分節(jié)選

    STM32待機(jī)模式適合用于那些應(yīng)用場(chǎng)景?

    對(duì)于查看STM32低功耗模式,共有三種,其中最省電的為待機(jī)模式,但是待機(jī)模式喚醒后相當(dāng)于軟件復(fù)位了,ram及寄存器中的值都復(fù)位了,僅僅是備份域的寄存器除外,因此有個(gè)疑問(wèn),待機(jī)模式適合用于那些應(yīng)用場(chǎng)景
    發(fā)表于 05-07 07:46

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算
    發(fā)表于 03-12 08:09

    AG32VF-MIPI應(yīng)用場(chǎng)景

    的基礎(chǔ)上,集成了MIPI接口協(xié)議,提供了豐富的功能和特性,能夠滿足不同應(yīng)用場(chǎng)景的需求,為用戶提供更加全面、便捷、高效的數(shù)據(jù)傳輸方案。 基本參數(shù): MIPI up to 1.5Gbps LVDS up
    發(fā)表于 01-22 08:56

    labview 和 wincc 的區(qū)別 使用場(chǎng)景

    labview 和 wincc 的區(qū)別 使用場(chǎng)景 都是上位機(jī)軟件,都可以做監(jiān)控軟件 wincc的名氣也比較大 對(duì)比的資料較少 寫這些文章的人,從自己的從事的行業(yè)出發(fā),帶有自己的思維 使用的場(chǎng)景 肯定
    發(fā)表于 10-27 18:01

    【華秋干貨鋪】SMT組裝工藝流程的應(yīng)用場(chǎng)景

    工藝流程的應(yīng)用場(chǎng)景。 01單面純貼片工藝 應(yīng)用場(chǎng)景: 僅在一面有需要焊接的貼片器件。 02雙面純貼片工藝 應(yīng)用場(chǎng)景: A/B面均為貼片元件。 03單面混裝工藝 應(yīng)用場(chǎng)景: A面有貼
    發(fā)表于 10-20 10:33

    SMT組裝工藝流程的應(yīng)用場(chǎng)景

    工藝流程的應(yīng)用場(chǎng)景。 01單面純貼片工藝 應(yīng)用場(chǎng)景: 僅在一面有需要焊接的貼片器件。 02雙面純貼片工藝 應(yīng)用場(chǎng)景: A/B面均為貼片元件。 03單面混裝工藝 應(yīng)用場(chǎng)景: A面有貼
    發(fā)表于 10-20 10:31

    SMT組裝工藝流程的應(yīng)用場(chǎng)景(多圖)

    工藝流程的應(yīng)用場(chǎng)景。 一、單面純貼片工藝 應(yīng)用場(chǎng)景: 僅在一面有需要焊接的貼片器件。 二、雙面純貼片工藝 應(yīng)用場(chǎng)景: A/B面均為貼片元件。 三、單面混裝工藝 應(yīng)用場(chǎng)景: A面有
    發(fā)表于 10-17 18:10

    直線模組的應(yīng)用場(chǎng)景

    直線模組的應(yīng)用場(chǎng)景
    的頭像 發(fā)表于 10-09 17:36 ?818次閱讀
    直線模組的應(yīng)<b class='flag-5'>用場(chǎng)景</b>