很多人都認(rèn)為大數(shù)據(jù)應(yīng)用程序是IT行業(yè)的未來,Hadoop是開發(fā)大數(shù)據(jù)應(yīng)用程序最常用的技術(shù)之一。Hadoop 最早誕生于 2006 年,并在2008年成為Apache頂級(jí)項(xiàng)目,至今,Hadoop已經(jīng)走過了12個(gè)年頭,這對(duì)于任何軟件的生命周期來說是很長的。
雖然早有唱衰Hadoop的聲音,但許多國內(nèi)外企業(yè)的大數(shù)據(jù)平臺(tái)用到了非常多的 Hadoop 生態(tài)組件,因此,Hadoop技術(shù)并非老矣。話說回來,學(xué)習(xí)Hadoop并使用它并不容易,要掌握這項(xiàng)技術(shù)并成為一名成功的開發(fā)人員,你可能需要一些好書來助你一臂之力
在本文,我收集了一系列最好的Hadoop書籍,這些書籍可以幫助你更輕松的上手這項(xiàng)技術(shù):
1、《Hadoop: The Definitive Guide》
本書對(duì)于那些需要分析數(shù)據(jù)集和建立Hadoop集群的程序員來說,絕對(duì)是一本理想指南,它將教你如何使用Apache Hadoop構(gòu)建和維護(hù)可靠的、可伸縮的分布式系統(tǒng)。還有一些關(guān)于YARN的章節(jié)以及與Hadoop相關(guān)的幾個(gè)項(xiàng)目(包括 Parquet, Flume, Crunch, and Spark),你將可以通過本書挖掘Hadoop構(gòu)建分布式數(shù)據(jù)集的強(qiáng)大功能。
2、《Hadoop Explained》
本書主要向讀者介紹Hadoop的基本概念,通過本書你將學(xué)到的有:
Hadoop組件的基礎(chǔ)知識(shí)
如何使用MapReduce
Yarn基礎(chǔ)知識(shí)
使用HDFS Federation
Hadoop的優(yōu)勢(shì)
Hadoop如何處理大數(shù)據(jù)
3、《Programming Hive》
這是一本全面的指南,通過它你將了解Hive在Hadoop生態(tài)系統(tǒng)中的工作方式,并了解如何在你的環(huán)境中設(shè)置和配置Hive。它還提供了真實(shí)的案例研究,幫助你解決大數(shù)據(jù)相關(guān)的疑難雜癥。
4、《Modern Big Data Processing with Hadoop》
本書對(duì)Hadoop組件進(jìn)行了一個(gè)全面的解釋,使你能夠使用Hadoop設(shè)計(jì)、構(gòu)建和執(zhí)行有效的大數(shù)據(jù)分析。如果你想成為一名Hadoop架構(gòu)專家,這將是你必讀的一本書,通過它你將學(xué)到:
企業(yè)數(shù)據(jù)架構(gòu)原則
Hadoop與Apache Spark、Elasticsearch等多種大數(shù)據(jù)框架結(jié)合使用
使用Apache Ambari設(shè)置和部署大數(shù)據(jù)環(huán)境
使用Spark開發(fā)大規(guī)模數(shù)據(jù)處理解決方案
理解Hadoop管理和集群部署
5、《Hadoop Security》
美亞評(píng)分4.5。如果你更關(guān)注Hadoop的安全性,那么你應(yīng)該閱讀這本書,它展示了在安全漏洞發(fā)生時(shí),如何制止攻擊者破壞和修改數(shù)據(jù)的解決辦法,從本書你將學(xué)到:
如何構(gòu)建安全的Hadoop集群硬件
了解Kerberos網(wǎng)絡(luò)身份驗(yàn)證協(xié)議
數(shù)據(jù)提取和客戶端訪問安全性
6、《Data Analytics with Hadoop》
美亞評(píng)分4.0。本書同樣是介紹Hadoop生態(tài)圈技術(shù)的指南書籍,它向你展示了如何利用Hadoop在大數(shù)據(jù)集上使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)技術(shù)。你將從這本書中學(xué)到
理解Hadoop和集群計(jì)算的基本概念
使用Spark進(jìn)行內(nèi)存計(jì)算
使用Apache Hive和HBase執(zhí)行數(shù)據(jù)挖掘和存儲(chǔ)
使用高級(jí)API進(jìn)行分析
使用Spark的MLlib進(jìn)行機(jī)器學(xué)習(xí)
7、《Expert Hadoop Administration》
美亞評(píng)分4.3。對(duì)于希望在任何環(huán)境中創(chuàng)建、配置、保護(hù)、管理和優(yōu)化Hadoop集群的Hadoop管理員來說,本書絕對(duì)是一本很棒的書。這本書解釋了復(fù)雜的Hadoop環(huán)境,并向你展示了在管理集群時(shí)背后的原理,并對(duì)問題和解決方案進(jìn)行詳細(xì)的解釋。
8、《Architecting Modern Data Platforms》
美亞評(píng)分滿分5分。如果你是一位希望構(gòu)建端到端企業(yè)數(shù)據(jù)平臺(tái)的企業(yè)架構(gòu)師或數(shù)據(jù)工程師,那么,這本書將是你的必備指南。這本書將教你如何將Hadoop這樣的大數(shù)據(jù)技術(shù)應(yīng)用到你的大數(shù)據(jù)應(yīng)用程序當(dāng)中去,并學(xué)會(huì)在本地和云中構(gòu)建大數(shù)據(jù)平臺(tái)
9、《Practical Hive》
美亞評(píng)分滿分5分。對(duì)于希望將關(guān)系數(shù)據(jù)庫遷移到Hadoop的人來說,這本書絕對(duì)是必讀書籍,本書由數(shù)據(jù)庫專家和大數(shù)據(jù)專家共同撰寫,具體內(nèi)容包括:Hive的安裝和配置,其核心組件和架構(gòu),Hive數(shù)據(jù)操作語言,如何加載、查詢和分析數(shù)據(jù),Hive的性能調(diào)優(yōu)以及安全性,等等。
10、《Hadoop 2.x Administration Cookbook》
這是一本入門書籍,它將通過示例逐步解釋如何將數(shù)據(jù)導(dǎo)入和導(dǎo)出到Hive,并使用Oozie管理工作流。它還提供了實(shí)用的方法來保護(hù)Hadoop集群,并使其高度可用。通過它,入門Hadoop應(yīng)該是沒有什么大問題。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1200瀏覽量
24619 -
Hadoop
+關(guān)注
關(guān)注
1文章
90瀏覽量
15944 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8854瀏覽量
137212
原文標(biāo)題:書來了 | 2019年了,12歲的Hadoop還值得你學(xué)習(xí)么?
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論