大數(shù)據(jù)的技術(shù)是一個(gè)技術(shù)群落,想全部學(xué)習(xí)短期內(nèi)是不現(xiàn)實(shí)的,那么我們?cè)趺礃涌茖W(xué)的有邏輯有規(guī)劃的來(lái)學(xué)習(xí),怎么進(jìn)行大數(shù)據(jù)的入門學(xué)習(xí)呢?我們得了解大數(shù)據(jù)行業(yè)里,有哪些崗位,我們直接從工作崗位的技能需求來(lái)倒推我們?nèi)绾螌W(xué)習(xí)大數(shù)據(jù),如何有側(cè)重點(diǎn)的來(lái)學(xué)習(xí)。
第一,先看看有哪些崗位,當(dāng)然大公司會(huì)分的比較詳細(xì),中小企企業(yè)相對(duì)要求會(huì)全面一些
先看看如下這幅圖,圖沒(méi)有很詳細(xì),我再做解答
我們從整個(gè)數(shù)據(jù)項(xiàng)目的業(yè)務(wù)流程出發(fā),(以上所有崗位都對(duì)編程有要求,所以編程基礎(chǔ)是必不可少的)
第一, 大數(shù)據(jù)工程師,眾所周知,在沒(méi)有大數(shù)據(jù)以前,行業(yè)應(yīng)用已經(jīng)非常成熟了,最早大家只關(guān)注功能的實(shí)現(xiàn),接著重視前臺(tái)的界面,前端工程師因此火了一段時(shí)間,因?yàn)橐郧皵?shù)據(jù)量不大,所以在功能上并不重視,由于移動(dòng)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)量非常龐大了,這個(gè)時(shí)候單機(jī)服務(wù)器不能解決問(wèn)題,那么分布式集群就出現(xiàn)了,大數(shù)據(jù)工程師的職責(zé)就是搭建大數(shù)據(jù)平臺(tái),所以從上圖可以得知,大數(shù)據(jù)工程師,需要有java基礎(chǔ)(行業(yè)應(yīng)用大部分是java語(yǔ)言編寫的),所以,今后想從事該崗位的,那么學(xué)習(xí)的路線圖如下
java基礎(chǔ)----linux----hadoop-----hive、hbase----scala---spark
第二, 算法工程師,該崗位零基礎(chǔ)的小伙伴就請(qǐng)止步吧,更適用于數(shù)學(xué)專業(yè)的研究生及以上學(xué)歷,對(duì)數(shù)據(jù)基礎(chǔ)要求比較高。
第三, 數(shù)據(jù)挖掘工程師,建議從python入手,畢竟python里面有大量的數(shù)據(jù)科學(xué)的包,也有pyspark,直接從spark里面調(diào)數(shù)據(jù),不用學(xué)習(xí)Scala語(yǔ)言(spark的編程語(yǔ)言是Scala),學(xué)習(xí)的路線如下:
python基礎(chǔ)—python web(強(qiáng)化編程基礎(chǔ))--數(shù)學(xué)基礎(chǔ)補(bǔ)充(線性代數(shù)、概率統(tǒng)計(jì)、離散數(shù)學(xué))--python numpy pandas包---機(jī)器學(xué)習(xí)算法---深度學(xué)習(xí)
第四, 數(shù)據(jù)分析師,該崗位對(duì)數(shù)學(xué)基礎(chǔ)要求不高,但對(duì)綜合素質(zhì)要求非常高,能充分的理解行業(yè)行情、公司運(yùn)營(yíng)、產(chǎn)品運(yùn)作、對(duì)市場(chǎng)敏銳度較高。具備一定的編程基礎(chǔ),建議學(xué)習(xí)python,能熟練使用相關(guān)的工具,如excel,sas、spss等,能寫漂亮的文章做PPT就行,數(shù)學(xué)基礎(chǔ)不好的女生可以建議走該方向。
學(xué)習(xí)路線:python基礎(chǔ)—python numpy pandas包---excel—spss---sas
第五, 大數(shù)據(jù)可視化,該崗位需要前端的相關(guān)基礎(chǔ),大數(shù)據(jù)運(yùn)維工程師,也不多做介紹了
-
工程師
+關(guān)注
關(guān)注
59文章
1565瀏覽量
68408 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8854瀏覽量
137212
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論