0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

迷茫的后端 想做大數(shù)據(jù)可以少走很多彎路

Linux愛好者 ? 來源:fqj ? 2019-05-02 11:10 ? 次閱讀

隨著大數(shù)據(jù)、人工智能的火熱,很多程序員都不甘現(xiàn)狀,尋求更廣闊的發(fā)展。但高薪工作也意味著高壓,對于很多工作了三五年的程序員來說,更不想放棄現(xiàn)有的技術(shù)基礎(chǔ),去重新學(xué)習(xí)新領(lǐng)域的技術(shù)。但大數(shù)據(jù)作為一個飛速發(fā)展的熱門領(lǐng)域,一半以上的專業(yè)人才卻是轉(zhuǎn)行而來……

1

數(shù)據(jù)是未來的“一切”

很多向大數(shù)據(jù)方向發(fā)展的人,都是看到了這個行業(yè)未來無限廣闊的前景和“錢景”。大數(shù)據(jù)并不是新名詞,但近幾年大數(shù)據(jù)、人工智能向各行各業(yè)逐漸滲透,數(shù)據(jù)也隨之井噴式增長。早年掌握大量用戶數(shù)據(jù)的互聯(lián)網(wǎng)公司,已經(jīng)向世人展現(xiàn)數(shù)據(jù)在不同應(yīng)用場景中的巨大價值:

“天然”大數(shù)據(jù)公司亞馬遜從海量購買數(shù)據(jù)中獲得信息、預(yù)測用戶行為;谷歌已成為網(wǎng)民的“意圖數(shù)據(jù)庫”;LinkedIn的獵頭價值;滴滴等出行、物流配送業(yè)務(wù)利用交易數(shù)據(jù)進(jìn)行實時定價,使利潤最大化;還有的借助大數(shù)據(jù)相關(guān)技術(shù),創(chuàng)造出新的業(yè)務(wù)模式——比如利用算法做個性化內(nèi)容推薦的今日頭條、一點(diǎn)資訊……

“一旦進(jìn)入大數(shù)據(jù)的世界,企業(yè)的手中將握有無限可能。你會發(fā)現(xiàn)數(shù)據(jù)越大,結(jié)果越好。為什么有的企業(yè)在商業(yè)上不斷犯錯?那是因為他們沒有足夠的數(shù)據(jù)對運(yùn)營和決策提供支持?!?/p>

亞馬遜CTO Werner Vogels

數(shù)據(jù)人才的旺盛需求源自一個根本性的變化:科技公司現(xiàn)如今都成了數(shù)據(jù)公司。大到 BAT 等互聯(lián)網(wǎng)巨頭,小到創(chuàng)業(yè)公司,都在向數(shù)據(jù)驅(qū)動型企業(yè)轉(zhuǎn)變,挖掘數(shù)據(jù)、解讀數(shù)據(jù)、用數(shù)據(jù)洞察助力企業(yè)業(yè)務(wù)發(fā)展變得更加重要,導(dǎo)致行業(yè)內(nèi)人才的供給相對不足,薪資也非??捎^。

迷茫的后端 想做大數(shù)據(jù)可以少走很多彎路

*數(shù)據(jù)工程師平均薪資(取自2019/4/25,Glassdoor

Glassdoor 最新數(shù)據(jù)顯示,美國數(shù)據(jù)工程師平均年薪為 116k 美金(約合月薪 6w+ 人民幣),比數(shù)據(jù)分析師高出60%。北美就業(yè)情況是中國的晴雨表,對比其他數(shù)據(jù)崗位,國內(nèi)的數(shù)據(jù)工程師需求急速上升。

2

數(shù)據(jù)工程師轉(zhuǎn)行人士占46%

隨著企業(yè)需求的增長,數(shù)據(jù)工程師數(shù)量也隨之急速增長,其中,接近一半的比例是從其他相關(guān)崗位轉(zhuǎn)行而來。越來越多的程序員、工程師轉(zhuǎn)而向大數(shù)據(jù)方向發(fā)展,不僅僅是崗位的高薪,也是為了順應(yīng)時代。并且從企業(yè)對數(shù)據(jù)人才的需求增長來看,這一趨勢并不會有所放緩。

迷茫的后端 想做大數(shù)據(jù)可以少走很多彎路

* 數(shù)據(jù)工程師的崗位來源前 10,排名最高的分別是軟件工程師(41.67%)、分析師、咨詢師、商業(yè)分析師。數(shù)據(jù)來源:Stitch,點(diǎn)擊可查看大圖

大數(shù)據(jù)行業(yè)之所以轉(zhuǎn)行人士占比大,也是因為轉(zhuǎn)行的門檻相對不高:

首先,大數(shù)據(jù)本身的年齡不大。其他崗位動輒“10年開發(fā)經(jīng)驗”的要求比比皆是,但大數(shù)據(jù)相關(guān)崗位往往更看重能力,不會對工作年限有過高要求,無形之中為剛畢業(yè)的學(xué)生、轉(zhuǎn)行人士提供了很多機(jī)會。

其次,大多數(shù)企業(yè)對大數(shù)據(jù)人才需求并不明確。大數(shù)據(jù)不是單一的學(xué)科,需要多方向的內(nèi)容支撐。因此當(dāng)企業(yè)需求不明確時,很多人本來在從事軟件工程師、后端、甚至是算法等崗位,只需補(bǔ)充對應(yīng)的技術(shù)內(nèi)容,很容易轉(zhuǎn)型大數(shù)據(jù)方向,還有很多想成為數(shù)據(jù)科學(xué)家的人,通過數(shù)據(jù)工程師“曲線救國”。

3

需要走多少彎路,才能成為數(shù)據(jù)工程師?

回答這個問題之前,你首先要知道數(shù)據(jù)工程師需要做什么,各種新技術(shù)和產(chǎn)品的出現(xiàn),數(shù)據(jù)工程師這個角色也發(fā)生了較大的變化。

幾年前的數(shù)據(jù)工程師,主要管理數(shù)據(jù)進(jìn)出數(shù)據(jù)庫,在 SQL 或 Procedural SQL 中創(chuàng)建管道,并在數(shù)據(jù)倉庫中加載數(shù)據(jù),創(chuàng)建統(tǒng)一、標(biāo)準(zhǔn)化的數(shù)據(jù)集結(jié)構(gòu)以供后期分析。但 2018 年以來,他們不再僅僅為數(shù)據(jù)的后期分析提供支持,還要負(fù)責(zé)整個數(shù)據(jù)流,保證任何數(shù)據(jù)都能夠正常操作,并方便其他使用者獲取。

這里的新技術(shù)和新產(chǎn)品,主要指的是大數(shù)據(jù)及其相關(guān)技術(shù)、DOE、機(jī)器學(xué)習(xí)、Spark&Real-time、云開發(fā)和無服務(wù)器等。

大數(shù)據(jù):

2006年,Hadoop 的開源大大改變了數(shù)據(jù)格局,存儲大量數(shù)據(jù)變得更容易,更便宜。最初,在 Hadoop 上進(jìn)行開發(fā)非常復(fù)雜,需要用 Java 開發(fā) Map Reduce 作業(yè)。直到 2010 年 Hive 開源,更多傳統(tǒng)數(shù)據(jù)工程師才能更容易進(jìn)入這個大數(shù)據(jù)時代。

DOE:

隨著大數(shù)據(jù)的發(fā)展,大型互聯(lián)網(wǎng)公司面臨的最大挑戰(zhàn)是:缺少運(yùn)行復(fù)雜數(shù)據(jù)流的工具。Spotify 在2012年開源 Luigi,在 2015 年開源 Airbnb Airflow,這些編排引擎本質(zhì)上是把數(shù)據(jù)流作為代碼。Python 是大多數(shù)編排引擎的編譯語言。

機(jī)器學(xué)習(xí):

在 Hadoop 出現(xiàn)之前,我們通常在一臺機(jī)器上訓(xùn)練機(jī)器學(xué)習(xí)模型,并且以非常特殊的方式進(jìn)行應(yīng)用。對于大型互聯(lián)網(wǎng)公司而言,需要利用先進(jìn)的軟件開發(fā)技術(shù)以更好地訓(xùn)練機(jī)器學(xué)習(xí)模型并應(yīng)用到生產(chǎn)中,比如使用 Mahout 之類的框架。

Spark&Real-time:

2014 年 Spark 發(fā)布了用于 python 的 MLlib,也將大數(shù)據(jù)上的機(jī)器學(xué)習(xí)計算民主化。關(guān)于 Hadoop 和 Spark 的選擇問題,也一直在討論中。作為兩個頂級的 Apache 項目,Spark 在性能、成本、可用性、安全性和機(jī)器學(xué)習(xí)等多個角度,都比 Hadoop 略勝一籌,或許 Spark 在未來會成為大數(shù)據(jù)領(lǐng)域更年輕的“統(tǒng)治者”。

云開發(fā)和無服務(wù)器:

遷移到云對數(shù)據(jù)工程師而言有多重影響?!霸啤贝蚱屏宋锢硐拗?,對于大多數(shù)用戶而言,它意味著存儲和計算趨于無限化。這樣一來,就不再需要對服務(wù)器進(jìn)行不斷的優(yōu)化。而且,通過允許擴(kuò)展和減少資源來實現(xiàn)云,使得處理數(shù)據(jù)工程中典型的高峰批處理作業(yè)變得更加容易。

大數(shù)據(jù)行業(yè),甚至是整個程序員行業(yè),都是需要不停學(xué)習(xí)、不停經(jīng)歷技術(shù)迭代的,想要成為一名新時代下的數(shù)據(jù)工程師,就必須不斷學(xué)習(xí)新技術(shù)以適應(yīng)這快速的變化。

Udacity 全新上線的數(shù)據(jù)工程師納米學(xué)位課程,將幫助想要進(jìn)入該領(lǐng)域的人學(xué)到必備的專業(yè)技能,并在實際場景中進(jìn)行應(yīng)用,進(jìn)而找到理想的工作。

或許很多人對 Udacity 并不陌生。Udacity 由 Google X 實驗室的無人車之父 Sebastian Thrun 創(chuàng)立,課程與 Amazon、Google、Kaggle 等全球領(lǐng)先企業(yè)聯(lián)合開發(fā)。在 MOOC 發(fā)展較為成熟的美國,Udacity 為畢業(yè)生頒發(fā)的「納米學(xué)位」相當(dāng)于“名企敲門磚”。

2016 年登陸中國后,與更多中國企業(yè)達(dá)成合作,騰訊、京東、唯品會等互聯(lián)網(wǎng)名企,都將 Udacity 納米學(xué)位項目作為員工的內(nèi)部培訓(xùn)內(nèi)容,入職的 Udacity 畢業(yè)生甚至可以獲得公司的“學(xué)費(fèi)返還”,納米學(xué)位在中國的影響也在逐漸擴(kuò)大。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11015

    瀏覽量

    102086
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136992
  • 后端
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    2180

原文標(biāo)題:迷茫的后端:想做大數(shù)據(jù),沒有這么多彎路要走

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    請教,SIM卡PCB線,這個CKL時鐘線和數(shù)據(jù)線DATA要等長嘛,一條頂層一條底層如圖這樣可以

    請教,SIM卡PCB線,這個CKL時鐘線和數(shù)據(jù)線DATA要等長嘛,一長條頂層一條底層如圖這樣可以
    發(fā)表于 08-03 22:49

    使用CYW20829的BLE進(jìn)行最大數(shù)據(jù)發(fā)送應(yīng)用,BLE丟失數(shù)據(jù)如何解決?

    我目前正在使用 CYW20829 的 BLE 進(jìn)行最大數(shù)據(jù)發(fā)送應(yīng)用,我使用的是 FREERTOS(例程 Bluetooth_LE_GATT_Throughput_Server 是我的參考),藍(lán)牙被
    發(fā)表于 07-23 07:56

    大數(shù)據(jù)起步之前我們還需要注意些什么?

    誰掌握超級傳感器,誰就站在了大數(shù)據(jù)的門口。比如手機(jī)就是一種超級傳感器,它具有很強(qiáng)的用戶專屬性和私密性,可準(zhǔn)確提供用戶多維度的數(shù)據(jù);再如互聯(lián)網(wǎng)瀏覽器,可以在用戶上網(wǎng)瀏覽時收集很多用戶信息
    的頭像 發(fā)表于 07-10 14:51 ?239次閱讀

    后端數(shù)據(jù)傳輸約定探討

    1 目的 穩(wěn)定可靠,降本增效 ? 前后端數(shù)據(jù)傳輸約定旨在提升系統(tǒng)穩(wěn)定性、可靠性,降低線上線下bug率;并提升研發(fā)效率、降低溝通成本、降低延期率。是確保項目前端和后端開發(fā)順利進(jìn)行的重要規(guī)約之一,定義了
    的頭像 發(fā)表于 07-08 19:10 ?143次閱讀
    前<b class='flag-5'>后端</b><b class='flag-5'>數(shù)據(jù)</b>傳輸約定探討

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集方法和應(yīng)用場景,
    的頭像 發(fā)表于 07-01 15:44 ?1037次閱讀

    大數(shù)據(jù)在軍事方面的應(yīng)用有哪些

    大數(shù)據(jù)技術(shù)為戰(zhàn)爭決策提供了全新的思路和工具。軍事機(jī)關(guān)指揮系統(tǒng)通過搜集和分析大量的戰(zhàn)場數(shù)據(jù),可以建立復(fù)雜的決策模型,快速分析敵我態(tài)勢,評估作戰(zhàn)可行性,并推薦最優(yōu)的戰(zhàn)術(shù)方案。 利用大數(shù)據(jù)
    的頭像 發(fā)表于 06-23 10:34 ?553次閱讀

    模擬后端是什么意思

    模擬后端,在軟件開發(fā)和測試領(lǐng)域,通常是指使用工具或技術(shù)來模擬實際后端服務(wù)的行為。這樣做的主要目的是在項目開發(fā)過程中,當(dāng)后端服務(wù)還未就緒或暫時無法訪問時,前端或其他依賴后端的系統(tǒng)能夠繼續(xù)
    的頭像 發(fā)表于 03-15 15:58 ?489次閱讀

    CYBT-343026傳輸大數(shù)據(jù)時會丟數(shù)據(jù)的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模塊。 我根據(jù) SPP 樣本制作了一個操作 SPP 的應(yīng)用程序。 但是,傳輸大數(shù)據(jù)時有時會丟失數(shù)據(jù)。 它從
    發(fā)表于 03-01 15:04

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)有哪些

    的核心技術(shù),包括數(shù)據(jù)采集、存儲與管理、處理與分析等方面。 一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景 隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人們可以通過各種途徑產(chǎn)生、獲取和傳輸數(shù)據(jù),使
    的頭像 發(fā)表于 01-31 11:07 ?2355次閱讀

    芯片設(shè)計分為哪些步驟?為什么要分前端后端?前端后端是什么意思

    芯片設(shè)計分為哪些步驟?為什么要分為前端后端?前端后端分別是什么意思? 芯片設(shè)計分為前端和后端兩個主要步驟。前端設(shè)計由邏輯設(shè)計和驗證組成,后端設(shè)計則包括物理設(shè)計與驗證。這樣的分工有利于更
    的頭像 發(fā)表于 12-07 14:31 ?3065次閱讀

    Get職場新知識:做分析,用大數(shù)據(jù)分析工具

    綜合分析。但現(xiàn)在有了大數(shù)據(jù)分析工具,一切問題都可迎刃而解。 大數(shù)據(jù)分析工具,顧名思義就是專門為分析海量數(shù)據(jù)而開發(fā)的一類工具。這類工具具有極強(qiáng)的大數(shù)據(jù)分析、指標(biāo)計算、
    發(fā)表于 12-05 09:36

    Standard cell是怎么應(yīng)用到我們的后端設(shè)計中的呢?

    Standard cell,標(biāo)準(zhǔn)單元,或者簡稱cell,可以說是數(shù)字芯片后端最基本的概念之一了,甚至可能沒有接觸過后端的同學(xué)也有所耳聞?
    的頭像 發(fā)表于 12-04 11:44 ?749次閱讀

    springboot前后端交互流程

    Boot 進(jìn)行開發(fā)時,前后端交互是一個非常重要的部分,本文將詳細(xì)介紹 Spring Boot 前后端交互的流程。 前后端交互的基本原理 在前后端交互的過程中,前端負(fù)責(zé)向
    的頭像 發(fā)表于 11-22 16:00 ?1678次閱讀

    怎么去計算PCB線的電阻呢?

    很多硬件朋友會說,用萬用表去測量PCB線兩端的阻值,就可以知道線的電阻。如果真的用萬用表去測量,測量的結(jié)果基本是0,非常不準(zhǔn)確。
    發(fā)表于 10-08 15:13 ?1617次閱讀
    怎么去計算PCB<b class='flag-5'>走</b>線的電阻呢?

    基于大數(shù)據(jù)分析的5G智能工廠如何實現(xiàn)

    隨著科技的快速發(fā)展,大數(shù)據(jù)分析和5G智能工廠已經(jīng)成為當(dāng)今社會的熱門話題。它們在很多領(lǐng)域都有著廣泛的應(yīng)用,如工業(yè)制造、醫(yī)療保健、交通運(yùn)輸?shù)?。在本文中,我們將探?b class='flag-5'>大數(shù)據(jù)分析和5G智能工廠的概念
    的頭像 發(fā)表于 09-25 17:08 ?461次閱讀