0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么數(shù)據(jù)分析師都要求寫代碼?

電子工程師 ? 來源:lp ? 2019-03-06 14:21 ? 次閱讀

Python官方在今年2月做了一份報(bào)告,從官方的角度說明了Python的使用狀況和受歡迎程度:

該調(diào)查由 Python 軟件基金會(huì)與 JetBrains 一起發(fā)起,有來自 150 多個(gè)國(guó)家的超過兩萬名開發(fā)人員參與。

從官方喜出望外的報(bào)告中,我們可以看到Python受到大部分人的歡迎,依舊是用戶手中的香餑餑:

在Python的用途上,大家使用Python最常用的場(chǎng)景是數(shù)據(jù)分析,從漲幅來看也是最高的。相關(guān)的機(jī)器學(xué)習(xí)場(chǎng)景漲幅也有7%。

這不禁引出一個(gè)問題:Python作為編程語言在數(shù)據(jù)分析領(lǐng)域的地位似乎舉足輕重,但明明有更親民的Excel、Tableau、PowerBI等軟件,為什么數(shù)據(jù)分析師最終都會(huì)代碼化?

作為一名使用Python的數(shù)據(jù)分析師,我想舉幾個(gè)小例子說明:

原因 1

鼠標(biāo)操作流程手速太慢

即使是打游戲,手速也很大程度上來源于快捷鍵的使用。

數(shù)據(jù)分析也一樣,代碼能簡(jiǎn)化大量鼠標(biāo)操作流程,用語言將過程“腳本化”,會(huì)幫助分析師減去不必要的操作時(shí)間,留出更多時(shí)間放在“分析過程”上。

舉個(gè)例子,Excel做分析的過程可能是:定位空值-刪除空值-修改數(shù)據(jù)格式-去除異常值-公式計(jì)算-數(shù)據(jù)透視表-整理數(shù)據(jù)-插入圖表-調(diào)整結(jié)果……

繁瑣的每一步都是來自鼠標(biāo)點(diǎn)擊,中間錯(cuò)誤了哪一步,很多步驟都需要重新調(diào)整,浪費(fèi)大量時(shí)間。

圖中演示的是使用Excel進(jìn)行簡(jiǎn)單的描述統(tǒng)計(jì)分析過程,比較繁瑣。

Python靠的是代碼編寫每一步過程,統(tǒng)一語言帶來記錄方法的統(tǒng)一。當(dāng)分析過程需要修改,只需要調(diào)整設(shè)定好的參數(shù),效率當(dāng)然嗖嗖的。

使用Python代碼可以迅速調(diào)用數(shù)據(jù),計(jì)算需求,并記錄每一步過程,方便修改。

原因 2

Python擁有強(qiáng)大的庫(kù)

分析軟件每開發(fā)出一個(gè)新功能需要大量投入。而Python作為編程語言,開發(fā)新工具相對(duì)容易,一個(gè)人開發(fā)一個(gè)庫(kù)的例子比比皆是。并且Python的使用熱度帶來了大量的大神,Python工具庫(kù)可謂應(yīng)有盡有,這也是Python有前文報(bào)告中眾多用途的原因。

回到數(shù)據(jù)分析,以Python可視化必知基本庫(kù)matplotlib為例,光是他的官方gallery就有26個(gè)大類527個(gè)樣式,數(shù)量上就碾壓了市面上大部分同功能軟件。

matplotlib官網(wǎng):https://matplotlib.org/tutorials/index.html

此外Python可視化類工具會(huì)有針對(duì)圖表樣式進(jìn)行調(diào)整的代碼,也可以交互,幾行代碼,省時(shí)省力,分分鐘關(guān)機(jī)下班。

原因 3

代碼輔助數(shù)學(xué)算法

小時(shí)候不愛數(shù)學(xué),因?yàn)橛憛捰浄爆嵉墓胶瓦M(jìn)行步驟推算,一步算錯(cuò),步步算錯(cuò),而且我還無法理解為什么老師要求這么算。

但代碼的出現(xiàn)拯救了我對(duì)數(shù)學(xué)的偏見。它能從特例的角度復(fù)現(xiàn)數(shù)學(xué)推理過程。通過計(jì)算機(jī)成千上萬次的計(jì)算,讓我更快理解算法的含義。

截圖來自3blue1brown的微積分教學(xué)視頻《微積分的本質(zhì)》

以一道高中數(shù)學(xué)求導(dǎo)題為例:

求y=x2在x=2時(shí)的導(dǎo)數(shù)。

這道題不難,使用求導(dǎo)公式可知導(dǎo)數(shù)是4。但很多函數(shù)是不方便推導(dǎo)求導(dǎo)公式的,是否可以從導(dǎo)數(shù)的定義出發(fā),尋找特例說明問題?

有的。

這道題要求的其實(shí)是連續(xù)可導(dǎo)函數(shù)f的曲線上,x=2時(shí)切線的斜率,那么我們可以定義一個(gè)移動(dòng)的點(diǎn)m,使得m不斷的接近x,當(dāng)(m-x)足夠小時(shí),(f(m)-f(x))/(m-x)會(huì)越來越接近該點(diǎn)的所在曲線的切線斜率,也就是我們要求的導(dǎo)數(shù)。

圖中所示程序迭代了1000次,點(diǎn)m以一定的0.01個(gè)單位的速度不斷趨近x,結(jié)果導(dǎo)數(shù)(斜率)在不斷趨近于4。

通過這個(gè)案例,我想說明的是代碼的存在讓模擬和迭代變得可能,定義一個(gè)規(guī)則,找到一個(gè)特例,讓程序模擬千萬遍,答案會(huì)呼之欲出。

這是一種使用程序構(gòu)建算法的思想。

另一個(gè)有趣的案例是基于Python的梯度下降算法,使用Python多次模擬尋找最小化的損失函數(shù)和模型參數(shù)值。

案例文名為《Python推導(dǎo)線性回歸模型》的文章,用到了梯度下降的方法推導(dǎo)出線性回歸模型,適合python數(shù)據(jù)分析及機(jī)器學(xué)習(xí)初學(xué)者觀看,完整鏈接見文末。

總結(jié)一下,數(shù)據(jù)分析師為什么會(huì)要求寫代碼?

原因在于代碼在數(shù)據(jù)分析上更高效、豐富和自由。事實(shí)上代碼不僅幫助分析,更能幫助邏輯思維。

如果你想自己感受下使用代碼做數(shù)據(jù)分析帶來的高效,建議你現(xiàn)在就可以開始學(xué)習(xí)Python。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4671

    瀏覽量

    67770
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131846
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1393

    瀏覽量

    33909
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84081

原文標(biāo)題:會(huì)Python和不會(huì)Python的區(qū)別

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPT-4替代年薪60萬數(shù)據(jù)分析師,成本只要2000多

    萬以上的數(shù)據(jù)分析師也包括在內(nèi)。 ? GPT-4 完勝人類數(shù)據(jù)分析師 ? 阿里達(dá)摩院與新加坡南洋理工大學(xué)合作研究了AI在數(shù)據(jù)分析上的作用,對(duì)比了OpenAI最新的GPT-4與金融行業(yè)中的數(shù)據(jù)分析
    的頭像 發(fā)表于 05-30 04:47 ?2050次閱讀

    學(xué)習(xí)大數(shù)據(jù)開發(fā)需要哪些條件?

    使用其中之一,其他分析工具(如Matlab)視情況而定。對(duì)于數(shù)據(jù)挖掘工程……嗯,會(huì)用用Excel就行了,主要工作要靠代碼來解決呢。3.
    發(fā)表于 03-01 15:42

    數(shù)據(jù)分析需要的技能

    商業(yè)價(jià)值的轉(zhuǎn)換,數(shù)據(jù)分析師是其中一個(gè)重要的職位,那么,想從事該職業(yè)需要具備哪些技能呢?1. 精通ExcelExcel處理技能是大數(shù)據(jù)分析師必備技能,并且需要十分精通,除了常規(guī)操作和函數(shù),一些不常
    發(fā)表于 04-10 15:59

    python數(shù)據(jù)分析的類庫(kù)

    Python之所以這么流行,這么好用,就是因?yàn)镻ython提供了大量的第三方的庫(kù),開箱即用,非常方便,而且還免費(fèi)哦,學(xué)Python的同學(xué)里估計(jì)有30%以上是為了做數(shù)據(jù)分析師或者數(shù)據(jù)挖掘,所以數(shù)據(jù)分析
    發(fā)表于 05-10 15:18

    數(shù)據(jù)分析師當(dāng)取數(shù)機(jī)?大材小用背后是BI軟件的缺位

    好端端一個(gè)數(shù)據(jù)分析師,天天被業(yè)務(wù)部門指揮著去拉數(shù)據(jù),累死累活不說,還擠兌得沒時(shí)間做深度分析。久而久之數(shù)據(jù)分析師都被逼成取數(shù)機(jī)了。數(shù)據(jù)分析師
    發(fā)表于 12-24 14:05

    成為Python數(shù)據(jù)分析師,需要掌握哪些技能

    的三大任務(wù)分析歷史預(yù)測(cè)未來優(yōu)化選擇第三、數(shù)據(jù)分析師要求的8項(xiàng)技能統(tǒng)計(jì)學(xué)統(tǒng)計(jì)檢驗(yàn)、P值、分布、估計(jì)基本工具PythonSQL多變量微積分和線性代數(shù)數(shù)據(jù)整理
    發(fā)表于 06-23 12:16

    成為Python數(shù)據(jù)分析師,需要掌握哪些技能

    的三大任務(wù)分析歷史預(yù)測(cè)未來優(yōu)化選擇第三、數(shù)據(jù)分析師要求的8項(xiàng)技能統(tǒng)計(jì)學(xué)統(tǒng)計(jì)檢驗(yàn)、P值、分布、估計(jì)基本工具PythonSQL多變量微積分和線性代數(shù)數(shù)據(jù)整理
    發(fā)表于 06-30 11:42

    介紹從數(shù)據(jù)分析師轉(zhuǎn)型為數(shù)據(jù)科學(xué)家的具體方法

    入門數(shù)據(jù)科學(xué)早已有許多優(yōu)秀的博文可供參考,比如以下兩篇:《成為Jet.com數(shù)據(jù)分析師的自學(xué)之路》和《入門數(shù)據(jù)科學(xué)需掌握的基礎(chǔ)知識(shí)》,但是為數(shù)據(jù)分析師提供轉(zhuǎn)型為
    的頭像 發(fā)表于 03-01 15:34 ?3028次閱讀

    數(shù)據(jù)工程數(shù)據(jù)分析師的區(qū)別在哪里

    不少朋友都很困惑,大數(shù)據(jù)工程數(shù)據(jù)分析師有什么區(qū)別,哪一個(gè)的就業(yè)好薪資高?
    的頭像 發(fā)表于 03-12 11:49 ?1.3w次閱讀

    數(shù)據(jù)分析師數(shù)據(jù)挖掘有什么區(qū)別

    數(shù)據(jù)分析師是指基于大數(shù)據(jù)進(jìn)行數(shù)據(jù)處理分析的人員,能熟練的用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來的大量數(shù)據(jù)進(jìn)
    的頭像 發(fā)表于 03-13 14:52 ?2328次閱讀

    目前數(shù)據(jù)分析師的招聘需求如何?評(píng)價(jià)待遇如何?

    從薪資來看,數(shù)據(jù)分析師確實(shí)是高薪職位,基本上是10k起步,能開30k的公司也不少。從薪資分布區(qū)域來看,各區(qū)平均工資基本在15k-22k之間,市場(chǎng)行情也比較統(tǒng)一,平均工資差距都不會(huì)太大。
    的頭像 發(fā)表于 04-24 17:32 ?3245次閱讀
    目前<b class='flag-5'>數(shù)據(jù)分析師</b>的招聘需求如何?評(píng)價(jià)待遇如何?

    數(shù)據(jù)分析師與大數(shù)據(jù)工程的區(qū)別

    數(shù)據(jù)分析師指的是不同行業(yè)中,專門從事行業(yè)數(shù)據(jù)搜集、整理、分析,并依據(jù)數(shù)據(jù)做出行業(yè)研究、評(píng)估和預(yù)測(cè)的專業(yè)人員。
    的頭像 發(fā)表于 08-16 16:46 ?4929次閱讀

    算法工程數(shù)據(jù)分析師有什么區(qū)別

    數(shù)據(jù)分析師在做什么?低階和高階的區(qū)別
    的頭像 發(fā)表于 08-19 15:23 ?5319次閱讀

    數(shù)據(jù)分析修煉手冊(cè)教程免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是數(shù)據(jù)分析修煉手冊(cè)教程免費(fèi)下載包括了:前言,數(shù)據(jù)分析師如何分類? ,數(shù)據(jù)分析師的具體工作職責(zé)和工作內(nèi)容有哪些?,如何在業(yè)余時(shí)間成為數(shù)據(jù)分析師?,
    發(fā)表于 10-08 08:00 ?1次下載
    <b class='flag-5'>數(shù)據(jù)分析</b>修煉手冊(cè)教程免費(fèi)下載

    高級(jí)數(shù)據(jù)分析師憑什么月薪三萬?一文解答你所有困惑

    適逢全國(guó)上下都在探討數(shù)字化,各行各業(yè)開始不遺余力地深耕數(shù)字化轉(zhuǎn)型,數(shù)據(jù)分析師也成了大熱職業(yè),變身?yè)屖值南沭G餑。 不過打開招聘網(wǎng)站大家卻能看見差距:數(shù)據(jù)分析師平均薪資在10k到20k之間, 大廠數(shù)據(jù)分析師
    發(fā)表于 07-08 18:07 ?367次閱讀
    高級(jí)<b class='flag-5'>數(shù)據(jù)分析師</b>憑什么月薪三萬?一文解答你所有困惑