0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采訪資深數(shù)據(jù)科學(xué)家:成為數(shù)據(jù)科學(xué)家應(yīng)具有的品質(zhì)

如意 ? 來(lái)源:百家號(hào) ? 作者:讀芯術(shù) ? 2020-06-30 11:28 ? 次閱讀

作為一門(mén)逐漸成熟的新興領(lǐng)域,與數(shù)據(jù)科學(xué)相關(guān)的很多領(lǐng)域開(kāi)始變得備受青睞,比如數(shù)據(jù)工程,數(shù)據(jù)分析以及機(jī)器學(xué)習(xí)深度學(xué)習(xí)。數(shù)據(jù)科學(xué)家們必須帶著具有科學(xué)性、創(chuàng)造性和研究性的思維,從各路數(shù)據(jù)集中提取有用信息,以解決客戶面臨的潛在挑戰(zhàn)。

生活會(huì)不斷衍生出數(shù)據(jù),涉及零售、交通、金融和醫(yī)療健康領(lǐng)域。觸手可及的各類計(jì)算產(chǎn)品人工智能的飛速發(fā)展將一群通過(guò)獲取、分析和利用原始數(shù)據(jù)的數(shù)據(jù)科學(xué)家們推到了聚光燈下。

2016年,數(shù)據(jù)科學(xué)家們選出了在北美洲最受歡迎的50種工作,這份榜單是參考收入潛力、工作滿意度以及在Glassdoor招聘網(wǎng)站上的需求量等各項(xiàng)指標(biāo)得出的結(jié)果。

所以成為一名數(shù)據(jù)科學(xué)家應(yīng)具備哪些品質(zhì)呢?

為了搞清楚這個(gè)問(wèn)題,我采訪了Ben Chu,他是路孚特實(shí)驗(yàn)室的一名資深數(shù)據(jù)科學(xué)家。Chu有人工智能領(lǐng)域的背景,擅長(zhǎng)處理語(yǔ)言、語(yǔ)義和圖表,并且在新加坡的路孚特實(shí)驗(yàn)室有著兩年的工作經(jīng)驗(yàn)。

1.保持好奇

Chu在訪談的一開(kāi)始就提到,數(shù)據(jù)科學(xué)家應(yīng)該像調(diào)查員一樣思考。你要時(shí)刻保持好奇,永遠(yuǎn)都想知道“為什么?”“就好像自己是一個(gè)偵探,通過(guò)這些數(shù)據(jù)拼湊細(xì)節(jié)以尋找新的線索?!?/p>

在金融界,數(shù)據(jù)科學(xué)家們從一系列數(shù)據(jù)集中提取信息,以供客戶參考并幫助制定決策。數(shù)據(jù)科學(xué)家們會(huì)把目光鎖定在客戶想要解決的問(wèn)題上面,然后從他們獲得的數(shù)據(jù)中抽絲剝繭,得出線索。

通過(guò)和Chu的交談,我領(lǐng)悟到了抓重點(diǎn)的重要性,調(diào)查背景也是很重要的。如果不能解決潛在問(wèn)題,即使是再完美的分析也無(wú)助于此。有時(shí)候你需要轉(zhuǎn)回來(lái),嘗試新的方法,重新思考問(wèn)題。核心在于要保持好奇,愛(ài)上提問(wèn)。

2.有創(chuàng)造力

數(shù)據(jù)科學(xué)并不僅僅指一種科學(xué)的方法,這個(gè)稱號(hào)其實(shí)會(huì)誤導(dǎo)大家。你不一定要有科研背景,但必須有創(chuàng)新性思維——另一種思維是解決問(wèn)題的關(guān)鍵。

“我經(jīng)常在兩種思維之間來(lái)回切換,是通過(guò)科學(xué)性思維還是創(chuàng)造性思維來(lái)探索更多的新的不同的解決方式。有邏輯的、科學(xué)的思考對(duì)于結(jié)論產(chǎn)出的幫助是必不可少的,但具備創(chuàng)造性思維也同樣重要:我也將成功和失敗的案例視為觀察新模式的線索?!?/p>

3.學(xué)習(xí)如何編碼

你需要扎實(shí)的編碼技能,才能預(yù)處理不同的數(shù)據(jù)源,并且能夠使用各種數(shù)據(jù)處理技術(shù),來(lái)解決棘手或不完整的數(shù)據(jù)。你得能夠創(chuàng)建一個(gè)機(jī)器學(xué)習(xí)管道,這要求你知道如何構(gòu)建模型,如何使用工具和框架來(lái)評(píng)估和分析其性能。

與大多數(shù)數(shù)據(jù)科學(xué)家一樣,Chu使用Python,因?yàn)槔锩嬗性S多很贊的包可用于操作和建模數(shù)據(jù)。事實(shí)上,GalasWalk在2017的上半年為數(shù)據(jù)科學(xué)家提供了10000份招聘信息,發(fā)現(xiàn)Python、R和SQL這三種特殊技能是數(shù)據(jù)科學(xué)中大多數(shù)職位空缺的根本原因。

Ben Chu的團(tuán)隊(duì)依賴于開(kāi)源的機(jī)器學(xué)習(xí)軟件包,如Tensorflow、Pytorch和BERT。

“我們主要將Confluence用作文檔工具;MLFlow、Amazon Sagemaker、Scikit Learn、Tensorflow、PyTorch和BERT用于機(jī)器學(xué)習(xí);Apache Spark用于在大型數(shù)據(jù)集上構(gòu)建快速數(shù)據(jù)管道;Athena用作處理后數(shù)據(jù)的存儲(chǔ)數(shù)據(jù)庫(kù)。我們還使用Superset連接數(shù)據(jù),輕松構(gòu)建儀表板以輸出圖表,使其更直觀?!?/p>

4.科學(xué)思考

數(shù)據(jù)科學(xué)家們會(huì)運(yùn)用不同的工具來(lái)管理流程、數(shù)據(jù)、進(jìn)行注釋和編碼。“我必須十分努力,時(shí)刻衡量并追蹤自己的進(jìn)度,這樣才有機(jī)會(huì)開(kāi)展復(fù)盤(pán)工作,嘗試新的方向,不斷比對(duì)結(jié)果?!?/p>

“重要的是要時(shí)刻秉持科學(xué)的原則,在分析時(shí)參考相應(yīng)的數(shù)據(jù),實(shí)驗(yàn)和文獻(xiàn),以便隨時(shí)調(diào)整結(jié)論。我需要把這些資料整理好,所以我會(huì)用Notion作為初步保存所有筆記、論文和可視化的基本工具。

Chu強(qiáng)調(diào),不僅要保留目前的調(diào)查記錄,還要保留以前所有調(diào)查結(jié)果的記錄?!斑@就像是一本數(shù)據(jù)科學(xué)日志。每當(dāng)遇到類似的情況時(shí),我都會(huì)把值得參考的要點(diǎn)保存好,下次再遇到問(wèn)題時(shí)可以有指導(dǎo)。”

5.擔(dān)心“冒名頂替綜合征”,大可不必

Chu現(xiàn)在是路孚特實(shí)驗(yàn)室的資深數(shù)據(jù)科學(xué)家,但他年少時(shí)曾想成為一名音樂(lè)家,并且對(duì)語(yǔ)言特別著迷?!皩?duì)于我在自然語(yǔ)言處理領(lǐng)域的工作,這需要我對(duì)語(yǔ)言學(xué)有較深的了解,特別是語(yǔ)義學(xué)和語(yǔ)言的細(xì)微差別。”

他解釋說(shuō),一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要一系列技能——他和他的同事?lián)碛袕牟煌尘鞍l(fā)展而來(lái)的重疊技能。

“你需要的技能將取決于工作領(lǐng)域。比如我需要對(duì)金融領(lǐng)域有很好的了解,數(shù)據(jù)分析目前應(yīng)用于防詐騙領(lǐng)域,通過(guò)建立異常檢測(cè)方法來(lái)檢測(cè)交易數(shù)據(jù)中不符合規(guī)范的欺詐‘行為’”。

“像我這樣的數(shù)據(jù)科學(xué)家需要懂得如何處理各種孤立的金融數(shù)據(jù)。關(guān)鍵是要建立各種數(shù)據(jù)之間的聯(lián)系,如果不知道它們之間的聯(lián)系的話,就無(wú)法建立一個(gè)成功的模式?!?/p>

做一名計(jì)算機(jī)科學(xué)家或數(shù)學(xué)家并不是進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的必要條件。沒(méi)有人精通所有領(lǐng)域。你可能有法律、經(jīng)濟(jì)或科學(xué)背景。這些背景決定了你的思考方式。如果能靈活運(yùn)用各種知識(shí)并將其系統(tǒng)化,那么在使用工具、框架和數(shù)據(jù)集時(shí),就能夠熟悉這些工具、框架和數(shù)據(jù)集的細(xì)節(jié)。

如何開(kāi)始

對(duì)于那些熱衷于數(shù)據(jù)科學(xué)技能的人,Chu提供了一些實(shí)用的技巧,這些技巧很容易學(xué)會(huì)。你可以尋找研究社區(qū),參加網(wǎng)絡(luò)研討會(huì),并在網(wǎng)上尋找找到培訓(xùn)課程。一旦可以進(jìn)行當(dāng)面交流,Chu建議你在數(shù)據(jù)科學(xué)領(lǐng)域活躍起來(lái)。

“參加會(huì)議和編程馬拉松,這將幫助你研究建立一個(gè)強(qiáng)大的網(wǎng)絡(luò),讓你有機(jī)會(huì)說(shuō)出自己的想法,啟發(fā)研究和回答疑問(wèn)”。

數(shù)據(jù)科學(xué)是一個(gè)全新的領(lǐng)域,而且還在處于不斷成熟階段。隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)工程師的出現(xiàn),數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和數(shù)據(jù)分析員等各種不同的職位也出現(xiàn)了,也許你會(huì)發(fā)現(xiàn)自己更適合或者更喜歡另一個(gè)職位呢。

一切都在不斷變化之中,永葆好奇心和創(chuàng)造力,繼續(xù)探索吧!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3565

    瀏覽量

    93535
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1410

    瀏覽量

    33984
  • 數(shù)據(jù)科學(xué)

    關(guān)注

    0

    文章

    164

    瀏覽量

    10039
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    處理的效率,還為科學(xué)研究提供了前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書(shū)中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個(gè)
    發(fā)表于 10-14 09:12

    受人眼啟發(fā)!科學(xué)家開(kāi)發(fā)出新型改良相機(jī)

    新型事件相機(jī)系統(tǒng)與標(biāo)準(zhǔn)事件相機(jī)系統(tǒng)對(duì)比圖。 馬里蘭大學(xué)計(jì)算機(jī)科學(xué)家領(lǐng)導(dǎo)的一個(gè)研究小組發(fā)明了一種照相機(jī)裝置,可以改善機(jī)器人觀察周圍世界并做出反應(yīng)的方式。受人眼工作原理的啟發(fā),他們的創(chuàng)新型照相機(jī)系統(tǒng)模仿
    的頭像 發(fā)表于 07-22 06:24 ?258次閱讀
    受人眼啟發(fā)!<b class='flag-5'>科學(xué)家</b>開(kāi)發(fā)出新型改良相機(jī)

    中國(guó)科學(xué)家發(fā)現(xiàn)新型高溫超導(dǎo)體

    據(jù)新華社報(bào)道,我國(guó)科學(xué)家再立新功,又一新型高溫超導(dǎo)體被發(fā)現(xiàn)。 復(fù)旦大學(xué)物理學(xué)系趙俊團(tuán)隊(duì)利用高壓光學(xué)浮區(qū)技術(shù)成功生長(zhǎng)了三層鎳氧化物,成功證實(shí)在鎳氧化物中具有壓力誘導(dǎo)的體超導(dǎo)電性,而且超導(dǎo)體積分?jǐn)?shù)達(dá)到
    的頭像 發(fā)表于 07-19 15:14 ?598次閱讀

    天津大學(xué)科學(xué)家突破人類大腦器官成功驅(qū)動(dòng)機(jī)器人

    在科技探索的征途上,天津大學(xué)的科研團(tuán)隊(duì)再次邁出了令人矚目的步伐。7月5日,該校宣布了一項(xiàng)革命性的成果——科學(xué)家們利用前沿的干細(xì)胞技術(shù),成功培育出了高度模擬人類大腦的類腦器官,并創(chuàng)新性地將其與機(jī)器人系統(tǒng)通過(guò)先進(jìn)的片上腦機(jī)接口技術(shù)緊密相連,開(kāi)啟了人腦與機(jī)器深度融合的新紀(jì)元。
    的頭像 發(fā)表于 07-08 16:00 ?545次閱讀

    新華社:突破性成果!祝賀我國(guó)科學(xué)家成功研發(fā)這一傳感器!

    6月25日,新華社以《突破性成果!祝賀我國(guó)科學(xué)家》為標(biāo)題,報(bào)道了由我國(guó)科學(xué)家研發(fā)的傳感器成果。 我國(guó)科學(xué)家研發(fā)高通道神經(jīng)探針實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè) 神經(jīng)探針是一種用來(lái)記錄神經(jīng)活動(dòng)的針狀電傳
    的頭像 發(fā)表于 06-27 18:03 ?397次閱讀
    新華社:突破性成果!祝賀我國(guó)<b class='flag-5'>科學(xué)家</b>成功研發(fā)這一傳感器!

    前OpenAI首席科學(xué)家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因?yàn)樘K茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學(xué)家,并在去年在OpenAI董事會(huì)上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?482次閱讀

    科學(xué)家研制出一款新型柔性X射線探測(cè)器

    英國(guó)科學(xué)家開(kāi)發(fā)出一種有機(jī)半導(dǎo)體材料,并利用其研制出一款新型柔性X射線探測(cè)器。這種探測(cè)器不僅“身段”更柔軟,可貼合需要掃描物體的形狀,從而提高患者篩查的準(zhǔn)確性,降低腫瘤成像和放射性治療的風(fēng)險(xiǎn),而且成本
    的頭像 發(fā)表于 06-13 06:29 ?243次閱讀

    科學(xué)家開(kāi)發(fā)電驅(qū)動(dòng)有機(jī)半導(dǎo)體激光器

    圣安德魯斯大學(xué)的科學(xué)家們經(jīng)過(guò)長(zhǎng)達(dá)數(shù)十年的努力,在緊湊型激光器研究方面取得了重大突破。 激光在世界各地廣泛應(yīng)用于通信、醫(yī)學(xué)、測(cè)量、制造和測(cè)量等領(lǐng)域。它們用于在互聯(lián)網(wǎng)上傳輸信息,用于醫(yī)療,甚至在
    的頭像 發(fā)表于 06-04 06:30 ?218次閱讀
    <b class='flag-5'>科學(xué)家</b>開(kāi)發(fā)電驅(qū)動(dòng)有機(jī)半導(dǎo)體激光器

    本源量子參與的國(guó)家重點(diǎn)研發(fā)計(jì)劃青年科學(xué)家項(xiàng)目啟動(dòng)會(huì)順利召開(kāi)

    2024年4月23日,國(guó)家重點(diǎn)研發(fā)計(jì)劃“先進(jìn)計(jì)算與新興軟件”重點(diǎn)專項(xiàng)“面向復(fù)雜物理系統(tǒng)求解的量子科學(xué)計(jì)算算法、軟件、應(yīng)用與驗(yàn)證”青年科學(xué)家項(xiàng)目啟動(dòng)會(huì)暨實(shí)施方案論證會(huì)在合肥順利召開(kāi)。該項(xiàng)目由合肥綜合性國(guó)家科學(xué)中心人工智能研究院(安
    的頭像 發(fā)表于 05-11 08:22 ?511次閱讀
    本源量子參與的國(guó)家重點(diǎn)研發(fā)計(jì)劃青年<b class='flag-5'>科學(xué)家</b>項(xiàng)目啟動(dòng)會(huì)順利召開(kāi)

    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢(shì)

    Bill Dally于2009年1月加入NVIDIA擔(dān)任首席科學(xué)家,此前在斯坦福大學(xué)任職12年,擔(dān)任計(jì)算機(jī)科學(xué)系主任。Dally及其斯坦福團(tuán)隊(duì)開(kāi)發(fā)了系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、信號(hào)傳輸、路由和同步技術(shù),在今天的大多數(shù)大型并行計(jì)算機(jī)中都可以找到。
    的頭像 發(fā)表于 02-25 16:16 ?1022次閱讀
    NVIDIA首席<b class='flag-5'>科學(xué)家</b>Bill Dally:深度學(xué)習(xí)硬件趨勢(shì)

    AI for Science,開(kāi)啟智能科學(xué)時(shí)代

    當(dāng)人工智能遇上科研,讓歷史上的科學(xué)家都聞之落淚……
    的頭像 發(fā)表于 02-02 09:36 ?2487次閱讀
    AI for Science,開(kāi)啟智能<b class='flag-5'>科學(xué)</b>時(shí)代

    康奈爾大學(xué)科學(xué)家研制出5分鐘快速充電鋰電池

    鋰離子電池如今廣泛應(yīng)用于電動(dòng)汽車及智能手機(jī)領(lǐng)域。其優(yōu)點(diǎn)包括輕巧、抗震、環(huán)保,但充電時(shí)間較長(zhǎng)及承受大功率電涌的能力不足。隨著最新研究成果發(fā)布,科學(xué)家找到了一種獨(dú)特的銦陽(yáng)極材料,與鋰離子電池內(nèi)的陰極材料實(shí)現(xiàn)良好配合。
    的頭像 發(fā)表于 01-26 09:57 ?615次閱讀
    康奈爾大學(xué)<b class='flag-5'>科學(xué)家</b>研制出5分鐘快速充電鋰電池

    谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門(mén)DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?441次閱讀

    飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào)

    ? ? ?飛騰首席科學(xué)家竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào) 1月19日上午,首屆 “國(guó)家工程師獎(jiǎng)” 表彰大會(huì)在北京人民大會(huì)堂隆重舉行。81 名個(gè)人被授予 “國(guó)家卓越工程師” 稱號(hào),50 個(gè)團(tuán)隊(duì)被授予
    的頭像 發(fā)表于 01-19 19:22 ?1597次閱讀
    飛騰首席<b class='flag-5'>科學(xué)家</b>竇強(qiáng)榮獲 “國(guó)家卓越工程師” 稱號(hào)