0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2018年數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具調(diào)查

算法與數(shù)據(jù)結(jié)構(gòu) ? 來源:未知 ? 作者:胡薇 ? 2018-06-07 17:05 ? 次閱讀

近日,數(shù)據(jù)科學(xué)網(wǎng)站KDnuggets發(fā)布 2018年數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具調(diào)查結(jié)果。下面一起來看看調(diào)查結(jié)果

最受青睞的分析、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)工具

圖1:2018年的最受青睞的工具及其在2016 - 2017年調(diào)查中的份額

*為了更有效的比較,KDnuggets重新計(jì)算了2016年,2017年問卷調(diào)查結(jié)果,排除了受訪者“單一”的選項(xiàng)。

下表是前11名的工具排行,其中每個(gè)工具至少有20%的份額:

表1:KDnuggets2018年頂級分析/數(shù)據(jù)科學(xué)/ ML軟件調(diào)查

在這里,“2018%share”是指使用該工具的受訪者百分比,“%change 2018 VS 2017”是表示2017年調(diào)查的變化 ,用綠色表示增長幅度達(dá)到10%以上,紅色表示下降幅度達(dá)到10%以上。

今年,每名受訪者的平均使用工具數(shù)量為7個(gè),略高于2017年投票中的6.75(不包括單一工具回復(fù))。

與2017年軟件投票相比,今年前11名中,出現(xiàn)了一個(gè)新面孔Keras,Keras取代了去年Knime的位置。下面是針對以上數(shù)據(jù)的一些觀察發(fā)現(xiàn):

Python消滅了R

到2017年,Python已經(jīng)擁有超過50%的份額,如今已經(jīng)將其份額提高到66%,而在我們此次的調(diào)查中,R份額首次出現(xiàn)下降,而且是一下子降到50%以下。

RapidMiner激增

在過去的幾次調(diào)查中,RapidMiner一直是最大的數(shù)據(jù)科學(xué)平臺(tái)之一,它的份額從2017年的33%大幅增加到50%左右。

這樣的增長速度是否是因?yàn)?a target="_blank">廠商的推廣帶來的呢?RapidMiner創(chuàng)始人兼總裁Ingo Mierswa的表示:

與許多供應(yīng)商一樣,RapidMiner通過多種渠道向用戶推廣KDnuggets問卷調(diào)查,之前我們也做過同樣的推廣,但與之前不同的是,首先今年得到了更好的回應(yīng),超過400位用戶親自回復(fù)了郵件,更重要的是,最近一年里,RapidMiner的月活躍用戶增長了300% ,因此可以向更多的用戶發(fā)送了關(guān)于KDnuggets問卷調(diào)查的郵件。

SQL是穩(wěn)定的

SQL(包括Spark SQL和SQL to Hadoop工具在內(nèi))在最近的3次調(diào)查中仍然占有約40%的份額。所以,如果你是一位有抱負(fù)的數(shù)據(jù)科學(xué)家,學(xué)習(xí)SQL吧,它可能會(huì)對你很有用!

趨勢

在調(diào)查中,使用率超過2%的新工具是Spark SQL,擁有11.7%的份額。

下表列出了2018年份額增長20%以上的工具,并在2018年達(dá)到至少3%的份額。

表 2:使用率增幅最大的主要分析/數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)工具

整合

值得一提的是,在2017年擁有2%以上份額的56個(gè)工具中,有19個(gè)(僅約三分之一)工具在2018年份額有所增加,而有37個(gè)的份額下降。結(jié)合Datawatch收購Angoss,Minitab收購Salford等近期的收購案可以表明,數(shù)據(jù)科學(xué)平臺(tái)的整合即將展開。

2018年擁有3%以上份額,卻在2018年份額下降25%以上的工具見下表:

表 3:使用率跌幅最大的主要分析/數(shù)據(jù)科學(xué)工具

深度學(xué)習(xí)工具

使用深度學(xué)習(xí)工具的受訪者比例保持穩(wěn)定,2018年有33%的受訪者表示使用深度學(xué)習(xí)工具,2017年為32%,2016年為18%。 谷歌Tensorflow依然是最主要的平臺(tái)。

頂級深度學(xué)習(xí)工具排名如下:

Tensorflow, 29.9%

● Keras, 22.2%

● PyTorch, 6.4%

● Theano, 4.9%

● Other Deep Learning Tools, 4.9%

● DeepLearning4J, 3.4%

● Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%

● Apache MXnet, 1.5%

● Caffe, 1.5%

● Caffe2, 1.2%

TFLearn, 1.1%

● Torch, 1.0%

● Lasagne, 0.3%

大數(shù)據(jù)工具:Hadoop被拋棄

2018年,約33%的開發(fā)者使用Hadoop或Spark等大數(shù)據(jù)工具 - 與2017年大致相同,但Hadoop使用率顯著下降,下降幅度高達(dá)35%,以下是詳細(xì)信息

編程語言

Python似乎不僅超過了R,還包括大多數(shù)其他語言,目前Python和SQL,Java和C / C ++幾乎保持在相同水平。自從KDnuggets 進(jìn)行這項(xiàng)調(diào)查以來,R第一次出現(xiàn)了下降。其他語言同樣也有所下降。

以下是按熱門度排序的主要編程語言:

● Python, 65.6% (was 59.0% in 2017), 11% up

● R, 48.5% (was 56.6%), 14% down

● SQL, 39.6% (was 39.2%), 1% up

● Java, 15.1% (was 15.5%), 3% down

● Unix, shell/awk/gawk, 9.2% (was 10.8%), 15% down

● Other programming and data languages, 6.9%, (was 7.6%), -9% down

● C/C++, 6.8%, (was 7.1%), 3% down

● Scala, 5.9%, (was 8.3%), 29% down

● Perl, 1.0% (was 1.9%), 46% down

● Julia, 0.7% (was 1.2%), 45% down

● Lisp, 0.3% (was 0.4%), -25% down

● Clojure, 0.2% (was 0.3%), -38% down

● F, # 0.1% (was 0.5%), -73% down

完整結(jié)果和 3 年來的趨勢

以下表格展示了調(diào)查結(jié)果的細(xì)節(jié)(此處僅列出排名前 20 的工具):

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4767

    瀏覽量

    84375
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    15943
  • r語言
    +關(guān)注

    關(guān)注

    1

    文章

    30

    瀏覽量

    6260

原文標(biāo)題:Python完勝R語言,Hadoop被拋棄!2018 年數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具調(diào)查

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    2024諾貝爾物理學(xué)獎(jiǎng)為何要頒給機(jī)器學(xué)習(xí)

    (Geoffrey Hinton),表彰他們在使用人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方面的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。 ? 作為在科學(xué)界具有舉足輕重的地位和深遠(yuǎn)影響的諾貝爾獎(jiǎng),它不僅是對科學(xué)家個(gè)人成就的最高
    的頭像 發(fā)表于 10-10 00:11 ?3509次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    閱讀這一章后,我深感人工智能與生命科學(xué)的結(jié)合正引領(lǐng)著一場前所未有的科學(xué)革命,以下是我個(gè)人的讀后感: 1. 技術(shù)革新與生命科學(xué)進(jìn)步 這一章詳細(xì)闡述了人工智能如何通過其強(qiáng)大的數(shù)據(jù)處理和分析
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)
    發(fā)表于 10-14 09:12

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開發(fā)者均可充分利用高計(jì)算密度的優(yōu)勢來加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計(jì)
    的頭像 發(fā)表于 09-18 09:16 ?284次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)分割方法

    機(jī)器學(xué)習(xí)中,數(shù)據(jù)分割是一項(xiàng)至關(guān)重要的任務(wù),它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評估。本文將從多個(gè)方面詳細(xì)探討機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 16:10 ?1174次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理和特征工程的基本概念出發(fā),詳細(xì)探討這
    的頭像 發(fā)表于 07-09 15:57 ?271次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,
    的頭像 發(fā)表于 07-02 11:22 ?515次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1100次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)
    的頭像 發(fā)表于 06-27 08:27 ?1545次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    名單公布!【書籍評測活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    設(shè)備的運(yùn)行狀況,生成各種維度的報(bào)告。 同時(shí),通過大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),可以對業(yè)務(wù)進(jìn)行預(yù)測和預(yù)警,從而協(xié)助社會(huì)和企業(yè)進(jìn)行科學(xué)決策、降低成本并創(chuàng)造新的價(jià)值。 當(dāng)今時(shí)代,
    發(fā)表于 06-25 15:00

    國內(nèi)機(jī)器人實(shí)際場景使用抽樣調(diào)查數(shù)據(jù)分析報(bào)告

    國內(nèi)機(jī)器人實(shí)際場景使用抽樣調(diào)查數(shù)據(jù)分析報(bào)告1背景我們通過為時(shí)3個(gè)月(20242月1日-20244月30日),針對國內(nèi)
    的頭像 發(fā)表于 05-28 08:14 ?518次閱讀
    國內(nèi)<b class='flag-5'>機(jī)器</b>人實(shí)際場景使用抽樣<b class='flag-5'>調(diào)查</b><b class='flag-5'>數(shù)據(jù)</b>分析報(bào)告

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識別、機(jī)器翻譯、圖像識別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是一類基于樣本數(shù)據(jù)和模型訓(xùn)練來進(jìn)行預(yù)測和判斷的
    的頭像 發(fā)表于 04-04 08:41 ?232次閱讀

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實(shí)現(xiàn)最佳性能。
    的頭像 發(fā)表于 03-23 08:26 ?550次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧