近日,KDnuggets網(wǎng)站公布了2018年度的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具調(diào)查結(jié)果。2300多名參與者對自己“過去 12 個(gè)月內(nèi)在項(xiàng)目開發(fā)中使用過的數(shù)據(jù)挖掘 / 機(jī)器學(xué)習(xí)工具和編程語言”進(jìn)行了投票。
最受歡迎的分析、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)工具
圖1:2018年最受歡迎的分析/數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)工具,以及與2016~2017年調(diào)查結(jié)果的對比
下表列舉了最受歡迎的前11個(gè)工具,其中每個(gè)的占比都達(dá)到20%以上。
表1:2018年最受歡迎的分析/數(shù)據(jù)科學(xué)/ 機(jī)器學(xué)習(xí)軟件Top 10
上表中,2018 % share 是指使用這個(gè)工具的人占所有投票者的百分比,% change是指2018年相較2017年的投票變化。
每個(gè)受訪者平均使用的工具數(shù)量為7.0個(gè),略高于2017年的6.75個(gè)(排除了只選擇1個(gè)工具的投票)。
與2017年的軟件調(diào)查相比,今年新進(jìn)入Top 10的是Keras。
Python取代R成為最受歡迎的編程語言
調(diào)查結(jié)果顯示,Python在2017年調(diào)查中的占比已經(jīng)超過50%,今年更是增加到66%,而R語言的占比自這個(gè)調(diào)查開始以來(今年是第19屆)第一次下降到低于50%。
RapidMiner受歡迎程度大幅提高
在過去幾次調(diào)查中,RapidMiner都是排名最高的數(shù)據(jù)科學(xué)平臺(tái),今年其占比從2017年的33%上升到50%。不過,這是由于RapidMiner采取了一些措施鼓勵(lì)他們的用戶參與該調(diào)查。
SQL排名保持穩(wěn)定
SQL,包括Spark SQL和SQL to Hadoop工具,在過去的3次投票中每一次都有大約40%的投票占比。所以,如果你是數(shù)據(jù)科學(xué)家,學(xué)習(xí)SQL吧——它很可能在很長一段時(shí)間里都很有用。
趨勢
下表列舉了使用率增幅達(dá)到 20% 及以上,且2018 年使用率達(dá)到 3% 以上的工具。
表2:使用率增幅最大的主要分析/數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)工具
我們注意到,在2017年使用率達(dá)到2%或更高的56個(gè)工具中,有19個(gè)(約三分之一)在2018年使用率有所上升,而其余37個(gè)的使用率下降了。這和近期的幾起收購(Datawatch收購Angoss, Minitab收購Salford)一起表明,數(shù)據(jù)科學(xué)平臺(tái)的整合正在進(jìn)行中。
下表列舉了在2017年使用率至少有3%的工具,今年下降了25%甚至更多。
表3:使用率跌幅最大的主要分析/數(shù)據(jù)科學(xué)工具。
調(diào)查結(jié)果顯示,近幾年深度學(xué)習(xí)工具的使用比例保持穩(wěn)定。今年的調(diào)查中有33%的投票者使用深度學(xué)習(xí)工具中,2017年和2016年的比率分別為32%和18%。
谷歌的TensorFlow仍然是是目前最受歡迎的深度學(xué)習(xí)平臺(tái),不過Keras的使用率也很高,接近TensorFlow。
PyTorch排在第3,使用率為6.4%。不過,KDnuggets的讀者更多是數(shù)據(jù)科學(xué)領(lǐng)域的,這個(gè)數(shù)據(jù)可能不能完全反映這些深度學(xué)習(xí)工具在研究社區(qū)中的真實(shí)受歡迎程度。PyTorch在今年有一次較大的升級(jí)更新,并且與Caffe 2合并,預(yù)計(jì)未來它的使用率將會(huì)更高。
深度學(xué)習(xí)工具排名:
Tensorflow, 29.9%
Keras, 22.2%
PyTorch, 6.4%
Theano, 4.9%
Other Deep Learning Tools, 4.9%
DeepLearning4J, 3.4%
Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%
Apache MXnet, 1.5%
Caffe, 1.5%
Caffe2, 1.2%
TFLearn, 1.1%
Torch, 1.0%
Lasagne, 0.3%
大數(shù)據(jù)工具:Hadoop的使用率有所下降
今年的調(diào)查中,大約33%的投票者使用了大數(shù)據(jù)工具,要么是Hadoop,要么是Spark——比率大致與2017年相同,但Hadoop的使用率顯著下降了——約為30%。
詳細(xì)結(jié)果如下:
編程語言
Python取代R語言成為數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)開發(fā)者中最受歡迎的編程語言,而且也遠(yuǎn)高于其他編程語言。SQL、Java、C/ C++的排名保持不變。
這是自KDnuggets網(wǎng)站開始進(jìn)行這項(xiàng)調(diào)查以來,R的使用率首次下降。其他編程語言的使用率也有所下降。
以下是按受歡迎程度排序的主要編程語言。
Python, 65.6% (2017年是59.0%), 11% 上升
R, 48.5% (2017年是 56.6%), 14% 下降
SQL, 39.6% (2017年是 39.2%), 1% 上升
Java, 15.1% (2017年是 15.5%), 3% 下降
Unix, shell/awk/gawk, 9.2% (2017年是 10.8%), 15% 下降
Other programming and data languages, 6.9%, (2017年是 7.6%), -9% 下降
C/C++, 6.8%, (2017年是 7.1%), 3% 下降
Scala, 5.9%, (2017年是 8.3%), 29% 下降
Perl, 1.0% (2017年是 1.9%), 46% 下降
Julia, 0.7% (2017年是 1.2%), 45% 下降
Lisp, 0.3% (2017年是 0.4%), -25% 下降
Clojure, 0.2% (2017年是 0.3%), -38% 下降
F, # 0.1% (2017年是 0.5%), -73% 下降
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315 -
python
+關(guān)注
關(guān)注
55文章
4768瀏覽量
84376
原文標(biāo)題:【機(jī)器學(xué)習(xí)工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎編程語言
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論